PyMuPDF4LLM은 LLM 및 RAG 애플리케이션에 필요한 PDF 콘텐츠를 Markdown 형식으로 더 쉽게 추출할 수 있도록 하는 것을 목표로 합니다.langchain-pymupdf4llm은 PyMuPDF4LLM을 Document Loader로 LangChain에 통합합니다.
Copy
pip install -qU langchain-pymupdf4llm
Copy
from langchain_pymupdf4llm import PyMuPDF4LLMLoader, PyMuPDF4LLMParser