UnDatasIOundatasio 패키지는 PDF와 같은 원본 소스 문서에서 깨끗한 텍스트를 추출합니다. 이 페이지에서는 LangChain 내에서 undatasio 생태계를 사용하는 방법을 다룹니다.

Installation and Setup

  • Python SDK를 설치하려면
    pip install undatasio를 실행하고
    pip install langchain-undatasio를 함께 설치하여
    UnDatasIOLoader를 사용하고 UnDatasIO API를 통해 원격으로 파티션을 수행할 수 있습니다. API 키가 필요하며, undatas.io에서 무료로 생성할 수 있습니다.
  • 로컬 시스템 종속성은 필요하지 않으며, 모든 처리는 클라우드에서 실행됩니다.

Data Loaders

UnDatasIO의 주요 사용법은 document loader를 통한 것입니다.

UnDatasIOLoader

단일 파일 파싱 및 lazy loading에 대한 사용 예제를 참조하세요.
from langchain_undatasio import UnDatasIOLoader

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I