Overview
Integration details
| Class | Package | Local | Serializable | JS support |
|---|---|---|---|---|
| OpenDataLoader PDF | langchain-opendataloader-pdf | ✅ | ❌ | ❌ |
Loader features
| Source | Document Lazy Loading | Native Async Support |
|---|---|---|
| OpenDataLoaderPDFLoader | ✅ | ❌ |
OpenDataLoaderPDFLoader 컴포넌트를 사용하면 PDF를 구조화된 Document 객체로 파싱할 수 있습니다.
Requirements
- Python >= 3.9
- 시스템
PATH에서 사용 가능한 Java 11 이상 - opendataloader-pdf >= 1.1.1
Installation
Quick start
Parameters
| Parameter | Type | Required | Default | Description |
|---|---|---|---|---|
file_path | List[str] | ✅ Yes | — | 처리할 하나 이상의 PDF 파일 경로 또는 디렉토리. |
format | str | No | None | 출력 형식 (예: "json", "html", "markdown", "text"). |
quiet | bool | No | False | True일 때 CLI 로깅 출력을 억제합니다. |
content_safety_off | Optional[List[str]] | No | None | 비활성화할 콘텐츠 안전 필터 목록 (예: "all", "hidden-text", "off-page", "tiny", "hidden-ocg"). |
Additional Resources
- LangChain OpenDataLoader PDF integration GitHub
- LangChain OpenDataLoader PDF integration PyPI package
- OpenDataLoader PDF GitHub
- OpenDataLoader PDF Homepage
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.