Overview
Integration details
| Class | Package | Local | Serializable | JS support |
|---|---|---|---|---|
| PowerScaleDocumentLoader | powerscale-rag-connector | ✅ | ❌ | ❌ |
| PowerScaleUnstructuredLoader | powerscale-rag-connector | ✅ | ❌ | ❌ |
Loader features
| Source | Document Lazy Loading | Native Async Support |
|---|---|---|
| PowerScaleDocumentLoader | ✅ | ✅ |
| PowerScaleUnstructuredLoader | ✅ | ✅ |
Setup
이 document loader는 MetadataIQ가 활성화된 Dell PowerScale 시스템을 사용해야 합니다. 추가 정보는 GitHub 페이지에서 확인할 수 있습니다: https://github.com/dell/powerscale-rag-connectorInstallation
이 document loader는 외부 pip 패키지에 있으며 표준 도구를 사용하여 설치할 수 있습니다Initialization
이제 document loader를 인스턴스화할 수 있습니다:Generic Document Loader
범용 document loader는 다음과 같은 방식으로 PowerScale에서 모든 파일을 점진적으로 로드하는 데 사용할 수 있습니다:UnstructuredLoader Loader
선택적으로PowerScaleUnstructuredLoader를 사용하여 변경된 파일을 찾고 자동으로 파일을 처리하여 소스 파일의 요소를 생성할 수 있습니다. 이는 LangChain의 UnstructuredLoader 클래스를 사용하여 수행됩니다.
es_host_url은 MetadataIQ Elasticsearch 데이터베이스의 엔드포인트입니다es_index_index는 PowerScale이 파일 시스템 메타데이터를 작성하는 인덱스의 이름입니다es_api_key는 elasticsearch API 키의 인코딩된 버전입니다folder_path는 변경 사항을 쿼리할 PowerScale의 경로입니다
Load
내부적으로 모든 코드는 PowerScale 및 MetadataIQ와 비동기적으로 작동하며 load 및 lazy load 메서드는 python generator를 반환합니다. lazy load 함수를 사용하는 것을 권장합니다.Returned Object
두 document loader 모두 이전에 애플리케이션에 반환된 파일을 추적합니다. 다시 호출하면 document loader는 이전 실행 이후 새로 생성되거나 수정된 파일만 반환합니다.- 반환된
Document의metadata필드는 수정된 파일이 포함된 PowerScale의 경로를 반환합니다. 이 경로를 사용하여 NFS(또는 S3)를 통해 데이터를 읽고 애플리케이션에서 데이터를 처리할 수 있습니다(예: 청크 및 임베딩 생성). source필드는 PowerScale의 경로이며 반드시 로컬 시스템의 경로는 아닙니다(마운트 전략에 따라 다름). OneFS는 전체 스토리지 시스템을/ifs를 루트로 하는 단일 트리로 표현합니다.change_types속성은 마지막 실행 이후 발생한 변경 사항(예: new, modified 또는 delete)을 알려줍니다.
change_types의 정보를 사용하여 청크 및 벡터 저장소의 항목을 추가, 업데이트 또는 삭제할 수 있습니다.
PowerScaleUnstructuredLoader를 사용하는 경우 page_content 필드는 Unstructured Loader의 데이터로 채워집니다
Lazy Load
내부적으로 모든 코드는 PowerScale 및 MetadataIQ와 비동기적으로 작동하며 load 및 lazy load 메서드는 python generator를 반환합니다. lazy load 함수를 사용하는 것을 권장합니다.Document가 반환되며 위에서 언급한 모든 속성이 동일합니다.
Additional Examples
추가 예제 및 코드는 공개 GitHub 웹페이지에서 확인할 수 있습니다: https://github.com/dell/powerscale-rag-connector/tree/main/examples에서 완전한 작동 예제를 제공합니다.- PowerScale LangChain Document Loader - 표준 document loader의 작동 예제
- PowerScale LangChain Unstructured Loader - 청크 및 임베딩을 위해 unstructured loader를 사용하는 표준 document loader의 작동 예제
- PowerScale NVIDIA Retriever Microservice Loader - 청크 및 임베딩을 위해 NVIDIA NeMo Retriever 마이크로서비스를 사용하는 document loader의 작동 예제
API reference
모든 PowerScale Document Loader 기능 및 구성에 대한 자세한 문서는 GitHub 페이지를 참조하세요: https://github.com/dell/powerscale-rag-connector/Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.