Doctran은 python 패키지입니다. LLM과 오픈소스 NLP 라이브러리를 사용하여 원시 텍스트를 벡터 공간 검색에 최적화된 깨끗하고 구조화된 정보 밀도가 높은 문서로 변환합니다. Doctran을 지저분한 문자열이 들어가면 깔끔하고 정리된 레이블이 붙은 문자열이 나오는 블랙박스로 생각할 수 있습니다.

Installation and Setup

pip install doctran

Document Transformers

Document Interrogator

DoctranQATransformer 사용 예제를 참조하세요.
from langchain_community.document_transformers import DoctranQATransformer

Property Extractor

DoctranPropertyExtractor 사용 예제를 참조하세요.
from langchain_community.document_transformers import DoctranPropertyExtractor

Document Translator

DoctranTextTranslator 사용 예제를 참조하세요.
from langchain_community.document_transformers import DoctranTextTranslator

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I