이 가이드는 UnstructuredXMLLoader document loader 시작하기에 대한 간단한 개요를 제공합니다. UnstructuredXMLLoaderXML 파일을 로드하는 데 사용됩니다. 이 loader는 .xml 파일과 함께 작동합니다. 페이지 콘텐츠는 XML 태그에서 추출된 텍스트가 됩니다.

Overview

Integration details

ClassPackageLocalSerializableJS support
UnstructuredXMLLoaderlangchain_community

Loader features

SourceDocument Lazy LoadingNative Async Support
UnstructuredXMLLoader

Setup

UnstructuredXMLLoader document loader에 액세스하려면 langchain-community integration package를 설치해야 합니다.

Credentials

UnstructuredXMLLoader를 사용하는 데 필요한 credentials는 없습니다 모델 호출의 자동 추적을 활성화하려면 LangSmith API key를 설정하세요:
os.environ["LANGSMITH_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")
os.environ["LANGSMITH_TRACING"] = "true"

Installation

langchain_community를 설치합니다.
pip install -qU langchain_community

Initialization

이제 model object를 인스턴스화하고 documents를 로드할 수 있습니다:
from langchain_community.document_loaders import UnstructuredXMLLoader

loader = UnstructuredXMLLoader(
    "./example_data/factbook.xml",
)

Load

docs = loader.load()
docs[0]
Document(metadata={'source': './example_data/factbook.xml'}, page_content='United States\n\nWashington, DC\n\nJoe Biden\n\nBaseball\n\nCanada\n\nOttawa\n\nJustin Trudeau\n\nHockey\n\nFrance\n\nParis\n\nEmmanuel Macron\n\nSoccer\n\nTrinidad & Tobado\n\nPort of Spain\n\nKeith Rowley\n\nTrack & Field')
print(docs[0].metadata)
{'source': './example_data/factbook.xml'}

Lazy Load

page = []
for doc in loader.lazy_load():
    page.append(doc)
    if len(page) >= 10:
        # do some paged operation, e.g.
        # index.upsert(page)

        page = []

API reference

모든 __ModuleName__Loader features 및 configurations에 대한 자세한 문서는 API reference를 참조하세요: python.langchain.com/api_reference/community/document_loaders/langchain_community.document_loaders.xml.UnstructuredXMLLoader.html
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I