Nuclia는 모든 내부 및 외부 소스의 비정형 데이터를 자동으로 인덱싱하여 최적화된 검색 결과와 생성형 답변을 제공합니다. 비디오 및 오디오 전사, 이미지 콘텐츠 추출, 문서 파싱을 처리할 수 있습니다.
Nuclia Understanding API document transformer는 텍스트를 단락과 문장으로 분할하고, 엔티티를 식별하며, 텍스트 요약을 제공하고 모든 문장에 대한 embedding을 생성합니다. Nuclia Understanding API를 사용하려면 Nuclia 계정이 필요합니다. https://nuclia.cloud에서 무료로 계정을 만들 수 있으며, NUA key를 생성할 수 있습니다. from langchain_community.document_transformers.nuclia_text_transform import NucliaTextTransformer
pip install -qU  protobuf
pip install -qU  nucliadb-protos
import os

os.environ["NUCLIA_ZONE"] = "<YOUR_ZONE>"  # e.g. europe-1
os.environ["NUCLIA_NUA_KEY"] = "<YOUR_API_KEY>"
Nuclia document transformer를 사용하려면 enable_mlTrue로 설정하여 NucliaUnderstandingAPI tool을 인스턴스화해야 합니다:
from langchain_community.tools.nuclia import NucliaUnderstandingAPI

nua = NucliaUnderstandingAPI(enable_ml=True)
Nuclia document transformer는 비동기 모드로 호출되어야 하므로 atransform_documents 메서드를 사용해야 합니다:
import asyncio

from langchain_community.document_transformers.nuclia_text_transform import (
    NucliaTextTransformer,
)
from langchain_core.documents import Document


async def process():
    documents = [
        Document(page_content="<TEXT 1>", metadata={}),
        Document(page_content="<TEXT 2>", metadata={}),
        Document(page_content="<TEXT 3>", metadata={}),
    ]
    nuclia_transformer = NucliaTextTransformer(nua)
    transformed_documents = await nuclia_transformer.atransform_documents(documents)
    print(transformed_documents)


asyncio.run(process())

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I