Setup
Databricks 모델에 액세스하려면 Databricks 계정을 생성하고, 자격 증명을 설정하고(Databricks 워크스페이스 외부에 있는 경우에만), 필요한 패키지를 설치해야 합니다.Credentials (Databricks 외부에 있는 경우에만)
Databricks 내부에서 LangChain 앱을 실행하는 경우 이 단계를 건너뛸 수 있습니다. 그렇지 않은 경우, Databricks 워크스페이스 호스트명과 개인 액세스 토큰을 각각DATABRICKS_HOST 및 DATABRICKS_TOKEN 환경 변수에 수동으로 설정해야 합니다. 액세스 토큰을 얻는 방법은 Authentication Documentation을 참조하세요.
Installation
LangChain Databricks 통합은databricks-langchain 패키지에 포함되어 있습니다.
Vector Search Endpoint와 Index 생성 (아직 생성하지 않은 경우)
이 섹션에서는 클라이언트 SDK를 사용하여 Databricks Vector Search endpoint와 index를 생성합니다. 이미 endpoint와 index가 있는 경우 이 섹션을 건너뛰고 “Instantiation” 섹션으로 바로 이동할 수 있습니다. 먼저 Databricks VectorSearch 클라이언트를 인스턴스화합니다:DatabricksVectorSearch 클래스는 두 가지 사용 사례를 모두 지원합니다.
- Delta Sync Index는 소스 Delta Table과 자동으로 동기화되며, Delta Table의 기본 데이터가 변경됨에 따라 자동으로 증분 업데이트됩니다.
- Direct Vector Access Index는 벡터와 메타데이터의 직접 읽기 및 쓰기를 지원합니다. 사용자는 REST API 또는 Python SDK를 사용하여 이 테이블을 업데이트할 책임이 있습니다.
Instantiation
DatabricksVectorSearch의 인스턴스화는 index가 Databricks 관리 임베딩을 사용하는지 또는 자체 관리 임베딩(선택한 LangChain Embeddings 객체)을 사용하는지에 따라 약간 다릅니다.
Databricks 관리 임베딩을 사용하는 delta-sync index를 사용하는 경우:
Manage vector store
vector store에 항목 추가
참고:add_documents 메서드를 통한 vector store에 항목 추가는 direct-access index에서만 지원됩니다.
vector store에서 항목 삭제
참고:delete 메서드를 통한 vector store에서 항목 삭제는 direct-access index에서만 지원됩니다.
Query vector store
vector store가 생성되고 관련 문서가 추가되면 체인이나 에이전트를 실행하는 동안 쿼리하고 싶을 것입니다.직접 쿼리
간단한 유사도 검색은 다음과 같이 수행할 수 있습니다:columns 매개변수에 추가 컬럼을 전달하세요.
retriever로 변환하여 쿼리
체인에서 더 쉽게 사용할 수 있도록 vector store를 retriever로 변환할 수도 있습니다.Usage for retrieval-augmented generation
retrieval-augmented generation (RAG)에 이 vector store를 사용하는 방법에 대한 가이드는 다음 섹션을 참조하세요:API reference
모든 DatabricksVectorSearch 기능 및 구성에 대한 자세한 문서는 API reference를 참조하세요: api-docs.databricks.com/python/databricks-ai-bridge/latest/databricks_langchain.html#databricks_langchain.DatabricksVectorSearchConnect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.