Xata는 PostgreSQL 기반의 서버리스 데이터 플랫폼입니다. 데이터베이스와 상호작용하기 위한 Python SDK와 데이터 관리를 위한 UI를 제공합니다. Xata는 네이티브 vector type을 가지고 있으며, 이는 모든 테이블에 추가할 수 있고 유사도 검색을 지원합니다. LangChain은 vector를 Xata에 직접 삽입하고, 주어진 vector의 최근접 이웃을 쿼리하므로, 모든 LangChain Embeddings 통합을 Xata와 함께 사용할 수 있습니다.이 노트북은 Xata를 VectorStore로 사용하는 방법을 안내합니다.
Setup
vector store로 사용할 데이터베이스 생성하기
Xata UI에서 새 데이터베이스를 생성합니다. 원하는 이름을 지정할 수 있지만, 이 노트북에서는langchain을 사용합니다.
테이블을 생성합니다. 역시 원하는 이름을 지정할 수 있지만, 여기서는 vectors를 사용합니다. UI를 통해 다음 컬럼들을 추가합니다:
content- “Text” type.Document.pageContent값을 저장하는 데 사용됩니다.embedding- “Vector” type. 사용할 모델의 dimension을 사용합니다. 이 노트북에서는 1536 dimension을 가진 OpenAI embeddings를 사용합니다.source- “Text” type. 이 예제에서 metadata 컬럼으로 사용됩니다.- metadata로 사용하려는 다른 컬럼들. 이들은
Document.metadata객체로부터 채워집니다. 예를 들어,Document.metadata객체에title속성이 있다면, 테이블에title컬럼을 생성하면 자동으로 채워집니다.
https://demo-uni3q8.eu-west-1.xata.sh/db/langchain.
Xata vector store 생성하기
테스트 데이터셋을 import 해봅시다:Similarity Search
score를 포함한 Similarity Search (vector distance)
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.