SemaDB는 SemaFind의 제품으로, AI 애플리케이션 구축을 위한 간편한 벡터 유사도 데이터베이스입니다. 호스팅되는 SemaDB Cloud는 시작하기 쉬운 개발자 경험을 제공합니다.
API의 전체 문서와 예제, 인터랙티브 플레이그라운드는 RapidAPI에서 확인할 수 있습니다.
이 노트북은 SemaDB Cloud vector store의 사용법을 보여줍니다.
이 integration을 사용하려면 pip install -qU langchain-community로 langchain-community를 설치해야 합니다
document embedding 로드하기
로컬에서 실행하기 위해, 문장 임베딩에 일반적으로 사용되는 Sentence Transformers를 사용합니다. LangChain이 제공하는 모든 embedding model을 사용할 수 있습니다.SemaDB에 연결하기
SemaDB Cloud는 인증을 위해 RapidAPI keys를 사용합니다. 무료 RapidAPI 계정을 생성하여 키를 얻을 수 있습니다.- “mycollection”: 이 벡터들을 저장할 collection 이름입니다.
- 768: 벡터의 차원입니다. 우리의 경우, sentence transformer embedding은 768차원 벡터를 생성합니다.
- API_KEY: RapidAPI 키입니다.
- embeddings: document, text, query의 embedding이 어떻게 생성될지를 나타냅니다.
- DistanceStrategy: 사용되는 거리 메트릭입니다. wrapper는 COSINE이 사용될 경우 자동으로 벡터를 정규화합니다.
Similarity Search
가장 유사한 문장을 검색하기 위해 기본 LangChain similarity search interface를 사용합니다.정리하기
모든 데이터를 제거하기 위해 collection을 삭제할 수 있습니다.Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.