Tencent Cloud VectorDB는 다차원 벡터 데이터를 저장, 검색 및 분석하기 위해 설계된 완전 관리형, 자체 개발 엔터프라이즈급 분산 데이터베이스 서비스입니다. 이 데이터베이스는 여러 인덱스 유형과 유사도 계산 방법을 지원합니다. 단일 인덱스는 최대 10억 개의 벡터 규모를 지원할 수 있으며, 수백만 QPS와 밀리초 수준의 쿼리 지연 시간을 지원할 수 있습니다. Tencent Cloud Vector Database는 대규모 모델의 응답 정확도를 향상시키기 위해 외부 지식 베이스를 제공할 수 있을 뿐만 아니라 추천 시스템, NLP 서비스, 컴퓨터 비전, 지능형 고객 서비스와 같은 AI 분야에서 광범위하게 사용될 수 있습니다.이 노트북은 Tencent vector database와 관련된 기능을 사용하는 방법을 보여줍니다. 실행하려면 Database instance가 있어야 합니다.
Basic Usage
- LangChain Embeddings와 호환되는 모든 Embeddings 모델을 사용합니다.
- Tencent VectorStore DB의 Embedding 모델 이름을 지정합니다. 선택 가능한 옵션은 다음과 같습니다:
bge-base-zh, dimension: 768m3e-base, dimension: 768text2vec-large-chinese, dimension: 1024e5-large-v2, dimension: 1024multilingual-e5-base, dimension: 768
embeddings 또는 t_vdb_embedding 매개변수 중 하나 이상을 제공해야 합니다. 둘 다 제공되면 embeddings 매개변수가 사용됩니다:
Metadata and filtering
Tencent VectorDB는 metadata와 filtering을 지원합니다. 문서에 metadata를 추가하고 metadata를 기반으로 검색 결과를 필터링할 수 있습니다. 이제 metadata가 포함된 새로운 TencentVectorDB collection을 생성하고 metadata를 기반으로 검색 결과를 필터링하는 방법을 시연하겠습니다:Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.