현재 기준(2024년 1월 25일) BaichuanTextEmbeddings는 C-MTEB(Chinese Multi-Task Embedding Benchmark) 리더보드에서 1위를 차지하고 있습니다. 리더보드 (Overall -> Chinese 섹션): huggingface.co/spaces/mteb/leaderboard 공식 웹사이트: platform.baichuan-ai.com/docs/text-Embedding 이 embedding model을 사용하려면 API key가 필요합니다. platform.baichuan-ai.com/docs/text-Embedding에서 등록하여 API key를 받을 수 있습니다. BaichuanTextEmbeddings는 512 token window를 지원하며 1024 차원의 vector를 생성합니다. BaichuanTextEmbeddings는 현재 중국어 텍스트 embedding만 지원한다는 점에 유의하시기 바랍니다. 다국어 지원은 곧 제공될 예정입니다.
from langchain_community.embeddings import BaichuanTextEmbeddings

embeddings = BaichuanTextEmbeddings(baichuan_api_key="sk-*")
또는 다음과 같은 방법으로 API key를 설정할 수 있습니다:
import os

os.environ["BAICHUAN_API_KEY"] = "YOUR_API_KEY"
text_1 = "今天天气不错"
text_2 = "今天阳光很好"

query_result = embeddings.embed_query(text_1)
query_result
doc_result = embeddings.embed_documents([text_1, text_2])
doc_result

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I