NebiusRetriever는 Nebius AI Studio의 embedding을 사용하여 효율적인 유사도 검색을 가능하게 합니다. 고품질 embedding model을 활용하여 문서에 대한 의미론적 검색을 수행합니다.
이 retriever는 문서 컬렉션에 대해 유사도 검색을 수행해야 하지만 vector를 vector database에 저장할 필요가 없는 시나리오에 최적화되어 있습니다. matrix 연산을 사용하여 메모리 내에서 vector 유사도 검색을 수행하므로 중간 규모의 문서 컬렉션에 효율적입니다.
Setup
Installation
Nebius integration은 pip를 통해 설치할 수 있습니다:Credentials
Nebius는 초기화 parameterapi_key로 전달하거나 환경 변수 NEBIUS_API_KEY로 설정할 수 있는 API key가 필요합니다. Nebius AI Studio에서 계정을 생성하여 API key를 얻을 수 있습니다.
Instantiation
NebiusRetriever는 NebiusEmbeddings instance와 문서 목록이 필요합니다. 초기화 방법은 다음과 같습니다:
Usage
Retrieve Relevant Documents
retriever를 사용하여 query와 관련된 문서를 찾을 수 있습니다:get_relevant_documents 사용하기
get_relevant_documents method를 직접 사용할 수도 있습니다 (단, invoke가 권장되는 interface입니다):
결과 수 사용자 정의
query 시점에k를 parameter로 전달하여 결과 수를 조정할 수 있습니다:
Async Support
NebiusRetriever는 async 작업을 지원합니다:빈 문서 처리
Use within a chain
NebiusRetriever는 LangChain RAG pipeline에서 원활하게 작동합니다. 다음은 NebiusRetriever를 사용하여 간단한 RAG chain을 생성하는 예제입니다:Search Tool 생성하기
NebiusRetrievalTool을 사용하여 agent용 tool을 생성할 수 있습니다:
How It Works
NebiusRetriever는 다음과 같이 작동합니다:-
초기화 중:
- 제공된 문서를 저장합니다
- 제공된 NebiusEmbeddings를 사용하여 모든 문서에 대한 embedding을 계산합니다
- 이러한 embedding은 빠른 검색을 위해 메모리에 저장됩니다
-
검색 중 (
invoke또는get_relevant_documents):- 동일한 embedding model을 사용하여 query를 embedding합니다
- query embedding과 모든 문서 embedding 간의 유사도 점수를 계산합니다
- 유사도 순으로 정렬된 상위 k개의 문서를 반환합니다
API reference
Nebius AI Studio API에 대한 자세한 내용은 Nebius AI Studio Documentation을 참조하세요.Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.