WatsonxRerank는 IBM watsonx.ai foundation model을 위한 wrapper입니다.이 노트북은 retriever에서 watsonx의 rerank endpoint를 사용하는 방법을 보여줍니다.
개요
Integration 세부사항
| Class | Package | JS support | Downloads | Version |
|---|---|---|---|---|
| WatsonxRerank | langchain-ibm | ✅ |
설정
IBM watsonx.ai model에 액세스하려면 IBM watsonx.ai 계정을 생성하고, API key를 받고,langchain-ibm integration package를 설치해야 합니다.
자격 증명
아래 셀은 watsonx Foundation Model inferencing 작업에 필요한 자격 증명을 정의합니다. 작업: IBM Cloud 사용자 API key를 제공하세요. 자세한 내용은 사용자 API key 관리를 참조하세요.설치
LangChain IBM integration은langchain-ibm package에 있습니다:
faiss 또는 faiss-cpu package도 설치하세요:
인스턴스화
기본 vector store retriever 설정
2023년 국정연설(청크 단위)을 저장하는 간단한 vector store retriever를 초기화하는 것부터 시작하겠습니다. retriever가 많은 수(20개)의 문서를 검색하도록 설정할 수 있습니다.WatsonxEmbeddings를 초기화합니다. 자세한 내용은 WatsonxEmbeddings를 참조하세요.
참고:
- API 호출에 대한 컨텍스트를 제공하려면
project_id또는space_id를 추가해야 합니다. 자세한 내용은 문서를 참조하세요. - 프로비저닝된 서비스 인스턴스의 지역에 따라 여기에 설명된 url 중 하나를 사용하세요.
project_id와 Dallas url을 사용합니다.
embedding에 사용할 model_id를 지정해야 합니다. 사용 가능한 모든 model은 문서에서 확인할 수 있습니다.
사용법
WatsonxRerank로 reranking 수행하기
이제 기본 retriever를ContextualCompressionRetriever로 래핑하겠습니다. watsonx rerank endpoint를 사용하여 반환된 결과를 rerank하는 WatsonxRerank를 추가합니다.
WatsonxRerank에서 model 이름을 지정하는 것이 필수라는 점에 유의하세요!
chain 내에서 사용
물론 이 retriever를 QA pipeline 내에서 사용할 수 있습니다ChatWatsonx를 초기화합니다. 자세한 내용은 ChatWatsonx를 참조하세요.
API reference
모든WatsonxRerank 기능 및 구성에 대한 자세한 문서는 API reference를 참조하세요.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.