Elasticsearch는 분산형 RESTful 검색 및 분석 엔진입니다. HTTP 웹 인터페이스와 스키마 프리 JSON 문서를 갖춘 분산형 멀티테넌트 지원 전문 검색 엔진을 제공합니다.
정보 검색 분야에서 Okapi BM25 (BM은 best matching의 약자)는 검색 엔진이 주어진 검색 쿼리에 대한 문서의 관련성을 추정하는 데 사용하는 순위 함수입니다. 이는 1970년대와 1980년대에 Stephen E. Robertson, Karen Spärck Jones 등이 개발한 확률적 검색 프레임워크를 기반으로 합니다.
실제 순위 함수의 이름은 BM25입니다. 더 완전한 이름인 Okapi BM25는 이를 처음 사용한 시스템의 이름을 포함하는데, 이는 1980년대와 1990년대에 런던의 City University에서 구현된 Okapi 정보 검색 시스템입니다. BM25와 그 최신 변형들, 예를 들어 BM25F(문서 구조와 앵커 텍스트를 고려할 수 있는 BM25 버전)는 문서 검색에 사용되는 TF-IDF와 유사한 검색 함수를 나타냅니다.이 노트북은
ElasticSearch와 BM25를 사용하는 retriever를 사용하는 방법을 보여줍니다.
BM25의 세부 사항에 대한 자세한 내용은 이 블로그 포스트를 참조하세요.
새 Retriever 생성
텍스트 추가 (필요한 경우)
retriever에 텍스트가 아직 없는 경우 선택적으로 추가할 수 있습니다Retriever 사용
이제 retriever를 사용할 수 있습니다!Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.