StarRocks는 고성능 분석 데이터베이스입니다.
StarRocks는 다차원 분석, 실시간 분석 및 ad-hoc 쿼리를 포함한 전체 분석 시나리오를 위한 차세대 서브초 MPP 데이터베이스입니다.
일반적으로 StarRocks는 OLAP으로 분류되며, ClickBench — a Benchmark For Analytical DBMS에서 뛰어난 성능을 보여주었습니다. 초고속 벡터화 실행 엔진을 갖추고 있어 빠른 vectordb로도 사용할 수 있습니다.
여기서는 StarRocks Vector Store를 사용하는 방법을 보여드리겠습니다.
Setup
update_vectordb = False로 설정합니다. 업데이트된 문서가 없다면 문서의 embedding을 다시 빌드할 필요가 없습니다.
문서를 로드하고 token으로 분할하기
docs 디렉토리 아래의 모든 markdown 파일을 로드합니다.
starrocks 문서의 경우 github.com/StarRocks/starrocks에서 repo를 clone할 수 있으며, 그 안에 docs 디렉토리가 있습니다.
update_vectordb = True로 설정합니다.
vectordb instance 생성하기
StarRocks를 vectordb로 사용하기
token을 embedding으로 변환하고 vectordb에 저장하기
여기서는 StarRocks를 vectordb로 사용하며,StarRocksSettings를 통해 StarRocks instance를 구성할 수 있습니다.
StarRocks instance 구성은 mysql instance 구성과 매우 유사합니다. 다음을 지정해야 합니다:
- host/port
- username(기본값: ‘root’)
- password(기본값: ”)
- database(기본값: ‘default’)
- table(기본값: ‘langchain’)
QA를 구축하고 질문하기
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.