이 페이지는 LangChain 내에서 MyScale vector database를 사용하는 방법을 다룹니다. 설치 및 설정, 그리고 특정 MyScale wrapper에 대한 참조, 이렇게 두 부분으로 나뉩니다. MyScale을 사용하면 구조화된 데이터와 비구조화된(벡터화된) 데이터를 모두 관리할 수 있으며, SQL을 사용하여 두 가지 유형의 데이터에 대한 조인 쿼리 및 분석을 수행할 수 있습니다. 또한 ClickHouse 위에 구축된 MyScale의 cloud-native OLAP 아키텍처는 대규모 데이터셋에서도 초고속 데이터 처리를 가능하게 합니다.

Introduction

MyScale 개요 및 고성능 벡터 검색 이제 SaaS에 등록하고 클러스터를 시작할 수 있습니다! SQL과 벡터를 통합한 방법에 관심이 있으시다면, 추가 구문 참조를 위해 이 문서를 참조하세요. 또한 huggingface에서 라이브 데모를 제공합니다! huggingface space를 확인해보세요! 수백만 개의 벡터를 순식간에 검색합니다!

Installation and Setup

  • pip install clickhouse-connect로 Python SDK를 설치합니다

Setting up environments

myscale index의 매개변수를 설정하는 두 가지 방법이 있습니다.
  1. Environment Variables 앱을 실행하기 전에 export로 환경 변수를 설정하세요: export MYSCALE_HOST='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ... SaaS에서 계정, 비밀번호 및 기타 정보를 쉽게 찾을 수 있습니다. 자세한 내용은 이 문서를 참조하세요. MyScaleSettings 아래의 모든 속성은 MYSCALE_ 접두사로 설정할 수 있으며 대소문자를 구분하지 않습니다.
  2. 매개변수로 MyScaleSettings 객체 생성
    from langchain_community.vectorstores import MyScale, MyScaleSettings
    config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
    index = MyScale(embedding_function, config)
    index.add_documents(...)
    

Wrappers

지원되는 함수:
  • add_texts
  • add_documents
  • from_texts
  • from_documents
  • similarity_search
  • asimilarity_search
  • similarity_search_by_vector
  • asimilarity_search_by_vector
  • similarity_search_with_relevance_scores
  • delete

VectorStore

MyScale database를 감싸는 wrapper가 있어, 의미론적 검색이나 유사 예제 검색을 위한 vectorstore로 사용할 수 있습니다. 이 vectorstore를 import하려면:
from langchain_community.vectorstores import MyScale
MyScale wrapper에 대한 더 자세한 안내는 이 노트북을 참조하세요
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I