GoogleGenerativeAIEmbeddings 클래스를 사용하여 Google의 generative AI embeddings 서비스에 연결하세요.
이 가이드는 LangChain을 사용하여 Google의 Generative AI embedding 모델(예: Gemini)을 시작하는 데 도움이 됩니다. GoogleGenerativeAIEmbeddings의 기능 및 구성 옵션에 대한 자세한 문서는 API reference를 참조하세요.
Overview
Integration details
Setup
Google Generative AI embedding 모델에 액세스하려면 Google Cloud 프로젝트를 생성하고, Generative Language API를 활성화하고, API 키를 받고,langchain-google-genai integration 패키지를 설치해야 합니다.
Credentials
Google Generative AI 모델을 사용하려면 API 키가 필요합니다. Google AI Studio에서 생성할 수 있습니다. 자세한 지침은 Google 문서를 참조하세요. 키를 받은 후 환경 변수GOOGLE_API_KEY로 설정하세요:
Installation
Usage
Batch
처리 속도 향상을 위해 여러 문자열을 한 번에 임베딩할 수도 있습니다:Indexing and Retrieval
Embedding 모델은 데이터 인덱싱과 나중에 검색하는 과정 모두에서 retrieval-augmented generation (RAG) 플로우에 자주 사용됩니다. 자세한 지침은 RAG 튜토리얼을 참조하세요. 아래에서는 위에서 초기화한embeddings 객체를 사용하여 데이터를 인덱싱하고 검색하는 방법을 확인할 수 있습니다. 이 예제에서는 InMemoryVectorStore에서 샘플 문서를 인덱싱하고 검색합니다.
Task type
GoogleGenerativeAIEmbeddings는 선택적으로 task_type을 지원하며, 현재 다음 중 하나여야 합니다:
SEMANTIC_SIMILARITY: 텍스트 유사성을 평가하는 데 최적화된 임베딩을 생성하는 데 사용됩니다.CLASSIFICATION: 미리 설정된 레이블에 따라 텍스트를 분류하는 데 최적화된 임베딩을 생성하는 데 사용됩니다.CLUSTERING: 유사성을 기반으로 텍스트를 클러스터링하는 데 최적화된 임베딩을 생성하는 데 사용됩니다.RETRIEVAL_DOCUMENT,RETRIEVAL_QUERY,QUESTION_ANSWERING,FACT_VERIFICATION: 문서 검색 또는 정보 검색에 최적화된 임베딩을 생성하는 데 사용됩니다.CODE_RETRIEVAL_QUERY: 배열 정렬 또는 연결 리스트 반전과 같은 자연어 쿼리를 기반으로 코드 블록을 검색하는 데 사용됩니다. 코드 블록의 임베딩은RETRIEVAL_DOCUMENT를 사용하여 계산됩니다.
embed_documents 메서드에서는 RETRIEVAL_DOCUMENT를 사용하고 embed_query 메서드에서는 RETRIEVAL_QUERY를 사용합니다. task type을 제공하면 모든 메서드에 대해 해당 타입을 사용합니다.
API reference
GoogleGenerativeAIEmbeddings의 기능 및 구성 옵션에 대한 자세한 문서는 API reference를 참조하세요.
Additional Configuration
SDK의 동작을 사용자 정의하기 위해 ChatGoogleGenerativeAI에 다음 매개변수를 전달할 수 있습니다:client_options: 사용자 정의client_options["api_endpoint"]와 같이 Google API Client에 전달할 Client Optionstransport:rest,grpc또는grpc_asyncio와 같이 사용할 전송 방법
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.