spaCy는 Python과 Cython 프로그래밍 언어로 작성된 고급 자연어 처리를 위한 오픈소스 소프트웨어 라이브러리입니다.

Installation and Setup

pip install -qU  spacy
필요한 class들을 import합니다
from langchain_community.embeddings.spacy_embeddings import SpacyEmbeddings

Example

SpacyEmbeddings를 초기화합니다. 이 작업은 Spacy model을 메모리에 로드합니다.
embedder = SpacyEmbeddings(model_name="en_core_web_sm")
예제 텍스트들을 정의합니다. 이는 분석하고자 하는 모든 문서가 될 수 있습니다 - 예를 들어, 뉴스 기사, 소셜 미디어 게시물 또는 제품 리뷰 등입니다.
texts = [
    "The quick brown fox jumps over the lazy dog.",
    "Pack my box with five dozen liquor jugs.",
    "How vexingly quick daft zebras jump!",
    "Bright vixens jump; dozy fowl quack.",
]
텍스트에 대한 embedding을 생성하고 출력합니다. SpacyEmbeddings class는 각 문서에 대한 embedding을 생성하며, 이는 문서 내용의 수치적 표현입니다. 이러한 embedding은 문서 유사도 비교나 텍스트 분류와 같은 다양한 자연어 처리 작업에 사용될 수 있습니다.
embeddings = embedder.embed_documents(texts)
for i, embedding in enumerate(embeddings):
    print(f"Embedding for document {i + 1}: {embedding}")
단일 텍스트에 대한 embedding을 생성하고 출력합니다. 검색 쿼리와 같은 단일 텍스트에 대한 embedding도 생성할 수 있습니다. 이는 주어진 쿼리와 유사한 문서를 찾고자 하는 정보 검색과 같은 작업에 유용할 수 있습니다.
query = "Quick foxes and lazy dogs."
query_embedding = embedder.embed_query(query)
print(f"Embedding for query: {query_embedding}")

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I