LangSmith Evaluations - Docs by LangChain

다음 섹션은 dataset 생성, evaluation 실행 및 결과 분석에 도움을 줍니다:

Evaluation 개념

LangSmith에서 evaluation이 작동하는 방식을 이해하기 위한 핵심 용어와 개념을 검토합니다.

Dataset 관리

UI 또는 SDK를 통해 evaluation을 위한 dataset을 생성하고 관리합니다.

Evaluation 실행

다양한 evaluator와 기법을 사용하여 애플리케이션을 평가하고 품질을 측정합니다.

결과 분석

Evaluation 결과를 확인 및 분석하고, experiment를 비교하며, 데이터를 필터링하고, 결과를 내보냅니다.

피드백 수집

Annotation queue와 출력물에 대한 inline annotation을 통해 사람의 피드백을 수집합니다.

튜토리얼 따라하기

간단한 chatbot부터 복잡한 agent evaluation까지 단계별 튜토리얼을 따라 학습합니다.

Edit the source of this page on GitHub.

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.

평가 빠른 시작

⌘I