Evaluation 개념
LangSmith에서 evaluation이 작동하는 방식을 이해하기 위한 핵심 용어와 개념을 검토합니다.
Dataset 관리
UI 또는 SDK를 통해 evaluation을 위한 dataset을 생성하고 관리합니다.
Evaluation 실행
다양한 evaluator와 기법을 사용하여 애플리케이션을 평가하고 품질을 측정합니다.
결과 분석
Evaluation 결과를 확인 및 분석하고, experiment를 비교하며, 데이터를 필터링하고, 결과를 내보냅니다.
피드백 수집
Annotation queue와 출력물에 대한 inline annotation을 통해 사람의 피드백을 수집합니다.
튜토리얼 따라하기
간단한 chatbot부터 복잡한 agent evaluation까지 단계별 튜토리얼을 따라 학습합니다.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.