때때로 custom evaluator 또는 summary evaluator가 여러 메트릭을 반환하는 것이 유용할 수 있습니다. 예를 들어, LLM judge에 의해 여러 메트릭이 생성되는 경우, 여러 번의 LLM 호출을 하는 대신 여러 메트릭을 생성하는 단일 LLM 호출을 수행하여 시간과 비용을 절약할 수 있습니다.Python SDK를 사용하여 여러 점수를 반환하려면, 다음 형식의 dictionary/object 리스트를 반환하면 됩니다:
Copy
[ # 'key' is the metric name # 'score' is the value of a numerical metric {"key": string, "score": number}, # 'value' is the value of a categorical metric {"key": string, "value": string}, ... # You may log as many as you wish]
JS/TS SDK에서 이를 수행하려면, ‘results’ 키를 가진 object를 반환하고 위와 같은 형식의 리스트를 포함시키면 됩니다
Copy
{results: [{ key: string, score: number }, ...]};
이러한 각 dictionary는 feedback fields 중 일부 또는 전부를 포함할 수 있습니다. 자세한 내용은 링크된 문서를 확인하세요.예시: