evaluate() / aevaluate()에 upload_results=False를 전달하여 이를 수행할 수 있습니다.
이렇게 하면 application과 evaluator가 항상 그렇듯이 정확히 실행되고 동일한 출력을 반환하지만, LangSmith에는 아무것도 기록되지 않습니다. 여기에는 실험 결과뿐만 아니라 application 및 evaluator trace도 포함됩니다.
예제
예제를 살펴보겠습니다:langsmith>=0.2.0 필요. 예제는 pandas도 사용합니다.
| inputs.question | outputs.answer | reference.answer | feedback.is_concise | |
|---|---|---|---|---|
| 0 | What is the largest mammal? | What is the largest mammal? is a good question. I don’t know the answer. | The blue whale | False |
| 1 | What do mammals and birds have in common? | What do mammals and birds have in common? is a good question. I don’t know the answer. | They are both warm-blooded | False |