WhyLabs는 데이터 품질 저하, 데이터 드리프트, 모델 성능 저하를 모니터링하기 위해 설계된 데이터 파이프라인 및 ML 애플리케이션용 관측성 플랫폼입니다.whylogs라는 오픈 소스 패키지를 기반으로 구축된 이 플랫폼은 데이터 과학자와 엔지니어가 다음을 수행할 수 있도록 합니다:
- 몇 분 안에 설정: 경량 오픈 소스 라이브러리인 whylogs를 사용하여 모든 데이터셋의 통계 프로파일 생성을 시작합니다.
- 데이터셋 프로파일을 WhyLabs 플랫폼에 업로드하여 데이터셋 특성과 모델 입력, 출력 및 성능에 대한 중앙 집중식 및 사용자 정의 가능한 모니터링/알림을 제공합니다.
- 원활한 통합: 모든 데이터 파이프라인, ML 인프라 또는 프레임워크와 상호 운용 가능합니다. 기존 데이터 흐름에 대한 실시간 인사이트를 생성합니다. 통합에 대한 자세한 내용은 여기를 참조하세요.
- 테라바이트 규모로 확장: 대규모 데이터를 처리하면서 컴퓨팅 요구 사항을 낮게 유지합니다. 배치 또는 스트리밍 데이터 파이프라인과 통합합니다.
- 데이터 프라이버시 유지: WhyLabs는 whylogs를 통해 생성된 통계 프로파일에 의존하므로 실제 데이터가 환경을 벗어나지 않습니다! 입력 및 LLM 문제를 더 빠르게 감지하고, 지속적인 개선을 제공하며, 비용이 많이 드는 사고를 방지하기 위해 관측성을 활성화하세요.
Installation and Setup
- WhyLabs API Key: whylabs.ai/whylabs-free-sign-up
- Org and Dataset https://docs.whylabs.ai/docs/whylabs-onboarding
- OpenAI: platform.openai.com/account/api-keys
참고: callback은 이러한 변수를 callback에 직접 전달하는 것을 지원하며, 인증이 직접 전달되지 않으면 환경 변수를 기본값으로 사용합니다. 인증을 직접 전달하면 WhyLabs의 여러 프로젝트 또는 조직에 프로파일을 작성할 수 있습니다.
Callbacks
다음은 OpenAI와의 단일 LLM 통합으로, 다양한 기본 메트릭을 로깅하고 모니터링을 위해 WhyLabs로 텔레메트리를 전송합니다.Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.