이 노트북의 목표
이 노트북은 OpenAI chain을 프로덕션에 배포하는 간단한 예제를 보여줍니다. 이를 확장하여 자체 호스팅 모델을 배포할 수 있으며, 프로덕션에서 모델을 효율적으로 실행하는 데 필요한 하드웨어 리소스(GPU 및 CPU)의 양을 쉽게 정의할 수 있습니다. 자동 스케일링을 포함한 사용 가능한 옵션에 대한 자세한 내용은 Ray Serve 문서를 참조하세요.Ray Serve 설정
pip install ray[serve]로 ray를 설치합니다.
일반적인 구조
서비스를 배포하기 위한 일반적인 구조는 다음과 같습니다:커스텀 prompt를 사용한 OpenAI chain 배포 예제
여기에서 OpenAI API key를 받으세요. 다음 코드를 실행하면 API key를 제공하라는 메시지가 표시됩니다.localhost:8282 포트에 배포되었으므로 post 요청을 보내 결과를 받을 수 있습니다.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.