개요
이 가이드는 RunPod Serverless에 호스팅된 chat model과 상호작용하기 위해 LangChainChatRunPod class를 사용하는 방법을 다룹니다.
설정
-
패키지 설치:
- Chat Model Endpoint 배포: RunPod Provider 가이드의 설정 단계를 따라 RunPod Serverless에 호환 가능한 chat model endpoint를 배포하고 Endpoint ID를 받으세요.
-
환경 변수 설정:
RUNPOD_API_KEY와RUNPOD_ENDPOINT_ID(또는 특정RUNPOD_CHAT_ENDPOINT_ID)가 설정되어 있는지 확인하세요.
인스턴스화
ChatRunPod class를 초기화합니다. model_kwargs를 통해 model별 parameter를 전달하고 polling 동작을 구성할 수 있습니다.
호출
표준 LangChain.invoke() 및 .ainvoke() method를 사용하여 model을 호출합니다. Streaming도 .stream() 및 .astream()을 통해 지원됩니다 (RunPod /stream endpoint를 polling하여 시뮬레이션).
체이닝
chat model은 LangChain Expression Language (LCEL) chain과 원활하게 통합됩니다.Model 기능 (Endpoint 의존적)
고급 기능의 가용성은 RunPod endpoint handler의 특정 구현에 크게 의존합니다.ChatRunPod integration은 기본 framework를 제공하지만, handler가 기본 기능을 지원해야 합니다.
| 기능 | Integration 지원 | Endpoint 의존적? | 참고사항 |
|---|---|---|---|
| Tool calling | ❌ | ✅ | handler가 tool 정의를 처리하고 tool call을 반환해야 합니다 (예: OpenAI 형식). Integration에는 parsing 로직이 필요합니다. |
| Structured output | ❌ | ✅ | handler가 structured output을 강제하는 기능을 지원해야 합니다 (JSON mode, function calling). Integration에는 parsing 로직이 필요합니다. |
| JSON mode | ❌ | ✅ | handler가 json_mode parameter (또는 유사한 것)를 받아들이고 JSON output을 보장해야 합니다. |
| Image input | ❌ | ✅ | image data를 받아들이는 multimodal handler가 필요합니다 (예: base64). Integration은 multimodal message를 지원하지 않습니다. |
| Audio input | ❌ | ✅ | audio data를 받아들이는 handler가 필요합니다. Integration은 audio message를 지원하지 않습니다. |
| Video input | ❌ | ✅ | video data를 받아들이는 handler가 필요합니다. Integration은 video message를 지원하지 않습니다. |
| Token-level streaming | ✅ (시뮬레이션) | ✅ | /stream을 polling합니다. handler가 status response의 stream list를 token chunk로 채워야 합니다 (예: [{"output": "token"}]). 실제 저지연 streaming은 내장되지 않았습니다. |
| Native async | ✅ | ✅ | 핵심 ainvoke/astream이 구현되었습니다. endpoint handler 성능에 의존합니다. |
| Token usage | ❌ | ✅ | handler가 최종 response에서 prompt_tokens, completion_tokens를 반환해야 합니다. Integration은 현재 이를 parsing하지 않습니다. |
| Logprobs | ❌ | ✅ | handler가 log probability를 반환해야 합니다. Integration은 현재 이를 parsing하지 않습니다. |
API reference
ChatRunPod class, parameter 및 method에 대한 자세한 문서는 소스 코드 또는 생성된 API reference (사용 가능한 경우)를 참조하세요.
소스 코드 링크: https://github.com/runpod/langchain-runpod/blob/main/langchain_runpod/chat_models.py
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.