SageMaker Endpoints Embeddings class를 로드해보겠습니다. 이 class는 예를 들어 자체 Hugging Face model을 SageMaker에 호스팅하는 경우 사용할 수 있습니다.
이를 수행하는 방법에 대한 지침은 여기를 참조하세요.
참고: 일괄 요청을 처리하려면 사용자 정의 inference.py script 내의 predict_fn() function에서 return 라인을 조정해야 합니다:
다음에서
return {"vectors": sentence_embeddings[0].tolist()}
다음으로 변경:
return {"vectors": sentence_embeddings.tolist()}.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.