- 메신저 데이터를 디스크에 다운로드합니다.
- Chat Loader를 생성하고
loader.load()(또는loader.lazy_load())를 호출하여 변환을 수행합니다. - 선택적으로
merge_chat_runs를 사용하여 동일한 발신자의 연속된 메시지를 결합하거나,map_ai_messages를 사용하여 지정된 발신자의 메시지를 “AIMessage” 클래스로 변환합니다. 이 작업을 완료한 후convert_messages_for_finetuning을 호출하여 파인튜닝을 위한 데이터를 준비합니다.
- 메시지를 OpenAI에 업로드하고 파인튜닝 작업을 실행합니다.
- 결과 모델을 LangChain 앱에서 사용합니다!
1. 데이터 다운로드
자신의 메신저 데이터를 다운로드하려면 여기의 지침을 따르세요. 중요 - JSON 형식으로 다운로드해야 합니다(HTML이 아님). 이 워크스루에서 사용할 예제 덤프를 이 구글 드라이브 링크에서 호스팅하고 있습니다.2. Chat Loader 생성
전체 채팅 디렉토리용과 개별 파일 로드용, 두 가지 다른FacebookMessengerChatLoader 클래스가 있습니다.
3. 파인튜닝 준비
load()를 호출하면 추출할 수 있는 모든 채팅 메시지가 human message로 반환됩니다. 챗봇과 대화할 때 대화는 일반적으로 실제 대화에 비해 더 엄격한 교대 대화 패턴을 따릅니다.
메시지 “runs”(동일한 발신자의 연속된 메시지)를 병합하고 “AI”를 나타낼 발신자를 선택할 수 있습니다. 파인튜닝된 LLM은 이러한 AI 메시지를 생성하는 방법을 학습합니다.
이제 OpenAI 형식 dictionary로 변환할 수 있습니다
4. 모델 파인튜닝
이제 모델을 파인튜닝할 시간입니다.openai가 설치되어 있고
OPENAI_API_KEY가 적절히 설정되어 있는지 확인하세요
5. LangChain에서 사용
결과 모델 ID를ChatOpenAI 모델 클래스에서 직접 사용할 수 있습니다.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.