AssemblyAIAudioTranscriptLoader는 AssemblyAI API를 사용하여 오디오 파일을 텍스트로 변환하고, 변환된 텍스트를 document로 로드합니다.
이를 사용하려면 assemblyai python package가 설치되어 있어야 하며, 환경 변수 ASSEMBLYAI_API_KEY에 API key가 설정되어 있어야 합니다. 또는 API key를 인자로 전달할 수도 있습니다.
AssemblyAI에 대한 자세한 정보:
Installation
먼저assemblyai python package를 설치해야 합니다.
자세한 정보는 assemblyai-python-sdk GitHub repo에서 확인할 수 있습니다.
Example
AssemblyAIAudioTranscriptLoader는 최소한 file_path 인자가 필요합니다. 오디오 파일은 URL 또는 로컬 파일 경로로 지정할 수 있습니다.
loader.load()를 호출하면 텍스트 변환이 완료될 때까지 차단됩니다.
변환된 텍스트는 page_content에서 확인할 수 있습니다:
metadata에는 추가 메타 정보가 포함된 전체 JSON response가 들어 있습니다:
Transcript Formats
다양한 형식을 위해transcript_format 인자를 지정할 수 있습니다.
형식에 따라 하나 이상의 document가 반환됩니다. 다음은 사용 가능한 TranscriptFormat 옵션입니다:
TEXT: 텍스트 변환 내용이 담긴 하나의 documentSENTENCES: 여러 개의 document, 텍스트 변환 내용을 문장별로 분할PARAGRAPHS: 여러 개의 document, 텍스트 변환 내용을 단락별로 분할SUBTITLES_SRT: SRT 자막 형식으로 내보낸 텍스트 변환 내용이 담긴 하나의 documentSUBTITLES_VTT: VTT 자막 형식으로 내보낸 텍스트 변환 내용이 담긴 하나의 document
Transcription Config
다양한 audio intelligence model을 사용하기 위해config 인자를 지정할 수도 있습니다.
사용 가능한 모든 model에 대한 개요는 AssemblyAI API Documentation을 참조하세요!
Pass the API Key as argument
API key를 환경 변수ASSEMBLYAI_API_KEY로 설정하는 것 외에도, 인자로 전달하는 것도 가능합니다.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.