Python agent를 사용합니다.
Bodo DataFrames는 간단한 import 변경만으로 Pandas 코드를 자동으로 가속화하고 확장할 수 있는 고성능 DataFrame 라이브러리입니다(아래 예제 참조). 강력한 Pandas 호환성 덕분에 Bodo DataFrames는 일반적으로 Pandas 코드 생성에 능숙한 LLM이 더 큰 데이터셋에 대한 질문에 더 효율적으로 답변하고 생성된 코드를 Pandas의 한계를 넘어 확장할 수 있도록 합니다.
참고: Python agent는 LLM이 생성한 Python 코드를 실행합니다 - LLM이 생성한 Python 코드가 유해한 경우 위험할 수 있습니다. 신중하게 사용하세요.
Setup
예제를 실행하기 전에 titanic dataset을 복사하여 로컬에titanic.csv로 저장하세요.
langchain-bodo를 설치하면 종속성인 Bodo와 Pandas도 함께 설치됩니다:
pip
Credentials
Bodo DataFrames는 무료이며 추가 자격 증명이 필요하지 않습니다. 예제에서는 OpenAI 모델을 사용하므로, 아직 구성하지 않았다면 OPENAI_API_KEY를 설정하세요:agent 생성 및 호출
다음 예제는 Pandas DataFrames agent 노트북에서 가져온 것으로 주요 차이점을 강조하기 위해 일부 수정되었습니다. 첫 번째 예제는 Bodo DataFrame을create_bodo_dataframes_agent에 직접 전달하고 간단한 질문을 하는 방법을 보여줍니다.
ZERO_SHOT_REACT_DESCRIPTION 사용
이 예제는 ZERO_SHOT_REACT_DESCRIPTION agent 타입을 사용하여 agent를 초기화하는 방법을 보여줍니다.
OpenAI Functions 사용
이 예제는 OPENAI_FUNCTIONS agent 타입을 사용하여 agent를 초기화하는 방법을 보여줍니다. 이는 위의 방법에 대한 대안입니다.Bodo DataFrames와 전처리를 사용한 agent 생성 및 호출
이 예제는 추가 전처리와 함께 Bodo DataFrame을create_bodo_dataframes_agent에 전달하는 약간 더 복잡한 사용 사례를 보여줍니다.
Bodo DataFrames는 지연 평가되므로, 질문에 답변하는 데 모든 열이 필요하지 않은 경우 잠재적으로 계산을 절약할 수 있습니다. agent에 전달되는 DataFrame(s)은 사용 가능한 메모리보다 클 수도 있습니다.
다중 DataFrame 예제
agent에 여러 DataFrame을 전달할 수도 있습니다. Bodo DataFrames는 Pandas의 가장 일반적인 계산 집약적 작업을 대부분 지원하지만, agent가 현재 지원되지 않는 코드를 생성하는 경우(아래 경고 참조), 오류를 방지하기 위해 DataFrame이 Pandas로 다시 변환됩니다. 현재 지원되는 기능에 대한 자세한 내용은 Bodo DataFrames API documentation을 참조하세요.number_of_head_rows를 사용한 agent 호출 최적화
기본적으로 DataFrame(s)의 head가 markdown 테이블로 프롬프트에 포함됩니다.
Bodo DataFrames는 지연 평가되므로 이 head 작업을 최적화할 수 있지만, 경우에 따라 여전히 느릴 수 있습니다. 최적화 방법으로, head의 행 수를 0으로 설정하여 프롬프트 중에 평가가 발생하지 않도록 할 수 있습니다.
Pandas DataFrames 전달
create_bodo_dataframes_agent에 하나 이상의 Pandas DataFrame을 전달할 수도 있습니다. DataFrame(s)은 agent에 전달되기 전에 Bodo로 변환됩니다.
API reference
Bodo DataFrames API documentationConnect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.