Beautiful Soup은 HTML 및 XML 문서를 파싱하기 위한 Python 패키지입니다 (잘못된 마크업, 즉 닫히지 않은 태그를 포함하며, 태그 수프(tag soup)의 이름을 따서 명명되었습니다). 파싱된 페이지에 대한 파싱 트리를 생성하여 HTML에서 데이터를 추출하는 데 사용할 수 있으며,[3] 웹 스크래핑에 유용합니다.

Installation and Setup

pip install beautifulsoup4

Document Transformer

사용 예제를 참조하세요.
from langchain_community.document_loaders import BeautifulSoupTransformer

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I