pull.md 서비스를 사용하여 URL을 Markdown으로 변환하는 Loader입니다. 이 패키지는 웹 콘텐츠를 위한 document loader를 구현합니다. 기존 웹 스크래퍼와 달리, PullMdLoader는 React, Angular, Vue.js와 같은 동적 JavaScript 프레임워크로 구축된 웹 페이지를 로컬 렌더링 없이 Markdown으로 변환할 수 있습니다.

Overview

Integration details

ClassPackageLocalSerializableJS Support
PullMdLoaderlangchain-pull-md

Setup

Installation

pip install langchain-pull-md

Initialization

from langchain_pull_md.markdown_loader import PullMdLoader

# Instantiate the loader with a URL
loader = PullMdLoader(url="https://example.com")

Load

documents = loader.load()
documents[0].metadata
{'source': 'https://example.com',
 'page_content': '# Example Domain\nThis domain is used for illustrative examples in documents. You may use this domain in literature without prior coordination or asking for permission.'}

Lazy Load

lazy loading은 구현되지 않았습니다. PullMdLoaderload 메서드가 호출될 때마다 제공된 URL을 실시간으로 Markdown 형식으로 변환합니다.

API reference


Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I