- 즉각적인 확장성 - 인프라 문제 없이 수백 개의 브라우저 세션을 몇 초 만에 시작
- 간편한 통합 - Puppeteer 및 Playwright와 같은 인기 있는 도구와 원활하게 작동
- 강력한 API - 모든 사이트를 스크래핑/크롤링하기 위한 사용하기 쉬운 API 등
- 봇 방지 조치 우회 - 내장된 스텔스 모드, 광고 차단, 자동 CAPTCHA 해결 및 순환 프록시
주요 기능
Scrape
Hyperbrowser는 모든 웹페이지에서 데이터를 추출할 수 있는 강력한 스크래핑 기능을 제공합니다. 스크래핑 도구는 웹 콘텐츠를 markdown이나 HTML과 같은 구조화된 형식으로 변환하여 데이터를 쉽게 처리하고 분석할 수 있습니다.Crawl
크롤링 기능을 사용하면 웹사이트의 여러 페이지를 자동으로 탐색할 수 있습니다. 페이지 제한과 같은 매개변수를 설정하여 크롤러가 사이트를 얼마나 광범위하게 탐색할지 제어하고, 방문하는 각 페이지에서 데이터를 수집할 수 있습니다.Extract
Hyperbrowser의 추출 기능은 AI를 사용하여 정의된 스키마에 따라 웹페이지에서 특정 정보를 추출합니다. 이를 통해 구조화되지 않은 웹 콘텐츠를 정확한 요구사항에 맞는 구조화된 데이터로 변환할 수 있습니다.개요
통합 세부정보
| Tool | Package | Local | Serializable | JS support |
|---|---|---|---|---|
| Crawl Tool | langchain-hyperbrowser | ❌ | ❌ | ❌ |
| Scrape Tool | langchain-hyperbrowser | ❌ | ❌ | ❌ |
| Extract Tool | langchain-hyperbrowser | ❌ | ❌ | ❌ |
설정
Hyperbrowser 웹 도구에 액세스하려면langchain-hyperbrowser 통합 패키지를 설치하고, Hyperbrowser 계정을 생성하여 API 키를 받아야 합니다.
자격 증명
Hyperbrowser로 이동하여 가입하고 API 키를 생성하세요. 완료되면 HYPERBROWSER_API_KEY 환경 변수를 설정하세요:설치
langchain-hyperbrowser를 설치하세요.인스턴스화
Crawl Tool
HyperbrowserCrawlTool은 주어진 URL에서 시작하여 전체 웹사이트를 크롤링할 수 있는 강력한 도구입니다. 구성 가능한 페이지 제한 및 스크래핑 옵션을 지원합니다.
Scrape Tool
HyperbrowserScrapeTool은 웹 페이지에서 콘텐츠를 스크래핑할 수 있는 도구입니다. markdown 및 HTML 출력 형식과 메타데이터 추출을 지원합니다.
Extract Tool
HyperbrowserExtractTool은 AI를 사용하여 웹 페이지에서 구조화된 데이터를 추출하는 강력한 도구입니다. 사전 정의된 스키마를 기반으로 정보를 추출할 수 있습니다.
호출
기본 사용법
Crawl Tool
Scrape Tool
Extract Tool
사용자 정의 옵션 사용
사용자 정의 옵션을 사용한 Crawl Tool
사용자 정의 옵션을 사용한 Scrape Tool
사용자 정의 스키마를 사용한 Extract Tool
비동기 사용
모든 도구는 비동기 사용을 지원합니다:Agent 내에서 사용
다음은 agent 내에서 웹 도구를 사용하는 방법입니다:구성 옵션
공통 옵션
모든 도구는 다음과 같은 기본 구성 옵션을 지원합니다:url: 처리할 URLsession_options: 브라우저 세션 구성use_proxy: 프록시 사용 여부solve_captchas: CAPTCHA 자동 해결 여부accept_cookies: 쿠키 수락 여부
도구별 옵션
Crawl Tool
max_pages: 크롤링할 최대 페이지 수scrape_options: 각 페이지 스크래핑 옵션formats: 출력 형식 목록 (markdown, html)
Scrape Tool
scrape_options: 페이지 스크래핑 옵션formats: 출력 형식 목록 (markdown, html)
Extract Tool
schema: 추출할 구조를 정의하는 Pydantic 모델extraction_prompt: 추출을 위한 자연어 프롬프트
API reference
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.