智能网页内容提取

使用智能算法自动识别网页类型并提取核心内容, 支持文章、论坛和微信等多种类型。

智能内容提取

自动识别网页类型和主要内容, 智能去除干扰元素。

多格式支持

支持输出为纯文本、Markdown和HTML等多种格式, 满足不同场景需求。

API 快速上手

GET /api/extract?url=https://example.com

参数说明:

  • url: 要提取内容的网页地址(必需)
  • output_format: 输出格式(可选,默认为text)
    • • text: 纯文本格式
    • • markdown: Markdown格式
    • • html: HTML格式