智能网页内容提取
使用智能算法自动识别网页类型并提取核心内容, 支持文章、论坛和微信等多种类型。
智能内容提取
自动识别网页类型和主要内容, 智能去除干扰元素。
多格式支持
支持输出为纯文本、Markdown和HTML等多种格式, 满足不同场景需求。
API 快速上手
GET /api/extract?url=https://example.com
参数说明:
url
: 要提取内容的网页地址(必需)output_format
: 输出格式(可选,默认为text)- • text: 纯文本格式
- • markdown: Markdown格式
- • html: HTML格式