Jina Reader — 网页内容提取

将任意网页 URL 转换为干净的 Markdown 文本，去除广告、导航栏等噪声。免费，无需 API Key。

使用场景

用户说「帮我读一下这个链接的内容」「总结这篇文章」
需要获取网页完整内容用于分析、翻译、摘要
深度调研流程中需要抓取网页正文
用户分享了一个 URL，想了解内容

执行方式

必须通过 nodes 工具执行，禁止使用 api_calling！

读取网页内容

将目标 URL 拼接到 https://r.jina.ai/ 后面：

{
  "action": "run",
  "command": ["curl", "-sS", "-L", "--max-time", "30", "-H", "Accept: text/markdown", "-H", "X-Retain-Images: none", "https://r.jina.ai/https://example.com/article"],
  "output_handling": "full"
}

搜索功能

{
  "action": "run",
  "command": ["curl", "-sS", "-L", "--max-time", "30", "-H", "Accept: application/json", "-H", "X-Retain-Images: none", "https://s.jina.ai/搜索关键词"],
  "output_handling": "full"
}

使用建议

优先用于长文章：短页面直接搜索摘要即可，长文用 Jina Reader 获取完整内容
配合搜索使用：先用搜索功能（https://s.jina.ai/关键词）找到 URL，再用 Jina Reader 提取正文
超时处理：--max-time 30 控制超时
内容截断：超长文章由 output_handling 控制，避免上下文溢出

输出规范

提取的内容保持原文结构（标题、段落、列表）
标注来源 URL
如果提取失败，告知用户并说明原因

注意事项

不要用 api_calling，Jina Reader 不是注册 API
不要打开 Safari/浏览器做手动搜索，直接用 nodes 执行 curl 命令
不要用 python3 -c "import httpx; ..."，直接用 curl（零依赖，所有系统预装）

jina-reader

Jina Reader — 网页内容提取

使用场景

执行方式

读取网页内容

搜索功能

使用建议

输出规范

注意事项