jina-reader

SKILL.md

Jina Reader — 网页内容提取

将任意网页 URL 转换为干净的 Markdown 文本,去除广告、导航栏等噪声。免费,无需 API Key。

使用场景

  • 用户说「帮我读一下这个链接的内容」「总结这篇文章」
  • 需要获取网页完整内容用于分析、翻译、摘要
  • 深度调研流程中需要抓取网页正文
  • 用户分享了一个 URL,想了解内容

执行方式

必须通过 nodes 工具执行,禁止使用 api_calling!

读取网页内容

将目标 URL 拼接到 https://r.jina.ai/ 后面:

{
  "action": "run",
  "command": ["curl", "-sS", "-L", "--max-time", "30", "-H", "Accept: text/markdown", "-H", "X-Retain-Images: none", "https://r.jina.ai/https://example.com/article"],
  "output_handling": "full"
}

搜索功能

{
  "action": "run",
  "command": ["curl", "-sS", "-L", "--max-time", "30", "-H", "Accept: application/json", "-H", "X-Retain-Images: none", "https://s.jina.ai/搜索关键词"],
  "output_handling": "full"
}

使用建议

  1. 优先用于长文章:短页面直接搜索摘要即可,长文用 Jina Reader 获取完整内容
  2. 配合搜索使用:先用搜索功能(https://s.jina.ai/关键词)找到 URL,再用 Jina Reader 提取正文
  3. 超时处理--max-time 30 控制超时
  4. 内容截断:超长文章由 output_handling 控制,避免上下文溢出

输出规范

  • 提取的内容保持原文结构(标题、段落、列表)
  • 标注来源 URL
  • 如果提取失败,告知用户并说明原因

注意事项

  • 不要用 api_calling,Jina Reader 不是注册 API
  • 不要打开 Safari/浏览器做手动搜索,直接用 nodes 执行 curl 命令
  • 不要用 python3 -c "import httpx; ...",直接用 curl(零依赖,所有系统预装)
Weekly Installs
1
GitHub Stars
31
First Seen
10 days ago
Installed on
amp1
cline1
openclaw1
opencode1
cursor1
kimi-cli1