jina-reader
SKILL.md
Jina Reader — 网页内容提取
将任意网页 URL 转换为干净的 Markdown 文本,去除广告、导航栏等噪声。免费,无需 API Key。
使用场景
- 用户说「帮我读一下这个链接的内容」「总结这篇文章」
- 需要获取网页完整内容用于分析、翻译、摘要
- 深度调研流程中需要抓取网页正文
- 用户分享了一个 URL,想了解内容
执行方式
必须通过 nodes 工具执行,禁止使用 api_calling!
读取网页内容
将目标 URL 拼接到 https://r.jina.ai/ 后面:
{
"action": "run",
"command": ["curl", "-sS", "-L", "--max-time", "30", "-H", "Accept: text/markdown", "-H", "X-Retain-Images: none", "https://r.jina.ai/https://example.com/article"],
"output_handling": "full"
}
搜索功能
{
"action": "run",
"command": ["curl", "-sS", "-L", "--max-time", "30", "-H", "Accept: application/json", "-H", "X-Retain-Images: none", "https://s.jina.ai/搜索关键词"],
"output_handling": "full"
}
使用建议
- 优先用于长文章:短页面直接搜索摘要即可,长文用 Jina Reader 获取完整内容
- 配合搜索使用:先用搜索功能(
https://s.jina.ai/关键词)找到 URL,再用 Jina Reader 提取正文 - 超时处理:
--max-time 30控制超时 - 内容截断:超长文章由 output_handling 控制,避免上下文溢出
输出规范
- 提取的内容保持原文结构(标题、段落、列表)
- 标注来源 URL
- 如果提取失败,告知用户并说明原因
注意事项
- 不要用 api_calling,Jina Reader 不是注册 API
- 不要打开 Safari/浏览器做手动搜索,直接用 nodes 执行 curl 命令
- 不要用 python3 -c "import httpx; ...",直接用 curl(零依赖,所有系统预装)
Weekly Installs
1
Repository
malue-ai/dazee-smallGitHub Stars
31
First Seen
10 days ago
Security Audits
Installed on
amp1
cline1
openclaw1
opencode1
cursor1
kimi-cli1