web-content-fetcher
网页内容获取技巧集合
本 skill 的核心思路:渐进回退,确保拿到内容。
回退策略
任何 URL 都按以下顺序尝试,不区分网页类型:
- WebFetch 直接抓取 — 最快,先试
- 如果失败或内容不完整 — 并行尝试
r.jina.ai和defuddle.md两种代理前缀,取内容更完整的结果 - 如果代理也失败 — 使用 WebSearch 搜索相关内容作为兜底
"不完整"的判断:返回正文少于 200 字、明显缺失关键段落、或返回错误/空白页面。
方法一:r.jina.ai 前缀
在目标 URL 前加上 https://r.jina.ai/ 前缀,用 WebFetch 抓取:
https://r.jina.ai/<目标URL>
示例
https://r.jina.ai/https://x.com/qoder_ai_ide/status/2036437931867644016
https://r.jina.ai/https://www.anthropic.com/engineering/some-post
https://r.jina.ai/https://any-website.com/any-page
特点
- 会自动执行 JS 渲染,对动态页面和 SPA 支持好
- 返回经过清洗的 Markdown 格式正文
- 响应稍慢但内容覆盖面广
方法二:defuddle.md 前缀
在目标 URL 前加上 https://defuddle.md/ 前缀,用 WebFetch 抓取:
https://defuddle.md/<目标URL>
示例
https://defuddle.md/https://mp.weixin.qq.com/s/ERSjcq9YURHvlsdTUv_Paw
https://defuddle.md/https://example.com/some-article
https://defuddle.md/https://any-website.com/any-page
特点
- 自动去除广告、导航栏等干扰元素,只保留正文
- 返回 Markdown 格式
- 响应较快
通用注意事项
- 两种代理方式都仅支持公开可访问的页面,需要登录的内容无法获取
- 图片等媒体资源不会返回,仅返回文字内容
- 两种方式各有擅长,无法预知哪个对特定网站效果更好,所以失败时应并行尝试两者
本 skill 持续更新中。如需添加新的获取方法,按照相同格式补充即可。
More from nangongwentian-fe/agent-skills
persistent-memory
通用跨会话记忆协议(Universal Memory Protocol)。让所有 AI 编程工具共享同一套记忆系统。适用 Claude Code / Cursor / Aider / Cline / Codex / Trae / OpenCode。能力:智能分类 / FSRS 衰减 / 月度压缩 / 多层检索。触发:用户说"记住";问"之前";检测到敏感信息;会话结束。
23exa-unified-research
Use this skill for ANY web research task — looking up companies, finding people, searching for code examples or API docs, reading tech blogs, finding academic papers, checking SEC filings or financial reports, or gauging social media sentiment. Covers any question that requires searching the internet for current information. Exa provides neural/semantic search that returns higher-quality, better-structured results than simple keyword search. Load this skill whenever the user asks you to search, research, find, look up, or investigate anything online — even if you think you can handle it with built-in search tools, this skill will produce significantly better results.
10git-rebase-workflow
Git Rebase 分支同步流程,用于将当前功能分支 rebase 到最新的目标分支(如 master/main),保持提交历史整洁。适用于功能分支落后于目标分支时,需要同步最新代码的场景。
8code-review-uncommitted
对 git 中未提交的代码变更进行多维度 code review,包括项目规范合规性、Bug 扫描、代码注释合规性、组件封装/架构设计合理性审查,并通过置信度评分过滤误报。当用户要求 review 未提交的代码、review 当前改动、或使用 /code-review-uncommitted 时触发。
8reflect-and-remember
|
4codex-cli
Delegate tasks to the local OpenAI Codex CLI (`codex exec`, `codex review`, `codex cloud exec`). Use this skill whenever the user asks to run Codex, delegate a task to Codex, use OpenAI's agent, do a Codex review, or mentions 'codex' in any form — including phrases like '用 codex 跑一下', '让 codex 帮忙', 'run this with codex', 'codex exec', 'codex review', 'send to codex cloud'. Also trigger when the user wants a second opinion from another AI agent on code changes, or wants to run a task in a sandboxed OpenAI environment.
1