article-list-processor
SKILL.md
Article List Processor Skill
概述
这个 Skill 专门用于处理"文章列表"。你只需要提供一个包含多个文章标题和链接的 Markdown 文件,它就会自动遍历列表,逐个抓取网页内容,并应用 Defou x Stanley 工作流进行重写。
核心功能
- 智能解析:自动识别 Markdown 文件中的链接列表
- 内容抓取:使用 Readability 技术提取网页正文
- 批量重写:为每篇文章生成 Defou x Stanley 风格内容
- 自动验证:生成后自动启动爆款要素验证
- 文件监听:支持后台监听模式,投放即处理
使用场景
- 批量处理收藏的文章链接
- 将 Newsletter 内容转化为自己的风格
- 从 Twitter、RSS 收集的文章批量重写
- 建立内容素材库
工作流程
投放清单文件 → 解析链接 → 抓取正文 → 生成初稿 → 爆款验证 → 输出终稿
详细步骤
- 检测文件:监听
local_inputs/目录 - 解析链接:提取所有
[标题](URL)格式的链接 - 抓取内容:使用爬虫获取网页正文
- 生成初稿:应用 Defou x Stanley 工作流
- 自动验证:启动
viral-verification进行优化 - 归档原文件:将处理完的文件移入
archive/
使用方法
1. 准备清单文件
在 defou-workflow-agent/local_inputs/ 下创建 Markdown 文件(例如 reading_list.md):
# 我的今日阅读清单
1. [为什么年轻人不爱存钱了?](https://example.com/article1)
2. [如何通过 AI 提高效率](https://example.com/article2)
- [DeepSeek 深度解析](https://example.com/article3)
支持的格式:
- 有序列表:
1. [标题](链接) - 无序列表:
- [标题](链接) - 直接链接:
[标题](链接)
2. 启动监听模式
npm run skill:list
终端将显示:
👀 Watching directory: /path/to/local_inputs/
等待文件投放...
3. 投放任务
将准备好的清单文件拖入 local_inputs/ 文件夹,系统会自动开始处理。
4. 查看结果
处理完成后,在以下目录查看结果:
- 初稿:
outputs/defou-stanley-posts/ - 终稿:
outputs/viral-verified-posts/
输出结果
文件结构
outputs/
├── defou-stanley-posts/ # 初稿
│ ├── article1_20260123.md
│ ├── article2_20260123.md
│ └── article3_20260123.md
└── viral-verified-posts/ # 终稿(经过验证优化)
├── verified_article1_20260123.md
├── verified_article2_20260123.md
└── verified_article3_20260123.md
local_inputs/
└── archive/ # 已处理的原文件
└── reading_list.md
前置条件
- 已安装 Node.js 环境
- 已配置
.env文件中的ANTHROPIC_API_KEY - 网络连接正常(需要抓取网页内容)
- 目标网站允许爬虫访问
配置选项
在 .env 文件中可配置:
# API 配置
ANTHROPIC_API_KEY=your_api_key
ANTHROPIC_BASE_URL=https://api.anthropic.com # 可选
# 爬虫配置
USER_AGENT=Mozilla/5.0... # 可选,自定义 User Agent
TIMEOUT=30000 # 可选,请求超时时间(毫秒)
示例
输入文件:reading_list.md
# 本周精选文章
1. [AI 如何改变内容创作](https://example.com/ai-content)
2. [2026 年自媒体趋势](https://example.com/trends-2026)
3. [爆款文案的底层逻辑](https://example.com/viral-logic)
处理过程
📂 检测到新文件:reading_list.md
📋 解析到 3 个链接
🌐 正在抓取:AI 如何改变内容创作...
✅ 抓取成功
📝 正在生成 Defou x Stanley 风格内容...
✅ 初稿已生成:article1_20260123.md
🔍 正在进行爆款验证...
✅ 终稿已生成:verified_article1_20260123.md
---
🌐 正在抓取:2026 年自媒体趋势...
...
🎉 全部完成!共处理 3 篇文章
📂 原文件已归档:archive/reading_list.md
注意事项
- 网站限制:某些网站可能限制爬虫访问,导致抓取失败
- 内容质量:抓取的内容质量取决于网页结构,建议选择结构清晰的文章
- API 配额:每篇文章会调用 2 次 API(生成 + 验证),注意配额
- 处理时间:取决于文章数量和网络速度,请耐心等待
- 文件格式:确保链接格式正确,否则可能无法识别
故障排除
问题:抓取失败
可能原因:
- 网站限制爬虫
- 网络连接问题
- URL 格式错误
解决方案:
- 检查 URL 是否可访问
- 尝试更换 User Agent
- 检查网络连接
问题:生成内容质量不佳
可能原因:
- 抓取的内容不完整
- 原文结构混乱
解决方案:
- 选择结构清晰的文章
- 手动检查抓取的内容
- 调整 Readability 配置
高级用法
单次处理模式
如果不想使用监听模式,可以直接运行:
npx ts-node src/article-list-processor.ts local_inputs/your-list.md
自定义输出目录
修改脚本中的输出路径配置:
const OUTPUT_DIR = './custom-output/';
Weekly Installs
2
Repository
wangdefou-dev/d…ow-agentGitHub Stars
86
First Seen
Jan 24, 2026
Security Audits
Installed on
trae2
claude-code2
codex2
kiro-cli2
cursor2
mcpjam1