process-video

SKILL.md

完整的视频处理流程,分三步执行:

步骤 1 + 2 - 截图并自动 OCR

source .venv/bin/activate && python pipeline.py process --save-dir output/captures --interval 500

告知用户:

  1. 点击 "Select Area" 选择屏幕上的视频区域
  2. 点击 "Start Capture" 开始定时截图
  3. 播放视频
  4. 截图会在停止后自动结束(无新截图超过 interval*2 时自动停止),然后自动运行 OCR

等待命令执行完毕。

步骤 3 - 生成文章

读取 output/extracted_text.txt,将零散的 OCR 文字整理成一篇通顺的 Markdown 文章:

  • 去除 OCR 噪音(乱码、非视频内容的 UI 文字等)
  • 去除重复和无意义的内容
  • 按逻辑组织段落
  • 语言通顺,保留原意

将最终文章写入 output/article.md 文件,并告知用户文件路径。

Weekly Installs
4
First Seen
12 days ago
Installed on
opencode4
gemini-cli4
github-copilot4
codex4
amp4
cline4