mineru-ocr

SKILL.md

MinerU PDF 转 Markdown

前置配置

⚠️ 重要:使用前需要申请 MinerU API Token(有效期 14 天)

申请 API Token

  1. 访问 https://mineru.net/apiManage/token
  2. 注册/登录账号
  3. 创建 API Token 并复制(格式:eyJ0eXAiOiJKV1QiLCJhbGc...

配置 Token

方式一:让 AI 配置

"帮我配置 MinerU,Token 是:xxx"

方式二:手动配置

cd .claude/skills/mineru-ocr/config
cp .env.example .env
nano .env  # 填入 MINERU_API_TOKEN

Token 更新

Token 有效期 14 天,过期后转换失败(错误 401Unauthorized)。

更新方法:告诉 AI "我的 MinerU Token 过期了,新的 Token 是:xxx"


功能说明

通过 MinerU API 将文档转换为 Markdown 格式,支持:

  • PDF、DOC、DOCX、PPT、PPTX、PNG、JPG、JPEG
  • OCR 文字识别
  • 表格识别和保留
  • 数学公式识别

使用方法

/usr/bin/osascript -l JavaScript .claude/skills/mineru-ocr/scripts/convert.js "/path/to/file.pdf"

配置选项

编辑 .claude/skills/mineru-ocr/config/.env

选项 默认值 说明
MINERU_API_TOKEN 必需 MinerU API 令牌
MINERU_ENABLE_OCR true 启用 OCR
MINERU_ENABLE_TABLE true 启用表格识别
MINERU_ENABLE_FORMULA false 启用公式识别
MINERU_LANGUAGE_CODE ch 语言代码
MINERU_POLL_MAX 20 最大轮询次数
MINERU_POLL_SLEEP 10 轮询间隔(秒)

输出

  • Markdown:源文件同目录,同名 .md 扩展名
  • 归档.claude/skills/mineru-ocr/archive/日期_时间_文件名/

故障排除

问题 解决方案
配置不存在 复制 .env.example.env 并填入 Token
401/Unauthorized Token 已过期,重新申请并更新
转换超时 增加 MINERU_POLL_MAX 或检查文件大小
配额不足 检查 MinerU 账户余额
Weekly Installs
20
GitHub Stars
56
First Seen
Feb 20, 2026
Installed on
gemini-cli20
kimi-cli20
cursor20
opencode20
github-copilot19
codex19