pdf-ocr-skill

Installation

SKILL.md

PDF OCR Skill

中文版本

PDF OCR技能用于从影印版PDF文件和图片文件中提取文字内容。该技能支持两种OCR引擎：

RapidOCR（本地引擎）：无需API密钥，免费使用，识别速度快
硅基流动大模型（云端引擎）：使用AI大模型进行高精度OCR识别

功能特性

支持影印版PDF文件的文字提取
支持多种图片格式的文字识别（JPG、PNG、BMP、GIF、TIFF、WEBP）
四引擎支持：RapidOCR（本地）、RapidDoc（增强）、PaddleOCR（本地）和硅基流动API（云端）
支持中文和英文文字识别
保持文字的顺序和结构
自动将PDF页面转换为图片进行识别
智能引擎切换：当RapidOCR初始化失败时自动切换到硅基流动API

安装

Installs

440

Repository

yejinlei/pdf-ocr-skill

GitHub Stars

9

First Seen

Feb 27, 2026

Security Audits

Gen Agent Trust HubWarn

pdf-ocr-skill — yejinlei/pdf-ocr-skill