easyocr
SKILL.md
easyocr
EasyOCR es un motor OCR basado en deep learning que soporta más de 80 idiomas y scripts. Funciona como alternativa/fallback a PaddleOCR con mejor rendimiento en caracteres especiales y alfabetos no latinos.
When to use
Usar en el ocr_agent como segundo motor OCR cuando PaddleOCR tiene baja confianza (< 0.7) en la extracción. Especialmente útil para documentos con caracteres árabes, cirílicos o asiáticos.
Instructions
- Instalar:
pip install easyocr. - Inicializar reader con idiomas:
reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True). - Ejecutar OCR:
results = reader.readtext(image). - Cada resultado contiene:
[bbox, text, confidence]. - Filtrar resultados con confianza < 0.5.
- Comparar resultados con PaddleOCR y usar el de mayor confianza por campo.
- Normalizar texto extraído con el
regex_data_normalizer.
Notes
- EasyOCR es más lento que PaddleOCR (~2x); usar solo como fallback.
- El modelo se descarga automáticamente la primera vez; pre-descargar en el Docker build.
- No soporta MRZ de forma nativa; usar
mrz_parserpara la zona MRZ.
Weekly Installs
9
Repository
davidcastagnetoa/skillsFirst Seen
13 days ago
Security Audits
Installed on
gemini-cli9
github-copilot9
codex9
kimi-cli9
amp9
cline9