easyocr
easyocr
EasyOCR es un motor OCR basado en deep learning que soporta más de 80 idiomas y scripts. Funciona como alternativa/fallback a PaddleOCR con mejor rendimiento en caracteres especiales y alfabetos no latinos.
When to use
Usar en el ocr_agent como segundo motor OCR cuando PaddleOCR tiene baja confianza (< 0.7) en la extracción. Especialmente útil para documentos con caracteres árabes, cirílicos o asiáticos.
Instructions
- Instalar:
pip install easyocr. - Inicializar reader con idiomas:
reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True). - Ejecutar OCR:
results = reader.readtext(image). - Cada resultado contiene:
[bbox, text, confidence]. - Filtrar resultados con confianza < 0.5.
- Comparar resultados con PaddleOCR y usar el de mayor confianza por campo.
- Normalizar texto extraído con el
regex_data_normalizer.
Notes
- EasyOCR es más lento que PaddleOCR (~2x); usar solo como fallback.
- El modelo se descarga automáticamente la primera vez; pre-descargar en el Docker build.
- No soporta MRZ de forma nativa; usar
mrz_parserpara la zona MRZ.
More from davidcastagnetoa/skills
traefik
Reverse proxy moderno con autodiscovery nativo en Kubernetes y Let's Encrypt
64prisma-nestjs-patterns
>
26c4_model_structurizr
Diagramas de arquitectura C4 como código con Structurizr DSL, versionados en Git
23exif_metadata_analyzer
Analizar metadatos EXIF para detectar edición previa con Photoshop, GIMP u otros editores
19asyncpg
Cliente PostgreSQL async de alto rendimiento para el backend FastAPI del pipeline KYC
14insightface_arcface
Reconocimiento facial de estado del arte con ArcFace R100 para comparar selfie con foto del documento
14