tesseract_ocr
SKILL.md
tesseract_ocr
Tesseract OCR es el motor OCR open-source más maduro, mantenido por Google. Aunque menos preciso que PaddleOCR/EasyOCR en documentos complejos, es extremadamente rápido y ligero como tercer nivel de fallback.
When to use
Usar en el ocr_agent como tercer motor de fallback cuando PaddleOCR y EasyOCR fallan o no están disponibles. Útil en modo de degradación cuando los recursos GPU son limitados.
Instructions
- Instalar:
apt install tesseract-ocr tesseract-ocr-spaypip install pytesseract. - Configurar:
pytesseract.pytesseract.tesseract_cmd = '/usr/bin/tesseract'. - Ejecutar OCR:
text = pytesseract.image_to_string(image, lang='spa+eng'). - Para bounding boxes:
data = pytesseract.image_to_data(image, output_type=Output.DICT). - Pre-procesar imagen: binarizar con Otsu, aplicar deskew antes del OCR.
- Usar PSM 6 para bloques de texto uniforme:
--psm 6. - Filtrar resultados con confianza del campo
conf> 60.
Notes
- Tesseract requiere imágenes bien preprocesadas; sin CLAHE/sharpening los resultados son pobres.
- Instalar datos de idioma adicionales:
tesseract-ocr-fra,tesseract-ocr-deu, etc. - No usar para MRZ; es menos preciso que PaddleOCR en fuentes monoespaciadas.
Weekly Installs
1
Repository
davidcastagnetoa/skillsFirst Seen
10 days ago
Installed on
mcpjam1
claude-code1
replit1
junie1
windsurf1
zencoder1