tesseract_ocr

Tesseract OCR es el motor OCR open-source más maduro, mantenido por Google. Aunque menos preciso que PaddleOCR/EasyOCR en documentos complejos, es extremadamente rápido y ligero como tercer nivel de fallback.

When to use

Usar en el ocr_agent como tercer motor de fallback cuando PaddleOCR y EasyOCR fallan o no están disponibles. Útil en modo de degradación cuando los recursos GPU son limitados.

Instructions

Instalar: apt install tesseract-ocr tesseract-ocr-spa y pip install pytesseract.
Configurar: pytesseract.pytesseract.tesseract_cmd = '/usr/bin/tesseract'.
Ejecutar OCR: text = pytesseract.image_to_string(image, lang='spa+eng').
Para bounding boxes: data = pytesseract.image_to_data(image, output_type=Output.DICT).
Pre-procesar imagen: binarizar con Otsu, aplicar deskew antes del OCR.
Usar PSM 6 para bloques de texto uniforme: --psm 6.
Filtrar resultados con confianza del campo conf > 60.

Notes

Related skills

More from davidcastagnetoa/skills

Installs

Repository

davidcastagnetoa/skills

First Seen

Mar 6, 2026

tesseract_ocr

tesseract_ocr

When to use

Instructions

Notes

More from davidcastagnetoa/skills

traefik

easyocr

prisma-nestjs-patterns

c4_model_structurizr

exif_metadata_analyzer

insightface_arcface