yolov8_documents
Installation
SKILL.md
yolov8_documents
YOLOv8 fine-tuned en documentos de identidad detecta y clasifica el tipo de documento (DNI, pasaporte, permiso de conducir) y localiza las regiones de interés (foto, MRZ, número de documento).
When to use
Usar como paso de clasificación y segmentación del documento, antes de OCR y face extraction.
Instructions
- Instalar:
pip install ultralytics. - Partir de YOLOv8n o YOLOv8s (nano/small) para balance velocidad/precisión.
- Fine-tuning con dataset de documentos de identidad (MIDV-500, MIDV-2020).
- Clases a detectar:
['DNI_ES', 'PASSPORT', 'DRIVING_LICENSE', 'region_photo', 'region_mrz', 'region_name', 'region_dob', 'region_docnum']. - Entrenar:
yolo train data=documents.yaml model=yolov8s.pt epochs=100 imgsz=640. - Exportar a ONNX:
yolo export model=best.pt format=onnx. - Cargar en Triton y servir via gRPC.
- Post-procesar: extraer crops de cada región detectada para procesamiento específico.
Notes
- Dataset MIDV-500: https://arxiv.org/abs/1807.05786 (500 tipos de documentos de 75 países).
- Si el tipo de documento no se reconoce con confianza > 0.7, rechazar o pedir nueva captura.
Related skills
More from davidcastagnetoa/skills
traefik
Reverse proxy moderno con autodiscovery nativo en Kubernetes y Let's Encrypt
62easyocr
OCR alternativo a PaddleOCR, excelente en caracteres especiales y múltiples scripts
32prisma-nestjs-patterns
>
26c4_model_structurizr
Diagramas de arquitectura C4 como código con Structurizr DSL, versionados en Git
23exif_metadata_analyzer
Analizar metadatos EXIF para detectar edición previa con Photoshop, GIMP u otros editores
19asyncpg
Cliente PostgreSQL async de alto rendimiento para el backend FastAPI del pipeline KYC
14