prefetch_multiplier_tuning
prefetch_multiplier_tuning
Ajuste fino del prefetch multiplier de los workers Celery para equilibrar throughput y latencia segun el tipo de tarea del pipeline de verificacion de identidad. Las tareas GPU-bound (face_match, liveness) requieren configuracion diferente a las CPU-bound (OCR, doc_processing) para evitar cuellos de botella y maximizar la utilizacion de recursos.
When to use
Usa esta skill cuando trabajes con el worker_pool_agent y necesites optimizar el rendimiento de los workers Celery en el pipeline KYC. Aplica cuando observes alta latencia en tareas GPU-bound, subutilizacion de workers CPU-bound, o desbalance de carga entre colas de verificacion.
Instructions
- Identificar y clasificar las tareas del pipeline por tipo de recurso consumido:
# backend/modules/worker_pool/task_classification.py TASK_RESOURCE_MAP = { "face_match": "gpu_bound", # ArcFace inference "liveness_detection": "gpu_bound", # Anti-spoofing model "ocr_extraction": "cpu_bound", # PaddleOCR / EasyOCR "doc_processing": "cpu_bound", # OpenCV processing "antifraud_analysis": "cpu_bound", # ELA, metadata analysis
More from davidcastagnetoa/skills
github_actions_cicd
Pipeline de CI/CD con gates de calidad automatizados en cada PR
11drawio
Diagramas visuales complejos exportables a XML versionables en Git
11dynamic_batching_triton
Batching dinámico en Triton Inference Server para maximizar throughput GPU en inferencia facial
11datamodel_code_generator
Generar modelos Pydantic a partir de OpenAPI/JSON Schema como fuente única de verdad
11weighted_score_aggregator
Algoritmo de agregación ponderada de scores parciales en score global de verificación
11human_review_queue
Cola de casos ambiguos para revisión humana con SLA de respuesta
11