Selección de la mejor estrategia de aprendizaje automático aplicable a clasificación binaria del comportamiento crediticio
Autor/es: Cevallos Guerra, Juan Pablo
Director/es: Garibó Orts, Óscar
Fecha de defensa: 2025/11
Tipo de contenido:
TFM
Resumen:
En un entorno financiero altamente competitivo y tecnológicamente dinámico, la capacidad de las instituciones para gestionar eficientemente el riesgo crediticio se ha vuelto crítica. Actualmente, el sistema HcRisk utiliza un modelo de regresión logística binaria (Logit) desarrollado en R para clasificar a los clientes como buenos o malos pagadores. Aunque este modelo ha mostrado eficacia durante más de una década, su arquitectura presenta limitaciones en términos de precisión, capacidad de adaptación, mantenimiento y escalabilidad frente a los avances en ciencia de datos y aprendizaje automático.
El presente proyecto tiene como objetivo principal reemplazar el modelo Logit por un modelo de aprendizaje automático (machine learning) más moderno, robusto y escalable, que permita una mejor aproximación al comportamiento crediticio real de los clientes. Para ello, serán seleccionados y evaluados al menos tres modelos del estado del arte como Random Forest, XGBoost y CatBoost, implementados mediante la plataforma Python y validados con datos históricos reales.
La metodología del proyecto combina análisis exploratorio de datos, preprocesamiento, entrenamiento supervisado, validación cruzada, comparación de métricas de rendimiento (como AUC-ROC y F1-score) y técnicas de interpretabilidad como SHAP para asegurar transparencia en la toma de decisiones. Asimismo, se contemplan criterios operativos como la facilidad de mantenimiento, compatibilidad tecnológica con el sistema HcRisk y capacidad de integración futura con plataformas analíticas.
El resultado esperado es la identificación e implementación de un modelo predictivo superior en desempeño y alineado con los requerimientos actuales del sector financiero. Además, el proyecto sienta las bases para la incorporación de modelos más complejos en otros procesos de evaluación, así como para el desarrollo de tableros de visualización, ampliación de variables de comportamiento y mecanismos de reentrenamiento automatizado, consolidando un sistema de scoring crediticio moderno, confiable y sostenible.
Ficheros en el ítem
Tamaño: 6.098Mb
Formato: PDF
Tipo de contenido:
TFM






