@mastersthesis{20.500.12880/13611, year = {2025}, url = {https://hdl.handle.net/20.500.12880/13611}, abstract = {En un entorno financiero altamente competitivo y tecnológicamente dinámico, la capacidad de las instituciones para gestionar eficientemente el riesgo crediticio se ha vuelto crítica. Actualmente, el sistema HcRisk utiliza un modelo de regresión logística binaria (Logit) desarrollado en R para clasificar a los clientes como buenos o malos pagadores. Aunque este modelo ha mostrado eficacia durante más de una década, su arquitectura presenta limitaciones en términos de precisión, capacidad de adaptación, mantenimiento y escalabilidad frente a los avances en ciencia de datos y aprendizaje automático. El presente proyecto tiene como objetivo principal reemplazar el modelo Logit por un modelo de aprendizaje automático (machine learning) más moderno, robusto y escalable, que permita una mejor aproximación al comportamiento crediticio real de los clientes. Para ello, serán seleccionados y evaluados al menos tres modelos del estado del arte como Random Forest, XGBoost y CatBoost, implementados mediante la plataforma Python y validados con datos históricos reales. La metodología del proyecto combina análisis exploratorio de datos, preprocesamiento, entrenamiento supervisado, validación cruzada, comparación de métricas de rendimiento (como AUC-ROC y F1-score) y técnicas de interpretabilidad como SHAP para asegurar transparencia en la toma de decisiones. Asimismo, se contemplan criterios operativos como la facilidad de mantenimiento, compatibilidad tecnológica con el sistema HcRisk y capacidad de integración futura con plataformas analíticas. El resultado esperado es la identificación e implementación de un modelo predictivo superior en desempeño y alineado con los requerimientos actuales del sector financiero. Además, el proyecto sienta las bases para la incorporación de modelos más complejos en otros procesos de evaluación, así como para el desarrollo de tableros de visualización, ampliación de variables de comportamiento y mecanismos de reentrenamiento automatizado, consolidando un sistema de scoring crediticio moderno, confiable y sostenible.}, title = {Selección de la mejor estrategia de aprendizaje automático aplicable a clasificación binaria del comportamiento crediticio}, keywords = {Aprendizaje automático}, keywords = {Scoring crediticio}, keywords = {Modelo Logit}, keywords = {Clasificación binaria}, author = {Cevallos Guerra, Juan Pablo}, }