Gobernanza del dato en sistemas analíticos y de IA en AWS
Author/s: Palan Murillo, Jonathan David
Advisor/s: García Onrubia, Joaquín
Date of defense: 2025/10
Type of content:
TFM
Abstract:
El creciente volumen y complejidad de los datos en sistemas analíticos y de inteligencia artificial plantea la necesidad de contar con marcos de gobernanza robustos que garanticen la calidad, seguridad y cumplimiento normativo de los datos. Este proyecto aborda dicho reto mediante el diseño e implementación de una arquitectura de gobernanza del dato en Amazon Web Services (AWS), aplicada a un caso práctico: una aplicación web de recomendaciones de libros basada en los datasets de Goodreads Book Graph.
La solución propuesta integra diversos servicios de AWS para cubrir el ciclo de vida completo
de los datos. Amazon S3 se emplea como data lake para datos en bruto y transformados, mientras que AWS Glue y su Data Catalog permiten la transformación, clasificación y catalogación de los datos. AWS Lake Formation y IAM aseguran un control de acceso granular y permisos basados en roles, garantizando la seguridad y el acceso gobernado. El monitoreo y la auditoría continua se logran mediante AWS CloudTrail y CloudWatch. Sobre este pipeline gobernado se desarrolló un modelo de recomendación, integrado en una aplicación web y complementado con dashboards de analítica de negocio en Amazon QuickSight.
Los resultados obtenidos muestran la viabilidad de aplicar un marco de gobernanza alineado con el modelo DAMA dentro de AWS, manteniendo la escalabilidad y eficiencia en costes. La implementación no solo garantizó el cumplimiento y la transparencia en el uso de los datos, sino que también mejoró la fiabilidad de los resultados de aprendizaje automático al asegurar datasets consistentes y de calidad.
En conclusión, el proyecto valida a AWS como una plataforma eficaz para combinar gobernanza del dato, analítica e inteligencia artificial, y resalta su potencial para futuras extensiones tanto en el ámbito técnico como empresarial.
Files in this item
Size: 7.377Mb
Format: PDF
Type of content:
TFM






