Sistema Inteligente para el Análisis Multimodal y Evaluación Automática de Presentaciones Técnicas en Entornos Formativos

Gatti, Matteo

Palabra/s clave: Procesamiento del lenguaje natural (NLP); Generación automática de resúmenes; Transcripción de audio a texto; Modelos generativos

Titulación: Máster Universitario en Análisis de Datos Masivos (Big Data)

Fecha de defensa: 2025/10

Tipo de contenido: TFM

URI: https://hdl.handle.net/20.500.12880/13627

Resumen:

En muchos entornos educativos y corporativos se graban presentaciones técnicas que terminan guardadas sin que se vuelvan a usar. El contenido que tienen se pierde porque no hay un análisis ni una forma sencilla de evaluarlas para reutilizarlas. Con esta idea se creó una herramienta que procesa de manera automática vídeos y documentos relacionados, genera una transcripción más clara, resúmenes con los puntos más importantes, preguntas tipo test para comprobar la comprensión y un chat que solo responde con la información cargada. Se desarrolló utilizando servicios gratuitos y escalables del ecosistema de Google como Speech‑to‑Text, Gemini y Cloud Storage. La aplicación funciona con una arquitectura simple pero práctica. Primero extrae el audio del vídeo con MoviePy y pydub, lo guarda de forma temporal y lo sube a un bucket en la nube. Desde allí se transcribe con Speech‑to‑Text y el texto pasa por una capa de mejora con Gemini para hacerlo más comprensible. Además analiza documentos en PowerPoint, Word, Excel y PDF, y une todo en un solo bloque de texto. Con esta información se genera un resumen automático, se crean preguntas de opción múltiple y se permite interactuar mediante un chat integrado en una interfaz web hecha con Streamlit. En las pruebas realizadas, desde subir el vídeo hasta obtener el resumen, las preguntas y las respuestas interactivas, todo se completó en pocos minutos y sin problemas. Esto demuestra que unir IA generativa, procesamiento multimodal y servicios en la nube es útil para automatizar el análisis de presentaciones técnicas y facilitar el acceso al conocimiento en educación y en empresas.