Show simple item record

dc.contributor.advisorCardinale, Yudith Coromoto
dc.contributor.authorGatti, Matteo
dc.date.accessioned2025-12-23T12:45:03Z
dc.date.available2025-12-23T12:45:03Z
dc.date.issued2025/10
dc.identifier.citationGatti, M. (2025). Sistema Inteligente para el Análisis Multimodal y Evaluación Automática de Presentaciones Técnicas en Entornos Formativos. [Trabajo Fin de Estudios, Universidad Europea de Madrid]. Repositorio de Trabajos Fin de Estudios TITULAes
dc.identifier.urihttps://hdl.handle.net/20.500.12880/13627
dc.description.abstractEn muchos entornos educativos y corporativos se graban presentaciones técnicas que terminan guardadas sin que se vuelvan a usar. El contenido que tienen se pierde porque no hay un análisis ni una forma sencilla de evaluarlas para reutilizarlas. Con esta idea se creó una herramienta que procesa de manera automática vídeos y documentos relacionados, genera una transcripción más clara, resúmenes con los puntos más importantes, preguntas tipo test para comprobar la comprensión y un chat que solo responde con la información cargada. Se desarrolló utilizando servicios gratuitos y escalables del ecosistema de Google como Speech‑to‑Text, Gemini y Cloud Storage. La aplicación funciona con una arquitectura simple pero práctica. Primero extrae el audio del vídeo con MoviePy y pydub, lo guarda de forma temporal y lo sube a un bucket en la nube. Desde allí se transcribe con Speech‑to‑Text y el texto pasa por una capa de mejora con Gemini para hacerlo más comprensible. Además analiza documentos en PowerPoint, Word, Excel y PDF, y une todo en un solo bloque de texto. Con esta información se genera un resumen automático, se crean preguntas de opción múltiple y se permite interactuar mediante un chat integrado en una interfaz web hecha con Streamlit. En las pruebas realizadas, desde subir el vídeo hasta obtener el resumen, las preguntas y las respuestas interactivas, todo se completó en pocos minutos y sin problemas. Esto demuestra que unir IA generativa, procesamiento multimodal y servicios en la nube es útil para automatizar el análisis de presentaciones técnicas y facilitar el acceso al conocimiento en educación y en empresas.es
dc.language.isospaes
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacionales
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/es
dc.titleSistema Inteligente para el Análisis Multimodal y Evaluación Automática de Presentaciones Técnicas en Entornos Formativoses
dc.typeTFMes
dc.description.affiliationUniversidad Europea de Madrides
dc.description.degreeMáster Universitario en Análisis de Datos Masivoses
dc.rights.accessRightsopenAccesses
dc.subject.keywordProcesamiento del lenguaje natural (NLP)es
dc.subject.keywordGeneración automática de resúmeneses
dc.subject.keywordTranscripción de audio a textoes
dc.subject.keywordModelos generativoses
dc.description.methodologyVirtual


Files in this item

ADOBE PDF

This item appears in the following Collection(s)

Show simple item record