• español
    • English
    • español
    • English
    JavaScript is disabled for your browser. Some features of this site may not work without it.
    View Item 
    •   TITULA home
    • Universidad Europea de Madrid
    • Escuela de Arquitectura, Ingeniería y Diseño
    • Máster
    • View Item
    •   TITULA home
    • Universidad Europea de Madrid
    • Escuela de Arquitectura, Ingeniería y Diseño
    • Máster
    • View Item

    Sistema Inteligente para el Análisis Multimodal y Evaluación Automática de Presentaciones Técnicas en Entornos Formativos

    Author/s: Gatti, Matteo
    Advisor/s: Cardinale, Yudith Coromoto
    Keyword/s: Procesamiento del lenguaje natural (NLP); Generación automática de resúmenes; Transcripción de audio a texto; Modelos generativos
    Degree: Máster Universitario en Análisis de Datos Masivos
    Date of defense: 2025/10
    Type of content: TFM
    URI: https://hdl.handle.net/20.500.12880/13627
    Abstract:
    En muchos entornos educativos y corporativos se graban presentaciones técnicas que terminan guardadas sin que se vuelvan a usar. El contenido que tienen se pierde porque no hay un análisis ni una forma sencilla de evaluarlas para reutilizarlas. Con esta idea se creó una herramienta que procesa de manera automática vídeos y documentos relacionados, genera una transcripción más clara, resúmenes con los puntos más importantes, preguntas tipo test para comprobar la comprensión y un chat que solo responde con la información cargada. Se desarrolló utilizando servicios gratuitos y escalables del ecosistema de Google como Speech‑to‑Text, Gemini y Cloud Storage. La aplicación funciona con una arquitectura simple pero práctica. Primero extrae el audio del vídeo con MoviePy y pydub, lo guarda de forma temporal y lo sube a un bucket en la nube. Desde allí se transcribe con Speech‑to‑Text y el texto pasa por una capa de mejora con Gemini para hacerlo más comprensible. Además analiza documentos en PowerPoint, Word, Excel y PDF, y une todo en un solo bloque de texto. Con esta información se genera un resumen automático, se crean preguntas de opción múltiple y se permite interactuar mediante un chat integrado en una interfaz web hecha con Streamlit. En las pruebas realizadas, desde subir el vídeo hasta obtener el resumen, las preguntas y las respuestas interactivas, todo se completó en pocos minutos y sin problemas. Esto demuestra que unir IA generativa, procesamiento multimodal y servicios en la nube es útil para automatizar el análisis de presentaciones técnicas y facilitar el acceso al conocimiento en educación y en empresas.
    Export: Exportar a MendeleyExportar a RefWorksExportar a EndNoteExportar a RISExportar a BibTeX
    Show full item record

    Files in this item

    ADOBE PDF
    Name: TFM_Matteo_Gatti.pdf
    Size: 2.224Mb
    Format: PDF
    Type of content: TFM

    Collections

    • Máster
    Attribution-NonCommercial-NoDerivatives 4.0 InternacionalExcept where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional

    TITULA. Repositorio de Proyectos Fin de titulación

    © Universidad Europea de Madrid - Universidad privada | email: titula_rep@universidadeuropea.es | All rights reserved

     

     

    Browse

    All of TITULACommunities and collectionsAuthors and advisorsTitlesKeywordsDegreesThis CollectionAuthors and advisorsTitlesKeywordsDegrees

    Information And Help

    Frequently Asked QuestionsSearch projectsContact

    TITULA. Repositorio de Proyectos Fin de titulación

    © Universidad Europea de Madrid - Universidad privada | email: titula_rep@universidadeuropea.es | All rights reserved