• español
    • English
    • español
    • English
    JavaScript is disabled for your browser. Some features of this site may not work without it.
    Ver ítem 
    •   TITULA principal
    • Universidad Europea de Madrid
    • Escuela de Arquitectura, Ingeniería y Diseño
    • Máster
    • Ver ítem
    •   TITULA principal
    • Universidad Europea de Madrid
    • Escuela de Arquitectura, Ingeniería y Diseño
    • Máster
    • Ver ítem

    Sistema Inteligente para el Análisis Multimodal y Evaluación Automática de Presentaciones Técnicas en Entornos Formativos

    Autor/es: Gatti, Matteo
    Director/es: Cardinale, Yudith Coromoto
    Palabra/s clave: Procesamiento del lenguaje natural (NLP); Generación automática de resúmenes; Transcripción de audio a texto; Modelos generativos
    Titulación: Máster Universitario en Análisis de Datos Masivos
    Fecha de defensa: 2025/10
    Tipo de contenido: TFM
    URI: https://hdl.handle.net/20.500.12880/13627
    Resumen:
    En muchos entornos educativos y corporativos se graban presentaciones técnicas que terminan guardadas sin que se vuelvan a usar. El contenido que tienen se pierde porque no hay un análisis ni una forma sencilla de evaluarlas para reutilizarlas. Con esta idea se creó una herramienta que procesa de manera automática vídeos y documentos relacionados, genera una transcripción más clara, resúmenes con los puntos más importantes, preguntas tipo test para comprobar la comprensión y un chat que solo responde con la información cargada. Se desarrolló utilizando servicios gratuitos y escalables del ecosistema de Google como Speech‑to‑Text, Gemini y Cloud Storage. La aplicación funciona con una arquitectura simple pero práctica. Primero extrae el audio del vídeo con MoviePy y pydub, lo guarda de forma temporal y lo sube a un bucket en la nube. Desde allí se transcribe con Speech‑to‑Text y el texto pasa por una capa de mejora con Gemini para hacerlo más comprensible. Además analiza documentos en PowerPoint, Word, Excel y PDF, y une todo en un solo bloque de texto. Con esta información se genera un resumen automático, se crean preguntas de opción múltiple y se permite interactuar mediante un chat integrado en una interfaz web hecha con Streamlit. En las pruebas realizadas, desde subir el vídeo hasta obtener el resumen, las preguntas y las respuestas interactivas, todo se completó en pocos minutos y sin problemas. Esto demuestra que unir IA generativa, procesamiento multimodal y servicios en la nube es útil para automatizar el análisis de presentaciones técnicas y facilitar el acceso al conocimiento en educación y en empresas.
    Exportar: Exportar a MendeleyExportar a RefWorksExportar a EndNoteExportar a RISExportar a BibTeX
    Mostrar el registro completo del ítem

    Ficheros en el ítem

    ADOBE PDF
    Nombre: TFM_Matteo_Gatti.pdf
    Tamaño: 2.224Mb
    Formato: PDF
    Tipo de contenido: TFM

    Colecciones

    • Máster
    Attribution-NonCommercial-NoDerivatives 4.0 InternacionalExcepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional

    TITULA. Repositorio de Proyectos Fin de titulación

    © Universidad Europea de Madrid - Universidad privada | email: titula_rep@universidadeuropea.es | Todos los derechos reservados

     

     

    Listar

    Todo TITULAComunidades y coleccionesAutores y directoresTítulosPalabras claveTitulacionesEsta colecciónAutores y directoresTítulosPalabras claveTitulaciones

    Información y ayuda

    Preguntas frecuentesBuscar proyectosContacto

    TITULA. Repositorio de Proyectos Fin de titulación

    © Universidad Europea de Madrid - Universidad privada | email: titula_rep@universidadeuropea.es | Todos los derechos reservados