• español
    • English
    • español
    • English
    JavaScript is disabled for your browser. Some features of this site may not work without it.
    View Item 
    •   TITULA home
    • Universidad Europea de Madrid
    • Escuela de Arquitectura, Ingeniería y Diseño
    • Máster
    • View Item
    •   TITULA home
    • Universidad Europea de Madrid
    • Escuela de Arquitectura, Ingeniería y Diseño
    • Máster
    • View Item

    Big Data y Analisis de Sentimiento: Estudio de la Opinión Global sobre Noticias en Tiempo Real

    Author/s: Nieto Primera, Jose Ricardo
    Advisor/s: García Saboya, Samuel
    Keyword/s: Big Data; Análisis de sentimiento; NLP; Titulares de noticias
    Degree: Máster Universitario en Análisis de Datos Masivos
    Date of defense: 2025/09
    Type of content: TFM
    URI: https://hdl.handle.net/20.500.12880/13606
    Abstract:
    En la actualidad, la conformación de la opinión pública sobre noticias ocurre de forma inmediata y global, principalmente a través de titulares difundidos en plataformas digitales. Sin embargo, los sistemas de análisis de sentimiento suelen centrarse en redes sociales y textos en inglés, presentando limitaciones en multilingüismo, tiempo real y granularidad geográfica. En este trabajo, se desarrolla una solución integral basada en Big Data y Procesamiento de Lenguaje Natural (NLP). El sistema es capaz de recopilar, limpiar, analizar y visualizar en tiempo real el sentimiento de titulares de noticias multilingües (inglés y español), con enriquecimiento geográfico. Su arquitectura modular de microservicios (Docker) automatiza la ingesta desde cuatro APIs, aplica limpieza avanzada y evalúa los titulares con un enfoque hibrido de modelos, combinando enfoques léxicos y basados en Transformer como XLM-RoBERTa y RoBERTuito. Validado sobre 120.000 titulares etiquetados manualmente, el estudio no solo confirma el alto rendimiento de XLM-RoBERTa, sino que revela dos hallazgos científicos clave: la “Paradoja del Preprocesamiento”, que demuestra el impacto marginal de la limpieza de textos en modelos Transformer, y el “Problema de la Neutralidad”, una incapacidad sistemática de los modelos actuales para clasificar titulares neutros. El proyecto aporta una solución técnica reproducible y, fundamentalmente, evidencia empírica que cuestiona los paradigmas de clasificación de sentimiento en el periodismo. Los resultados validan la viabilidad del sistema y abren nuevas vías de investigación sobre los límites del análisis de sentimiento en lenguaje mediático.
    Export: Exportar a MendeleyExportar a RefWorksExportar a EndNoteExportar a RISExportar a BibTeX
    Show full item record

    Files in this item

    ADOBE PDF
    Name: TFM_Jose_Ricardo_Nieto_Primera.pdf
    Size: 3.682Mb
    Format: PDF
    Type of content: TFM

    Collections

    • Máster
    Attribution-NonCommercial-NoDerivatives 4.0 InternacionalExcept where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional

    TITULA. Repositorio de Proyectos Fin de titulación

    © Universidad Europea de Madrid - Universidad privada | email: titula_rep@universidadeuropea.es | All rights reserved

     

     

    Browse

    All of TITULACommunities and collectionsAuthors and advisorsTitlesKeywordsDegreesThis CollectionAuthors and advisorsTitlesKeywordsDegrees

    Information And Help

    Frequently Asked QuestionsSearch projectsContact

    TITULA. Repositorio de Proyectos Fin de titulación

    © Universidad Europea de Madrid - Universidad privada | email: titula_rep@universidadeuropea.es | All rights reserved