Aplicación de LLM para la interpretación de señales biomédicas

Clavijo Mojica, Mario Alfonso

Author/s: Clavijo Mojica, Mario Alfonso

Advisor/s: Gil Ruiz, Jesús

Keyword/s: ECG; LLM; LoRA/QLoRA; PMC-LLaMA

Degree: Máster Universitario en Análisis de Datos Masivos

Date of defense: 2025/11

Type of content: TFM

URI: https://hdl.handle.net/20.500.12880/13624

Abstract:

Este proyecto aborda la generación automática de informes de electrocardiograma (ECG) combinando modelos de lenguaje de gran tamaño (LLM) con datos públicos. Se parte del problema práctico de transformar hallazgos de ECG en descripciones clínicas coherentes y estandarizadas, reduciendo el esfuerzo manual y la variabilidad entre redactores. Para ello se diseña una metodología reproducible sobre el dataset PTB-XL: preparación de datos con una única columna text (input clínico textualizado →report), ajuste fino de cuatro LLM biomédicos (BioGPT, BioMedLM, PMC-LLaMA y BioMistral-7B) y evaluación homogénea con BLEU, ROUGE y METEOR en un conjunto de prueba fijo. Los principales resultados muestran que la variante PMC-LLaMA (7B) con QLoRA/LoRA y plantilla instruccional“### Input / ### Report” ofrece el mejor rendimiento global, produciendo informes más fieles y concisos que las alternativas probadas. BioMistral-7B y BioGPT logran un desempeño intermedio; BioMedLM, en mi configuración, resulta más ver- boso y penalizado por métricas léxicas. Por tanto se concluye que, para recursos limitados de GPU, la combinación plantilla + LoRA/QLoRA es eficaz y viable. Como líneas futuras, propongo integrar un etiquetador multietiqua desde señal cruda (tipo “ECG-BERT” o CNN) para automatizar los hallazgos y reforzar la evaluación clínica con es- pecialistas, cerrando el ciclo señal →hallazgos →informe.