Aplicación de LLM para la interpretación de señales biomédicas

Clavijo Mojica, Mario Alfonso

Autor/es: Clavijo Mojica, Mario Alfonso

Director/es: Gil Ruiz, Jesús

Palabra/s clave: ECG; LLM; LoRA/QLoRA; PMC-LLaMA

Titulación: Máster Universitario en Análisis de Datos Masivos

Fecha de defensa: 2025/11

Tipo de contenido: TFM

URI: https://hdl.handle.net/20.500.12880/13624

Resumen:

Este proyecto aborda la generación automática de informes de electrocardiograma (ECG) combinando modelos de lenguaje de gran tamaño (LLM) con datos públicos. Se parte del problema práctico de transformar hallazgos de ECG en descripciones clínicas coherentes y estandarizadas, reduciendo el esfuerzo manual y la variabilidad entre redactores. Para ello se diseña una metodología reproducible sobre el dataset PTB-XL: preparación de datos con una única columna text (input clínico textualizado →report), ajuste fino de cuatro LLM biomédicos (BioGPT, BioMedLM, PMC-LLaMA y BioMistral-7B) y evaluación homogénea con BLEU, ROUGE y METEOR en un conjunto de prueba fijo. Los principales resultados muestran que la variante PMC-LLaMA (7B) con QLoRA/LoRA y plantilla instruccional“### Input / ### Report” ofrece el mejor rendimiento global, produciendo informes más fieles y concisos que las alternativas probadas. BioMistral-7B y BioGPT logran un desempeño intermedio; BioMedLM, en mi configuración, resulta más ver- boso y penalizado por métricas léxicas. Por tanto se concluye que, para recursos limitados de GPU, la combinación plantilla + LoRA/QLoRA es eficaz y viable. Como líneas futuras, propongo integrar un etiquetador multietiqua desde señal cruda (tipo “ECG-BERT” o CNN) para automatizar los hallazgos y reforzar la evaluación clínica con es- pecialistas, cerrando el ciclo señal →hallazgos →informe.