Aplicación de LLM para la interpretación de señales biomédicas
Author/s: Clavijo Mojica, Mario Alfonso
Advisor/s: Gil Ruiz, Jesús
Date of defense: 2025/11
Type of content:
TFM
Abstract:
Este proyecto aborda la generación automática de informes de electrocardiograma (ECG)
combinando modelos de lenguaje de gran tamaño (LLM) con datos públicos. Se parte del
problema práctico de transformar hallazgos de ECG en descripciones clínicas coherentes y
estandarizadas, reduciendo el esfuerzo manual y la variabilidad entre redactores. Para ello
se diseña una metodología reproducible sobre el dataset PTB-XL: preparación de datos con
una única columna text (input clínico textualizado →report), ajuste fino de cuatro LLM
biomédicos (BioGPT, BioMedLM, PMC-LLaMA y BioMistral-7B) y evaluación homogénea con
BLEU, ROUGE y METEOR en un conjunto de prueba fijo.
Los principales resultados muestran que la variante PMC-LLaMA (7B) con QLoRA/LoRA
y plantilla instruccional“### Input / ### Report” ofrece el mejor rendimiento global,
produciendo informes más fieles y concisos que las alternativas probadas. BioMistral-7B y
BioGPT logran un desempeño intermedio; BioMedLM, en mi configuración, resulta más ver-
boso y penalizado por métricas léxicas. Por tanto se concluye que, para recursos limitados
de GPU, la combinación plantilla + LoRA/QLoRA es eficaz y viable.
Como líneas futuras, propongo integrar un etiquetador multietiqua desde señal cruda (tipo
“ECG-BERT” o CNN) para automatizar los hallazgos y reforzar la evaluación clínica con es-
pecialistas, cerrando el ciclo señal →hallazgos →informe.
Files in this item
Size: 965.7Kb
Format: PDF
Type of content:
TFM






