Aplicación de LLM para la interpretación de señales biomédicas
Autor/es: Clavijo Mojica, Mario Alfonso
Director/es: Gil Ruiz, Jesús
Fecha de defensa: 2025/11
Tipo de contenido:
TFM
Resumen:
Este proyecto aborda la generación automática de informes de electrocardiograma (ECG)
combinando modelos de lenguaje de gran tamaño (LLM) con datos públicos. Se parte del
problema práctico de transformar hallazgos de ECG en descripciones clínicas coherentes y
estandarizadas, reduciendo el esfuerzo manual y la variabilidad entre redactores. Para ello
se diseña una metodología reproducible sobre el dataset PTB-XL: preparación de datos con
una única columna text (input clínico textualizado →report), ajuste fino de cuatro LLM
biomédicos (BioGPT, BioMedLM, PMC-LLaMA y BioMistral-7B) y evaluación homogénea con
BLEU, ROUGE y METEOR en un conjunto de prueba fijo.
Los principales resultados muestran que la variante PMC-LLaMA (7B) con QLoRA/LoRA
y plantilla instruccional“### Input / ### Report” ofrece el mejor rendimiento global,
produciendo informes más fieles y concisos que las alternativas probadas. BioMistral-7B y
BioGPT logran un desempeño intermedio; BioMedLM, en mi configuración, resulta más ver-
boso y penalizado por métricas léxicas. Por tanto se concluye que, para recursos limitados
de GPU, la combinación plantilla + LoRA/QLoRA es eficaz y viable.
Como líneas futuras, propongo integrar un etiquetador multietiqua desde señal cruda (tipo
“ECG-BERT” o CNN) para automatizar los hallazgos y reforzar la evaluación clínica con es-
pecialistas, cerrando el ciclo señal →hallazgos →informe.
Ficheros en el ítem
Tamaño: 965.7Kb
Formato: PDF
Tipo de contenido:
TFM






