| dc.contributor.advisor | Díaz Vico, David | |
| dc.contributor.author | Valderrama Martínez, Julio | |
| dc.date.accessioned | 2025-12-23T12:42:57Z | |
| dc.date.available | 2025-12-23T12:42:57Z | |
| dc.date.issued | 2025/10 | |
| dc.identifier.citation | Valderrama Martínez, J. (2025). Evaluación comparativa de modelos OCR y LLMS para el procesamiento inteligente de facturas escaneadas. [Trabajo Fin de Estudios, Universidad Europea de Madrid]. Repositorio de Trabajos Fin de Estudios TITULA | es |
| dc.identifier.uri | https://hdl.handle.net/20.500.12880/13613 | |
| dc.description.abstract | La digitalización de documentos ha incrementado la necesidad de automatizar el procesamiento de facturas de suministros (electricidad, agua y gas), tradicionalmente gestionadas de
forma manual con riesgo de errores, altos costes y tiempos prolongados. Este Trabajo Fin
de Máster aborda este reto mediante el diseño, implementación y evaluación de un sistema
automatizado que combina técnicas de Reconocimiento Óptico de Caracteres (OCR) con modelos de lenguaje multimodales de última generación (LLMs), integrados en una arquitectura
basada en microservicios y orquestada con n8n y PostgreSQL.
El proyecto siguió un enfoque experimental y comparativo, evaluando modelos líderes como
GPT-4o, Gemini 2.5 Flash y Claude Sonnet 4, junto con soluciones comerciales como Azure AI Document Intelligence. El sistema incorpora un flujo completo: ingesta automática de
facturas desde Google Drive, preprocesamiento condicional (PDF a imagen), extracción estructurada mediante prompts diseñados con precisión y almacenamiento en base de datos
relacional.
Un aporte clave es el microservicio ocr-evaluator, que permite calcular métricas de desempeño (precisión, recall y F1-score) e indicadores de coste y eficiencia temporal, contrastando
automáticamente los resultados con un ground truth curado manualmente. Los experimentos
muestran que la combinación de OCR y LLMs supera ampliamente a los métodos tradicionales, logrando más del 95 % de precisión en campos críticos y reduciendo significativamente
la intervención manual. Asimismo, se demostró que el diseño del prompt influye directamente
en la obediencia del modelo y en la calidad de la extracción.
En conclusión, la solución propuesta no solo mejora la eficiencia y reduce errores humanos,
sino que también establece un marco reproducible para la evaluación objetiva de tecnologías
OCR/LLM, ofreciendo criterios sólidos para la toma de decisiones en entornos empresariales. | es |
| dc.language.iso | spa | es |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | es |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | es |
| dc.title | Evaluación comparativa de modelos OCR y LLMS para el procesamiento inteligente de facturas escaneadas | es |
| dc.type | TFM | es |
| dc.description.affiliation | Universidad Europea de Madrid | es |
| dc.description.degree | Máster Universitario en Análisis de Datos Masivos | es |
| dc.rights.accessRights | openAccess | es |
| dc.subject.keyword | OCR | es |
| dc.subject.keyword | LLMs | es |
| dc.subject.keyword | Ingeniería de prompts | es |
| dc.subject.keyword | Extracción de información | es |
| dc.subject.keyword | Automatización documental | es |
| dc.description.methodology | Virtual | |