Show simple item record

dc.contributor.advisorDíaz Vico, David
dc.contributor.authorValderrama Martínez, Julio
dc.date.accessioned2025-12-23T12:42:57Z
dc.date.available2025-12-23T12:42:57Z
dc.date.issued2025/10
dc.identifier.citationValderrama Martínez, J. (2025). Evaluación comparativa de modelos OCR y LLMS para el procesamiento inteligente de facturas escaneadas. [Trabajo Fin de Estudios, Universidad Europea de Madrid]. Repositorio de Trabajos Fin de Estudios TITULAes
dc.identifier.urihttps://hdl.handle.net/20.500.12880/13613
dc.description.abstractLa digitalización de documentos ha incrementado la necesidad de automatizar el procesamiento de facturas de suministros (electricidad, agua y gas), tradicionalmente gestionadas de forma manual con riesgo de errores, altos costes y tiempos prolongados. Este Trabajo Fin de Máster aborda este reto mediante el diseño, implementación y evaluación de un sistema automatizado que combina técnicas de Reconocimiento Óptico de Caracteres (OCR) con modelos de lenguaje multimodales de última generación (LLMs), integrados en una arquitectura basada en microservicios y orquestada con n8n y PostgreSQL. El proyecto siguió un enfoque experimental y comparativo, evaluando modelos líderes como GPT-4o, Gemini 2.5 Flash y Claude Sonnet 4, junto con soluciones comerciales como Azure AI Document Intelligence. El sistema incorpora un flujo completo: ingesta automática de facturas desde Google Drive, preprocesamiento condicional (PDF a imagen), extracción estructurada mediante prompts diseñados con precisión y almacenamiento en base de datos relacional. Un aporte clave es el microservicio ocr-evaluator, que permite calcular métricas de desempeño (precisión, recall y F1-score) e indicadores de coste y eficiencia temporal, contrastando automáticamente los resultados con un ground truth curado manualmente. Los experimentos muestran que la combinación de OCR y LLMs supera ampliamente a los métodos tradicionales, logrando más del 95 % de precisión en campos críticos y reduciendo significativamente la intervención manual. Asimismo, se demostró que el diseño del prompt influye directamente en la obediencia del modelo y en la calidad de la extracción. En conclusión, la solución propuesta no solo mejora la eficiencia y reduce errores humanos, sino que también establece un marco reproducible para la evaluación objetiva de tecnologías OCR/LLM, ofreciendo criterios sólidos para la toma de decisiones en entornos empresariales.es
dc.language.isospaes
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacionales
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/es
dc.titleEvaluación comparativa de modelos OCR y LLMS para el procesamiento inteligente de facturas escaneadases
dc.typeTFMes
dc.description.affiliationUniversidad Europea de Madrides
dc.description.degreeMáster Universitario en Análisis de Datos Masivoses
dc.rights.accessRightsopenAccesses
dc.subject.keywordOCRes
dc.subject.keywordLLMses
dc.subject.keywordIngeniería de promptses
dc.subject.keywordExtracción de informaciónes
dc.subject.keywordAutomatización documentales
dc.description.methodologyVirtual


Files in this item

ADOBE PDF

This item appears in the following Collection(s)

Show simple item record