Mostrar el registro sencillo del ítem
Sistema inteligente de búsqueda y coincidencia basado en Vector Stores
| dc.contributor.advisor | Coca López, Nicolás | |
| dc.contributor.author | Buitrago Roa, Lina Marcela | |
| dc.date.accessioned | 2025-12-23T12:43:42Z | |
| dc.date.available | 2025-12-23T12:43:42Z | |
| dc.date.issued | 2025/10 | |
| dc.identifier.citation | Buitrago Roa, L. M. (2025). Sistema inteligente de búsqueda y coincidencia basado en Vector Stores. [Trabajo Fin de Estudios, Universidad Europea de Madrid]. Repositorio de Trabajos Fin de Estudios TITULA | es |
| dc.identifier.uri | https://hdl.handle.net/20.500.12880/13618 | |
| dc.description.abstract | Esta tesis aborda la brecha que impide a las PYMEs acceder a búsqueda semántica y multimodal de nivel empresarial. Se propone y valida una arquitectura de referencia open-source basada en PostgreSQL + pgvector que integra búsqueda léxica (BM25), vectorial (HNSW), fusión por RRF y RAG-to-SQL orquestado con LangChain. Se emplean embeddings de texto (E5, JE3,GTE) e imagen (CLIP) y se evalúa el sistema sobre una muestra operativa (≈15.000 ítems) del dataset FooDI-ML, utilizando etiquetas estructurales como proxy de relevancia. El plan de evaluación combina métricas proxy-based (1-NN, Silhouette, ARI/NMI, Label Consistency@K), multimodales (Recall@K, MRR, separación de pares) y de búsqueda híbrida (Hybrid Recall y Filter-Separation). Los resultados muestran que E5 ofrece mejor estructura local y Recall@K con filtros, mientras que GTE/JE3 aportan mayor separación útil para re-ranking. En multimodal, la dirección imagen-texto supera a texto-imagen. La solución opera en CPU en tiempo real (la GPU se limita al backfill offline), manteniendo costes bajos. Se concluye que la arquitectura propuesta es técnica y económicamente viable para PYMEs y se aporta una “receta” operativa (candidatos híbridos,fusión RRF, re-ranking ligero, multimodal, RAG-to-SQL), junto con líneas futuras. | es |
| dc.language.iso | spa | es |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | es |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | es |
| dc.title | Sistema inteligente de búsqueda y coincidencia basado en Vector Stores | es |
| dc.type | TFM | es |
| dc.description.affiliation | Universidad Europea de Madrid | es |
| dc.description.degree | Máster Universitario en Análisis de Datos Masivos | es |
| dc.rights.accessRights | openAccess | es |
| dc.subject.keyword | Búsqueda híbrida | es |
| dc.subject.keyword | Pgvector | es |
| dc.subject.keyword | RAG-to-SQL | es |
| dc.subject.keyword | Recuperación multimodal | es |
| dc.description.methodology | Virtual |
