• español
    • English
    • español
    • English
    JavaScript is disabled for your browser. Some features of this site may not work without it.
    View Item 
    •   TITULA home
    • Universidad Europea de Madrid
    • Escuela de Arquitectura, Ingeniería y Diseño
    • Máster
    • View Item
    •   TITULA home
    • Universidad Europea de Madrid
    • Escuela de Arquitectura, Ingeniería y Diseño
    • Máster
    • View Item

    Sistema inteligente de búsqueda y coincidencia basado en Vector Stores

    Author/s: Buitrago Roa, Lina Marcela
    Advisor/s: Coca López, Nicolás
    Keyword/s: Búsqueda híbrida; Pgvector; RAG-to-SQL; Recuperación multimodal
    Degree: Máster Universitario en Análisis de Datos Masivos
    Date of defense: 2025/10
    Type of content: TFM
    URI: https://hdl.handle.net/20.500.12880/13618
    Abstract:
    Esta tesis aborda la brecha que impide a las PYMEs acceder a búsqueda semántica y multimodal de nivel empresarial. Se propone y valida una arquitectura de referencia open-source basada en PostgreSQL + pgvector que integra búsqueda léxica (BM25), vectorial (HNSW), fusión por RRF y RAG-to-SQL orquestado con LangChain. Se emplean embeddings de texto (E5, JE3,GTE) e imagen (CLIP) y se evalúa el sistema sobre una muestra operativa (≈15.000 ítems) del dataset FooDI-ML, utilizando etiquetas estructurales como proxy de relevancia. El plan de evaluación combina métricas proxy-based (1-NN, Silhouette, ARI/NMI, Label Consistency@K), multimodales (Recall@K, MRR, separación de pares) y de búsqueda híbrida (Hybrid Recall y Filter-Separation). Los resultados muestran que E5 ofrece mejor estructura local y Recall@K con filtros, mientras que GTE/JE3 aportan mayor separación útil para re-ranking. En multimodal, la dirección imagen-texto supera a texto-imagen. La solución opera en CPU en tiempo real (la GPU se limita al backfill offline), manteniendo costes bajos. Se concluye que la arquitectura propuesta es técnica y económicamente viable para PYMEs y se aporta una “receta” operativa (candidatos híbridos,fusión RRF, re-ranking ligero, multimodal, RAG-to-SQL), junto con líneas futuras.
    Export: Exportar a MendeleyExportar a RefWorksExportar a EndNoteExportar a RISExportar a BibTeX
    Show full item record

    Files in this item

    ADOBE PDF
    Name: TFM_Lina_Marcela_Buitrago_Roa.pdf
    Size: 1.572Mb
    Format: PDF
    Type of content: TFM

    Collections

    • Máster
    Attribution-NonCommercial-NoDerivatives 4.0 InternacionalExcept where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional

    TITULA. Repositorio de Proyectos Fin de titulación

    © Universidad Europea de Madrid - Universidad privada | email: titula_rep@universidadeuropea.es | All rights reserved

     

     

    Browse

    All of TITULACommunities and collectionsAuthors and advisorsTitlesKeywordsDegreesThis CollectionAuthors and advisorsTitlesKeywordsDegrees

    Information And Help

    Frequently Asked QuestionsSearch projectsContact

    TITULA. Repositorio de Proyectos Fin de titulación

    © Universidad Europea de Madrid - Universidad privada | email: titula_rep@universidadeuropea.es | All rights reserved