%0 Thesis %A Arrabal Ruiz, Enrique Ángel %8 2025/11 %U https://hdl.handle.net/20.500.12880/13587 %X La conducción es una actividad realizada cotidianamente por muchas personas, y es una tarea repetitiva, compleja, y en muchos casos, peligrosa. Requiere un buen conocimiento de normas de tráfico, atención constante, y una capacidad de reacción y decisión rápida. Estas exigencias han impulsado el desarrollo de sistemas encargados de automatizar estas tareas y poder así liberar a los humanos de estas responsabilidades. El avance de la inteligencia artificial, especialmente de los modelos visuales de gran escala, o Large Vision Models (LVMs), ha abierto nuevas oportunidades en el contexto de los coches autónomos. En este Trabajo Fin de Máster se estudia el potencial de estos modelos en tareas como la detección de objetos en la carretera, concretamente vehículos típicos, evaluando así su rendimiento, precisión y aplicabilidad en escenarios reales. Este estudio se centra en algunos de los LVMs más relevantes actualmente, destacando su capacidad para interpretar imágenes en tiempo real. Se realiza una comparativa con otros enfoques de visión artificial, tanto tradicionales como actuales, resaltando ventajas y desafíos en escenarios reales. Además, se analizan las limitaciones relacionadas con la latencia y la precisión en la detección, así como la viabilidad de su implementación en plataformas reales. Los resultados obtenidos muestran un buen rendimiento en cuanto a precisión, tanto en la detección de objetos como en la descripción semántica de imágenes, considerando métricas clave como precision y recall. Sin embargo, para ambas tareas, la velocidad de procesamiento junto al tiempo de inferencia alcanzados por los modelos está aún muy lejos de los requisitos que demanda la conducción autónoma en tiempo real. El modelo más rápido solo ha sido capaz de alcanzar 12,64 FPS, muy lejos de los 30 demandados por la percepción visual. Estos hallazgos permiten valorar el potencial de los LVMs, pero también señalan claramente sus fuertes limitaciones en cuanto a tiempo de inferencia, sensibilidad a objetos pequeños y su elevada complejidad computacional en ciertos modelos. %T Aplicación de Large Vision Models en conducción autónoma: Detección de objetos y análisis de viabilidad %K Conducción Autónoma %K Modelos Visuales de Gran Escala (LVMs) %K Visión Artificial %~ END