Glosario

Arquitecturas de detección de objetos

Explora las arquitecturas de detección de objetos en IA con Ultralytics YOLOv8 . Descubre modelos de vanguardia que mejoran la visión en vehículos, asistencia sanitaria y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Las arquitecturas de detección de objetos son marcos o modelos diseñados para identificar y localizar objetos dentro de imágenes o vídeos. Estas arquitecturas desempeñan un papel fundamental en la visión por ordenador, un campo de la inteligencia artificial centrado en capacitar a las máquinas para interpretar y comprender la información visual. Se utilizan ampliamente en diversas aplicaciones, como vehículos autónomos, sanidad, seguridad, etc.

Comprender las arquitecturas de detección de objetos

Las arquitecturas de detección de objetos están especializadas en realizar dos tareas simultáneamente: clasificación de objetos (identificar qué es el objeto) y localización de objetos (determinar dónde está el objeto dentro de una imagen). Consiguen estas tareas aprovechando algoritmos avanzados, diseños de redes neuronales y conjuntos de datos significativos.

Modelos populares como R-CNN, Fast R-CNN y YOLO (You Only Look Once) han establecido puntos de referencia en la detección de objetos a lo largo de los años. Ultralytics YOLOv8, por ejemplo, proporciona un modelo de detección de objetos de vanguardia con velocidad en tiempo real y gran precisión.

Componentes clave

Redes neuronales convolucionales (CNN)

Las CNN son la columna vertebral de las arquitecturas de detección de objetos, utilizadas para extraer características de las imágenes. Al procesar datos de píxeles, las CNN pueden analizar eficazmente el contenido visual, lo que las hace esenciales para tareas de clasificación y detección.

Cajas delimitadoras

Un cuadro delimitador define la ubicación espacial de un objeto dentro de una imagen. Es un borde rectangular alrededor del objeto, que proporciona datos críticos para la localización del objeto. Más información sobre los recuadros delimitadores y sus aplicaciones.

Intersección sobre Unión (IOU)

IoU es una métrica utilizada para medir la precisión de los detectores de objetos comparando el solapamiento entre los cuadros delimitadores previstos y los reales. Para más información, explora el concepto de IoU.

Tipos de arquitecturas de detección de objetos

Detectores de una etapa

Los detectores de una etapa, como Ultralytics YOLOv8 , realizan la clasificación y la localización en una sola pasada por la red, lo que los hace más rápidos y adecuados para aplicaciones en tiempo real. Descubre más sobre los detectores de una etapa.

Detectores de dos etapas

Los detectores de dos etapas, como Faster R-CNN, primero generan propuestas de regiones y luego las clasifican en categorías de objetos. Suelen ofrecer mayor precisión, pero a menor velocidad. Lee sobre los detectores de dos etapas para comprenderlos mejor.

Aplicaciones en IA y ML

Vehículos autónomos

En el ámbito de los coches autoconducidos, las arquitecturas de detección de objetos ayudan a identificar peatones, vehículos, señales de tráfico y otros objetos, mejorando la navegación y la seguridad. Descubre cómo la IA está transformando la tecnología de autoconducción.

Sanidad

En sanidad, estos modelos ayudan en el análisis de imágenes médicas, mejorando el diagnóstico y la planificación del tratamiento mediante la detección de anomalías o características específicas en las exploraciones. Más información sobre el impacto de la IA en la sanidad.

Retos y orientaciones futuras

A pesar de los avances, las arquitecturas de detección de objetos se enfrentan a retos como la oclusión, las diferentes escalas de los objetos y las diversas apariencias de los objetos. Los investigadores siguen innovando, desarrollando modelos más robustos y eficientes. Técnicas como la detección sin anclaje están ganando adeptos, simplificando el proceso de detección y mejorando la velocidad. Profundiza en los detectores sin anclaje.

Conclusión

Las arquitecturas de detección de objetos son cruciales para el avance de las aplicaciones de aprendizaje automático, convirtiendo los datos visuales en perspectivas procesables. Con innovaciones continuas y modelos como Ultralytics YOLO que amplían los límites, el alcance de estas arquitecturas sigue ampliándose en diversos sectores. Explora la misión deUltralytics de potenciar las soluciones de IA y cómo están dando forma al futuro de la visión por ordenador.

Leer todo