Glosario

Detección de objetos

Explora los fundamentos de la detección de objetos. Descubre cómo Ultralytics identifica y localiza objetos en tiempo real con una velocidad y precisión sin igual.

La detección de objetos es una tecnología fundamental en el campo de la visión artificial (CV) que permite a los sistemas informáticos identificar y localizar elementos específicos dentro de los datos visuales. A diferencia de las tareas más simples de clasificación de imágenes, que asignan una única etiqueta a toda una imagen, la detección de objetos proporciona una comprensión granular al predecir simultáneamente la clase de un objeto (por ejemplo, «persona», «coche», «perro») y su ubicación espacial. Esta ubicación se representa normalmente mediante un cuadro delimitador rectangular que abarca el objeto, acompañado de una puntuación de confianza que indica la certeza del modelo. Esta doble capacidad —reconocimiento más localización— sirve de base sensorial para las aplicaciones modernas de inteligencia artificial (IA) , lo que permite a las máquinas interactuar de forma significativa con su entorno.

La mecánica de la detección

Los detectores modernos dependen en gran medida de las arquitecturas de aprendizaje profundo (DL), concretamente de las redes neuronales convolucionales (CNN), para extraer características complejas de las imágenes de entrada. El proceso comienza con una fase de entrenamiento, en la que un modelo aprende a reconocer patrones utilizando colecciones masivas y etiquetadas, como el COCO . Durante esta fase, el algoritmo optimiza los pesos de su modelo para minimizar los errores de predicción .

Cuando el modelo se implementa para la inferencia, escanea nuevas imágenes para proponer posibles objetos. A continuación, los algoritmos avanzados aplican la supresión no máxima (NMS) para filtrar las detecciones duplicadas, lo que garantiza que cada entidad distinta se resalte solo una vez. La precisión de estas predicciones se evalúa a menudo utilizando la métrica de intersección sobre unión (IoU), que mide la superposición entre el cuadro predicho y la verdad fundamental. Los avances recientes han dado lugar a arquitecturas integrales como YOLO26, que optimizan este proceso para ofrecer una velocidad excepcional y capacidades de inferencia en tiempo real en dispositivos periféricos .

Diferenciación de términos clave

Es fundamental distinguir la detección de objetos de conceptos relacionados para elegir la herramienta adecuada para un proyecto:

Detección de objetos frente a clasificación de imágenes: mientras que la clasificación de imágenes responde a la pregunta «¿Qué hay en esta imagen?», la detección de objetos responde a la pregunta «¿Qué hay y dónde?».
Detección de objetos frente a segmentación de instancias: la detección dibuja un recuadro alrededor de un elemento. Por el contrario, la segmentación de instancias identifica el contorno exacto (máscara) de cada objeto con precisión de píxeles.
Detección de objetos frente a seguimiento de objetos: la detección encuentra objetos en un solo fotograma. El seguimiento de objetos conecta estas detecciones a lo largo de una secuencia de vídeo para supervisar el movimiento a lo largo del tiempo.

Aplicaciones en el mundo real

La versatilidad de la detección de objetos impulsa la innovación en las principales industrias. En el sector automovilístico, la IA de los vehículos autónomos depende fundamentalmente de modelos de detección para identificar peatones, señales de tráfico y otros vehículos al instante y poder circular con seguridad. Al procesar las imágenes de vídeo de las cámaras a bordo, estos sistemas toman decisiones en fracciones de segundo que evitan accidentes.

Otro caso de uso destacado se encuentra en la IA en el sector minorista. Los sistemas de caja automáticos y los robots inteligentes de gestión de inventario utilizan la detección de objetos para escanear estanterías, reconocer productos y detect faltas detect o artículos mal colocados. Esta automatización agiliza las cadenas de suministro y mejora la experiencia del cliente al garantizar que los productos estén siempre disponibles.