Glosario

Arquitecturas de detección de objetos

Descubre el poder de las arquitecturas de detección de objetos, la columna vertebral de la IA para la comprensión de imágenes. ¡Aprende tipos, herramientas y aplicaciones reales hoy mismo!

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Las arquitecturas de detección de objetos son las estructuras fundamentales en las que se basa la forma en que los sistemas de inteligencia artificial (IA ) interpretan la información visual. Estas redes neuronales especializadas están diseñadas no sólo para clasificar objetos dentro de una imagen (identificando lo que está presente), sino también para localizarlos con precisión, normalmente dibujando recuadros delimitadores alrededor de cada instancia detectada. Para quienes estén familiarizados con los conceptos básicos del aprendizaje automático (AM), comprender estas arquitecturas es crucial para aprovechar las capacidades de la visión por ordenador (VC) moderna. Constituyen la columna vertebral de los sistemas que permiten a las máquinas "ver" y comprender el mundo de forma similar a los humanos.

Componentes básicos

La mayoría de las arquitecturas de detección de objetos constan de varios componentes clave que trabajan juntos. Una red troncal, a menudo una Red Neuronal Convolucional (CNN), realiza la extracción inicial de características de la imagen de entrada, identificando patrones de bajo nivel como bordes y texturas, y características progresivamente más complejas. A menudo le sigue un componente de "cuello", que agrega características de diferentes etapas de la red troncal para crear representaciones más ricas, adecuadas para detectar objetos a varias escalas, un concepto detallado en recursos como el documento Feature Pyramid Network. Por último, la cabeza de detección utiliza estas características para predecir la clase y la ubicación (coordenadas de la caja delimitadora) de los objetos. El rendimiento suele medirse utilizando métricas como la Intersección sobre la Unión (IoU) para evaluar la precisión de la localización y la Precisión Media Media (mAP) para la calidad general de la detección, con explicaciones detalladas disponibles en sitios como la página de evaluación del conjunto de datos COCO.

Tipos de arquitecturas

Las arquitecturas de detección de objetos se clasifican a grandes rasgos en función de su enfoque:

Distinción de términos similares

Es importante diferenciar las arquitecturas de detección de objetos de las tareas de visión por ordenador relacionadas:

Aplicaciones en el mundo real

Las arquitecturas de detección de objetos impulsan numerosas aplicaciones de IA en diversos sectores:

Herramientas y tecnologías

Desarrollar y desplegar modelos basados en estas arquitecturas suele implicar herramientas y marcos especializados:

Leer todo