Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Detectores Basados en Anclas (Anchor-Based)

Descubra cómo los detectores basados en anclajes utilizan cuadros delimitadores predefinidos para la detección de objetos. Conozca sus mecanismos básicos, casos de uso en el mundo real y cómo se comparan con el moderno y más rápido Ultralytics .

Los detectores basados en anclajes son una clase fundamental de modelos de detección de objetos en la visión por computadora que utilizan un conjunto de cuadros delimitadores predefinidos para localizar y classify . En lugar de intentar predecir las coordenadas de un objeto partiendo de cero, estos sistemas comienzan con plantillas de referencia fijas conocidas como cuadros de anclaje. A continuación, se entrena la red neuronal para determinar cuál de estas plantillas se ajusta mejor a un objeto de la imagen y para calcular los desplazamientos específicos (ajustes en la posición y el tamaño) necesarios para alinear perfectamente el ancla con el objetivo. Este enfoque transforma el difícil problema de la predicción de coordenadas arbitrarias en una tarea de regresión más estable, lo que supuso un avance clave en el desarrollo de las primeras arquitecturas de aprendizaje profundo (DL) como Faster R-CNN y SSD.

Cómo funcionan los mecanismos basados en anclajes

La operación central de un detector basado en anclajes gira en torno a la división de la imagen de entrada en una cuadrícula densa. En cada celda de esta cuadrícula, el modelo genera múltiples cuadros de anclaje con diferentes escalas y relaciones de aspecto para tener en cuenta las diferentes formas de los objetos, como peatones altos o vehículos anchos. A medida que los datos de la imagen pasan por la columna vertebral del modelo , la red extrae características ricas para realizar dos tareas simultáneas:

  1. Clasificación: El modelo asigna una puntuación de probabilidad a cada ancla, prediciendo si contiene una clase específica de objeto (por ejemplo, «coche», «perro») o si es simplemente ruido de fondo.
  2. Regresión de caja: Para los anclajes identificados como contenedores de un objeto, la red predice factores de corrección para refinar el centro del anclaje. x, y coordenadas, anchura y altura, lo que da como resultado un ajuste perfecto. bounding box.

Durante el entrenamiento del modelo, estos detectores utilizan una métrica denominada Intersección sobre Unión (IoU) para hacer coincidir los anclajes predefinidos con las etiquetas de verdad fundamental proporcionadas en el conjunto de datos. Los anclajes con un alto solapamiento se tratan como muestras positivas. Dado que este proceso genera miles de detecciones potenciales, se aplica un algoritmo de filtrado conocido como supresión no máxima (NMS) durante la inferencia para eliminar las cajas redundantes y conservar solo la predicción más precisa para cada objeto.

Comparación con detectores sin anclaje

Aunque los métodos basados en anclajes establecieron el estándar durante años, el campo ha evolucionado hacia los detectores sin anclajes. Comprender la distinción es vital para los profesionales modernos.

  • Basados en anclajes: Modelos como YOLOv5 y el RetinaNet original se basan en la configuración manual o en algoritmos de agrupamiento como el agrupamiento k-means para determinar los mejores tamaños de anclaje para un conjunto de datos. Esto ofrece estabilidad, pero puede resultar rígido si los objetos varían mucho en forma.
  • Sin anclaje: Las arquitecturas modernas, incluida YOLO26, suelen eliminar por completo la etapa de anclaje. Predicen los centros y tamaños de los objetos directamente a partir de los píxeles del mapa de características, lo que reduce la sobrecarga computacional y simplifica la búsqueda de hiperparámetros. Este enfoque «de extremo a extremo» suele ser más rápido y fácil de entrenar con datos diversos.

Aplicaciones en el mundo real

La lógica basada en anclajes sigue siendo relevante en muchos sistemas de producción heredados y especializados en los que las formas de los objetos son predecibles y consistentes.

  • Monitorización del tráfico: En los sistemas de transporte inteligentes, las cámaras detect para gestionar el flujo o identificar infracciones. Dado que los coches y camiones tienen dimensiones estandarizadas, los modelos basados en anclajes pueden ajustarse con priores específicos para maximizar la precisión y la recuperación.
  • Automatización minorista: los sistemas de caja automáticos utilizan la visión por ordenador para identificar productos. Dado que los productos envasados, como las cajas de cereales, mantienen una relación de aspecto fija, los anclajes proporcionan una base sólida para la red, ayudándola a distinguir entre artículos de aspecto similar en una escena desordenada.

Ejemplo de aplicación

Si bien los últimos modelos YOLO26 utilizan cabezales sin anclajes para obtener un rendimiento superior, la interfaz para ejecutar la detección sigue siendo la misma. La Ultralytics y Python abstraen la complejidad de si un modelo utiliza anclajes o puntos centrales, lo que permite a los usuarios centrarse en los resultados.

A continuación se explica cómo cargar un modelo y ejecutar la inferencia para detect , un flujo de trabajo que se aplica independientemente de la arquitectura de anclaje subyacente:

from ultralytics import YOLO

# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the first result with bounding boxes
results[0].show()

Lecturas complementarias

Para profundizar en su comprensión de los mecanismos de detección, explore la investigación fundamental sobre Faster R-CNN, que introdujo la Red de Propuestas de Regiones (RPN), o lea sobre el Detector MultiBox de Disparo Único (SSD), que optimizó la detección basada en anclajes para aumentar la velocidad. Para obtener una visión más amplia del campo, el COCO sirve como referencia estándar para evaluar tanto los modelos basados en anclajes como los que no lo están. Además, los cursos avanzados de Coursera suelen cubrir los detalles matemáticos de la regresión de cajas y la coincidencia de anclajes.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora