Descubre cómo los detectores basados en anclas revolucionan la detección de objetos con una localización precisa, adaptabilidad a la escala y aplicaciones en el mundo real.
Los detectores basados en anclas son un tipo de modelo de detección de objetos utilizado habitualmente en visión por ordenador. Utilizan recuadros predefinidos, conocidos como "anclas", para predecir las ubicaciones y clases de objetos dentro de una imagen. Estas anclas actúan como puntos de referencia, ayudando al modelo a generar propuestas de objetos potenciales. Son especialmente eficaces para identificar objetos de distintos tamaños y formas, lo que las convierte en una opción popular en muchas arquitecturas de detección de objetos.
Los detectores basados en anclajes funcionan utilizando una rejilla de cajas de anclaje con diferentes escalas y relaciones de aspecto que se deslizan por la imagen. Estas cajas de anclaje se colocan estratégicamente para cubrir una amplia gama de posibles tamaños y formas de objetos. Durante el proceso de entrenamiento, el modelo aprende a clasificar cada caja de anclaje como conteniendo un objeto o sólo fondo. También refina la posición de estas cajas de anclaje para detectar objetos con precisión. Este refinamiento consiste en ajustar las dimensiones y la posición de los recuadros de anclaje para que coincidan mejor con el recuadro delimitador real del objeto. El resultado final es un conjunto de cuadros delimitadores, cada uno con una etiqueta de clase y una puntuación de confianza correspondientes, que indican la probabilidad de que haya un objeto.
Para los usuarios familiarizados con los conceptos básicos del aprendizaje automático, imagina que buscas distintos tipos de vehículos en un gran aparcamiento. En lugar de escanear aleatoriamente toda la zona, utilizas áreas de búsqueda predefinidas (anclas) de distintos tamaños y formas: pequeñas para motos, medianas para coches y grandes para autobuses. Desplaza estas áreas de búsqueda por el aparcamiento, comprobando en cada una de ellas si contiene un vehículo. Si un área de búsqueda coincide con un vehículo, ajustas su tamaño y posición para que se adapte perfectamente al vehículo. Este método te ayuda a localizar con rapidez y precisión todos los vehículos del aparcamiento.
Los detectores basados en anclajes ofrecen varias ventajas que los hacen adecuados para una amplia gama de aplicaciones:
Aunque los detectores basados en anclas son eficaces, tienen algunas limitaciones en comparación con los detectores sin anclas. Los detectores sin anclas predicen la ubicación de los objetos directamente, sin utilizar cajas de anclaje predefinidas. He aquí algunas diferencias clave:
Para más información sobre las ventajas de la detección sin anclaje, puedes consultar el artículo sobre las ventajas de Ultralytics YOLO11 como detector sin anclaje.
Los detectores basados en anclas se utilizan mucho en diversos sectores debido a su robustez y adaptabilidad. Son especialmente eficaces en escenarios en los que los objetos pueden aparecer a diferentes escalas y relaciones de aspecto. He aquí dos ejemplos concretos de aplicaciones en el mundo real:
Varios modelos populares de detección de objetos utilizan enfoques basados en anclajes. Las versiones anteriores de la familia Ultralytics YOLO como YOLOv4, son detectores basados en anclas muy conocidos. Otros modelos notables son Faster R-CNN, que introdujo el concepto de Red de Propuesta de Regiones (RPN) para generar propuestas de regiones utilizando anclas, y Single Shot MultiBox Detector (SSD)(fuente), que utiliza múltiples mapas de características a diferentes escalas para detectar objetos. Estos modelos han establecido puntos de referencia en el campo de la detección de objetos y siguen influyendo en el desarrollo de nuevas arquitecturas.