Glosario

Detectores de objetos de dos etapas

Aprende cómo los detectores de objetos en dos etapas consiguen una gran precisión en la detección de objetos con propuestas de región, clasificación y refinamiento de la caja delimitadora.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Los detectores de objetos en dos etapas son una categoría de modelos de detección de objetos en visión por ordenador que realizan el proceso de detección en dos etapas distintas. Inicialmente, estos modelos generan un conjunto de propuestas de regiones, que son zonas potenciales de la imagen donde podrían localizarse objetos. Posteriormente, clasifican cada región propuesta y refinan las coordenadas de su cuadro delimitador para identificar y localizar con precisión los objetos. Este enfoque en dos pasos permite una mayor precisión en las tareas de detección de objetos, especialmente en escenarios complejos en los que los objetos pueden variar en escala, orientación y apariencia.

Cómo funcionan los detectores de objetos de dos etapas

El funcionamiento de los detectores de objetos de dos etapas puede dividirse en dos fases principales: propuesta de regiones y clasificación de regiones.

Propuesta de región: En la primera etapa, el modelo identifica las posibles ubicaciones de los objetos dentro de una imagen. Para ello se suelen utilizar algoritmos como la Búsqueda Selectiva o, más recientemente, las Redes de Propuesta de Región (RPN). Las RPN son un tipo de red neuronal que escanea la imagen para identificar áreas susceptibles de contener objetos, generando recuadros delimitadores alrededor de esas áreas.

Clasificación de las regiones: La segunda etapa consiste en clasificar los objetos dentro de las regiones propuestas y ajustar los recuadros delimitadores para conseguir un ajuste más preciso. Cada región propuesta se hace pasar por una red neuronal convolucional (CNN ) para extraer características, que luego se utilizan para clasificar el objeto y refinar las coordenadas del cuadro delimitador. Esta etapa garantiza que cada objeto detectado se etiquete y localice con precisión dentro de la imagen.

Componentes y técnicas clave

Varios componentes y técnicas clave forman parte integrante del funcionamiento de los detectores de objetos de dos etapas:

Redes de Propuestas Regionales (RPN): Las RPN son cruciales para generar eficazmente propuestas de regiones de alta calidad. Funcionan deslizando una pequeña red sobre el mapa de características generado por una CNN, prediciendo la probabilidad de que haya un objeto en cada ubicación y sugiriendo ajustes del cuadro delimitador.

Extracción de características: La extracción de características implica utilizar una CNN, como ResNet o VGG, para extraer características significativas de las regiones propuestas. Estos rasgos son esenciales para las tareas posteriores de clasificación y regresión de la caja delimitadora.

Regresión del cuadro delimitador: Tras clasificar el objeto dentro de una región propuesta, se utiliza la regresión del cuadro delimitador para afinar las coordenadas del cuadro delimitador, asegurando un ajuste preciso alrededor del objeto detectado.

Comparación con detectores de objetos de una etapa

Los detectores de objetos de dos etapas suelen compararse con los detectores de objetos de una etapa, como Ultralytics YOLO (You Only Look Once). Mientras que los detectores de una etapa realizan la detección de objetos en una sola pasada por la red, lo que los hace más rápidos y más adecuados para aplicaciones en tiempo real, los detectores de dos etapas suelen ofrecer mayor precisión debido a su proceso en dos etapas.

Precisión: Los detectores de dos etapas suelen lograr una mayor precisión porque la segunda etapa permite un análisis detallado y el refinamiento de cada región propuesta. Esto es especialmente beneficioso en escenarios con objetos superpuestos o fondos complejos.

La velocidad: Los detectores de una etapa como Ultralytics YOLO son más rápidos porque procesan toda la imagen en una sola pasada hacia delante. Los detectores de dos etapas, aunque son más precisos, son más lentos debido al paso adicional de procesar cada propuesta de región por separado.

Aplicaciones en el mundo real

Los detectores de objetos de dos etapas se utilizan en diversas aplicaciones del mundo real en las que es primordial una gran precisión:

Vehículos autónomos: En los coches autónomos, la detección precisa de peatones, vehículos y otros objetos es fundamental para una navegación segura. Los detectores de dos etapas ayudan a garantizar que todos los peligros potenciales se identifiquen y localicen con precisión. Más información sobre el uso de la IA en la tecnología de conducción autónoma.

Imágenes médicas: En sanidad, los detectores de dos etapas se utilizan para analizar imágenes médicas, como radiografías y resonancias magnéticas, para detectar anomalías como tumores o fracturas. La gran precisión de estos detectores es crucial para un diagnóstico y una planificación del tratamiento fiables. Más información sobre IA y radiología.

Modelos populares de detección de objetos en dos etapas

Se han desarrollado varios modelos influyentes basados en el marco de detección en dos fases:

R-CNN (Regiones con características CNN): Uno de los modelos pioneros en esta categoría, R-CNN utiliza la Búsqueda Selectiva para generar propuestas de regiones y una CNN para clasificar cada región.

R-CNN rápida: Una mejora sobre la R-CNN, la R-CNN rápida procesa toda la imagen a través de la CNN una vez y luego extrae características para cada propuesta de región, acelerando significativamente el proceso.

R-CNN más rápida: Este modelo introduce la Red de Propuesta de Regiones (RPN), que integra la generación de propuestas de regiones con la red de detección, mejorando aún más tanto la velocidad como la precisión.

Para más detalles sobre arquitecturas específicas de detección de objetos, puedes consultar recursos como la página de Wikipedia sobre detección de objetos.

Leer todo