Glosario

Detectores de objetos de dos etapas

Descubre la potencia de los detectores de objetos de dos etapas: soluciones centradas en la precisión para la detección precisa de objetos en tareas complejas de visión por ordenador.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Los detectores de objetos en dos etapas representan una categoría de arquitecturas de detección de objetos en visión por ordenador que priorizan la precisión dividiendo el proceso de detección en dos etapas distintas. Estos detectores están diseñados para identificar primero las regiones de interés dentro de una imagen en las que podría haber objetos y, a continuación, en la segunda etapa, clasificar los objetos dentro de estas regiones y refinar sus ubicaciones. Este enfoque metódico permite un análisis más detallado de cada objeto potencial, lo que conduce a una mayor precisión en la detección, especialmente en escenarios complejos.

Visión general

Los detectores de dos etapas son una piedra angular en la evolución de la detección de objetos, ya que ofrecen un marco sólido para identificar y localizar objetos en imágenes. A diferencia de sus homólogos, los detectores de una etapa, hacen hincapié en la precisión por encima de la velocidad, realizando la detección de objetos de forma secuencial. Esto implica una etapa inicial de propuesta, en la que se identifican las ubicaciones potenciales de los objetos, seguida de una etapa de refinamiento, en la que estas propuestas se clasifican y localizan con precisión. Este meticuloso proceso permite a los detectores de dos etapas alcanzar una precisión de vanguardia en diversas tareas de visión por ordenador.

Cómo funcionan los detectores de dos etapas

El funcionamiento de los detectores de dos etapas puede dividirse en dos fases principales:

  • Propuesta de Región: En la primera etapa, la arquitectura genera un conjunto de cuadros delimitadores candidatos que probablemente contengan objetos. Para ello se suelen utilizar algoritmos como la Búsqueda Selectiva o las Redes de Propuesta de Regiones (RPN). Estos métodos escanean eficazmente la imagen y proponen regiones que merecen un examen más detallado.
  • Clasificación y Localización de Objetos: La segunda etapa refina las propuestas de la primera etapa. Cada región propuesta se hace pasar por una Red Neuronal Convolucional (CNN ) para clasificar el objeto que contiene y ajustar el cuadro delimitador para una localización más precisa. Esta etapa se beneficia de la concentración de los recursos informáticos en las regiones propuestas, lo que permite una clasificación y una regresión del cuadro delimitador más precisas.

Este proceso en dos pasos permite al modelo dedicar recursos tanto a identificar objetos potenciales como a clasificarlos y localizarlos con precisión, lo que contribuye a su gran precisión.

Ventajas y desventajas

Los detectores de dos etapas ofrecen varias ventajas, principalmente en cuanto a la precisión de la detección. Al dedicar etapas separadas a la propuesta de regiones y a la clasificación de objetos, estos modelos pueden alcanzar un mayor nivel de detalle y conocimiento del contexto. Sin embargo, esta precisión tiene sus contrapartidas:

Ventajas:

  • Alta precisión: El proceso en dos fases suele conducir a una detección de objetos más precisa, sobre todo en escenarios con objetos superpuestos o pequeños.
  • Localización precisa: La etapa de refinamiento permite una colocación más precisa del cuadro delimitador alrededor de los objetos detectados.
  • Eficaces en escenas complejas: Manejan mejor las escenas complejas y las oclusiones gracias al análisis detallado de la segunda etapa.

Desventajas:

  • Menor velocidad de inferencia: La naturaleza secuencial de la detección en dos etapas hace que sean más lentas en comparación con los detectores de una etapa, lo que puede ser una limitación para las aplicaciones en tiempo real.
  • Intensidad computacional: La necesidad de procesar las propuestas de regiones y luego clasificarlas hace que los detectores de dos etapas sean más caros computacionalmente.
  • Complejidad: La arquitectura y el proceso de formación pueden ser más complejos que las alternativas de una sola etapa.

Aplicaciones en el mundo real

A pesar de sus exigencias computacionales, la gran precisión de los detectores de dos etapas los hace inestimables en aplicaciones en las que la precisión es primordial:

  • Análisis de imágenes médicas: En el análisis de imágenes médicas, la detección precisa de anomalías como tumores es fundamental. Los detectores de dos etapas se emplean por su capacidad para localizar y clasificar con precisión anomalías sutiles en exploraciones médicas, ayudando al diagnóstico y la planificación del tratamiento. Por ejemplo, pueden usarse para detectar tumores en resonancias magnéticas cerebrales, como se explora en las aplicaciones de Ultralytics YOLO11 en imágenes médicas.
  • Conducción autónoma: Aunque el procesamiento en tiempo real es crucial para la tecnología de conducción autónoma, ciertos aspectos como la detección de peatones y señales de tráfico se benefician de la alta precisión de los detectores de dos etapas. Por ejemplo, identificar con precisión a los peatones en condiciones variadas es vital para la seguridad, y los detectores de dos etapas contribuyen a ello proporcionando una detección fiable incluso en escenarios abarrotados o con poca visibilidad.

Comparación con detectores de una etapa

La principal diferencia entre los detectores de objetos de dos etapas y los de una etapa radica en su enfoque de la detección de objetos. Los detectores de una etapa, como Ultralytics YOLOagilizan el proceso realizando la localización y clasificación de objetos en una sola pasada. Esto los hace significativamente más rápidos, ideales para aplicaciones en tiempo real. Sin embargo, los detectores de dos etapas, como Faster R-CNN y Mask R-CNN, consiguen una mayor precisión al separar estas tareas en etapas distintas, como se ha comentado antes.

Elegir entre detectores de una o dos etapas implica equilibrar la necesidad de velocidad con el requisito de precisión. Para aplicaciones que requieren una detección rápida, como la videovigilancia en tiempo real o la navegación autónoma, suelen preferirse los detectores de una etapa. En cambio, para aplicaciones en las que la precisión es primordial, como el diagnóstico médico o el análisis detallado de imágenes, los detectores de dos etapas siguen siendo la opción preferida.

Leer todo