Un cuadro delimitador es un marco rectangular utilizado en visión por ordenador (VC) para indicar la ubicación y extensión aproximada de un objeto dentro de un fotograma de imagen o vídeo. Típicamente definidas por las coordenadas de sus esquinas superior izquierda e inferior derecha (o punto central, anchura y altura), estas cajas proporcionan un método sencillo pero eficaz para especificar dónde está situado un objeto y cuánto espacio ocupa. Las cajas delimitadoras son componentes fundamentales en diversas tareas de CV, como la detección de objetos, el seguimiento de objetos y la anotación de imágenes, y constituyen una piedra angular de muchos sistemas modernos de Inteligencia Artificial (IA) y aprendizaje automático (AM). Son esenciales para que las máquinas comprendan no sólo qué objetos hay, sino también dónde están situados en una escena visual.
Importancia en la detección de objetos
Las cajas delimitadoras son cruciales tanto para entrenar como para evaluar modelos de detección de objetos. En tareas abordadas por modelos como Ultralytics YOLOlos recuadros delimitadores sirven de "verdad básica" durante el proceso de entrenamiento. Esto significa que representan la ubicación y el tamaño correctos de los objetos en los datos de entrenamiento, enseñando al modelo a localizar objetos con precisión. Este proceso suele comenzar con una cuidadosa anotación de los datos, en la que humanos o herramientas automatizadas dibujan estos recuadros alrededor de los objetos en las imágenes, utilizando frecuentemente plataformas como CVAT o integrándose con plataformas como Ultralytics HUB para la gestión del conjunto de datos. Durante la inferencia, el modelo entrenado predice recuadros delimitadores alrededor de los objetos detectados, junto con etiquetas de clase y puntuaciones de confianza. Esta capacidad de localización es vital para las aplicaciones que requieren no sólo la identificación de objetos, sino también su posición exacta.
Conceptos clave relacionados con los recuadros delimitadores
Varias métricas y técnicas están estrechamente relacionadas con el uso y la evaluación de los recuadros delimitadores en los modelos de ML:
- Intersección sobre Unión (IOU): Métrica utilizada para medir el solapamiento entre el cuadro delimitador predicho y el cuadro delimitador de la verdad sobre el terreno. Cuantifica la precisión de la localización.
- Supresión no máxima (NMS): Técnica de postprocesamiento utilizada para eliminar los recuadros delimitadores redundantes y superpuestos de un mismo objeto, manteniendo sólo la predicción más segura.
- Precisión media (mAP): Una métrica estándar para evaluar el rendimiento de los modelos de detección de objetos, teniendo en cuenta tanto la precisión de clasificación como la precisión de localización (a menudo basada en un umbral IoU). Consulta las métricas de rendimiento detalladas YOLO .
- Cajas de anclaje: Cajas predefinidas de varios tamaños y relaciones de aspecto utilizadas en algunos detectores (como las versiones antiguas de YOLO ) para ayudar a predecir las cajas delimitadoras con mayor eficacia. Los modelos más recientes, como YOLO11suelen carecer de anclajes, lo que simplifica el cabezal de detección.
- Conjunto de datos COCO: Un conjunto de datos a gran escala de detección, segmentación y subtitulado de objetos muy utilizado para evaluar modelos de detección de objetos. Ultralytics facilita el acceso a COCO y a otros conjuntos de datos de detección.
Cajas delimitadoras frente a términos relacionados
Mientras que las cajas delimitadoras estándar (alineadas con el eje) localizan los objetos con simples rectángulos, otras técnicas de visión por ordenador ofrecen distintos niveles de detalle o manejan escenarios diferentes:
Aplicaciones en situaciones reales
Las cajas delimitadoras forman parte integral de numerosas aplicaciones prácticas de la IA:
- Vehículos autónomos: Los coches autónomos dependen en gran medida de la detección de objetos para identificar y localizar peatones, otros vehículos, semáforos y obstáculos mediante cuadros delimitadores. Esta conciencia espacial, a menudo conseguida mediante modelos de aprendizaje profundo, es fundamental para una navegación y una toma de decisiones seguras. Empresas como Waymo exhiben ampliamente esta tecnología. Ultralytics ofrece información sobre la IA en los coches autoconducidos.
- Análisis del comercio minorista: En el comercio minorista, las cajas delimitadoras ayudan en la gestión de inventarios impulsada por la IA, detectando productos en las estanterías, controlando los niveles de existencias y analizando el comportamiento de los clientes mediante la interacción en las estanterías o los patrones de tráfico peatonal(recuento de objetos).
- Seguridad y vigilancia: Las cajas delimitadoras permiten a los sistemas de vigilancia automatizados detectar y seguir a personas u objetos de interés en tiempo real, activando alertas de acceso no autorizado o actividades sospechosas. Esto es fundamental para aplicaciones de construcción como los sistemas de alarma de seguridad.
- Análisis de imágenes médicas: En el ámbito sanitario, los recuadros delimitadores ayudan a los radiólogos y médicos clínicos a resaltar posibles anomalías, como tumores o lesiones, en las exploraciones (radiografías, TC, RM), contribuyendo a un diagnóstico más rápido y preciso. Ver ejemplos en Radiología: Inteligencia Arti ficial y la visión general de Ultralytics sobre el análisis de imágenes médicas.
- Agricultura: Las cajas delimitadoras se utilizan en la agricultura de precisión para tareas como la identificación de frutos para la cosecha(detección de frutos), el control de la salud de los cultivos o la detección de plagas.