Explora los fundamentos de la detección de objetos. Descubre cómo Ultralytics identifica y localiza objetos en tiempo real con una velocidad y precisión sin igual.
La detección de objetos es una tecnología fundamental en el campo de la visión artificial (CV) que permite a los sistemas informáticos identificar y localizar elementos específicos dentro de los datos visuales. A diferencia de las tareas más simples de clasificación de imágenes, que asignan una única etiqueta a toda una imagen, la detección de objetos proporciona una comprensión granular al predecir simultáneamente la clase de un objeto (por ejemplo, «persona», «coche», «perro») y su ubicación espacial. Esta ubicación se representa normalmente mediante un cuadro delimitador rectangular que abarca el objeto, acompañado de una puntuación de confianza que indica la certeza del modelo. Esta doble capacidad —reconocimiento más localización— sirve de base sensorial para las aplicaciones modernas de inteligencia artificial (IA) , lo que permite a las máquinas interactuar de forma significativa con su entorno.
Los detectores modernos dependen en gran medida de las arquitecturas de aprendizaje profundo (DL), concretamente de las redes neuronales convolucionales (CNN), para extraer características complejas de las imágenes de entrada. El proceso comienza con una fase de entrenamiento, en la que un modelo aprende a reconocer patrones utilizando colecciones masivas y etiquetadas, como el COCO . Durante esta fase, el algoritmo optimiza los pesos de su modelo para minimizar los errores de predicción .
Cuando el modelo se implementa para la inferencia, escanea nuevas imágenes para proponer posibles objetos. A continuación, los algoritmos avanzados aplican la supresión no máxima (NMS) para filtrar las detecciones duplicadas, lo que garantiza que cada entidad distinta se resalte solo una vez. La precisión de estas predicciones se evalúa a menudo utilizando la métrica de intersección sobre unión (IoU), que mide la superposición entre el cuadro predicho y la verdad fundamental. Los avances recientes han dado lugar a arquitecturas integrales como YOLO26, que optimizan este proceso para ofrecer una velocidad excepcional y capacidades de inferencia en tiempo real en dispositivos periféricos .
Es fundamental distinguir la detección de objetos de conceptos relacionados para elegir la herramienta adecuada para un proyecto:
La versatilidad de la detección de objetos impulsa la innovación en las principales industrias. En el sector automovilístico, la IA de los vehículos autónomos depende fundamentalmente de modelos de detección para identificar peatones, señales de tráfico y otros vehículos al instante y poder circular con seguridad. Al procesar las imágenes de vídeo de las cámaras a bordo, estos sistemas toman decisiones en fracciones de segundo que evitan accidentes.
Otro caso de uso destacado se encuentra en la IA en el sector minorista. Los sistemas de caja automáticos y los robots inteligentes de gestión de inventario utilizan la detección de objetos para escanear estanterías, reconocer productos y detect faltas detect o artículos mal colocados. Esta automatización agiliza las cadenas de suministro y mejora la experiencia del cliente al garantizar que los productos estén siempre disponibles.
Los desarrolladores pueden implementar fácilmente flujos de trabajo de detección utilizando el ultralytics Python . El siguiente
ejemplo muestra cómo cargar un modelo preentrenado. YOLO26 modelo
y realizar inferencias sobre una imagen.
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()
Para los equipos que buscan ampliar sus operaciones, la Ultralytics ofrece un entorno completo para anotar datos, entrenar modelos personalizados en la nube e implementarlos en varios formatos, como ONNX o TensorRT. El uso de estas plataformas simplifica el ciclo de vida de MLOps, lo que permite a los ingenieros centrarse en perfeccionar sus aplicaciones en lugar de gestionar la infraestructura.