Aprenda cómo funciona el seguimiento de objetos en la visión artificial. Descubra cómo utilizar Ultralytics para identificar y supervisar objetos con identificadores únicos para su análisis en tiempo real.
El seguimiento de objetos es un proceso dinámico en la visión por computadora (CV) que implica identificar entidades específicas en un video y monitorear su movimiento a través de una secuencia de fotogramas. A diferencia del análisis de imágenes estáticas, que trata cada instantánea de forma aislada, el seguimiento introduce la dimensión del tiempo. Esto permite a los sistemas de inteligencia artificial (IA) asignar un número de identificación único (ID) a cada elemento detectado, como un coche, una persona o un animal, y mantener esa identidad a medida que el objeto se mueve, cambia de orientación o queda temporalmente oculto. Esta capacidad es la piedra angular de la comprensión avanzada de vídeo, ya que permite a las máquinas analizar el comportamiento, calcular trayectorias y obtener información útil a partir de las imágenes sin procesar.
Los sistemas de seguimiento modernos suelen utilizar un paradigma de «seguimiento por detección». Este flujo de trabajo combina potentes modelos de detección con algoritmos especializados para asociar las detecciones a lo largo del tiempo. El proceso suele seguir tres etapas principales:
Aunque estos términos están estrechamente relacionados, cumplen funciones distintas dentro del proceso de aprendizaje automático (ML).
La capacidad de mantener la identidad de los objetos permite complejas aplicaciones de inferencia en tiempo real en diversas industrias.
Ultralytics la implementación de un seguimiento de alto rendimiento. El track modo en la biblioteca
gestiona automáticamente la detección, la predicción de movimiento y la asignación de ID. El ejemplo siguiente muestra cómo utilizar el
Plataforma Ultralytics Modelo YOLO26 compatible para track en un
vídeo.
from ultralytics import YOLO
# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)
# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")
Para comprender plenamente el ecosistema del seguimiento, resulta útil explorar la segmentación de instancias, que realiza un seguimiento de los contornos precisos a nivel de píxeles de un objeto, en lugar de limitarse a un recuadro. Además, los retos de seguimiento de múltiples objetos (MOT) suelen incluir referencias ampliamente utilizadas, como MOTChallenge, para evaluar la capacidad de los algoritmos para gestionar escenas concurridas y oclusiones. Para la implementación en entornos de producción, los desarrolladores suelen utilizar herramientas como NVIDIA u OpenCV para integrar estos modelos en procesos eficientes.