Explora las capacidades principales OpenCVpara el procesamiento de imágenes en tiempo real. Aprende a integrarlo con Ultralytics para crear potentes aplicaciones de visión artificial.
OpenCV Open Source Computer Vision Library) es una biblioteca de software de código abierto ampliamente utilizada, diseñada específicamente para la visión artificial (CV) en tiempo real y el procesamiento de imágenes . Desarrollada originalmente por Intel 1999, se ha convertido en una herramienta estándar para investigadores y desarrolladores, que proporciona más de 2500 algoritmos optimizados. Estos algoritmos permiten a los ordenadores percibir y comprender los datos visuales del mundo, realizando tareas que van desde la manipulación básica de imágenes hasta la compleja inferencia del aprendizaje automático (ML). Escrito en C++ para un alto rendimiento, OpenCV enlaces robustos para lenguajes como Python, Java y MATLAB, lo que lo hace accesible para la creación rápida de prototipos y la implementación a gran escala.
OpenCV como capa fundamental en el ecosistema de IA, a menudo gestionando los pasos de preprocesamiento de datos necesarios antes de que los datos visuales entren en los modelos de aprendizaje profundo. Su funcionalidad abarca varias áreas críticas:
OpenCV presente en todos los sectores y suele funcionar en combinación con marcos de aprendizaje profundo.
Es importante distinguir OpenCV marcos de aprendizaje profundo como PyTorch o TensorFlow.
En los flujos de trabajo modernos, estas herramientas se complementan entre sí. Por ejemplo, un desarrollador podría utilizar OpenCV leer un flujo de vídeo y cambiar el tamaño de los fotogramas, luego pasar esos fotogramas a un modelo YOLO26 para la detección de objetos y, finalmente, utilizar OpenCV para dibujar cuadros delimitadores en la salida.
OpenCV utiliza con frecuencia junto con el ultralytics paquete para gestionar flujos de vídeo y visualizar
los resultados. La integración permite una inferencia eficiente en tiempo real.
El siguiente ejemplo muestra cómo utilizar OpenCV abrir un archivo de vídeo, procesar fotogramas y aplicar un modelo YOLO26n para la detección.
import cv2
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Open the video file using OpenCV
cap = cv2.VideoCapture("path/to/video.mp4")
while cap.isOpened():
success, frame = cap.read()
if not success:
break
# Run YOLO26 inference on the frame
results = model(frame)
# Visualize the results on the frame
annotated_frame = results[0].plot()
# Display the annotated frame
cv2.imshow("YOLO26 Inference", annotated_frame)
# Break loop if 'q' is pressed
if cv2.waitKey(1) & 0xFF == ord("q"):
break
cap.release()
cv2.destroyAllWindows()
OpenCV evolucionando, admitiendo nuevos estándares y aceleraciones de hardware. Su amplia comunidad contribuye a un rico ecosistema de tutoriales y documentación. Para los equipos que buscan ampliar sus proyectos de visión por ordenador desde prototipos locales a soluciones basadas en la nube, la Ultralytics ofrece herramientas completas para la gestión de conjuntos de datos y el entrenamiento de modelos que se integran a la perfección con los canales de preprocesamiento OpenCV. Ya sea para sistemas de seguridad de reconocimiento facial o estimación de posturas en el análisis deportivo, OpenCV una utilidad esencial en el kit de herramientas de los desarrolladores de IA.