术语表

光流

探索光学流在计算机视觉中的强大功能。了解它如何估算运动、增强视频分析以及推动人工智能创新。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

光学流(Optical Flow)是计算机视觉领域的一个重要概念,指的是视觉场景中的物体、表面和边缘因观察者(如摄像机)与场景之间的相对运动而产生的明显运动模式。试想一下,在观看视频时,光学流试图估算每个像素从一帧到下一帧的运动,从而创建一个密集的运动场,描述整个图像的运动方向和速度。这个运动场对于理解视频序列中的场景动态和物体运动非常有价值。

了解光流

光学流的核心是假设连续帧中属于同一物体的像素会表现出相似的运动。算法通过分析像素强度随时间的变化来估算运动矢量。这些矢量表示像素在帧间的位移,可有效直观地显示图像不同部分的运动情况。虽然由于光照变化、无纹理表面和遮挡等因素的影响,完美的精确度具有挑战性,但在现实世界的许多场景中,光学流都能提供运动的可靠近似值。

光流与物体检测图像分割有很大不同。物体检测的目的是识别和定位单幅图像中的物体,图像分割则是将像素划分为不同的物体类别,而光学流则侧重于连续帧之间的运动。它不一定能识别移动的物体,但能识别像素在图像平面上随着时间的推移是如何移动的。这使得它在理解运动动态至关重要的应用中特别有用。

光流的应用

光流技术应用广泛,尤其是在利用视频分析和实时处理的领域。两个突出的例子包括

  • 自动驾驶:在自动驾驶汽车中,光学流(Optical Flow)用于感知周围物体相对于车辆的运动。通过分析光流场,系统可以检测到环境中移动的车辆、行人和其他动态元素,从而提高态势感知能力,实现更安全的导航。这些信息对于自主系统的决策至关重要。

  • 视频监控: 安防系统利用光流进行运动检测和异常识别。通过分析运动模式,系统可以识别异常活动,如入侵者或人群行为的突然变化。这种功能可实现主动安全措施和对大面积区域的有效监控。例如,通过光学流检测到的异常运动模式可以触发安全警报系统的警报。

除了这些例子,光学流还被用于机器人视觉 SLAM(同步定位与映射)、视频压缩中估算运动矢量以实现高效编码,以及各种形式的视频分析,如动作识别和视频编辑。随着计算机视觉技术的不断进步,光学流仍然是理解和解释视觉数据中运动的基本技术,并与Ultralytics YOLOv8 等强大的模型相辅相成,以实现全面的场景理解。我们还在探索深度学习的进一步发展,以增强光学流估计,并将其与改进物体跟踪和场景分析的模型相结合。

阅读全部