Khám phá sức mạnh của Optical Flow trong thị giác máy tính. Tìm hiểu cách nó ước tính chuyển động, tăng cường phân tích video và thúc đẩy đổi mới trong AI.
Optical Flow là một khái niệm quan trọng trong lĩnh vực thị giác máy tính, đề cập đến mô hình chuyển động biểu kiến của các vật thể, bề mặt và cạnh trong một cảnh trực quan do chuyển động tương đối giữa người quan sát (như máy ảnh) và cảnh đó. Hãy tưởng tượng bạn đang xem một video; Optical Flow cố gắng ước tính chuyển động của từng pixel từ khung hình này sang khung hình tiếp theo, tạo ra một trường chuyển động dày đặc mô tả hướng và tốc độ chuyển động trên toàn bộ hình ảnh. Trường chuyển động này vô cùng có giá trị để hiểu động lực của cảnh và chuyển động của vật thể trong các chuỗi video.
Về bản chất, Optical Flow dựa trên giả định rằng các pixel thuộc cùng một đối tượng trong các khung liên tiếp sẽ thể hiện chuyển động tương tự. Các thuật toán phân tích những thay đổi về cường độ pixel theo thời gian để ước tính các vectơ chuyển động. Các vectơ này biểu diễn sự dịch chuyển của các pixel giữa các khung, trực quan hóa hiệu quả cách các phần khác nhau của hình ảnh chuyển động. Mặc dù độ chính xác hoàn hảo là thách thức do các yếu tố như thay đổi ánh sáng, bề mặt không có kết cấu và che khuất, Optical Flow cung cấp một phép tính gần đúng mạnh mẽ về chuyển động trong nhiều tình huống thực tế.
Optical Flow khác biệt đáng kể so với phát hiện đối tượng và phân đoạn hình ảnh . Trong khi phát hiện đối tượng nhằm mục đích xác định và định vị các đối tượng trong một hình ảnh duy nhất và phân đoạn hình ảnh phân loại các pixel thành các loại đối tượng, Optical Flow tập trung vào chuyển động giữa các khung hình liên tiếp. Nó không nhất thiết xác định những gì đang chuyển động, mà là cách các pixel dịch chuyển trên mặt phẳng hình ảnh theo thời gian. Điều này làm cho nó đặc biệt hữu ích cho các ứng dụng mà việc hiểu động lực chuyển động là tối quan trọng.
Optical Flow có nhiều ứng dụng, đặc biệt là trong các lĩnh vực tận dụng phân tích video và xử lý thời gian thực. Hai ví dụ nổi bật bao gồm:
Lái xe tự động: Trong xe tự lái, Optical Flow được sử dụng để nhận biết chuyển động của các vật thể xung quanh so với xe. Bằng cách phân tích trường Optical Flow , hệ thống có thể phát hiện các phương tiện đang di chuyển, người đi bộ và các yếu tố động khác trong môi trường, nâng cao nhận thức tình huống và cho phép điều hướng an toàn hơn. Thông tin này rất quan trọng để ra quyết định trong các hệ thống tự động.
Giám sát video: Hệ thống an ninh sử dụng Optical Flow để phát hiện chuyển động và nhận dạng bất thường. Bằng cách phân tích các mẫu chuyển động, hệ thống có thể xác định các hoạt động bất thường, chẳng hạn như kẻ xâm nhập hoặc thay đổi đột ngột trong hành vi của đám đông. Khả năng này cho phép thực hiện các biện pháp an ninh chủ động và giám sát hiệu quả các khu vực rộng lớn. Ví dụ, các mẫu chuyển động bất thường được phát hiện qua Optical Flow có thể kích hoạt cảnh báo trong hệ thống báo động an ninh .
Ngoài những ví dụ này, Optical Flow cũng được sử dụng trong robot cho SLAM trực quan (Simultaneous Localization and Mapping), trong nén video để ước tính các vectơ chuyển động cho mã hóa hiệu quả và trong nhiều hình thức phân tích video khác nhau như nhận dạng hành động và chỉnh sửa video. Khi thị giác máy tính tiếp tục phát triển, Optical Flow vẫn là một kỹ thuật cơ bản để hiểu và diễn giải chuyển động trong dữ liệu trực quan, bổ sung cho các mô hình mạnh mẽ như Ultralytics YOLOv8 để hiểu toàn cảnh. Những tiến bộ hơn nữa trong học sâu cũng đang được khám phá để nâng cao ước tính Dòng quang học, tích hợp nó với các mô hình để cải thiện khả năng theo dõi đối tượng và phân tích cảnh.