Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

Hiểu vai trò của FPS trong thị giác máy tính

Tìm hiểu lý do tại sao FPS trong thị giác máy tính lại quan trọng và nó ảnh hưởng thế nào đến việc phát hiện đối tượng theo thời gian thực, phân tích video và các ứng dụng hỗ trợ AI.

Xem lại cảnh quay chậm khoảnh khắc thể thao yêu thích của bạn, trong đó mọi chi tiết đều rõ ràng, rất khác so với việc xem cảnh quay giám sát thường trông giật cục và khó theo dõi. Chi tiết kỹ thuật chính đằng sau những khác biệt này là FPS, hay Khung hình trên giây, dùng để chỉ số khung hình hiển thị mỗi giây trong video. FPS cao hơn sẽ tạo ra chuyển động mượt mà, sống động, trong khi FPS thấp hơn có thể tạo ra cảnh quay giật cục, ít chi tiết hơn.

Khái niệm này tác động trực tiếp đến thị giác máy tính , một nhánh của AI cho phép máy móc diễn giải và phân tích dữ liệu trực quan tương tự như cách con người làm. Trong thị giác máy tính, FPS cao hơn có nghĩa là hệ thống có thể thu thập nhiều thông tin hơn mỗi giây, cải thiện độ chính xác của việc phát hiện và theo dõi đối tượng theo thời gian thực.

Trong bài viết này, chúng ta sẽ khám phá các khía cạnh kỹ thuật của FPS và cách nó liên quan đến các ứng dụng thị giác máy tính. Hãy bắt đầu nào!

FPS có nghĩa là gì trong thị giác máy tính?

Giả sử bạn đang chơi một trò chơi đua xe: ở 60 FPS, mọi lượt chơi đều mượt mà và phản hồi nhanh, nhưng ở 20 FPS, các điều khiển bị trễ, khiến việc né tránh chướng ngại vật trở nên khó khăn hơn. Nói một cách đơn giản, bạn có thể nghĩ FPS là số lượng ảnh tĩnh được hiển thị mỗi giây. Nhiều ảnh hơn mỗi giây khiến chuyển động trông mượt mà và tự nhiên, trong khi ít ảnh hơn có thể khiến chuyển động trông chập chờn.

Giống như trong trò chơi, FPS là một phần quan trọng của các ứng dụng thị giác máy tính . FPS cao hơn giúp có thể theo dõi các đối tượng bằng Vision AI một cách mượt mà, trong khi FPS thấp hơn có thể dẫn đến việc bỏ lỡ các chi tiết. 

Ví dụ, trong phân tích thể thao, camera hỗ trợ AI cần FPS cao hơn để có thể theo dõi các đường chuyền nhanh, chuyển động của cầu thủ và quỹ đạo bóng. FPS thấp hơn có thể dẫn đến việc bỏ lỡ một pha tiếp xúc bóng quan trọng hoặc thay đổi hướng nhanh, ảnh hưởng đến độ chính xác của phân tích. 

Tương tự như vậy, trong giám sát giao thông, các hệ thống dựa vào FPS cao để phát hiện các phương tiện chạy quá tốc độ và thay đổi làn đường theo thời gian thực. Việc lựa chọn FPS phù hợp phụ thuộc vào các yêu cầu cụ thể của từng ứng dụng thị giác máy tính, cân bằng hiệu suất, hiệu quả và độ rõ nét của hình ảnh.

Hình 1. So sánh các tốc độ khung hình khác nhau.

Các khía cạnh kỹ thuật của FPS trong tầm nhìn máy tính

Bây giờ chúng ta đã thảo luận về FPS là gì và cách sử dụng nó trong thị giác máy tính, hãy cùng tìm hiểu sâu hơn về các khía cạnh kỹ thuật của nó - bắt đầu với cách tính FPS của video. 

Chia tổng số khung hình cho thời lượng tính bằng giây sẽ cho bạn FPS của video. Ví dụ, nếu video có 96 khung hình trong 4 giây, nó sẽ tính ra 24 FPS - nghĩa là 24 hình ảnh được hiển thị mỗi giây - trong khi 32 khung hình trong 4 giây sẽ cho kết quả là 8 FPS. Python các thư viện như OpenCV có thể được sử dụng để trích xuất siêu dữ liệu video, đếm khung hình và tự động tính toán FPS, giúp hợp lý hóa quá trình phân tích video.

Hình 2. 24 FPS so với 8 FPS so với 4FPS.

Các yếu tố ảnh hưởng đến FPS của video

Tuy nhiên, chỉ tính FPS thôi thì không đủ để đưa ra quyết định kỹ thuật khi phát triển các giải pháp thị giác máy tính . Điều quan trọng nữa là phải xem xét các yếu tố khác nhau có thể ảnh hưởng đến tốc độ khung hình hiệu quả, chẳng hạn như khả năng phần cứng, tối ưu hóa phần mềm và điều kiện môi trường. 

Sau đây là cái nhìn sâu hơn về những yếu tố đó:

  • Khả năng phần cứng : Chất lượng cảm biến camera và sức mạnh xử lý của thiết bị có thể quyết định số khung hình được chụp mỗi giây. Phần cứng tốt hơn thường có nghĩa là hỗ trợ FPS cao hơn và video mượt mà hơn.
  • Tối ưu hóa phần mềm : Phần mềm mã hóa và xử lý video hiệu quả giúp trích xuất và phân tích khung hình nhanh chóng. Điều này đảm bảo video được xử lý mà không có sự chậm trễ không cần thiết.
  • Điều kiện môi trường : Ánh sáng và chuyển động trong cảnh ảnh hưởng đến độ rõ nét của khung hình được chụp. Ánh sáng tốt và chuyển động vừa phải có thể cải thiện FPS, trong khi điều kiện kém có thể yêu cầu FPS cao hơn để duy trì độ rõ nét.
  • Nhu cầu lưu trữ : FPS cao hơn sẽ chụp được nhiều khung hình hơn mỗi giây, dẫn đến kích thước tệp lớn hơn. Điều này làm tăng yêu cầu lưu trữ và đòi hỏi xử lý dữ liệu nhanh hơn để đảm bảo phát lại mượt mà.

Khám phá FPS trong các ứng dụng thị giác máy tính

Các mô hình AI như Ultralytics YOLO11 hỗ trợ các tác vụ thị giác máy tính thời gian thực có thể được sử dụng để phân tích video có tốc độ khung hình cao. Khả năng thời gian thực này rất quan trọng đối với các ứng dụng như lái xe tự động, giám sát và robot, nơi mà ngay cả sự chậm trễ nhỏ cũng có thể dẫn đến lỗi đáng kể. 

Chúng ta hãy cùng tìm hiểu một số ứng dụng Vision AI trong thế giới thực, trong đó FPS cao là yếu tố cần thiết để đảm bảo độ chính xác và hiệu suất. 

Tốc độ khung hình cao hơn cho các giải pháp giám sát và an ninh

Hệ thống giám sát theo dõi các khu vực có lưu lượng giao thông cao như đường cao tốc sử dụng FPS cao để nắm bắt các chi tiết nhỏ, đảm bảo các phương tiện di chuyển nhanh được ghi lại rõ ràng. Độ rõ nét này rất cần thiết cho các hệ thống nhận dạng biển số xe tự động (ANPR) , dựa vào cảnh quay chất lượng tốt để xác định chính xác các phương tiện.

Trong các hệ thống như vậy, các mô hình như YOLO11 có thể được sử dụng để phát hiện biển số xe trực tiếp từ nguồn cấp dữ liệu video. Sau khi phát hiện ra biển số, Nhận dạng ký tự quang học (OCR), chuyển đổi hình ảnh văn bản thành các ký tự có thể đọc được bằng máy, được sử dụng để đọc thông tin chi tiết về biển số. Quá trình này cho phép nhận dạng xe nhanh chóng và chính xác, tăng cường thực thi giao thông và an ninh tổng thể.

Hình 3. Sử dụng YOLO11 để phát hiện biển số xe.

Hiểu các yêu cầu về FPS cho các hệ thống tự động

Hãy xem xét một chiếc xe tự lái ở biển báo dừng, cẩn thận phân tích môi trường xung quanh để quyết định xem nó có thể tiếp tục an toàn hay không. Chiếc xe này phải đưa ra quyết định gần như ngay lập tức, đòi hỏi phải thu thập và xử lý dữ liệu trực quan theo thời gian thực. 

Nếu xe tự hành được trang bị camera có thể quay cảnh ở FPS cao hơn, nó sẽ nhận được luồng hình ảnh liên tục và chi tiết hơn. Đầu vào hình ảnh nâng cao này cho phép xe nhanh chóng phát hiện chướng ngại vật, người đi bộ và các phương tiện khác. Nó giúp xe có thể phản ứng nhanh với mọi thay đổi trong môi trường của nó.

Nếu camera xử lý hình ảnh ở FPS thấp hơn, xe có thể nhận được hình ảnh nhiễu hơn, ít chi tiết hơn. Điều này có thể làm chậm thời gian phản hồi, làm tăng nguy cơ bỏ lỡ thông tin quan trọng và có khả năng gây nguy hiểm cho sự an toàn.

Mối liên hệ giữa FPS và phân tích thể thao

Việc nắm bắt mọi chuyển động một cách chính xác là rất quan trọng trong thể thao, nơi mà những quyết định trong tích tắc có thể tạo nên sự khác biệt giữa thắng và thua. Công nghệ hỗ trợ FPS cao hơn cho phép chúng tôi ghi lại mọi chi tiết nhỏ trong chuyển động và các huấn luyện viên, nhà phân tích và vận động viên có thể xem lại các vở kịch ở chế độ chuyển động chậm mà không bỏ lỡ một nhịp nào. Nó cũng giúp trọng tài đưa ra quyết định chính xác hơn trong các môn thể thao như quần vợt, bóng đá và cricket bằng cách cung cấp chế độ xem rõ ràng, từng khung hình của hành động.

Ví dụ, một nghiên cứu thú vị về bóng chuyền đã phân tích cách sử dụng FPS cao hơn cải thiện đánh giá hiệu suất. Tăng FPS từ 30 lên 240 cải thiện đáng kể độ rõ nét của chuyển động và theo dõi vật thể. Độ chính xác của phân tích đột biến cũng được cải thiện, giúp các huấn luyện viên hiểu chính xác hơn về vị trí tay, điểm tiếp xúc bóng và cơ chế nhảy. Trên hết, nghiên cứu phát hiện ra rằng FPS cao hơn làm giảm độ mờ chuyển động, giúp phân tích các pha giao bóng và phản ứng phòng thủ dễ dàng hơn. 

Hình 4. So sánh FPS thấp và cao về độ rõ nét chuyển động.

Khi sử dụng FPS thấp có hiệu quả trong phân tích video

Không phải tất cả các ứng dụng thị giác máy tính đều yêu cầu ghi lại cảnh quay ở FPS cao hơn. Trong nhiều trường hợp, FPS thấp hơn là đủ để đạt được kết quả chính xác, tùy thuộc vào nhiệm vụ. Sau đây là một số lĩnh vực chính mà FPS thấp hơn được ưu tiên:

  • Hậu xử lý và phân tích ngoại tuyến : Đối với các ứng dụng như giám sát giao thông và phân tích đám đông, việc chụp mọi khung hình ở FPS cao không phải lúc nào cũng cần thiết. FPS thấp hơn vẫn có thể cung cấp đủ dữ liệu để phân tích các mẫu chuyển động, chẳng hạn như lưu lượng xe cộ, mật độ người đi bộ và xu hướng tắc nghẽn. Bằng cách giảm các khung hình dư thừa, phương pháp này giảm thiểu yêu cầu lưu trữ và tải tính toán trong khi vẫn duy trì phân tích chính xác.
  • Giám sát môi trường theo thời gian: Để theo dõi những thay đổi chậm như sự phát triển của thực vật, tiến độ xây dựng hoặc chuyển động của sông băng, việc chụp một khung hình sau mỗi vài phút hoặc một lần mỗi ngày là đủ, giúp ghi lại hiệu quả các chuyển đổi dài hạn đồng thời tiết kiệm dung lượng lưu trữ.
  • Môi trường hạn chế về tài nguyên : Trong giám sát động vật hoang dã và an ninh từ xa, FPS thấp hơn giúp tiết kiệm pin và dung lượng lưu trữ. Camera kích hoạt chuyển động hoạt động ở mức 5–10 FPS có thể ghi lại các sự kiện quan trọng trong thời gian dài, khiến chúng trở nên lý tưởng cho các cài đặt ngoài lưới điện.

Chọn FPS phù hợp cho các ứng dụng học sâu

Việc lựa chọn FPS lý tưởng đòi hỏi phải cân bằng hiệu suất với các hạn chế của hệ thống. Sau đây là một số cân nhắc cần lưu ý khi tối ưu hóa FPS cho các ứng dụng học sâu:

  • Cân bằng hiệu suất và tài nguyên : FPS cao hơn cải thiện khả năng phản hồi nhưng cũng làm tăng nhu cầu về năng lượng và xử lý. Điều chỉnh FPS động, sử dụng nội suy khung hình và tối ưu hóa phần cứng có thể giúp duy trì hiệu suất mượt mà mà không làm quá tải hệ thống.
  • Nhu cầu cụ thể của ứng dụng : Các ứng dụng khác nhau có yêu cầu FPS khác nhau. Các thiết bị chạy bằng pin nên sử dụng FPS thấp hơn để tiết kiệm năng lượng, trong khi các hệ thống thời gian thực như máy bay không người lái và xe tự hành cần FPS cao hơn để phản hồi nhanh và chính xác.
  • Kiểm tra và tối ưu hóa : Thiết lập FPS lý tưởng nhất nên được kiểm tra trong các điều kiện ánh sáng và chuyển động khác nhau. Đánh giá độ trễ và so sánh các mức FPS cạnh nhau giúp xác định sự cân bằng tốt nhất giữa khả năng phản hồi, chất lượng hình ảnh và hiệu quả tài nguyên.

Những đổi mới trong tương lai và tối ưu hóa FPS cho các mô hình AI

Những tiến bộ trong AI và tối ưu hóa phần cứng đang giúp đạt được tốc độ khung hình cao hơn, ngay cả trong môi trường hạn chế về tài nguyên. Ví dụ, các ngành như điện ảnh, thể thao và robot có thể hưởng lợi từ việc quản lý tốc độ khung hình thông minh hơn, trong đó các hệ thống điều chỉnh FPS một cách linh hoạt dựa trên độ phức tạp của chuyển động và sức mạnh xử lý. Nội suy khung hình do AI điều khiển cũng cải thiện độ mượt của video bằng cách tạo thêm khung hình theo thời gian thực.

Trong khi đó, một đột phá gần đây từ NVIDIA đang đẩy hiệu suất FPS lên cao hơn nữa. DLSS 4 (Deep Learning Super Sampling) giới thiệu công nghệ tạo nhiều khung hình, sử dụng AI để dự đoán và tạo thêm khung hình. Công nghệ này tăng tốc độ khung hình lên tới 8 lần đồng thời giảm tải cho hệ thống.

Bằng cách để AI xử lý một phần quá trình kết xuất, DLSS 4 giúp hình ảnh mượt mà hơn mà không gây thêm áp lực cho phần cứng, cải thiện cả hiệu suất và hiệu quả.

Những điểm chính

FPS không chỉ là thước đo hình ảnh mượt mà; nó thúc đẩy quá trình ra quyết định theo thời gian thực trong AI và thị giác máy tính. Mỗi khung hình trong video đều ghi lại dữ liệu quan trọng, cho phép máy móc theo dõi các vật thể, phân tích chuyển động và phản ứng với môi trường động. Cho dù đó là xe tự lái tránh chướng ngại vật hay hệ thống giám sát phát hiện mối đe dọa ngay lập tức, FPS phù hợp sẽ đảm bảo độ chính xác và hiệu quả.

Tương lai của FPS không chỉ là tăng tốc độ khung hình mà còn là tối ưu hóa chúng một cách thông minh. Sự phát triển này sẽ giúp các hệ thống thị giác máy tính nhanh hơn, sáng tạo hơn và tiết kiệm tài nguyên hơn trong nhiều ngành công nghiệp khác nhau.

Bạn muốn tìm hiểu thêm về AI? Khám phá kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi . Sẵn sàng bắt đầu các dự án thị giác máy tính của riêng bạn? Hãy xem các tùy chọn cấp phép của chúng tôi. Tìm hiểu cách thị giác máy tính trong chăm sóc sức khỏe đang cải thiện hiệu quả và khám phá tác động của AI trong sản xuất bằng cách truy cập các trang giải pháp của chúng tôi!

Logo FacebookBiểu trưng TwitterBiểu tượng LinkedInBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning