Thuật ngữ

MởCV

Khám phá sức mạnh của OpenCV, thư viện mã nguồn mở dành cho thị giác máy tính thời gian thực, xử lý hình ảnh và các cải tiến dựa trên AI.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

OpenCV, viết tắt của Open Source Computer Vision Library, là một thư viện mã nguồn mở mạnh mẽ và đa năng được sử dụng rộng rãi trong trí tuệ nhân tạo và học máy. Nó cung cấp một bộ công cụ và thuật toán toàn diện được thiết kế riêng cho các tác vụ thị giác máy tính (CV) thời gian thực, xử lý hình ảnh và phân tích video. Đối với những người thực hành học máy, OpenCV đóng vai trò là bộ công cụ thiết yếu để xử lý dữ liệu trực quan, cho phép thực hiện các tác vụ từ tải và thao tác hình ảnh cơ bản đến hiểu cảnh phức tạp. Bản chất mã nguồn mở của nó, được duy trì bởi OpenCV.org , thúc đẩy một cộng đồng lớn và phát triển liên tục.

Sự liên quan trong AI và Học máy

OpenCV đóng vai trò quan trọng trong quy trình AI và ML, đặc biệt là khi xử lý các đầu vào trực quan. Nó cung cấp các công cụ cơ bản để xử lý dữ liệu trước , một bước quan trọng trước khi đưa hình ảnh hoặc video vào các mô hình học máy. Các bước xử lý trước phổ biến do OpenCV xử lý bao gồm thay đổi kích thước, chuyển đổi không gian màu, giảm nhiễu và áp dụng nhiều bộ lọc khác nhau để nâng cao chất lượng hình ảnh hoặc trích xuất các tính năng có liên quan. Quá trình xử lý trước này ảnh hưởng đáng kể đến hiệu suất của các mô hình học sâu . OpenCV thường được sử dụng kết hợp với các khuôn khổ ML phổ biến như PyTorchTensorFlow để xây dựng các ứng dụng CV đầu cuối. Hiệu quả của nó trong việc xử lý các luồng video thời gian thực khiến nó trở nên không thể thiếu đối với các ứng dụng yêu cầu phân tích trực quan ngay lập tức, chẳng hạn như suy luận thời gian thực với các mô hình phát hiện đối tượng như Ultralytics YOLO .

Các tính năng chính và sự khác biệt

OpenCV cung cấp một loạt các chức năng, bao gồm cả các thuật toán thị giác máy tính cổ điển và hỗ trợ các kỹ thuật hiện đại. Các khả năng chính bao gồm:

  • I/O hình ảnh/video: Đọc và ghi nhiều định dạng tệp hình ảnh và video.
  • Xử lý hình ảnh: Các thao tác như cắt, xoay, thay đổi kích thước và điều chỉnh màu sắc. Khám phá các hướng dẫn như cắt đối tượng bằng mô hình Ultralytics .
  • Phát hiện tính năng: Triển khai các thuật toán như SIFT, SURF và ORB để xác định các điểm chính trong hình ảnh ( tài liệu Phát hiện tính năng ).
  • Phát hiện đối tượng: Bao gồm các phương pháp cổ điển như chuỗi Haar và hỗ trợ tích hợp các máy dò học sâu.
  • Phân tích video: Các chức năng theo dõi chuyển động, trừ nền và luồng quang học .

Trong khi OpenCV cung cấp các công cụ để triển khai các tác vụ CV, nó khác với lĩnh vực Thị giác máy tính , là ngành khoa học rộng hơn. Nó cũng khác với Xử lý hình ảnh , thường chỉ tập trung vào thao tác hình ảnh; OpenCV bao gồm xử lý nhưng mở rộng sang diễn giải và phân tích. Không giống như các khuôn khổ ML như PyTorch hoặc TensorFlow , tập trung vào việc xây dựng và đào tạo mạng nơ-ron, OpenCV cung cấp khả năng xử lý hình ảnh cơ bản và các thuật toán CV truyền thống thường được sử dụng trước hoặc sau bước suy luận mô hình học sâu, chẳng hạn như vẽ các hộp giới hạn trên các đối tượng được phát hiện.

Ứng dụng trong thế giới thực

Khả năng của OpenCV được tận dụng trên nhiều lĩnh vực:

  • Xe tự hành: Trong công nghệ tự lái , OpenCV được sử dụng để xử lý dữ liệu từ camera theo thời gian thực. Nó giúp phát hiện làn đường, xác định biển báo và đèn giao thông, nhận dạng người đi bộ và theo dõi các phương tiện khác, cung cấp thông tin đầu vào quan trọng cho hệ thống dẫn đường.
  • Phân tích hình ảnh y tế: OpenCV hỗ trợ xử lý trước hình ảnh y tế như X-quang, CT và MRI. Các tác vụ bao gồm giảm nhiễu, tăng cường độ tương phản và phân đoạn, chuẩn bị hình ảnh để xem xét chẩn đoán hoặc phân tích bằng các mô hình chăm sóc sức khỏe AI chuyên biệt. Xem cách các kỹ thuật tương tự áp dụng để phát hiện khối u .
  • An ninh và giám sát: Được sử dụng trong các hệ thống nhận dạng khuôn mặt , phát hiện chuyển động và theo dõi đối tượng để giám sát các khu vực và kích hoạt cảnh báo, như được trình bày trong các hướng dẫn như dự án hệ thống báo động an ninh .
  • Robot: Cho phép robot nhận thức môi trường của chúng thông qua các cảm biến thị giác, tạo điều kiện thuận lợi cho việc điều hướng, thao tác đối tượng và tương tác. Khám phá sự tích hợp của thị giác máy tính trong robot .

OpenCV vẫn là thư viện nền tảng cho các nhà phát triển và nghiên cứu làm việc trên các ứng dụng thị giác máy tính, thường được tích hợp vào các hệ thống lớn hơn được quản lý thông qua các nền tảng như Ultralytics HUB để phát triển và triển khai mô hình hợp lý.

Đọc tất cả