Thuật ngữ

Tầm nhìn máy tính (CV)

Mở khóa tiềm năng của AI với Computer Vision! Khám phá vai trò của nó trong phát hiện vật thể, chăm sóc sức khỏe, xe tự lái và hơn thế nữa. Tìm hiểu thêm ngay!

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Thị giác máy tính (CV) là một lĩnh vực chuyên biệt trong Trí tuệ nhân tạo (AI) cho phép máy tính và hệ thống trích xuất thông tin có ý nghĩa từ hình ảnh kỹ thuật số, video và các đầu vào trực quan khác. Về cơ bản, nó nhằm mục đích sao chép khả năng hiểu thị giác của con người, cho phép máy móc "nhìn", diễn giải và đưa ra quyết định dựa trên dữ liệu trực quan. Điều này liên quan đến việc xử lý thông tin trực quan bằng các thuật toán phức tạp và mô hình học sâu (DL) để nhận dạng đối tượng, hiểu các cảnh và trích xuất thông tin chi tiết cấp cao. Không giống như xử lý hình ảnh đơn giản, chủ yếu tập trung vào việc tăng cường hoặc thao tác dữ liệu hình ảnh (như điều chỉnh độ sáng hoặc áp dụng bộ lọc), thị giác máy tính tìm cách hiểu nội dungbối cảnh trong hình ảnh.

Tầm quan trọng trong AI và Học máy

Thị giác máy tính là nền tảng cho nhiều hệ thống AI và Học máy (ML) hiện đại, cung cấp các khả năng cần thiết để máy móc tương tác và hiểu thế giới vật lý thông qua nhận thức trực quan. Sự ra đời của các kỹ thuật như Mạng nơ-ron tích chập (CNN) , lấy cảm hứng từ vỏ não thị giác của con người, đã cách mạng hóa CV. Các mạng này cho phép các mô hình tự động học các tính năng phân cấp từ lượng lớn dữ liệu trực quan, dẫn đến cải thiện đáng kể về độ chính xác cho nhiều tác vụ thị giác máy tính khác nhau. Tiến bộ này cho phép các ứng dụng tinh vi trước đây không thể đạt được, biến CV trở thành nền tảng của sự phát triển AI hiện tại và là động lực chính cho các trường hợp sử dụng AI biến đổi tương lai của chúng ta .

Các khái niệm và nhiệm vụ chính

Tầm nhìn máy tính bao gồm nhiều nhiệm vụ nhằm trích xuất các loại thông tin khác nhau từ dữ liệu trực quan. Một số nhiệm vụ cốt lõi bao gồm:

Tầm nhìn máy tính so với các lĩnh vực liên quan

Sẽ rất hữu ích khi phân biệt Thị giác máy tính với các ngành liên quan:

  • Xử lý hình ảnh: Tập trung vào việc xử lý hình ảnh ở cấp độ thấp hơn, thường là bước tiền xử lý cho CV. Các tác vụ bao gồm giảm nhiễu, tăng cường độ tương phản và lọc bằng các thư viện như OpenCV . Xử lý hình ảnh sửa đổi các pixel nhưng không nhất thiết phải diễn giải nội dung hình ảnh. Đọc thêm về những khác biệt chính giữa Computer Vision và Image Processing .
  • Machine Vision (MV): Mặc dù trùng với CV, MV thường đề cập đến ứng dụng công nghệ thị giác trong các thiết lập công nghiệp để kiểm tra tự động, kiểm soát quy trình và hướng dẫn robot. Các hệ thống MV thường hoạt động trong môi trường được kiểm soát với các thiết lập camera và ánh sáng cụ thể, tập trung vào độ tin cậy và tốc độ cho các nhiệm vụ cụ thể như kiểm tra chất lượng trong sản xuất . Thêm thông tin về Machine Vision .

Công nghệ và khuôn khổ

Việc phát triển các ứng dụng thị giác máy tính dựa vào nhiều công cụ, thư viện và khuôn khổ khác nhau:

  • Thư viện: OpenCV (Thư viện thị giác máy tính nguồn mở) là một thư viện nền tảng cung cấp một bộ sưu tập lớn các thuật toán để xử lý hình ảnh và các tác vụ CV cổ điển. Các thư viện khác bao gồm Pillow để thao tác hình ảnh trong Python và Scikit-image cho các thuật toán xử lý hình ảnh.
  • Khung học sâu: PyTorchTensorFlow là các khung hàng đầu để xây dựng và đào tạo các mô hình học sâu, bao gồm cả các mô hình được sử dụng trong CV.
  • Mô hình: Các mô hình tiên tiến như YOLO (Bạn chỉ nhìn một lần) cung cấp khả năng phát hiện đối tượng hiệu quả theo thời gian thực. Các kiến trúc như ResNet là xương sống chung và Vision Transformers (ViT) đại diện cho một lớp mô hình mới hơn đang nổi lên. So sánh hiệu suất của các mô hình YOLO khác nhau.
  • Nền tảng: Các công cụ như Ultralytics HUB hợp lý hóa quy trình đào tạo, triển khai và quản lý các mô hình CV, cung cấp các tính năng như đào tạo đám mây và quản lý tập dữ liệu. Các nền tảng khác như RoboflowWeights & Biases cung cấp các công cụ bổ sung để chú thích dữ liệu và theo dõi thử nghiệm.

Ứng dụng trong thế giới thực

Các ứng dụng về thị giác máy tính ngày càng phổ biến trong nhiều lĩnh vực khác nhau:

Đọc tất cả