Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

Tận dụng phát hiện màu sắc trong các ứng dụng thị giác máy tính

Khám phá cách phát hiện màu sắc kết nối thị giác của con người và máy tính, sử dụng không gian màu RGB và HSV để tự động hóa các giải pháp thị giác máy tính.

Màu sắc đóng vai trò quan trọng trong cách con người trải nghiệm thế giới, giúp chúng ta nhận ra, hiểu và kết nối với môi trường xung quanh. Tuy nhiên, không giống như chúng ta, máy móc không nhìn thấy màu sắc - chúng xử lý chúng dưới dạng dữ liệu, chuyển đổi sắc thái và màu sắc thành giá trị số.

Xe tự lái không chỉ nhìn thấy đèn giao thông màu đỏ - nó xử lý màu sắc như một tín hiệu dừng lại. Khả năng nhận biết và diễn giải màu sắc này giúp thu hẹp khoảng cách giữa thị giác của con người và thị giác máy tính.

Thị giác máy tính là một nhánh của AI cho phép máy phân tích và hiểu dữ liệu hình ảnh. Một khía cạnh quan trọng của điều này là phát hiện màu sắc, cho phép máy xác định và phân biệt các đối tượng dựa trên màu sắc. Bằng cách phân tích các giá trị pixel trong các không gian màu khác nhau, phát hiện màu sắc có thể được sử dụng trong các ứng dụng như theo dõi đối tượng, hình ảnh y tế và tự động hóa.

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn cách phát hiện màu sắc hoạt động, lý do tại sao nó quan trọng và cách nó được sử dụng trong các ứng dụng thị giác máy tính. Hãy bắt đầu nào!

Phát hiện màu sắc là gì?

Phát hiện màu giúp máy móc xác định các vật thể và hiểu các cảnh dựa trên màu sắc. Khi kết hợp với các tác vụ thị giác máy tính khác, nó cải thiện độ chính xác và nâng cao các ứng dụng trong thế giới thực. Trước khi đi sâu vào cách phát hiện màu hoạt động, bạn nên hiểu cách màu sắc được biểu diễn dưới dạng kỹ thuật số.

Hình ảnh kỹ thuật số được tạo thành từ các ô vuông nhỏ gọi là pixel, mỗi ô chứa thông tin màu. Ví dụ, đối với mô hình màu RGB (Đỏ, Xanh lục, Xanh lam), màu sắc được tạo ra bằng cách trộn các cường độ khác nhau của đỏ, xanh lục và xanh lam. 

Mỗi màu được xác định bằng ba giá trị, dao động từ 0 đến 255, trong đó 0 nghĩa là không màu và 255 nghĩa là cường độ đầy đủ. Ví dụ, màu đỏ nguyên chất là (255, 0, 0) vì nó có giá trị đỏ cao nhất và không có màu xanh lá cây hoặc xanh lam. Màu trắng là (255, 255, 255) vì cả ba màu đều có cường độ đầy đủ.

Hình 1. Một ví dụ về cách máy tính nhìn thấy màu sắc của quả táo.

Nếu bạn quen thuộc với các mô hình thị giác máy tính như Ultralytics YOLO11 , bạn có thể tự hỏi tại sao phát hiện màu sắc lại là một kỹ thuật riêng biệt với phát hiện đối tượng. Mặc dù cả hai đều phân tích hình ảnh, nhưng chúng phục vụ các mục đích khác nhau.

Phát hiện màu tập trung vào việc xác định các màu cụ thể trong hình ảnh, trong khi phát hiện đối tượng nhận dạng và phân loại các đối tượng bất kể màu sắc của chúng. Trong trường hợp xe tự lái, phát hiện màu phát hiện màu đỏ trong đèn giao thông, trong khi phát hiện đối tượng xác định chính đèn giao thông, giúp xe đưa ra quyết định lái xe an toàn.

Giới thiệu về không gian màu

Mô hình màu hoặc không gian màu là một hệ thống được sử dụng để biểu diễn màu sắc trong hình ảnh kỹ thuật số và là một phần quan trọng của quá trình phát hiện màu. Nó gán các giá trị số cho màu sắc, cho phép máy tính diễn giải chúng một cách nhất quán trên các thiết bị khác nhau. Không gian màu cung cấp một cách có cấu trúc để lưu trữ, điều chỉnh và hiển thị màu sắc trong các hệ thống kỹ thuật số.

Một số không gian màu thường dùng bao gồm RGB cho màn hình kỹ thuật số, HSV (Sắc thái, Độ bão hòa, Giá trị) cho xử lý hình ảnh và CMYK (Lục lam, Hồng cánh sen, Vàng, Đen) cho in ấn. RGB và HSV là những không gian màu thường dùng nhất để phát hiện màu sắc. Hãy cùng tìm hiểu cách chúng hoạt động.

Tổng quan về không gian màu RGB

Không gian màu RGB được sử dụng rộng rãi trong hình ảnh kỹ thuật số, có trong màn hình, máy ảnh và thiết bị hiển thị. Nó hoạt động bằng cách kết hợp các mức độ khác nhau của ánh sáng đỏ, xanh lá cây và xanh lam để tạo ra nhiều màu sắc khác nhau. Khi cả ba màu đều ở cường độ tối đa, kết quả là màu trắng và khi không có màu nào, nó sẽ xuất hiện màu đen.

Không gian màu này thường được hình dung như một khối lập phương màu, trong đó mỗi trục biểu diễn một trong các màu chính. Các góc của khối lập phương hiển thị màu đỏ, xanh lá cây và xanh lam nguyên chất, cùng với các kết hợp của chúng, trong khi bên trong chứa tất cả các sắc thái có thể có.

Mặc dù RGB đơn giản và phổ biến, nhưng nó có một số hạn chế. Màu sắc có thể không phải lúc nào cũng giống nhau đối với mắt người vì RGB không khớp với cách chúng ta cảm nhận sự khác biệt về màu sắc. Nó cũng bị ảnh hưởng bởi điều kiện ánh sáng, nghĩa là màu sắc có thể xuất hiện khác nhau tùy thuộc vào độ sáng và môi trường.

Hình 2. Khối màu RGB.

Tổng quan về không gian màu HSV

Không gian màu HSV (Sắc thái, Độ bão hòa, Giá trị) biểu diễn màu sắc dựa trên ba thành phần: sắc thái (loại màu), độ bão hòa (cường độ) và giá trị (độ sáng). Không giống như RGB, kết hợp cường độ ánh sáng, HSV gần hơn với cách con người cảm nhận màu sắc, khiến nó trở thành lựa chọn thực tế hơn cho nhiều tác vụ xử lý hình ảnh.

Cụ thể, sắc thái biểu thị màu thực tế và được đo bằng độ trên bánh xe màu, với màu đỏ ở 0° và màu xanh lam ở 240°. Trong khi đó, độ bão hòa kiểm soát mức độ sống động hoặc xỉn màu của màu, trong đó 0% là hoàn toàn xám và 100% là hoàn toàn rực rỡ. Mặt khác, giá trị xác định độ sáng, dao động từ 0% (đen) đến 100% (độ sáng tối đa).

Điều thú vị là không gian màu HSV thường được hình dung như một hình nón, trong đó sắc độ bao quanh mép, độ bão hòa di chuyển ra ngoài và độ sáng tăng dần từ dưới lên trên. Vì nó tách màu khỏi độ sáng, HSV được sử dụng rộng rãi trong các ứng dụng thị giác máy tính .

Hình 3. Hình nón HSV.

So sánh không gian màu RGB và HSV

Để so sánh RGB và HSV cạnh nhau, chúng ta hãy lấy màu cam làm ví dụ. Trong không gian màu RGB, màu cam được tạo ra bằng cách trộn màu đỏ và màu xanh lá cây ở cường độ cụ thể, thường được biểu thị là (255, 165, 0) - nghĩa là toàn màu đỏ, một ít màu xanh lá cây và không có màu xanh lam. Tuy nhiên, vì RGB không tách màu khỏi độ sáng nên có thể kém trực quan hơn đối với các tác vụ đòi hỏi thao tác màu chính xác.

Trong HSV, màu cam được định nghĩa khác. Sắc độ của nó vào khoảng 30°, xác định vị trí của nó trên bánh xe màu. Độ bão hòa của nó gần bằng 100%, nghĩa là nó là màu sống động, tinh khiết và giá trị của nó cũng là 100%, biểu thị độ sáng đầy đủ. Vì HSV tách màu khỏi độ sáng, nên nó thường hữu ích hơn trong các ứng dụng phát hiện màu khi điều kiện ánh sáng có thể thay đổi.

Hình 4. So sánh giá trị RGB và HSV. Hình ảnh của tác giả.

Cách thức hoạt động của phát hiện màu sắc

Thông thường, phát hiện màu được tiếp cận như một kỹ thuật xử lý hình ảnh được sử dụng để xác định và tách màu khỏi hình ảnh hoặc video. Màu sắc được phát hiện trong hình ảnh bằng cách xử lý hình ảnh dựa vào không gian màu và kỹ thuật ngưỡng để phân biệt các sắc thái, sắc thái và cường độ cụ thể. 

Sau đây là tổng quan nhanh về các bước chính liên quan đến việc phát hiện màu sắc bằng cách xử lý hình ảnh:

  • Thu thập hình ảnh: Quá trình bắt đầu bằng cách chụp ảnh hoặc khung hình video bằng máy ảnh. Hình ảnh thường được lưu trữ ở định dạng RGB dưới dạng ma trận pixel.
  • Chuyển đổi không gian màu: Vì RGB không phải lúc nào cũng lý tưởng để phát hiện màu, nên hình ảnh được chuyển đổi sang không gian màu HSV. Điều này giúp tách màu khỏi độ sáng, giúp phát hiện ổn định hơn trong các điều kiện ánh sáng khác nhau.
  • Ngưỡng màu: Một phạm vi cụ thể được xác định cho màu mục tiêu theo định dạng HSV. Bước này tạo ra một mặt nạ nhị phân, trong đó các điểm ảnh trong phạm vi màu đã chọn sẽ hiển thị màu trắng và tất cả các điểm ảnh khác sẽ hiển thị màu đen.
  • Masking: Mặt nạ nhị phân được áp dụng cho hình ảnh gốc để cô lập màu được phát hiện, lọc bỏ mọi thứ khác. Điều này chỉ làm nổi bật các vùng khớp với màu mong muốn.

Sau khi phát hiện và phân lập được màu sắc, nó có thể được sử dụng trong nhiều tác vụ thị giác máy tính khác nhau, chẳng hạn như theo dõi đối tượng, phân đoạn hình ảnh và ra quyết định tự động trong các ứng dụng như robot, hình ảnh y tế và xe tự hành.

Vai trò của phát hiện màu sắc trong thị giác máy tính

Bây giờ chúng ta đã biết cách phát hiện màu sắc hoạt động, hãy cùng khám phá cách nó hỗ trợ các ứng dụng thị giác máy tính. 

Trong một số trường hợp, phát hiện màu có thể là một giải pháp thay thế đơn giản hơn cho các mô hình thị giác máy tính , đặc biệt là trong các môi trường được kiểm soát, nơi màu sắc là yếu tố chính để phân biệt các đối tượng. Thay vì đào tạo một mô hình bằng một tập dữ liệu lớn, phát hiện màu cung cấp một giải pháp nhanh chóng và hiệu quả mà không cần phải dán nhãn rộng rãi hoặc công suất tính toán cao.

Ví dụ, trong một hệ thống phân loại táo tự động, một mô hình thị giác máy tính như YOLO11 có thể được đào tạo để phân loại táo theo độ chín, nhưng sẽ cần một tập dữ liệu hình ảnh được gắn nhãn để xử lý các biến thể về ánh sáng, kết cấu và loại táo. 

Một cách tiếp cận đơn giản hơn là đầu tiên phát hiện táo bằng cách sử dụng phát hiện đối tượng và sau đó phân tích màu sắc của chúng để xác định độ chín. Vì phương pháp này dựa trên ngưỡng màu được xác định trước thay vì đào tạo mô hình, nên nó hoạt động tốt trong điều kiện ổn định khi ánh sáng và nền không thay đổi đáng kể.

Trong khi một mô hình được đào tạo tùy chỉnh có thể tốt hơn cho các môi trường phức tạp và biến đổi hơn, phát hiện màu là một giải pháp nhanh chóng, thiết thực và dễ tiếp cận cho các ứng dụng thời gian thực. Đây cũng là điểm khởi đầu tuyệt vời cho những người tìm hiểu về xử lý hình ảnh và thị giác máy tính trước khi chuyển sang các giải pháp nâng cao hơn.

Ứng dụng thực tế của phát hiện màu sắc

Phát hiện màu sắc được sử dụng trong nhiều ngành công nghiệp cho nhiều ứng dụng khác nhau. Chúng ta hãy cùng xem qua một số trường hợp sử dụng thực tế.

Phát hiện màu sắc để đánh giá chất lượng vải

Phát hiện màu sắc là rất quan trọng trong sản xuất vải và hàng dệt may . Nó thường được sử dụng trong hệ thống kiểm soát chất lượng tự động và xác định lỗi. Không giống như kiểm tra thủ công, tốn thời gian và dễ xảy ra lỗi của con người, hệ thống tự động cung cấp khả năng phát hiện lỗi chính xác và theo thời gian thực. 

Cụ thể, bằng cách phân tích hình ảnh vải, hệ thống thị giác máy tính có thể xác định các khuyết tật như phân phối thuốc nhuộm không đều, phai màu và nhiễm bẩn. Các kỹ thuật phát hiện màu tiên tiến giúp kiểm soát chất lượng chính xác hơn bằng cách đo độ đồng nhất màu giữa các lô khác nhau.

Hình 5. Phát hiện màu sắc đóng vai trò quan trọng trong việc tạo ra vải nhiều màu sắc.

Sử dụng phát hiện màu sắc trong nông nghiệp

Như đã đề cập trước đó, màu sắc là chỉ số quan trọng để đánh giá độ chín và công nghệ phát hiện màu sắc có thể được sử dụng trong nông nghiệp để theo dõi sức khỏe cây trồng và cải thiện quá trình thu hoạch. 

Bằng cách phân tích các biến thể màu sắc, nông dân có thể đánh giá sức khỏe cây trồng, phát hiện bệnh tật và xác định thời điểm cây trồng sẵn sàng để thu hoạch. Các rô-bốt tiên tiến được trang bị cảm biến màu sắc và thị giác máy tính giúp tự động hóa quy trình bằng cách đảm bảo chỉ thu hoạch những cây trồng chín. Các hệ thống này có thể tăng hiệu quả và năng suất, đặc biệt là ở những khu vực thiếu lao động.

Hình 6. Xoài ở các mức độ chín khác nhau: (a) thối, (b) chín và (c) chưa chín.

Những điểm chính

Phát hiện màu là một kỹ thuật thị giác máy tính sáng tạo có ứng dụng trong nông nghiệp, sản xuất, chăm sóc sức khỏe và tự động hóa. Nó giúp máy móc nhận dạng và diễn giải màu sắc để theo dõi đối tượng, kiểm soát chất lượng và ra quyết định. 

Trong khi các mô hình AI tiên tiến tiếp tục phát triển, phát hiện màu sắc vẫn là giải pháp đơn giản và hiệu quả, đặc biệt là trong môi trường được kiểm soát. Khi công nghệ tiến bộ, nó có khả năng sẽ tiếp tục đóng vai trò quan trọng trong việc cải thiện các ứng dụng trong thế giới thực.

Khám phá sâu hơn về AI bằng cách khám phá cộng đồngkho lưu trữ GitHub của chúng tôi. Tìm hiểu về những đổi mới trong AI trong sản xuấtthị giác máy tính trong chăm sóc sức khỏe , và khám phá cách bắt đầu tận dụng Vision AI với các tùy chọn cấp phép của chúng tôi.

Logo FacebookBiểu trưng TwitterBiểu tượng LinkedInBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning