Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

Khám phá cách thị giác máy tính có thể được sử dụng để phát hiện ánh mắt

Khám phá cách các kỹ thuật Vision AI như phát hiện vật thể và ước tính tư thế có thể được sử dụng để theo dõi mắt và phát hiện ánh nhìn trong nhiều ứng dụng khác nhau.

Thị giác máy tính là một nhánh của trí tuệ nhân tạo (AI) tập trung vào việc cho phép máy móc phân tích và diễn giải dữ liệu trực quan theo cách tương tự như con người. Một ứng dụng đặc biệt hấp dẫn của Vision AI là phát hiện ánh mắt, giúp máy móc có thể theo dõi và hiểu được hướng nhìn của một người.

Là con người, chúng ta có thể theo dõi ánh mắt của ai đó và hiểu họ đang tập trung vào điều gì. Ví dụ, nếu bạn đang nói chuyện với một người bạn và họ đột nhiên nhìn về phía cửa, bạn có thể theo bản năng quay lại để xem điều gì thu hút sự chú ý của họ. Mặt khác, máy móc không có khả năng tích hợp này - chúng cần được đào tạo bằng các kỹ thuật thị giác máy tính để nhận dạng chuyển động của mắt và diễn giải hướng nhìn. 

Với thị trường phát hiện ánh mắt toàn cầu dự kiến đạt 11,9 tỷ đô la vào năm 2032, nhiều ngành công nghiệp đang áp dụng nó cho các ứng dụng khác nhau. Ví dụ, phát hiện ánh mắt trong ô tô đang được sử dụng để cải thiện sự an toàn của người lái xe bằng cách theo dõi mức độ chú ý và phát hiện các dấu hiệu buồn ngủ hoặc mất tập trung.

Trong bài viết này, chúng ta sẽ khám phá cách thị giác máy tính được sử dụng để theo dõi mắt và phát hiện ánh nhìn. Chúng ta cũng sẽ xem xét một số ứng dụng chính của nó trong nhiều ngành công nghiệp khác nhau. Hãy bắt đầu nào!

Theo dõi mắt và phát hiện ánh mắt là gì?

Theo dõi mắt và phát hiện ánh mắt là các kỹ thuật được sử dụng để xác định sự tập trung chú ý của một người bằng cách phân tích chuyển động mắt và hướng nhìn. Nhờ những tiến bộ trong công nghệ AI và cảm biến, giờ đây có thể theo dõi mắt của một người theo thời gian thực. 

Theo truyền thống, hầu hết các hệ thống theo dõi mắt đều dựa vào camera hồng ngoại (IR), phát hiện chuyển động của đồng tử bằng cách chiếu sáng mắt bằng ánh sáng gần hồng ngoại và chụp lại phản xạ giác mạc. Các hệ thống này cung cấp độ chính xác cao. Tuy nhiên, chúng thường yêu cầu mũ bảo hiểm chuyên dụng, có thể không thoải mái khi đeo và dễ gặp vấn đề về hiệu chuẩn.

Với sự phát triển của AI, các nhà nghiên cứu đã tích cực khám phá các phương pháp theo dõi mắt dựa trên thị giác máy tính. Không giống như các hệ thống dựa trên IR truyền thống, các phương pháp tiếp cận này dựa vào các mô hình thị giác máy tính như Ultralytics YOLO11 để phát hiện các đặc điểm trên khuôn mặt như mắt và đồng tử, cũng như thực hiện ước tính tư thế đầu. Ngoài ra, các mô hình học sâu chuyên biệt như NVIDIA GazeNet được thiết kế đặc biệt để ước tính ánh nhìn. 

Hình 1. Một ví dụ về việc sử dụng YOLO11 để phát hiện mắt và đồng tử của một người.

Mặc dù vẫn là một lĩnh vực đang phát triển, nhưng công nghệ theo dõi ánh mắt dựa trên thị giác máy tính có tiềm năng giúp việc theo dõi ánh mắt dễ tiếp cận hơn, giảm chi phí và cải thiện khả năng sử dụng cho các ứng dụng trong tiếp thị, tâm lý học và khoa học thần kinh.

Sự phát triển của việc phát hiện ánh mắt và theo dõi mắt

Tiếp theo, chúng ta hãy cùng khám phá sự chuyển đổi từ hệ thống hồng ngoại truyền thống sang các giải pháp dễ tiếp cận hơn do phần mềm điều khiển.

Bạn có thể tự hỏi liệu có thể theo dõi mắt và phát hiện ánh mắt mà không cần AI hay không - vậy tại sao vẫn có nghiên cứu đang diễn ra về việc tích hợp AI và thị giác máy tính vào các công nghệ này? Mặc dù các phương pháp theo dõi mắt truyền thống vẫn tồn tại, nhưng chúng thường dựa vào camera hồng ngoại chuyên dụng và thiết bị theo dõi mắt gắn trên đầu, có thể tốn kém, cồng kềnh và đòi hỏi điều kiện ánh sáng được kiểm soát. Tuy nhiên, các giải pháp do AI thúc đẩy cho phép theo dõi mắt bằng webcam và camera điện thoại thông minh tiêu chuẩn, giúp giảm chi phí và cải thiện khả năng truy cập. 

Hình 2. Thiết bị theo dõi mắt gắn trên đầu.

Sau đây là một số yếu tố khác thúc đẩy sự phát triển của công nghệ theo dõi mắt và phát hiện ánh nhìn:

  • Ứng dụng : Các phương pháp tiếp cận dựa trên phần mềm cho phép không gian này mở rộng ra ngoài phạm vi nghiên cứu sang các thiết bị tiêu dùng và các lĩnh vực như chơi game.
  • Khả năng mở rộng : AI có thể can thiệp để cung cấp các giải pháp phát hiện ánh mắt cho nhiều đối tượng hơn, từ người dùng cá nhân đến các ngành công nghiệp quy mô lớn.
  • Những tiến bộ trong công nghệ camera : Ngày nay, chúng ta có thể sử dụng camera trên điện thoại thông minh và webcam có độ phân giải cao giúp tăng cường độ chính xác khi theo dõi chuyển động của mắt - điều không khả thi cách đây 20 năm.

Sử dụng Ultralytics YOLO11 để phát hiện ánh mắt và theo dõi mắt

Bây giờ chúng ta đã thảo luận về vai trò của thị giác máy tính trong việc theo dõi mắt và phát hiện ánh nhìn, hãy cùng tìm hiểu cách YOLO11 có thể được sử dụng ở đây.

Ultralytics YOLO11 hỗ trợ các tác vụ như phát hiện đối tượng và ước tính tư thế. Được đào tạo trước trên tập dữ liệu COCO , nó đạt được độ chính xác cao trong việc phát hiện các đối tượng khác nhau. Cụ thể, đối với giải pháp phát hiện ánh mắt, YOLO11 có thể đóng vai trò hỗ trợ. 

Mặc dù không thể dự đoán trực tiếp hướng nhìn, nhưng nó có thể được tinh chỉnh để phát hiện khuôn mặt, mắt và đồng tử, đây là những yếu tố quan trọng để phân tích sâu hơn. Khi các đặc điểm này được xác định, các mô hình bổ sung có thể xử lý dữ liệu chuyển động của mắt để ước tính hướng nhìn. 

Ví dụ, để cải thiện độ chính xác, YOLO11 có thể được đào tạo tùy chỉnh trên các tập dữ liệu như WIDER FACE để phát hiện khuôn mặt. Ngoài ra, liên quan đến YOLO11 Với khả năng ước tính tư thế, nó có thể giúp theo dõi hướng đầu, giúp tăng cường độ chính xác khi phát hiện ánh mắt.

Hình 3 . YOLO11 có thể được sử dụng để phát hiện khuôn mặt người.

Ứng dụng thực tế của phát hiện ánh nhìn

Phát hiện ánh mắt, được hỗ trợ bởi thị giác máy tính, có nhiều ứng dụng trong nhiều ngành công nghiệp, từ cải thiện sự an toàn trong lĩnh vực ô tô đến phân tích sự tập trung trong trò chơi. Hãy cùng khám phá cách các lĩnh vực khác nhau đang tận dụng công nghệ này.

Theo dõi ánh mắt trong trò chơi

Theo dõi chuyển động mắt đang được sử dụng trong trò chơi để cung cấp thông tin chi tiết theo thời gian thực về sự tập trung, ra quyết định và thời gian phản ứng của người chơi. Bằng cách theo dõi chuyển động mắt, công nghệ này giúp người chơi tinh chỉnh chiến lược của mình, nâng cao chương trình đào tạo và cải thiện sự tương tác của khán giả bằng cách hiển thị trực quan nơi người chơi đang nhìn vào trong những khoảnh khắc quan trọng.

Một ví dụ thú vị về điều này là đua xe mô phỏng, một môn thể thao mô tô ảo cạnh tranh, nơi người chơi đua xe bằng cách sử dụng mô phỏng lái xe thực tế. Theo dõi mắt giúp phân tích cách người lái xe tập trung vào đường đua, phản ứng với đối thủ và điều hướng các khúc cua gấp. Bằng cách theo dõi ánh mắt của họ theo thời gian thực, người huấn luyện có thể xác định các mẫu, phát hiện sự mất tập trung và cải thiện các chiến lược đua xe. 

Hình 4. Có thể sử dụng công nghệ theo dõi mắt để giám sát và phân tích người đua xe mô phỏng. 

Ngoài đua xe mô phỏng, theo dõi mắt cũng được sử dụng trong các trò chơi cạnh tranh nhịp độ nhanh để phân tích phản xạ của người chơi, thời gian phản ứng và cách họ tập trung vào các yếu tố chính trong trò chơi. Bằng cách hiểu được người chơi nhìn vào đâu trước khi di chuyển, dữ liệu này giúp tinh chỉnh việc ra quyết định, cải thiện độ chính xác và nâng cao đào tạo cho lối chơi cấp cao.

Ước tính ánh mắt cho nghiên cứu tâm lý

Có nhiều ứng dụng Vision AI về ước tính ánh mắt liên quan đến nghiên cứu. Một ví dụ điển hình là việc sử dụng nó trong tâm lý học để nghiên cứu sự chú ý, tải nhận thức và hành vi xã hội. Bằng cách phân tích chuyển động của mắt, các nhà nghiên cứu có thể hiểu sâu hơn về nhận thức, quá trình ra quyết định và các tình trạng sức khỏe tâm thần như chứng tự kỷ và ADHD. 

Cụ thể, theo dõi ánh mắt bằng thị giác máy tính giúp xác định các mẫu chuyển động mắt, thời gian cố định và sự chú ý thị giác, có thể tiết lộ trạng thái nhận thức và cảm xúc. Với sự tiến bộ của học sâu và ước tính ánh mắt do AI điều khiển, các phương pháp này đang trở nên chính xác và dễ tiếp cận hơn, cho phép ứng dụng rộng rãi hơn trong nghiên cứu thần kinh.

An toàn ô tô

Trong nhiều năm qua, các nhà nghiên cứu đã sử dụng nhiều phương pháp khác nhau để nghiên cứu sự chú ý và tập trung của người lái xe trong các điều kiện giao thông khác nhau. Trong số các phương pháp này, theo dõi bằng mắt đóng vai trò quan trọng và có thể cung cấp thông tin chi tiết về nơi người lái xe đang nhìn khi lái xe. 

Với sự trợ giúp của các mô hình thị giác máy tính, phát hiện ánh mắt có thể cải thiện hơn nữa phân tích này bằng cách theo dõi chính xác chuyển động của mắt theo thời gian thực. Phân tích này có thể giúp chúng ta hiểu rõ hơn về hành vi của người lái xe, giúp xác định sự mất tập trung, mệt mỏi hoặc mất tập trung, có thể cải thiện an toàn giao thông và hỗ trợ phát triển các hệ thống hỗ trợ người lái tiên tiến.

Hình 5. Ví dụ về việc giám sát người lái xe bằng cách phát hiện khuôn mặt và theo dõi ánh mắt.

Ví dụ, nếu người lái xe thường xuyên rời mắt khỏi đường để kiểm tra điện thoại hoặc phản ứng chậm ở các ngã tư, hệ thống có thể phát hiện những hành vi này và đưa ra cảnh báo để họ tập trung lại, có khả năng ngăn ngừa tai nạn.

Ưu và nhược điểm của theo dõi mắt và phát hiện ánh nhìn

Sau đây là một số lợi ích chính mà công nghệ theo dõi mắt và phát hiện ánh nhìn có thể mang lại cho cuộc sống hàng ngày của chúng ta:

  • Nâng cao nhận thức: Theo dõi chuyển động mắt cung cấp thông tin chi tiết về cách mọi người tương tác trực quan với môi trường xung quanh, giúp hiểu rõ hơn về các kiểu chú ý và tập trung.
  • Ra quyết định tốt hơn : Dữ liệu thu thập được từ việc theo dõi mắt giúp các nhà nghiên cứu và chuyên gia đưa ra quyết định sáng suốt dựa trên các mô hình chú ý khách quan.
  • Cải thiện công thái học thị giác : Phân tích hành vi nhìn có thể giúp thiết kế màn hình, không gian làm việc và môi trường giúp giảm mỏi mắt và cải thiện sự thoải mái.

Mặc dù những lợi ích này nêu bật cách phát hiện ánh nhìn có thể tác động tích cực đến cuộc sống của chúng ta, nhưng cũng cần cân nhắc đến những thách thức liên quan đến việc triển khai nó. Sau đây là một số hạn chế chính cần lưu ý:

  • Mối quan ngại về quyền riêng tư : Theo dõi mắt liên tục có thể gây ra các vấn đề về quyền riêng tư, khiến người dùng không thoải mái. Đảm bảo tính minh bạch, sự đồng ý của người dùng và xử lý dữ liệu cục bộ có thể giúp giảm thiểu những mối quan ngại này.
  • Nhu cầu tính toán cao: Theo dõi ánh mắt theo thời gian thực có thể yêu cầu phần cứng mạnh, hạn chế khả năng truy cập trên các thiết bị có công suất thấp. Tuy nhiên, các mô hình được tối ưu hóa đang giúp cải thiện hiệu quả.
  • Giới hạn độ chính xác: Theo dõi ánh mắt có thể kém tin cậy hơn trong bối cảnh thực tế do thay đổi ánh sáng, chuyển động đầu hoặc các chướng ngại vật như kính và tóc. Góc máy ảnh cũng có thể ảnh hưởng đến hiệu suất.

Giữ mắt bạn hướng tới tương lai

Theo dõi mắt và phát hiện ánh nhìn, được hỗ trợ bởi các mô hình thị giác máy tính như YOLO11 , đang thay đổi cách chúng ta tương tác với thế giới. Từ việc làm cho đường sá an toàn hơn đến việc hiểu được hành vi của con người, công nghệ này đang ngày càng trở nên hữu ích trong cuộc sống hàng ngày.

Mặc dù có những thách thức như lo ngại về quyền riêng tư và nhu cầu về máy tính mạnh mẽ, những tiến bộ trong AI và thị giác máy tính đang giúp theo dõi mắt chính xác hơn và dễ sử dụng hơn. Khi tiếp tục cải thiện, nó có thể sẽ đóng vai trò lớn hơn trong nhiều ngành công nghiệp.

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi . Khám phá những đổi mới trong các lĩnh vực như AI trong xe tự láithị giác máy tính trong nông nghiệp trên các trang giải pháp của chúng tôi. Hãy xem các tùy chọn cấp phép của chúng tôi và hiện thực hóa các dự án Vision AI của bạn. 🚀

Logo FacebookBiểu trưng TwitterBiểu tượng LinkedInBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning