Khám phá cách Ultralytics đang giải quyết ô nhiễm nhựa đại dương bằng cách sử dụng AUV và YOLOv5 để phát hiện và dọn dẹp dưới nước hiệu quả.
Nhựa đang bóp nghẹt động vật hoang dã biển: mỗi phút, hai xe tải nhựa được đổ vào đại dương của chúng ta, tương đương với hơn 10 triệu tấn mỗi năm. Các nhà khoa học của DeepPlastic tuyên bố rằng loại nhựa đại dương này gây ra các mối đe dọa xã hội đối với "môi trường biển, an toàn thực phẩm, sức khỏe con người, du lịch sinh thái và những đóng góp cho biến đổi khí hậu".
Để chống lại điều này, nhóm các nhà nghiên cứu và kỹ sư này đã điều tra làm thế nào thị giác máy tính có thể loại bỏ nhựa trong đại dương của chúng ta.
Với công nghệ học sâu, các nhà nghiên cứu DeepPlastic đã phát triển một phương pháp sử dụng các phương tiện tự hành dưới nước (AUV) để quét, xác định và định lượng nhựa nằm ngay dưới bề mặt đại dương nơi ánh sáng vẫn có thể xuyên qua hoặc lớp Epipelagic.
"Mục tiêu của chúng tôi là có một mô hình rất nhỏ với tốc độ suy luận rất nhanh có thể được sử dụng để phát hiện nhựa."
Jay Lowe, Nhà nghiên cứu Machine Learning
Nhóm DeepPlastic đã đào tạo hai mô hình nhỏ và chính xác, YOLOv4 và YOLOv5, cho phép phát hiện đối tượng theo thời gian thực. Các mô hình này được đào tạo trên bộ dữ liệu DeepTrash, bao gồm:
AUV là một robot di chuyển dưới nước. Chúng là những phương tiện chậm chạp có thể lướt tự do xuống độ sâu đại dương và trở lại bề mặt. Một mô hình học sâu phải được cài đặt vào AUV để chúng có thể xác định và thu thập nhựa dưới nước. AUV có thể được triển khai trong ba bước đơn giản để phát hiện nhựa dưới nước.
1. Cài đặt mô hình deep learning vào AUV
2. Quét đại dương
3. Nhận biết nhựa
Nhóm DeepPlastic đã thử nghiệm một số mô hình học sâu như YOLOv4 và Faster R-CNN trên AUV. Tuy nhiên, các nhà nghiên cứu đã phải đối mặt với một loạt các thách thức khiến việc làm sạch đại dương trở nên khó khăn.
Không có bất kỳ chuyên gia học sâu nào trong nhóm, các nhà nghiên cứu đã bị ngăn cản tận dụng tối đa các mô hình học sâu.
Suy luận là AUV có thể nhận ra nhựa nhanh như thế nào. Với YOLOv4 và Faster R-CNN, AUV không hiệu quả trong việc phát hiện nhựa, làm giảm khả năng làm sạch nước của chúng.
YOLOv4 và Faster R-CNN chỉ có tỷ lệ thành công trung bình 77% -80% khi xác định nhựa.
Khi sử dụng Faster R-CNN, 3-5% san hô được xác định là nhựa bởi AUV, thấp hơn tiêu chuẩn chấp nhận được.
Khi chuyển sang YOLOv5, các nhà nghiên cứu đã thấy một sự thay đổi ngay lập tức. Độ chính xác được tăng cường, tốc độ được tối đa hóa và sự đơn giản của YOLOv5 làm cho nó có thể truy cập được cho tất cả mọi người trong nhóm.
Tốc độ suy luận nhanh hơn trung bình 20% khi so sánh với R-CNN nhanh hơn
Tỷ lệ chính xác 93%
Ít hơn một giờ để thiết lập YOLOv5
Có một số khía cạnh của YOLOv5 Điều đó cho phép nhóm dễ dàng làm việc với nó, dựa trên quy trình từng bước đơn giản mà chúng tôi đã thiết lập trên kho lưu trữ.
YOLOv5 trình bày tốc độ suy luận nhanh hơn 20% so với RCNN nhanh hơn, xử lý trung bình 1 hình ảnh trong 9 mili giây. Kết quả là, AUV có thể phát hiện nhựa nổi với tốc độ nhanh hơn, làm tăng lượng nhựa thu được và hiệu quả tổng thể của dự án.
Tỷ lệ chính xác ở mức trung bình 85%, đôi khi lên tới 93%. Đây là một bước nhảy vọt so với mức trung bình 77-80% được thấy với các mô hình trước đó.
Thiết lập YOLOv5 vừa là một trải nghiệm liền mạch vừa dễ dàng cho các nhà nghiên cứu. Người dùng được hướng dẫn từ A đến Z trong toàn bộ quá trình thiết lập cho phép nhóm bắt đầu YOLOv5 trong vòng chưa đầy một giờ.
Trong vòng vài ngày, sử dụng một bộ dữ liệu nhỏ gồm 3000 hình ảnh mà không cần tăng cường, nhóm đã có thể huấn luyện các AUV làm việc trong hồ và sông. Mặc dù nước đục và các điều kiện tồi tệ khác, các AUV đã được huấn luyện YOLOv5 vẫn có thể phát hiện và xác định nhựa với độ chính xác cao.
"Chúng tôi đang tìm kiếm một thuật toán phát hiện đối tượng tạo ra độ chính xác cao và cực kỳ nhanh. Môi trường đại dương mà chúng tôi làm việc là những địa hình khắc nghiệt, gồ ghề. YOLOv5 được cung cấp trên tất cả các mặt trận như là mô hình phát hiện đối tượng tốt nhất mà chúng tôi có thể sử dụng.
"Chúng tôi thích sử dụng YOLOv5 Vì nó rất dễ thiết lập và sử dụng, và nó đã tạo ra kết quả mà chúng tôi muốn một cách nhất quán.
"Đối với bất kỳ mô hình nào trong tương lai mà chúng tôi sẽ triển khai, chúng tôi sẽ xem xét YOLOv5 là lựa chọn đầu tiên của chúng tôi mà không nghi ngờ gì nữa."
Gautam Tata, Nhà nghiên cứu Machine Learning
Kiểm tra kho lưu trữ DeepPlastic, bài báo đã xuất bản và tóm tắt video.
Bắt đầu hành trình của bạn với tương lai của machine learning