Hiểu cách SharkEye được trình bày tại YOLO Tầm nhìn 2024, đòn bẩy Ultralytics YOLOv8 để phát hiện vật thể theo thời gian thực và đảm bảo an toàn bãi biển.
Việc theo dõi động vật trong môi trường sống tự nhiên của chúng, dù là gia súc gặm cỏ trên trang trại hay cá mập di chuyển gần bờ, luôn quan trọng đối với sự an toàn và sức khỏe của chúng. Tuy nhiên, việc quan sát chúng bằng tay không hề dễ dàng. Thường phải mất nhiều giờ kiên nhẫn và tập trung cẩn thận, vì người quan sát phải theo dõi chặt chẽ mọi thay đổi về hành vi hoặc chuyển động. Ngay cả khi đó, vẫn dễ bỏ qua những dấu hiệu tinh tế nhưng quan trọng.
Nhờ trí tuệ nhân tạo (AI) can thiệp, quá trình này đang trở nên nhanh hơn, thông minh hơn và hiệu quả hơn nhiều, giảm bớt gánh nặng cho người quan sát trong khi cải thiện độ chính xác. Đặc biệt, thị giác máy tính có thể được sử dụng để theo dõi động vật, phát hiện nguy hiểm và đưa ra quyết định theo thời gian thực. Các nhiệm vụ từng mất nhiều giờ giờ đây có thể được thực hiện trong vài phút, mở ra những cách mới để hiểu hành vi của động vật.
Tại YOLO Tầm nhìn 2024 (YV24), một sự kiện kết hợp thường niên do Ultralytics , các chuyên gia và nhà sáng tạo đã tập hợp lại để khám phá cách AI giải quyết những thách thức hàng ngày. Một số chủ đề được giới thiệu bao gồm những tiến bộ trong phát hiện vật thể theo thời gian thực và giám sát động vật , chứng minh cách AI đang nâng cao tính an toàn và hiệu quả trong nhiều lĩnh vực khác nhau.
Một trong những điểm nhấn của sự kiện là bài phát biểu của Jim Griffin, Nhà sáng lập AI Master Group, nơi ông trình bày cách Vision AI giúp bãi biển an toàn hơn bằng cách phát hiện cá mập trước khi chúng đến quá gần bờ. Ông giải thích cách họ sử dụng Ultralytics YOLOv8 , một mô hình thị giác máy tính tiên tiến, để xác định chính xác cá mập theo thời gian thực, ngay cả trong những điều kiện khó khăn như sóng dữ, ánh sáng chói và chướng ngại vật dưới nước.
Trong bài viết này, chúng ta sẽ xem xét kỹ hơn về dự án SharkEye và chia sẻ những hiểu biết thú vị từ bài nói chuyện của Jim.
Jim bắt đầu bài nói chuyện của mình bằng cách giới thiệu Bãi biển Padaro, một điểm đến lướt sóng nổi tiếng ở California, nơi những người lướt sóng và cá mập thường cùng chia sẻ một vùng nước. Nhấn mạnh thách thức thực sự trong việc phát hiện cá mập, ông chia sẻ, "Tất nhiên, rất dễ để phát hiện ra một con cá mập nếu nó cắn bạn, vì vậy điều chúng tôi muốn làm là xác định những con cá mập trước."
SharkEye được tạo ra để giải quyết vấn đề này, với sự hỗ trợ của Đại học California, Santa Barbara. Jim đã mô tả cách máy bay không người lái có camera AI độ phân giải cao được sử dụng để bay cách mặt nước khoảng 200 feet, quét đại dương theo thời gian thực.
Nếu phát hiện thấy cá mập, cảnh báo qua SMS sẽ đến được khoảng 80 người, bao gồm nhân viên cứu hộ, chủ cửa hàng lướt sóng và bất kỳ ai đã đăng ký nhận thông tin cập nhật. Jim chỉ ra cách những thông báo tức thời này cho phép phản hồi nhanh chóng, giúp người đi biển an toàn hơn khi có cá mập ở gần bờ.
Jim cũng đề cập rằng SharkEye có bảng điều khiển trực tiếp nơi người dùng có thể xem số liệu thống kê phát hiện cá mập. Ví dụ, trong hơn 12 tuần, hệ thống đã xác định được hai con cá mập lớn và 15 con nhỏ hơn, trung bình chỉ hơn một con cá mập mỗi tuần.
Sau đó, ông giới thiệu Neil Nathan, nhà khoa học dẫn đầu những nỗ lực đằng sau SharkEye. Mặc dù có nền tảng về nghiên cứu môi trường hơn là khoa học máy tính, Nathan đã dẫn đầu thành công dự án. Jim nhấn mạnh cách các công cụ AI hiện đại, như những công cụ được sử dụng trong SharkEye, được thiết kế để dễ tiếp cận, cho phép những cá nhân không có nền tảng kỹ thuật phát triển các giải pháp có tác động.
Đi sâu hơn vào chi tiết, Jim đã giải thích chi tiết về những gì ẩn chứa bên trong SharkEye và giải pháp phát hiện cá mập không chỉ liên quan đến nhiệm vụ phát hiện vật thể đơn giản. Nó phải xử lý các điều kiện động, không thể đoán trước như rong biển trôi nổi có thể dễ dàng bị nhầm lẫn với cá mập. Không giống như việc phát hiện vật thể cố định, việc xác định cá mập đòi hỏi độ chính xác và khả năng thích ứng, khiến YOLOv8 một sự lựa chọn lý tưởng.
Một lợi thế khác của YOLOv8 là nó có thể được triển khai trên máy bay không người lái mà không cần dựa vào máy chủ đám mây. Jim giải thích cách tiếp cận này giúp SharkEye có thể gửi cảnh báo ngay lập tức - một phần thiết yếu để đảm bảo phản ứng kịp thời trong điều kiện đại dương không thể đoán trước.
Sau khi nêu bật cách thức hoạt động của SharkEye và nỗ lực hợp tác đằng sau nó, Jim đã trình bày bản demo trực tiếp.
Jim Griffin bắt đầu bản demo trực tiếp của mình bằng cách hướng dẫn khán giả qua một ví dụ quen thuộc - đoạn mã "hello world" cho các mô hình YOLO Ultralytics . Chỉ với sáu dòng Python mã, anh ấy đã trình bày cách một mã được đào tạo trước Ultralytics YOLOv8 mô hình có thể dễ dàng phát hiện xe buýt trong hình ảnh.
Bản demo của anh ấy đã sử dụng YOLOv8 Mô hình Nano, phiên bản nhẹ cho các thiết bị công suất thấp như máy bay không người lái. Mô hình tương tự đã được sử dụng trong SharkEye để phát hiện cá mập theo thời gian thực.
Để cung cấp thêm ngữ cảnh, Jim đã đề cập rằng mô hình trong bản demo đang được đào tạo trên COCO128, một tập hợp con nhỏ hơn của tập dữ liệu COCO được sử dụng rộng rãi. Tập dữ liệu COCO chứa hơn 20.000 hình ảnh trên 80 danh mục đối tượng khác nhau. Mặc dù COCO128 hoạt động tốt cho các bản trình diễn nhanh, ông chỉ ra rằng SharkEye cần thứ gì đó mạnh mẽ hơn - một tập dữ liệu phát hiện cá mập dành riêng cho ứng dụng có thể xử lý được sự phức tạp của các tình huống thực tế.
Theo Jim, phần khó nhất của dự án SharkEye không phải là đào tạo mô hình AI mà là thu thập dữ liệu phù hợp. Ông bình luận, “Công việc chính của dự án này không phải là AI. Công việc chính của dự án này là bay những chiếc máy bay không người lái đó trong năm năm, loại bỏ hình ảnh khỏi những video đó và gắn thẻ chúng một cách phù hợp.”
Ông mô tả cách nhóm thu thập 15.000 hình ảnh tại Bãi biển Padaro. Mỗi hình ảnh phải được dán nhãn thủ công để phân biệt giữa cá mập, rong biển và các vật thể khác trong nước. Mặc dù quá trình này chậm và đòi hỏi nhiều công sức, nhưng nó đã đặt nền tảng cho mọi thứ sau này.
Khi tập dữ liệu đã sẵn sàng, Ultralytics YOLOV8 đã được đào tạo riêng về nó. Jim cho biết, "Việc đào tạo thực tế không phải là phần khó - chỉ mất 20 giờ trên GPU T4 [Bộ xử lý đồ họa]." Ông cũng nói thêm rằng thời gian có thể được rút ngắn xuống chỉ còn năm giờ với phần cứng mạnh hơn, chẳng hạn như GPU A100.
Sau đó, Jim thảo luận về cách đánh giá hiệu suất của SharkEye. Ông minh họa rằng số liệu chính là độ chính xác - hệ thống xác định chính xác cá mập thực tế như thế nào. Với SharkEye đạt được độ chính xác ấn tượng 92%, mô hình đã chứng minh được tính hiệu quả cao trong việc xác định chính xác cá mập giữa môi trường đại dương phức tạp.
Đi sâu hơn vào tầm quan trọng của độ chính xác, Jim đã làm rõ lý do tại sao độ chính xác lại quan trọng hơn việc nhớ lại trong trường hợp này. “Hầu hết thời gian, mọi người quan tâm đến việc nhớ lại , đặc biệt là trong các lĩnh vực như chăm sóc sức khỏe, nơi mà việc bỏ sót một trường hợp dương tính có thể rất quan trọng. Nhưng trong trường hợp này, chúng tôi không biết có bao nhiêu con cá mập ngoài kia, vì vậy điều chúng tôi quan tâm là độ chính xác”, ông giải thích. SharkEye đảm bảo rằng các báo động giả được giảm thiểu bằng cách tập trung vào độ chính xác, giúp nhân viên cứu hộ và những người ứng cứu khác dễ dàng hành động nhanh chóng hơn.
Ông kết thúc bài nói chuyện của mình bằng cách so sánh AI với hiệu suất của con người, lưu ý rằng độ chính xác 92% của SharkEye vượt xa độ chính xác 60% của các chuyên gia con người. Ông nhấn mạnh khoảng cách này, nói rằng, "Đó là vì chúng ta là con người. Bất kể bạn hay tôi có thể chuyên nghiệp đến mức nào, nếu chúng ta phải ngồi trước màn hình cả ngày để tìm kiếm cá mập, cuối cùng, chúng ta sẽ để tâm trí mình lang thang." Không giống như con người, các mô hình AI không mệt mỏi hoặc bị mất tập trung, khiến nó trở thành một giải pháp đáng tin cậy cho các nhiệm vụ đòi hỏi phải giám sát liên tục.
Một trích dẫn thú vị từ bài nói chuyện của Jim Griffin, “Sáu dòng mã có thể cứu sống bạn một ngày nào đó”, đã mô tả một cách hoàn hảo về việc AI đã trở nên tiên tiến nhưng vẫn dễ tiếp cận như thế nào. Ultralytics YOLO các mô hình đã được tạo ra với mục đích này, giúp công nghệ thị giác máy tính tiên tiến có thể tiếp cận được với các nhà phát triển và doanh nghiệp ở mọi quy mô. Ultralytics YOLO11 xây dựng dựa trên điều này với khả năng suy luận nhanh hơn và độ chính xác cao hơn.
Đây là cái nhìn nhanh về những gì thiết lập YOLO11 riêng biệt:
Những tính năng này làm cho YOLO11 rất phù hợp để theo dõi hành vi động vật trong môi trường năng động, dù ở trang trại hay ngoài tự nhiên.
Những tiến bộ trong Vision AI đang giúp giải quyết các thách thức trong thế giới thực dễ dàng hơn bằng cách cung cấp các công cụ thiết thực cho nhiều lĩnh vực khác nhau. Ví dụ, các mô hình thị giác máy tính như YOLO11 có thể được sử dụng để theo dõi và giám sát động vật theo thời gian thực, ngay cả trong điều kiện khắc nghiệt.
Bài phát biểu quan trọng của Jim Griffin tại YV24 đã minh họa cách YOLOv8 có thể được sử dụng để giải quyết các vấn đề phức tạp với mã hóa tối thiểu. Dự án SharkEye, kết hợp máy bay không người lái với AI để phát hiện cá mập theo thời gian thực, đã giới thiệu cách công nghệ có thể cải thiện an toàn bãi biển.
Đây là một nghiên cứu điển hình hấp dẫn về cách AI dễ tiếp cận trao quyền cho mọi người từ nhiều nền tảng khác nhau để tạo ra các giải pháp hiệu quả. Khi AI tiếp tục phát triển, nó đang chuyển đổi các ngành công nghiệp và giúp mọi người có thể khai thác tiềm năng của nó để biến thế giới thành một nơi an toàn hơn, thông minh hơn và hiệu quả hơn.
Hãy trở thành một phần trong cộng đồng của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu sâu hơn về AI. Từ tầm nhìn máy tính trong nông nghiệp đến AI trong xe tự lái , hãy xem những công nghệ này đang thúc đẩy sự đổi mới như thế nào. Hãy xem các tùy chọn cấp phép của chúng tôi để bắt đầu các dự án AI của bạn ngay hôm nay!
Bắt đầu hành trình của bạn với tương lai của machine learning