Узнай, как SharkEye, представленный на YOLO Vision 2024, использует Ultralytics YOLOv8 для обнаружения объектов в реальном времени и обеспечения безопасности на пляже.
Наблюдение за животными в их естественной среде обитания, будь то скот, пасущийся на ферме, или акулы, передвигающиеся у берега, всегда было важно для их безопасности и благополучия. Однако вручную наблюдать за ними не так-то просто. Часто это может потребовать нескольких часов терпения и тщательной сосредоточенности, ведь наблюдателям приходится внимательно следить за любыми изменениями в поведении или движении. Но даже в этом случае легко пропустить едва заметные, но важные признаки.
Благодаря искусственному интеллекту (ИИ) этот процесс становится все быстрее, умнее и намного эффективнее, снижая нагрузку на наблюдателей-людей и повышая точность. В частности, компьютерное зрение можно использовать для отслеживания животных, обнаружения опасностей и принятия решений в режиме реального времени. Задачи, на которые раньше уходили часы, теперь можно решать за считанные минуты, открывая новые пути к пониманию поведения животных.
На ежегодном гибридном мероприятии YOLO Vision 2024 (YV24), организованном компанией Ultralytics, собрались эксперты и новаторы, чтобы узнать, как ИИ решает повседневные задачи. Среди представленных тем были достижения в области обнаружения объектов в реальном времени и наблюдения за животными, демонстрирующие, как ИИ повышает безопасность и эффективность в различных областях.
Одним из главных событий мероприятия стало выступление Джима Гриффина, основателя AI Master Group, в котором он продемонстрировал, как Vision AI делает пляжи безопаснее, обнаруживая акул до того, как они подойдут слишком близко к берегу. Он объяснил, как они используют Ultralytics YOLOv8передовую модель компьютерного зрения, чтобы точно идентифицировать акул в режиме реального времени, даже в таких сложных условиях, как неспокойные волны, блики и подводные препятствия.
В этой статье мы подробнее рассмотрим проект SharkEye и поделимся интересными моментами из выступления Джима.
Джим начал свой доклад с представления Падаро-Бич, известного места для серфинга в Калифорнии, где серферы и акулы часто живут в одних и тех же водах. Подчеркивая реальную сложность обнаружения акул, он поделился: "Конечно, легко обнаружить акулу, если она тебя укусит, поэтому то, что мы хотели сделать, - это идентифицировать акул заранее".
Для решения этой проблемы при поддержке Калифорнийского университета в Санта-Барбаре был создан проект SharkEye. Джим рассказал, как использовались дроны с камерами высокого разрешения с искусственным интеллектом, которые летали на высоте около 200 футов над водой, сканируя океан в режиме реального времени.
Если акула обнаружена, SMS-оповещения приходят примерно 80 людям, включая спасателей, владельцев серф-магазинов и всех, кто подписался на обновления. Джим отметил, что такие мгновенные оповещения позволяют быстро реагировать на ситуацию, делая пляжников более безопасными, когда акула оказывается рядом с берегом.
Джим также упомянул, что в SharkEye есть живая приборная панель, на которой пользователи могут увидеть статистику обнаружения акул. Например, за 12 недель система выявила две большие акулы и 15 маленьких, в среднем чуть больше одной акулы в неделю.
Затем он представил Нила Натана, ученого, который возглавил работу над SharkEye. Несмотря на то, что Натан получил образование в области экологии, а не информатики, он успешно возглавил проект. Джим подчеркнул, что современные инструменты искусственного интеллекта, подобные тем, что используются в SharkEye, разработаны так, чтобы быть доступными, позволяя людям с нетехническим образованием разрабатывать эффективные решения.
Углубившись в детали, Джим подробно рассказал о том, что находится под капотом SharkEye, и о том, что решение по обнаружению акул не сводилось к простой задаче распознавания объектов. Ему пришлось иметь дело с динамичными, непредсказуемыми условиями, такими как плавающие водоросли, которые легко можно принять за акул. В отличие от обнаружения неподвижного объекта, идентификация акулы требует точности и адаптивности, что делает YOLOv8 идеальным выбором.
Еще одно преимущество YOLOv8 заключалось в том, что его можно было развернуть на дроне, не полагаясь на облачные серверы. Джим объяснил, как такой подход позволил SharkEye отправлять немедленные оповещения - важная часть обеспечения своевременной реакции в непредсказуемых условиях океана.
Рассказав о том, как работает SharkEye и какие совместные усилия стоят за этим, Джим продемонстрировал живую демонстрацию.
Джим Гриффин начал свое живое демо с того, что провел аудиторию по знакомому примеру - фрагменту кода "hello world" для моделейUltralytics YOLO . С помощью всего шести строк кода на Python он продемонстрировал, как предварительно обученная модель Ultralytics YOLOv8 может без труда обнаружить автобус на изображении.
В его демонстрации использовалась модель YOLOv8 Nano - облегченная версия для маломощных устройств вроде дронов. Эта же модель использовалась в SharkEye для обнаружения акул в режиме реального времени.
В качестве дополнительного контекста Джим упомянул, что модель в демонстрации обучалась на COCO128, меньшем подмножестве широко используемого набора данных COCO. Набор данных COCO содержит более 20 000 изображений 80 различных категорий объектов. Хотя COCO128 хорошо подходит для быстрых демонстраций, он отметил, что SharkEye нужно что-то более надежное - набор данных для обнаружения акул, ориентированный на конкретные приложения, который мог бы справиться со сложностями реальных сценариев.
По словам Джима, самым сложным в проекте SharkEye было не обучение ИИ-модели, а сбор нужных данных. Он прокомментировал: "Главной работой этого проекта был не ИИ. Основная работа в этом проекте заключалась в том, чтобы в течение пяти лет летать над этими дронами, отбирать изображения из этих видео и помечать их соответствующим образом".
Он рассказал, как команда собрала 15 000 снимков на пляже Падаро. Каждое изображение приходилось вручную маркировать, чтобы отличить акул, водоросли и другие объекты в воде. Хотя этот процесс был медленным и трудоемким, он заложил основу для всего последующего.
Как только набор данных был готов, Ultralytics YOLOV8 был обучен на нем. Джим сказал: "Само обучение было не самым сложным - оно заняло всего 20 часов на T4 GPU [графических процессорах]". Он также добавил, что это время можно было бы сократить до пяти часов при использовании более мощного оборудования, например графических процессоров A100.
Затем Джим рассказал о том, как оценивается эффективность SharkEye. Он показал, что ключевой метрикой была точность - насколько точно система идентифицировала реальных акул. Так как SharkEye достигла впечатляющей точности в 92%, модель оказалась очень эффективной в точном определении акул среди сложной океанской среды.
Углубившись в важность точности, Джим пояснил, почему в данном случае точность имела большее значение, чем отзыв. "Чаще всего людей интересует отзыв, особенно в таких областях, как здравоохранение, где пропуск положительного случая может быть критичным. Но в данном случае мы не знали, сколько там акул, поэтому нам была важна точность", - объяснил он. SharkEye обеспечил минимизацию ложных тревог, сосредоточившись на точности, что облегчило спасателям и другим специалистам быстрое принятие мер.
В завершение своего выступления он сравнил работу ИИ с работой человека, отметив, что 92-процентная точность SharkEye намного превосходит 60-процентную точность человеческих экспертов. Он подчеркнул этот разрыв, сказав: "Это потому, что мы люди. Каким бы экспертом ты или я ни были, если нам приходится целыми днями сидеть перед экраном и искать акул, в конце концов мы позволим своему разуму блуждать". В отличие от людей, модели ИИ не устают и не отвлекаются, что делает их надежным решением для задач, требующих постоянного контроля.
Интригующая цитата из выступления Джима Гриффина "Шесть строчек кода могут однажды спасти тебе жизнь" как нельзя лучше передает, насколько продвинутым и в то же время доступным стал ИИ. Модели Ultralytics YOLO были созданы с учетом этого, делая передовые технологии компьютерного зрения доступными для разработчиков и предприятий любого размера. Ultralytics YOLO11 развивает эту идею благодаря более быстрым умозаключениям и высокой точности.
Вот краткий взгляд на то, что отличает YOLO11 :
Благодаря этим особенностям YOLO11 отлично подходит для отслеживания поведения животных в динамичных условиях, будь то на ферме или в дикой природе.
Достижения в области искусственного зрения облегчают решение реальных задач, предоставляя практичные инструменты для различных областей. Например, модели компьютерного зрения, такие как YOLO11 , можно использовать для мониторинга и слежения за животными в реальном времени, даже в сложных условиях.
Ключевой доклад Джима Гриффина на YV24 проиллюстрировал, как YOLOv8 можно использовать для решения сложных задач с минимальным кодированием. Проект SharkEye, объединяющий дроны с искусственным интеллектом для обнаружения акул в режиме реального времени, продемонстрировал, как технологии могут повысить безопасность на пляже.
Это был увлекательный пример того, как доступный ИИ дает возможность людям из разных слоев общества создавать эффективные решения. По мере того как ИИ продолжает развиваться, он преобразует отрасли и дает возможность людям использовать его потенциал, чтобы сделать мир безопаснее, умнее и эффективнее.
Стань частью нашего сообщества и изучи наш репозиторий на GitHub, чтобы глубже погрузиться в ИИ. От компьютерного зрения в сельском хозяйстве до ИИ в самодвижущихся автомобилях- посмотри, как эти технологии двигают инновации. Ознакомься с нашими вариантами лицензирования, чтобы начать свои проекты в области ИИ уже сегодня!
Начни свое путешествие с будущим машинного обучения