Зелёная проверка
Ссылка копируется в буфер обмена

Поведенческий ИИ делает компьютерное зрение более эффективным

Присоединяйся к нам, чтобы пересмотреть ключевой доклад Дэвида Скотта YOLO Vision 2024, посвященный анализу поведения на основе ИИ и его реальному применению в таких отраслях, как животноводство.

На протяжении многих лет инновации в области компьютерного зрения были направлены на решение таких задач, как обнаружение объектов - идентификация таких объектов, как собака или автомобиль, на изображениях и видео. Эти подходы позволили найти применение в таких областях, как автономные транспортные средства, производство и здравоохранение. 

Однако зачастую эти задачи сосредоточены только на определении того, что представляет собой объект. Что, если бы системы Vision AI могли пойти на шаг дальше? Например, вместо того чтобы просто обнаружить собаку, допустим, она могла бы понять, что собака гонится за мячом или что машина резко тормозит, потому что пешеход переходит дорогу. Этот переход от базового распознавания к контекстуальному пониманию представляет собой серьезный сдвиг в сторону более умного, учитывающего контекст поведенческого ИИ.

На YOLO Vision 2024 (YV24), Ultralytics' ежегодном гибридном мероприятии, посвященном достижениям в области Vision AI, концепция анализа поведения на основе ИИ заняла центральное место во время интересного выступления Дэвида Скотта, генерального директора The Main Branch.

В своем выступлении Дэвид исследовал переход от базовых задач компьютерного зрения к отслеживанию поведения. Имея более чем 25-летний опыт создания передовых технологических приложений, он продемонстрировал влияние этого скачка. Он подчеркнул, как декодирование паттернов и поведения перестраивает такие отрасли, как сельское хозяйство и защита животных.

В этой статье мы пройдемся по основным моментам выступления Дэвида и рассмотрим, как отслеживание поведения делает ИИ более практичным. 

Понимание проблем внедрения ИИ

Дэвид Скотт начал свой доклад со смелой проверки реальности и сказал: "Один мой коллега часто говорит: "Наука не продается", и это немного обижает многих из нас, потому что мы действительно любим науку. ИИ действительно крут - почему бы людям просто не купить его? Но реальность такова, что люди не хотят покупать его только потому, что мы считаем его крутым; им нужна причина, чтобы купить его".

Далее он рассказал, что в его компании The Main Branch основное внимание всегда уделяется решению реальных проблем с помощью ИИ, а не просто демонстрации его возможностей. Многие клиенты приходят с желанием рассказать о том, как они могут использовать ИИ в целом, но он считает такой подход отсталым - это все равно что иметь решение без проблемы. Вместо этого они работают с клиентами, которые приносят конкретные проблемы, чтобы они могли создавать ИИ-решения, которые действительно приносят пользу.

Рис. 1. Дэвид Скотт на сцене YV24.

Дэвид также поделился, что их работа часто выходит за рамки простого распознавания объектов в сцене. Увидеть, что там есть, - это только первый шаг. Настоящая ценность заключается в том, чтобы понять, что делать с этой информацией и сделать ее полезной в рамках более крупной цепочки создания стоимости. 

Технология отслеживания поведенческих факторов: ключ к действенному ИИ

Важнейшим шагом к тому, чтобы сделать ИИ по-настоящему полезным, является выход за рамки базовых задач компьютерного зрения, таких как обнаружение объектов, и использование этих знаний для отслеживания поведения. Дэвид подчеркнул, что поведенческий ИИ фокусируется на понимании действий и закономерностей, а не просто на идентификации объектов. Это делает ИИ способным распознавать значимые события и предоставлять действенные идеи.

Он привел пример, когда животное катается по полу, что может свидетельствовать о болезни. Если люди не могут круглосуточно наблюдать за животным, то системы наблюдения на базе ИИ с возможностью отслеживания поведения - могут. Такие решения могут непрерывно наблюдать за объектами, обнаруживать специфическое поведение, отправлять оповещение и позволять своевременно принять меры. Это превращает необработанные данные в нечто практичное и ценное.

Дэвид также продемонстрировал, что такой подход делает ИИ не просто интересным, а по-настоящему действенным. Решая реальные проблемы, такие как отслеживание поведения и действия в соответствии с ним, отслеживание поведения может стать ключевой частью эффективных ИИ-решений в различных отраслях.

Воплощение поведенческого ИИ в жизнь

Затем Дэвид Скотт рассказал о том, как Ultralytics YOLOv8, модель компьютерного зрения, стала прорывом для проектов его команды по отслеживанию поведения. Она дала им прочную основу для обнаружения, классификации и отслеживания объектов. Кроме того, его команда пошла дальше и обучила YOLOv8 отслеживать поведение с течением времени, что сделало ее более практичной и полезной для реальных ситуаций.

Интересно, что с выходом Ultralytics YOLO11, решения, подобные тем, что создала The Main Branch, могут стать еще более надежными и точными. Последняя модель предлагает такие функции, как улучшенная точность и более быстрая обработка данных, что повышает ее способность отслеживать поведение. Мы обсудим это более подробно после того, как лучше поймем, для каких целей можно использовать поведенческий ИИ.

Далее давай рассмотрим решения, о которых говорил Дэвид, и то, как технология отслеживания поведения используется в реальных приложениях для решения повседневных задач и оказания значимого влияния.

HerdSense с анализом поведения на основе искусственного интеллекта

Сначала Дэвид рассказал о захватывающей задаче, которую они решали в рамках проекта под названием HerdSense, который предполагал наблюдение за здоровьем тысяч коров на огромном откормочном комплексе. Целью было отследить поведение отдельных коров, чтобы выявить потенциальные проблемы со здоровьем. Это означало одновременное наблюдение за десятками тысяч животных, и задача была не из простых.

Рис. 2. HerdSense сосредоточилась на мониторинге и идентификации коров с помощью поведенческого ИИ.

Чтобы начать решать проблему идентификации каждой коровы и отслеживания ее поведения, команда Дэвида провела двухдневный семинар, на котором обрисовала все возможные виды поведения, которые им нужно было отслеживать. Всего они определили более 200 вариантов поведения.

Каждая из 200 моделей поведения зависела от возможности точно распознать отдельных коров, так как все данные должны были быть привязаны к конкретным животным. Одной из главных проблем было отслеживание коров, когда они сбивались в стаи, что затрудняло наблюдение за отдельными животными. 

Команда Дэвида разработала систему компьютерного зрения, чтобы обеспечить последовательную идентификацию каждой коровы, даже в сложных ситуациях. Они смогли подтвердить, что одной и той же корове всегда будет присвоен один и тот же идентификатор, даже если она исчезнет из виду, смешается с другими или появится снова позже.

Мониторинг здоровья лошади с помощью компьютерного зрения

Двигаясь дальше, Дэвид представил еще один увлекательный проект, в котором они применили аналогичную технику отслеживания поведения для наблюдения за лошадьми. В этом проекте команде Дэвида не нужно было отслеживать индивидуальные идентификаторы лошадей так же тщательно, как в случае с коровами. Вместо этого они сосредоточились на конкретных моделях поведения и отслеживали такие детали, как режим питания и общий уровень активности, чтобы на ранней стадии заметить любые проблемы со здоровьем. Выявление небольших изменений в поведении может привести к более быстрому вмешательству, чтобы обеспечить лучший уход и предотвратить проблемы до того, как они станут серьезными.

Рис. 3. Наблюдение за лошадьми с помощью поведенческого ИИ.

Почему поведенческий ИИ не так прост, как кажется

Дэвид также рассказал о сложности отслеживания поведения на интригующем примере. Изучая способы улучшения поведенческого анализа, его команда наткнулась на компанию, утверждавшую, что она может обнаружить кражу в магазине, анализируя определенные позы, например, когда кто-то держит руку в кармане. Поначалу это казалось умной идеей - ведь определенные движения могут навести на мысль о подозрительном поведении, верно?

Рис 4. Понимание сложностей технологии отслеживания поведения.

Однако по мере дальнейшего изучения Дэвид осознал ограниченность этого метода. Одна-единственная поза, например рука в кармане, не обязательно означает, что кто-то ворует в магазине. Она может просто указывать на то, что он расслаблен, задумался или даже замерз. Проблема с концентрацией на изолированных позах заключается в том, что при этом игнорируется более широкий контекст. Поведение - это не просто единичное действие - это шаблон действий в течение времени, сформированный контекстом и намерениями.

Дэвид подчеркнул, что настоящее отслеживание поведения гораздо сложнее и требует целостного подхода. Речь идет об анализе последовательностей действий и понимании того, что они означают в общей картине. Несмотря на то что индустрия ИИ делает успехи, он отметил, что еще многое предстоит сделать для развития поведенческого трекинга, чтобы получить значимые и точные данные.

Создание более умных моделей ИИ зрения, которые понимают действия

Затем Дэвид провел аудиторию за кулисы, чтобы показать, как его команда создала решение для компьютерного зрения, позволяющее следить за здоровьем коров с помощью YOLOv8, и его возможностей оценки позы.

Они начали с создания пользовательского набора данных для оценки позы коровы, увеличив стандартное количество ключевых точек с 17 до 145, чтобы модель лучше анализировала движения. Затем модель была обучена на массивном наборе данных, включающем более 2 миллионов изображений и 110 миллионов примеров поведения. 

Используя передовую аппаратную инфраструктуру, команда Дэвида смогла обучить модель всего за два дня вместо недель, которые потребовались бы на обычном оборудовании. Затем обученная модель была интегрирована с пользовательским трекером поведения, который анализировал несколько видеокадров одновременно, чтобы обнаружить закономерности в действиях коров.

В результате было разработано решение на основе искусственного интеллекта, способное обнаруживать и отслеживать восемь различных форм поведения коров, таких как еда, питье и лежание, чтобы заметить незначительные изменения в поведении, которые могут сигнализировать о проблемах со здоровьем. Это позволяет фермерам действовать быстро и улучшает управление стадом.

Дальнейший путь поведенческого искусственного интеллекта

В завершение своего выступления Дэвид поделился с аудиторией важным уроком: "Если ты не даешь ИИ возможности для неудач, ты сам себя настраиваешь на провал, потому что, в конце концов, это статистика". Он отметил, что ИИ, несмотря на свои сильные стороны, не безупречен. Это инструмент, который учится на шаблонах, и всегда будут моменты, когда он не будет делать все правильно. Вместо того чтобы бояться этих ошибок, главное - создавать системы, которые могут с ними справиться и продолжать совершенствоваться с течением времени.

Это справедливо и в отношении самих моделей компьютерного зрения. Например, Ultralytics YOLO11 , последняя версия моделей Ultralytics YOLO , была построена с учетом необходимости выйти на новый уровень по сравнению с YOLOv8. 

Рис. 5. Задачи компьютерного зрения, поддерживаемые YOLO11.

В частности, YOLO11 предлагает более высокую производительность, особенно в приложениях реального времени, где точность имеет ключевое значение, например в сельском хозяйстве и здравоохранении. Благодаря своим передовым возможностям YOLO11 пересматривает способы использования ИИ в промышленности, предоставляя инновационные знания в реальном времени и помогая эффективнее решать проблемы.

Основные выводы

Выступление Дэвида на YV24 стало напоминанием о том, что ИИ - это не просто крутая инновация, это мощный инструмент для решения реальных проблем и улучшения того, как мы живем и работаем. Ориентируясь на поведение, ИИ уже оказывает влияние в таких областях, как отслеживание здоровья животных и распознавание значимых закономерностей в повседневных действиях. 

Потенциал поведенческого ИИ просто захватывает, и мы находимся только в начале пути. Преобразуя необработанные данные в действенные идеи, поведенческий ИИ переходит от пассивного наблюдения к активному решению проблем. По мере дальнейшего развития поведенческий ИИ будет принимать более разумные решения, оптимизировать процессы и вносить значимые улучшения в нашу жизнь.

Будь на связи с нашим сообществом, чтобы узнать больше об ИИ и его реальных применениях. Посети наш репозиторий на GitHub, чтобы узнать об инновациях в таких областях, как ИИ в сельском хозяйстве и компьютерное зрение в производстве.

Логотип FacebookЛоготип ТвиттераЛоготип LinkedInСимвол копирования-ссылки

Читайте больше в этой категории

Давай вместе построим будущее
искусственного интеллекта!

Начни свое путешествие с будущим машинного обучения