Присоединяйся к нам, чтобы пересмотреть ключевой доклад Дэвида Скотта YOLO Vision 2024, посвященный анализу поведения на основе ИИ и его реальному применению в таких отраслях, как животноводство.
На протяжении многих лет инновации в области компьютерного зрения были направлены на решение таких задач, как обнаружение объектов - идентификация таких объектов, как собака или автомобиль, на изображениях и видео. Эти подходы позволили найти применение в таких областях, как автономные транспортные средства, производство и здравоохранение.
Однако зачастую эти задачи сосредоточены только на определении того, что представляет собой объект. Что, если бы системы Vision AI могли пойти на шаг дальше? Например, вместо того чтобы просто обнаружить собаку, допустим, она могла бы понять, что собака гонится за мячом или что машина резко тормозит, потому что пешеход переходит дорогу. Этот переход от базового распознавания к контекстуальному пониманию представляет собой серьезный сдвиг в сторону более умного, учитывающего контекст поведенческого ИИ.
На YOLO Vision 2024 (YV24), Ultralytics' ежегодном гибридном мероприятии, посвященном достижениям в области Vision AI, концепция анализа поведения на основе ИИ заняла центральное место во время интересного выступления Дэвида Скотта, генерального директора The Main Branch.
В своем выступлении Дэвид исследовал переход от базовых задач компьютерного зрения к отслеживанию поведения. Имея более чем 25-летний опыт создания передовых технологических приложений, он продемонстрировал влияние этого скачка. Он подчеркнул, как декодирование паттернов и поведения перестраивает такие отрасли, как сельское хозяйство и защита животных.
В этой статье мы пройдемся по основным моментам выступления Дэвида и рассмотрим, как отслеживание поведения делает ИИ более практичным.
Дэвид Скотт начал свой доклад со смелой проверки реальности и сказал: "Один мой коллега часто говорит: "Наука не продается", и это немного обижает многих из нас, потому что мы действительно любим науку. ИИ действительно крут - почему бы людям просто не купить его? Но реальность такова, что люди не хотят покупать его только потому, что мы считаем его крутым; им нужна причина, чтобы купить его".
Далее он рассказал, что в его компании The Main Branch основное внимание всегда уделяется решению реальных проблем с помощью ИИ, а не просто демонстрации его возможностей. Многие клиенты приходят с желанием рассказать о том, как они могут использовать ИИ в целом, но он считает такой подход отсталым - это все равно что иметь решение без проблемы. Вместо этого они работают с клиентами, которые приносят конкретные проблемы, чтобы они могли создавать ИИ-решения, которые действительно приносят пользу.
Дэвид также поделился, что их работа часто выходит за рамки простого распознавания объектов в сцене. Увидеть, что там есть, - это только первый шаг. Настоящая ценность заключается в том, чтобы понять, что делать с этой информацией и сделать ее полезной в рамках более крупной цепочки создания стоимости.
Важнейшим шагом к тому, чтобы сделать ИИ по-настоящему полезным, является выход за рамки базовых задач компьютерного зрения, таких как обнаружение объектов, и использование этих знаний для отслеживания поведения. Дэвид подчеркнул, что поведенческий ИИ фокусируется на понимании действий и закономерностей, а не просто на идентификации объектов. Это делает ИИ способным распознавать значимые события и предоставлять действенные идеи.
Он привел пример, когда животное катается по полу, что может свидетельствовать о болезни. Если люди не могут круглосуточно наблюдать за животным, то системы наблюдения на базе ИИ с возможностью отслеживания поведения - могут. Такие решения могут непрерывно наблюдать за объектами, обнаруживать специфическое поведение, отправлять оповещение и позволять своевременно принять меры. Это превращает необработанные данные в нечто практичное и ценное.
Дэвид также продемонстрировал, что такой подход делает ИИ не просто интересным, а по-настоящему действенным. Решая реальные проблемы, такие как отслеживание поведения и действия в соответствии с ним, отслеживание поведения может стать ключевой частью эффективных ИИ-решений в различных отраслях.
Затем Дэвид Скотт рассказал о том, как Ultralytics YOLOv8, модель компьютерного зрения, стала прорывом для проектов его команды по отслеживанию поведения. Она дала им прочную основу для обнаружения, классификации и отслеживания объектов. Кроме того, его команда пошла дальше и обучила YOLOv8 отслеживать поведение с течением времени, что сделало ее более практичной и полезной для реальных ситуаций.
Интересно, что с выходом Ultralytics YOLO11, решения, подобные тем, что создала The Main Branch, могут стать еще более надежными и точными. Последняя модель предлагает такие функции, как улучшенная точность и более быстрая обработка данных, что повышает ее способность отслеживать поведение. Мы обсудим это более подробно после того, как лучше поймем, для каких целей можно использовать поведенческий ИИ.
Далее давай рассмотрим решения, о которых говорил Дэвид, и то, как технология отслеживания поведения используется в реальных приложениях для решения повседневных задач и оказания значимого влияния.
Сначала Дэвид рассказал о захватывающей задаче, которую они решали в рамках проекта под названием HerdSense, который предполагал наблюдение за здоровьем тысяч коров на огромном откормочном комплексе. Целью было отследить поведение отдельных коров, чтобы выявить потенциальные проблемы со здоровьем. Это означало одновременное наблюдение за десятками тысяч животных, и задача была не из простых.
Чтобы начать решать проблему идентификации каждой коровы и отслеживания ее поведения, команда Дэвида провела двухдневный семинар, на котором обрисовала все возможные виды поведения, которые им нужно было отслеживать. Всего они определили более 200 вариантов поведения.
Каждая из 200 моделей поведения зависела от возможности точно распознать отдельных коров, так как все данные должны были быть привязаны к конкретным животным. Одной из главных проблем было отслеживание коров, когда они сбивались в стаи, что затрудняло наблюдение за отдельными животными.
Команда Дэвида разработала систему компьютерного зрения, чтобы обеспечить последовательную идентификацию каждой коровы, даже в сложных ситуациях. Они смогли подтвердить, что одной и той же корове всегда будет присвоен один и тот же идентификатор, даже если она исчезнет из виду, смешается с другими или появится снова позже.
Двигаясь дальше, Дэвид представил еще один увлекательный проект, в котором они применили аналогичную технику отслеживания поведения для наблюдения за лошадьми. В этом проекте команде Дэвида не нужно было отслеживать индивидуальные идентификаторы лошадей так же тщательно, как в случае с коровами. Вместо этого они сосредоточились на конкретных моделях поведения и отслеживали такие детали, как режим питания и общий уровень активности, чтобы на ранней стадии заметить любые проблемы со здоровьем. Выявление небольших изменений в поведении может привести к более быстрому вмешательству, чтобы обеспечить лучший уход и предотвратить проблемы до того, как они станут серьезными.
Дэвид также рассказал о сложности отслеживания поведения на интригующем примере. Изучая способы улучшения поведенческого анализа, его команда наткнулась на компанию, утверждавшую, что она может обнаружить кражу в магазине, анализируя определенные позы, например, когда кто-то держит руку в кармане. Поначалу это казалось умной идеей - ведь определенные движения могут навести на мысль о подозрительном поведении, верно?
Однако по мере дальнейшего изучения Дэвид осознал ограниченность этого метода. Одна-единственная поза, например рука в кармане, не обязательно означает, что кто-то ворует в магазине. Она может просто указывать на то, что он расслаблен, задумался или даже замерз. Проблема с концентрацией на изолированных позах заключается в том, что при этом игнорируется более широкий контекст. Поведение - это не просто единичное действие - это шаблон действий в течение времени, сформированный контекстом и намерениями.
Дэвид подчеркнул, что настоящее отслеживание поведения гораздо сложнее и требует целостного подхода. Речь идет об анализе последовательностей действий и понимании того, что они означают в общей картине. Несмотря на то что индустрия ИИ делает успехи, он отметил, что еще многое предстоит сделать для развития поведенческого трекинга, чтобы получить значимые и точные данные.
Затем Дэвид провел аудиторию за кулисы, чтобы показать, как его команда создала решение для компьютерного зрения, позволяющее следить за здоровьем коров с помощью YOLOv8, и его возможностей оценки позы.
Они начали с создания пользовательского набора данных для оценки позы коровы, увеличив стандартное количество ключевых точек с 17 до 145, чтобы модель лучше анализировала движения. Затем модель была обучена на массивном наборе данных, включающем более 2 миллионов изображений и 110 миллионов примеров поведения.
Используя передовую аппаратную инфраструктуру, команда Дэвида смогла обучить модель всего за два дня вместо недель, которые потребовались бы на обычном оборудовании. Затем обученная модель была интегрирована с пользовательским трекером поведения, который анализировал несколько видеокадров одновременно, чтобы обнаружить закономерности в действиях коров.
В результате было разработано решение на основе искусственного интеллекта, способное обнаруживать и отслеживать восемь различных форм поведения коров, таких как еда, питье и лежание, чтобы заметить незначительные изменения в поведении, которые могут сигнализировать о проблемах со здоровьем. Это позволяет фермерам действовать быстро и улучшает управление стадом.
В завершение своего выступления Дэвид поделился с аудиторией важным уроком: "Если ты не даешь ИИ возможности для неудач, ты сам себя настраиваешь на провал, потому что, в конце концов, это статистика". Он отметил, что ИИ, несмотря на свои сильные стороны, не безупречен. Это инструмент, который учится на шаблонах, и всегда будут моменты, когда он не будет делать все правильно. Вместо того чтобы бояться этих ошибок, главное - создавать системы, которые могут с ними справиться и продолжать совершенствоваться с течением времени.
Это справедливо и в отношении самих моделей компьютерного зрения. Например, Ultralytics YOLO11 , последняя версия моделей Ultralytics YOLO , была построена с учетом необходимости выйти на новый уровень по сравнению с YOLOv8.
В частности, YOLO11 предлагает более высокую производительность, особенно в приложениях реального времени, где точность имеет ключевое значение, например в сельском хозяйстве и здравоохранении. Благодаря своим передовым возможностям YOLO11 пересматривает способы использования ИИ в промышленности, предоставляя инновационные знания в реальном времени и помогая эффективнее решать проблемы.
Выступление Дэвида на YV24 стало напоминанием о том, что ИИ - это не просто крутая инновация, это мощный инструмент для решения реальных проблем и улучшения того, как мы живем и работаем. Ориентируясь на поведение, ИИ уже оказывает влияние в таких областях, как отслеживание здоровья животных и распознавание значимых закономерностей в повседневных действиях.
Потенциал поведенческого ИИ просто захватывает, и мы находимся только в начале пути. Преобразуя необработанные данные в действенные идеи, поведенческий ИИ переходит от пассивного наблюдения к активному решению проблем. По мере дальнейшего развития поведенческий ИИ будет принимать более разумные решения, оптимизировать процессы и вносить значимые улучшения в нашу жизнь.
Будь на связи с нашим сообществом, чтобы узнать больше об ИИ и его реальных применениях. Посети наш репозиторий на GitHub, чтобы узнать об инновациях в таких областях, как ИИ в сельском хозяйстве и компьютерное зрение в производстве.
Начни свое путешествие с будущим машинного обучения