Узнай, как использовать модель Ultralytics YOLO11 для точной оценки позы. Мы расскажем о том, как делать выводы в реальном времени и обучать модели для различных приложений.
Исследования, связанные с компьютерным зрением, ветвью искусственного интеллекта (ИИ), можно проследить еще с 1960-х годов. Однако только в 2010-х годах, с появлением глубокого обучения, мы увидели серьезный прорыв в том, как машины понимают изображения. Одним из последних достижений в области компьютерного зрения являются передовые Ultralytics YOLO11 модели. МоделиYOLO11 , впервые представленные на Ultralytics' ежегодном гибридном мероприятии YOLO Vision 2024 (YV24), поддерживают целый ряд задач компьютерного зрения, включая оценку позы.
Оценка позы может использоваться для определения ключевых точек человека или объекта на изображении или видео, чтобы понять его положение, позу или движение. Она широко используется в таких приложениях, как спортивная аналитика, мониторинг поведения животных и робототехника, чтобы помочь машинам интерпретировать физические действия в реальном времени. Благодаря повышенной точности, эффективности и скорости по сравнению с предыдущими моделями серииYOLO (You Only Look Once)YOLO11 хорошо подходит для задач оценки позы в реальном времени.
В этой статье мы узнаем, что такое оценка позы, обсудим некоторые области ее применения и расскажем, как ты можешь использовать YOLO11 с пакетомUltralytics Python для оценки позы. Мы также рассмотрим, как ты можешь использовать Ultralytics HUB, чтобы опробовать YOLO11 и оценку позы в несколько простых кликов. Давай приступим!
Прежде чем мы погрузимся в то, как использовать новую модельUltralytics YOLO11 для оценки позы, давай лучше разберемся с оценкой позы.
Оценка позы - это техника компьютерного зрения, которая используется для анализа позы человека или объекта на изображении или видео. Модели глубокого обучения, такие как YOLO11 могут определять, находить и отслеживать ключевые точки на данном объекте или человеке. Для объектов такими ключевыми точками могут быть углы, края или четкие отметки на поверхности, а для людей - основные суставы, такие как локоть, колено или плечо.
Оценка позы - уникальная и более сложная задача по сравнению с другими задачами компьютерного зрения, такими как обнаружение объектов. В то время как обнаружение объектов определяет их местоположение на изображении, рисуя вокруг них рамку, оценка позы идет дальше, предсказывая точное положение ключевых точек на объекте.
Когда речь заходит об оценке позы, есть два основных способа: "снизу вверх" и "сверху вниз". Подход "снизу вверх" обнаруживает отдельные ключевые точки и группирует их в скелеты, а подход "сверху вниз" фокусируется сначала на обнаружении объектов, а затем на оценке ключевых точек внутри них.
YOLO11 сочетает в себе сильные стороны методов "сверху вниз" и "снизу вверх". Как и подход "снизу вверх", он позволяет действовать просто и быстро, не прибегая к ручной группировке ключевых точек. В то же время он использует точность нисходящего метода, обнаруживая людей и оценивая их позы за один шаг.
Универсальные возможности YOLO11 для оценки позы открывают широкий спектр возможных применений во многих отраслях. Давай подробнее рассмотрим некоторые примеры использования YOLO11 для оценки позы.
Безопасность - важный аспект любого строительного проекта. Это особенно актуально, поскольку, по статистике, на строительных площадках происходит большее количество производственных травм. В 2021 году около 20% всех смертельных травм, связанных с работой, произошли на строительных площадках или вблизи них. Учитывая ежедневные риски, такие как тяжелое оборудование и электрические системы, надежные меры безопасности необходимы для обеспечения безопасности рабочих. Традиционные методы, такие как использование знаков, заграждений и ручной контроль со стороны супервайзеров, не всегда эффективны и часто отвлекают супервайзеров от более важных задач.
ИИ может вмешаться в процесс повышения безопасности, и риск несчастных случаев можно снизить, если использовать систему мониторинга работников на основе оценки позы. Ultralytics YOLO11 модели могут использоваться для отслеживания движений и поз работников. Любые потенциальные опасности, например, когда работники стоят слишком близко к опасному оборудованию или неправильно выполняют задания, могут быть быстро замечены. Если риск обнаружен, можно уведомить об этом супервайзеров или подать сигнал тревоги рабочему. Система непрерывного мониторинга может сделать строительные площадки более безопасными, ведь она всегда начеку и защищает рабочих от опасностей.
Фермеры и исследователи могут использовать YOLO11 для изучения движения и поведения сельскохозяйственных животных, например крупного рогатого скота, чтобы обнаружить ранние признаки таких заболеваний, как хромота. Хромота - это состояние, при котором животное не может нормально двигаться из-за боли в ногах или ступнях. У крупного рогатого скота такие заболевания, как хромота, не только влияют на его здоровье и благополучие, но и приводят к проблемам с производством на молочных фермах. Исследования показывают, что хромота затрагивает от 8 % крупного рогатого скота в пастбищных системах и от 15 до 30 % в закрытых системах во всей мировой молочной промышленности. Обнаружение и устранение хромоты на ранней стадии может помочь улучшить благосостояние животных и снизить производственные потери, связанные с этим заболеванием.
YOLO11Функция оценки позы может помочь фермерам отслеживать походку животного и быстро выявлять любые отклонения, которые могут сигнализировать о проблемах со здоровьем, например о проблемах с суставами или инфекциях. Выявление этих проблем на ранних стадиях позволяет ускорить лечение, уменьшить дискомфорт животных и помочь фермерам избежать экономических потерь.
Системы мониторинга с поддержкой ИИ Vision также могут помочь проанализировать поведение в состоянии покоя, социальные взаимодействия и характер кормления. Фермеры также могут использовать оценку позы, чтобы получить наблюдения о признаках стресса или агрессии. Эти сведения можно использовать для создания лучших условий жизни для животных и повышения их благосостояния.
Оценка позы также может помочь людям улучшить свою осанку в режиме реального времени во время тренировки. С помощью YOLO11 инструкторы тренажерных залов и йоги могут контролировать и отслеживать движения тела тренирующихся людей, обращая внимание на такие ключевые точки, как суставы и конечности, чтобы оценить их осанку. Собранные данные можно сравнить с идеальными позами и техникой тренировок, а инструкторы могут получать предупреждения, если кто-то выполняет движение неправильно, что поможет предотвратить травмы.
Например, во время занятий йогой оценка позы может помочь проконтролировать, все ли ученики сохраняют правильный баланс и выравнивание. Мобильные приложения, интегрированные с компьютерным зрением и оценкой позы, могут сделать фитнес более доступным для людей, занимающихся дома, или тех, у кого нет доступа к персональным тренерам. Такая постоянная обратная связь в реальном времени помогает пользователям совершенствовать технику и достигать своих фитнес-целей, снижая при этом риск травм.
Теперь, когда мы выяснили, что такое оценка позы, и обсудили некоторые области ее применения. Давай посмотрим, как ты можешь опробовать оценку позы с помощью новой модели YOLO11 . Для начала есть два удобных способа сделать это: с помощью пакета Ultralytics Python или через Ultralytics HUB. Давай рассмотрим оба варианта.
Запуск умозаключений заключается в том, что модель YOLO11 обрабатывает новые данные, не входящие в ее обучающие наборы, и использует изученные закономерности для составления прогнозов на основе этих данных. Ты можешь запускать умозаключения через код с помощью пакета Ultralytics Python . Все, что тебе нужно сделать для начала , - это установить пакет Ultralytics с помощью pip, conda или Docker. Если ты столкнешься с какими-либо трудностями во время установки, в нашем руководстве по общим проблемам ты найдешь полезные советы по устранению неполадок.
После успешной установки пакета в следующем коде описано, как загрузить модель и использовать ее для предсказания поз объектов на изображении.
Допустим, ты работаешь над проектом по компьютерному зрению и у тебя есть определенный набор данных для конкретного приложения, связанного с оценкой позы. Тогда ты можешь точно настроить и обучить пользовательскую модель YOLO11 , которая будет соответствовать твоему приложению. Например, ты можешь использовать набор данных ключевых точек для анализа и понимания позы тигра на изображениях, определяя такие ключевые особенности, как положение его конечностей, головы и хвоста.
Ты можешь использовать следующий фрагмент кода, чтобы загрузить и обучить модель оценки позы YOLO11 . Модель может быть построена из конфигурации YAML, или ты можешь загрузить предварительно обученную модель для тренировки. Этот скрипт также позволяет передать веса и начать обучение модели на заданном наборе данных, например наборе данных COCO для оценки позы.
Используя только что обученную пользовательскую модель, ты можешь проводить умозаключения на невидимых изображениях, связанных с твоим решением для компьютерного зрения. Обученную модель также можно преобразовать в другие форматы с помощью режима экспорта.
До сих пор мы рассматривали методы использования YOLO11 , требующие некоторых базовых знаний о кодинге. Если это не то, что ты ищешь, или ты не знаком с кодингом, есть другой вариант: Ultralytics HUB. Ultralytics HUB - это удобная платформа, призванная упростить процесс обучения и развертывания моделей YOLO . HUB позволяет тебе легко управлять наборами данных, обучать модели и разворачивать их, не требуя технических знаний.
Чтобы провести предсказания на изображениях, ты можешь создать аккаунт, перейти в раздел "Модели" и выбрать интересующую тебя модель оценки позы YOLO11 . В разделе предварительного просмотра ты можешь загрузить изображение и просмотреть результаты предсказания, как показано ниже.
Ultralytics YOLO11 предлагает точные и гибкие решения для таких задач, как оценка позы, в широком спектре приложений. От повышения безопасности рабочих на строительных площадках до мониторинга здоровья домашнего скота и помощи в коррекции осанки при занятиях фитнесом - YOLO11 обеспечивает точность и обратную связь в реальном времени благодаря передовой технологии компьютерного зрения.
Его универсальность, множество вариантов моделей и возможность индивидуального обучения для конкретных случаев использования, делает его очень ценным инструментом как для разработчиков, так и для предприятий. Будь то кодирование с помощью пакета Ultralytics Python или использование Ultralytics HUB для более простой реализации, YOLO11 делает оценку позы доступной и эффективной.
Чтобы узнать больше, посети наш репозиторий GitHub и присоединяйся к нашему сообществу. Изучи применение ИИ в производстве и сельском хозяйстве на страницах наших решений. 🚀
Начни свое путешествие с будущим машинного обучения