Как использовать Ultralytics YOLO11 для классификации изображений

Абирами Вина

4 мин. чтения

11 ноября 2024 г.

Узнайте, как новая модель Ultralytics YOLO11 улучшает классификацию изображений, обеспечивая более высокую точность при решении задач в сельском хозяйстве, розничной торговле и мониторинге дикой природы.

Допустим, робот смотрит на двух кошек, черную и белую, и ему нужно определить, кто из них кто. Для этого он может использовать классификацию изображений- задачу компьютерного зрения, которая помогает идентифицировать и классифицировать объекты или сцены на изображении. Благодаря последним достижениям в области искусственного интеллекта (ИИ) классификация изображений может применяться в самых разных областях - от наблюдения за животными до производства и сельского хозяйства с выявлением болезней сельскохозяйственных культур.

Одним из последних достижений в области классификации изображений является модель Ultralytics YOLO11. Представленная на ежегодном гибридном мероприятии Ultralytics YOLO Vision 2024 (YV24), модель YOLO11 предназначена для легкого и точного решения широкого спектра задач искусственного интеллекта, включая классификацию изображений.

В этой статье мы рассмотрим основы классификации изображений, обсудим реальные приложения и покажем, как можно использовать YOLO11 для классификации изображений с помощью пакета Ultralytics Python. Мы также рассмотрим, как вы можете опробовать возможности YOLO11 на Ultralytics HUB в несколько простых шагов. Давайте начнем!

__wf_reserved_inherit
Рис. 1. Пример использования Ultralytics YOLO11 для классификации персидской кошки.

Что такое классификация изображений?

Классификация изображений осуществляется путем присвоения изображению метки или тега на основе шаблонов, полученных из ранее помеченных изображений. Тщательно анализируя пиксели изображения, модель компьютерного зрения может найти наилучшее соответствие для него. Надежные модели, такие как YOLO11, справляются с этим процессом без проблем. Архитектура модели YOLO11 позволяет обрабатывать изображения или видеокадры практически мгновенно, что делает ее идеальным решением для приложений, требующих быстрой и точной классификации изображений.

Чтобы по-настоящему понять сферу применения классификации изображений, необходимо отличать ее от других задач, таких как обнаружение объектов. В то время как классификация изображений маркирует все изображение, обнаружение объектов идентифицирует и определяет местоположение каждого объекта на изображении. 

__wf_reserved_inherit
Рис. 2. Сравнение классификации изображений, обнаружения объектов и сегментации изображений.

Рассмотрим изображение жирафа. При классификации изображений модель может обозначить все изображение как жирафа, основываясь на его общем содержании. Однако при обнаружении объектов модель не ограничивается идентификацией жирафа; она также помещает вокруг него ограничительную рамку, определяя его точное местоположение на изображении.

Теперь представьте жирафа, стоящего у дерева в саванне вместе с другими животными. Модель классификации изображений может определить всю сцену как саванну или просто дикую природу. Однако при обнаружении объектов модель идентифицирует каждый элемент по отдельности, распознавая жирафа, дерево и других животных, каждый из которых имеет свои собственные ограничительные рамки.

Приложения для классификации изображений YOLO11

Точность и производительность модели Ultralytics YOLO11 для классификации изображений делает ее полезной в самых разных отраслях. Давайте рассмотрим некоторые из ключевых применений YOLO11 в классификации изображений.

Классификация изображений YOLO11 в сельском хозяйстве

Классификация изображений может помочь оптимизировать многие функции в сельском хозяйстве и фермерской отрасли. В частности, используя такие модели классификации изображений, как YOLO11, фермеры могут постоянно следить за состоянием своих посевов, выявлять серьезные заболевания и с высокой точностью определять наличие вредителей

Вот как это работает:

  • Захват изображений: Устройства Интернета вещей (IoT), такие как камеры и дроны, могут быть использованы для получения в реальном времени изображений сельскохозяйственных культур с различных углов и мест на полях.
  • Обработка: В зависимости от имеющихся ресурсов и возможностей подключения, изображения могут обрабатываться на месте с помощью пограничных вычислений или загружаться в облако для более интенсивного анализа.
  • Классификация изображений с помощью YOLO11: модель YOLO11 может анализировать эти изображения, чтобы классифицировать различные состояния сельскохозяйственных культур. Общие классы могут включать здоровые, больные, пораженные вредителями или испытывающие дефицит питательных веществ, что помогает определить конкретные проблемы, затрагивающие различные участки поля.
  • Генерирование информации: Основываясь на классификации, YOLO11 предоставляет информацию о показателях здоровья сельскохозяйственных культур, помогая фермерам обнаружить ранние признаки заболеваний, выявить очаги вредителей или обнаружить дефицит питательных веществ.
  • Принятие обоснованных решений: Благодаря этим знаниям фермеры могут принимать целенаправленные решения по орошению, внесению удобрений и борьбе с вредителями, применяя ресурсы только там, где они больше всего нужны.
__wf_reserved_inherit
Рис. 3. Пример различных классов листьев - от здоровых до зараженных.

YOLO11 классификация изображений в розничной торговле

Классификация изображений может значительно улучшить опыт розничных покупок, сделав его более персонализированным и удобным для пользователя. Ритейлеры могут использовать специально разработанные модели компьютерного зрения для распознавания товаров в своем инвентаре и интегрировать эту возможность в свои мобильные приложения или веб-сайты. Покупатели могут искать товары, просто загрузив фотографию, что делает покупки более быстрыми и удобными.

Когда клиент загружает изображение в систему визуального поиска, до появления результатов поиска происходит несколько процессов. 

Во-первых, обнаружение объектов позволяет выделить основные предметы на изображении, например, определить предмет одежды или мебели и отделить его от фона. Затем можно использовать классификацию изображений для дальнейшей классификации каждого предмета, определяя, является ли он пиджаком, рубашкой, диваном или столом. 

С помощью этой информации система может найти похожие товары, доступные для покупки, что особенно полезно для поиска уникальных или модных товаров, которые трудно описать одними словами. Эта же технология может помочь упростить другие задачи розничной торговли, например управление запасами, благодаря автоматическому распознаванию и распределению товаров по категориям.

__wf_reserved_inherit
Рис. 4. Платформа визуального поиска на основе классификации изображений в действии.

Мониторинг дикой природы с помощью классификации изображений YOLO11

Традиционно наблюдение за животными в дикой природе - утомительная задача, требующая от многих людей ручной сортировки и анализа тысяч фотографий. С помощью таких режимов компьютерного зрения, как YOLO11, исследователи могут автоматически следить за животными с большей скоростью. Камеры можно разместить в естественной среде обитания и делать снимки. Затем модель искусственного зрения может быть использована для анализа этих фотографий и классификации животных на них (если таковые имеются). Такая система может помочь исследователям изучать и отслеживать популяции животных, их миграции и т. д.

Еще один способ, которым модели искусственного интеллекта и компьютерного зрения, подобные YOLO11, могут помочь в этой области, - это упрощение процесса классификации исчезающих видов. Определяя потенциальные виды или категории пород, к которым может принадлежать животное, эти модели могут предоставить важные данные для исследователей. Например, Университет Тасмании (UTAS) разработал систему классификации изображений для мониторинга различных видов тасманийских диких животных. Прогнозы, полученные с помощью моделей, помогают ученым и исследователям следить за активностью и поведением животных, которые могут сигнализировать о таких угрозах, как браконьерство или потеря среды обитания

__wf_reserved_inherit
Рис. 5. YOLO11 предсказывает возможные породы, к которым может принадлежать собака.

Испытание классификации изображений с помощью модели YOLO11

Теперь, когда мы обсудили, что такое классификация изображений, и рассмотрели некоторые области ее применения. Давайте посмотрим, как можно опробовать классификацию изображений с помощью новой модели YOLO11. Есть два простых способа начать: использовать пакет Ultralytics Python или Ultralytics HUB. Мы рассмотрим оба варианта.

Выполнение выводов с помощью YOLO11

Чтобы начать работу с пакетом Ultralytics Python, просто установите его с помощью pip, conda или Docker. Если у вас возникнут проблемы, ознакомьтесь с нашим руководством по общим проблемам, чтобы получить полезные советы по устранению неполадок.

После установки пакета вы можете использовать следующий код, чтобы загрузить вариант модели классификации изображений YOLO11 и выполнить вывод на изображении. Выполнить вывод - значит использовать обученную модель для предсказаний на новых, невидимых данных. Вы можете попробовать это на выбранном вами изображении!

__wf_reserved_inherit
Рис. 6. Выполнение выводов с использованием модели YOLO11.

Обучение пользовательской модели классификации YOLO11

Вы также можете использовать тот же пакет Python для обучения пользовательской модели классификации YOLO11. Пользовательское обучение позволяет точно настроить модель YOLO11 под ваши конкретные нужды. Например, если вы разрабатываете приложение для классификации различных пород кошек, вы можете обучить модель YOLO11 специально для этой цели.

Приведенный ниже код показывает, как загрузить и обучить модель классификации изображений YOLO11. Он позволяет передавать предварительно обученные веса, используя знания из существующей модели для повышения производительности вашей собственной модели. Вы можете указать набор данных, например, набор данных "fashion-mnist", который представляет собой хорошо известный набор полутоновых изображений предметов одежды (рубашки, брюки, обувь и т. д.). Обучение модели на этом наборе данных научит ее распознавать различные категории одежды. Вы можете заменить "fashion-mnist" на любой набор данных, подходящий для вашего проекта, например породы кошек или виды растений.

__wf_reserved_inherit
Рис. 7. Индивидуальное обучение модели YOLO11 для классификации изображений.

Испытайте YOLO11 на Ultralytics HUB

Хотя работа с пакетом Ultralytics проста, она требует некоторых знаний языка Python. Если вы ищете более удобный для новичков вариант, вы можете воспользоваться Ultralytics HUB - платформой, разработанной для простого и доступного обучения и развертывания различных моделей YOLO. Чтобы начать работу, вам нужно будет создать учетную запись.

Войдя в систему, перейдите в раздел "Модели" и выберите модель YOLO11 для классификации изображений. Вы увидите ряд доступных размеров модели: нано, малый, средний, большой и сверхбольшой. После выбора модели вы можете загрузить изображение в раздел "Предварительный просмотр", где прогнозы появятся в левой части страницы после обработки изображения.

__wf_reserved_inherit
Рис. 8. Использование Ultralytics HUB для выполнения умозаключений.

Основные выводы

YOLO11 предлагает мощные возможности классификации изображений, которые открывают новые возможности в различных отраслях. Скорость и точность YOLO11 делают его идеальным решением для самых разных задач - от улучшения мониторинга урожая в сельском хозяйстве и поиска товаров в розничной торговле до поддержки охраны дикой природы. Благодаря возможности индивидуального обучения с помощью пакета Ultralytics Python или удобной настройки без кода на Ultralytics HUB, пользователи могут легко внедрить YOLO11 в свои рабочие процессы. По мере того как все больше отраслей промышленности внедряют решения на основе искусственного интеллекта, YOLO11 предлагает гибкий, высокопроизводительный инструмент, который поддерживает инновации и практические достижения.

Чтобы узнать больше, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Изучите применение ИИ в самодвижущихся автомобилях и здравоохранении на страницах наших решений. 🚀

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена