Узнай, как новая модель Ultralytics YOLO11 улучшает классификацию изображений, предлагая более высокую точность для задач в сельском хозяйстве, розничной торговле и мониторинге дикой природы.
Допустим, робот смотрит на двух кошек, черную и белую, и ему нужно выяснить, кто из них кто. Для этого он может использовать классификацию изображений- задачу компьютерного зрения, которая помогает идентифицировать и классифицировать объекты или сцены на изображении. На самом деле, благодаря последним достижениям в области искусственного интеллекта (ИИ), классификация изображений может использоваться в самых разных приложениях - от наблюдения за животными до производства и сельского хозяйства с выявлением болезней сельскохозяйственных культур.
Одно из последних достижений в области классификации изображений - модельUltralytics YOLO11 . Она была представлена на Ultralytics' ежегодном гибридном мероприятии YOLO Vision 2024 (YV24), YOLO11 призвана с легкостью и точностью решать самые разные задачи искусственного интеллекта в области зрения, включая классификацию изображений.
В этой статье мы рассмотрим основы классификации изображений, обсудим реальные приложения и покажем, как ты можешь использовать YOLO11 для классификации изображений с помощью пакетаUltralytics Python . Также мы рассмотрим, как ты можешь опробовать возможности YOLO11на Ultralytics HUB в несколько простых шагов. Давай начнем!
Классификация изображений работает путем присвоения метки или тега изображению на основе шаблонов, изученных на основе ранее помеченных изображений. Тщательно анализируя пиксели изображения, модель компьютерного зрения может найти наилучшее соответствие для него. Надежные модели, такие как YOLO11 могут без проблем справиться с этим процессом. YOLO11Архитектура модели позволяет обрабатывать изображения или видеокадры практически мгновенно, что делает ее идеальной для приложений, нуждающихся в быстрой и точной классификации изображений.
Чтобы по-настоящему понять сферу применения классификации изображений, нужно отличать ее от других задач, таких как обнаружение объектов. В то время как классификация изображений маркирует все изображение, обнаружение объектов идентифицирует и определяет местоположение каждого объекта на изображении.
Рассмотрим изображение жирафа. При классификации изображений модель может обозначить все изображение просто как жирафа, основываясь на его общем содержании. Однако при распознавании объектов модель не ограничивается идентификацией жирафа, она также помещает вокруг него ограничительную рамку, точно определяя его местоположение на изображении.
Теперь представь, что жираф стоит возле дерева в саванне вместе с другими животными. Модель классификации изображений могла бы обозначить всю сцену как саванну или просто дикую природу. Однако при распознавании объектов модель определит каждый элемент в отдельности, распознав жирафа, дерево и других животных, каждый из которых имеет свои собственные ограничительные рамки.
Точность и производительность модели Ultralytics YOLO11 для классификации изображений делает ее полезной в самых разных отраслях. Давай рассмотрим некоторые из ключевых применений YOLO11 в классификации изображений.
Классификация изображений может помочь оптимизировать многие функции в сельском хозяйстве и фермерской индустрии. В частности, используя такие модели классификации изображений, как YOLO11, фермеры могут постоянно следить за здоровьем своих культур, выявлять серьезные заболевания и с высокой точностью определять заражение вредителями.
Вот посмотри, как это работает:
Классификация изображений может значительно улучшить опыт розничных покупок, сделав его более персонализированным и удобным для пользователя. Ритейлеры могут использовать специально обученные модели компьютерного зрения для распознавания товаров в своем инвентаре и интегрировать эту возможность в свои мобильные приложения или веб-сайты. Тогда покупатели смогут искать товары, просто загрузив фотографию, что сделает покупки быстрее и удобнее.
Как только клиент загружает изображение в систему визуального поиска, за кулисами происходит несколько вещей, прежде чем появятся результаты поиска.
Во-первых, распознавание объектов может использоваться для выделения основных предметов на изображении, например, для идентификации предмета одежды или мебели и отделения его от фона. Далее можно использовать классификацию изображений, чтобы еще больше классифицировать каждый предмет, распознавая, что это - пиджак, рубашка, диван или стол.
Получив эту информацию, система может найти похожие товары, доступные для покупки, что особенно полезно для поиска уникальных или модных вещей, которые сложно описать одними словами. Эта же технология может помочь упростить и другие задачи розничной торговли, например управление запасами, благодаря автоматическому распознаванию и распределению товаров по категориям.
Традиционно наблюдение за животными в дикой природе - утомительная задача, требующая от многих людей ручной сортировки и анализа тысяч фотографий. С помощью таких режимов компьютерного зрения, как YOLO11, исследователи могут автоматически следить за животными с большей скоростью. Камеры могут быть размещены в естественной среде обитания, чтобы делать снимки. Затем модель искусственного зрения может быть использована для анализа этих фотографий и классификации животных на них (если таковые имеются). Такая система может помочь исследователям изучать и отслеживать популяции животных, их миграционные схемы и так далее.
Еще один способ, которым ИИ и модели компьютерного зрения вроде YOLO11 могут помочь в этой области, - это упрощение процесса классификации исчезающих видов. Определяя потенциальные виды или категории пород, к которым может принадлежать животное, эти модели могут предоставить важные данные для исследователей. Например, в Университете Тасмании (UTAS) разработали систему на основе классификации изображений для мониторинга различных видов тасманийских диких животных. Прогнозы, полученные с помощью моделей, могут затем помочь ученым и исследователям следить за активностью и поведением животных, которые могут сигнализировать о таких угрозах, как браконьерство или потеря среды обитания.
Теперь, когда мы обсудили, что такое классификация изображений, и изучили некоторые области ее применения. Давай посмотрим, как ты можешь опробовать классификацию изображений с помощью новой модели YOLO11 . Есть два простых способа начать: с помощью пакетаUltralytics Python или через Ultralytics HUB. Мы рассмотрим оба варианта.
Чтобы начать работу с пакетом Ultralytics Python , просто установи его с помощью pip, conda или Docker. Если у тебя возникнут какие-либо проблемы, посмотри наше руководство по общим проблемам, в котором ты найдешь полезные советы по устранению неполадок.
Когда пакет установлен, ты можешь использовать следующий код, чтобы загрузить вариант модели классификации изображений YOLO11 и выполнить вывод на изображении. Запустить вывод - значит использовать обученную модель для предсказаний на новых, невидимых данных. Ты можешь попробовать это на выбранном тобой изображении!
Ты также можешь использовать тот же пакет Python для обучения пользовательской YOLO11 модели классификации. Пользовательское обучение позволяет тебе точно настроить модель YOLO11 под свои конкретные нужды. Например, если ты разрабатываешь приложение для классификации различных пород кошек, ты можешь обучить модель YOLO11 именно для этой цели.
Приведенный ниже код показывает, как загрузить и обучить модель классификации изображений YOLO11 . Он позволяет передавать предварительно обученные веса, используя знания из существующей модели для повышения производительности твоей собственной модели. Ты можешь указать набор данных, например, набор данных "fashion-mnist", который представляет собой известный набор полутоновых изображений предметов одежды (рубашки, брюки, обувь и т.д.). Обучение модели на этом наборе данных научит ее распознавать различные категории одежды. Ты можешь заменить "fashion-mnist" на любой набор данных, подходящий для твоего проекта, например, породы кошек или виды растений.
Хотя использование пакета Ultralytics довольно простое, оно требует некоторых знаний о Python. Если ты ищешь более удобный для новичков вариант, то можешь воспользоваться Ultralytics HUB - платформой, созданной для того, чтобы сделать обучение и внедрение различных моделей YOLO простым и доступным. Чтобы начать, тебе нужно будет создать аккаунт.
После того как ты вошел в систему, перейди в раздел "Модели" и выбери модель YOLO11 для классификации изображений. Ты увидишь ряд доступных размеров моделей: нано, маленькая, средняя, большая и сверхбольшая. Выбрав модель, ты можешь загрузить изображение в раздел "Предварительный просмотр", где предсказания появятся в левой части страницы после того, как изображение будет обработано.
YOLO11 предлагает мощные возможности классификации изображений, которые открывают новые возможности в различных отраслях. Скорость и точность YOLO11делают его идеальным решением для самых разных задач: от улучшения мониторинга урожая в сельском хозяйстве и поиска товаров в розничной торговле до поддержки охраны дикой природы. Благодаря возможности индивидуального обучения с помощью пакета Ultralytics Python или удобной настройки без кода на Ultralytics HUB пользователи могут легко внедрить YOLO11 в свои рабочие процессы. По мере того как все больше отраслей промышленности внедряют решения на основе искусственного интеллекта, YOLO11 предлагает гибкий, высокопроизводительный инструмент, который поддерживает инновации и практические достижения.
Чтобы узнать больше, посети наш репозиторий на GitHub и присоединяйся к нашему сообществу. Изучи применение ИИ в самодвижущихся автомобилях и здравоохранении на страницах наших решений. 🚀
Начни свое путешествие с будущим машинного обучения