Узнай, как новая модель Ultralytics YOLO11 может быть использована для обнаружения объектов, чтобы добиться более высокой точности в различных сферах промышленности.
Компьютерное зрение - это область искусственного интеллекта (ИИ), которая помогает машинам интерпретировать и понимать визуальную информацию для решения таких важных задач, как обнаружение объектов. В отличие от классификации изображений, обнаружение объектов позволяет не только определить, какие объекты находятся на изображении, но и точно определить их местоположение. Это делает его важнейшим инструментом для таких приложений искусственного интеллекта, как самодвижущиеся автомобили, системы безопасности в реальном времени и автоматизация складов.
Со временем технология обнаружения объектов стала более совершенной и простой в использовании. На Ultralytics' ежегодном гибридном мероприятии YOLO Vision 2024 (YV24) было объявлено о большом шаге вперед - выпуске моделиUltralytics YOLO11 . YOLO11 улучшает точность и производительность, поддерживая те же задачи, что и YOLOv8что позволяет пользователям предыдущих моделей легко перейти на новую модель.
В этой статье мы расскажем, что такое обнаружение объектов, чем оно отличается от других задач компьютерного зрения, и рассмотрим его реальные применения. Также мы расскажем тебе, как использовать модель YOLO11 с пакетомUltralytics Python и платформойUltralytics HUB. Давай начнем!
Обнаружение объектов - это основная задача компьютерного зрения, которая не просто определяет объекты на изображении. В отличие от классификации изображений, которая определяет только наличие конкретного объекта, обнаружение объектов распознает несколько объектов и определяет их точное местоположение с помощью ограничительных рамок.
Например, он может определять и находить лица на групповой фотографии, автомобили на оживленной улице или товары на полке магазина. Сочетание распознавания объектов и локализации делает его особенно полезным для таких приложений, как видеонаблюдение, мониторинг толпы и автоматизированное управление запасами.
Что отличает обнаружение объектов от других задач, таких как семантическая сегментация или сегментация экземпляров, так это его целенаправленность и эффективность.
Семантическая сегментация маркирует каждый пиксель изображения, но не делает различий между отдельными объектами одного типа (например, все лица на фотографии будут сгруппированы как "лицо"). Экземплярная сегментация идет дальше, отделяя каждый объект и очерчивая его точную форму, даже для объектов одного класса.
Обнаружение объектов, однако, обеспечивает более рациональный подход, идентифицируя и классифицируя объекты, одновременно отмечая их положение. Это делает его идеальным для задач реального времени, таких как обнаружение лиц на записях с камер наблюдения или выявление препятствий для автономных автомобилей.
YOLO11Продвинутые функции обнаружения объектов делают его полезным во многих отраслях. Давай рассмотрим несколько примеров.
YOLO11 и обнаружение объектов пересматривают аналитику розничной торговли, делая управление запасами и контроль полок более эффективным и точным. Способность модели быстро и надежно обнаруживать объекты помогает ритейлерам отслеживать уровень запасов, организовывать полки и сокращать количество ошибок при подсчете запасов.
Например, YOLO11 может обнаружить конкретные предметы, например солнечные очки, на полке магазина. Но зачем ритейлеру следить за полкой? Поддержание запасов на полках и их организация жизненно важны для того, чтобы покупатели могли найти то, что им нужно, а это напрямую влияет на продажи. Контролируя полки в режиме реального времени, ритейлеры могут быстро заметить, когда товары заканчиваются, неправильно расставлены или переполнены, что поможет им поддерживать организованную и привлекательную выкладку, улучшающую впечатления от покупок.
Эффективное функционирование шумного города зависит от плавности транспортного потока и безопасности улиц, и YOLO11 может помочь сделать это возможным. На самом деле многие приложения для умных городов могут быть интегрированы с YOLO11.
Один из интересных случаев - использование обнаружения объектов для идентификации номерных знаков на движущихся автомобилях. Благодаря этому YOLO11 может поддерживать более быстрый сбор платы за проезд, более эффективное управление дорожным движением и более быстрое соблюдение правил.
Информация, полученная от систем искусственного интеллекта Vision, следящих за дорогами, может предупредить власти о нарушениях правил дорожного движения или заторах до того, как они перерастут в более серьезные проблемы. YOLO11 Они также могут обнаруживать пешеходов и велосипедистов, делая улицы безопаснее и эффективнее для всех.
Собственно говоря, способность YOLO11обрабатывать визуальные данные делает его мощным инструментом для улучшения городской инфраструктуры. Например, он может помочь оптимизировать время работы светофора, анализируя движение транспорта и пешеходов. Он также может повысить безопасность в школьных зонах, обнаруживая детей и предупреждая водителей о необходимости снизить скорость. С помощью YOLO11 города могут принимать упреждающие меры для решения проблем и создавать более эффективную среду для всех.
Обнаружение объектов в реальном времени - это способность системы идентифицировать и классифицировать объекты в видеопотоке по мере их появления. YOLO11 рассчитана на превосходную производительность в реальном времени и отлично справляется с поддержкой этой возможности. Его применение выходит за рамки простого упорядочивания процессов - он также может помочь создать более инклюзивный и доступный мир.
Например, YOLO11 может помочь людям с ослабленным зрением, распознавая объекты в режиме реального времени. На основе обнаруженных объектов могут быть предоставлены аудиоописания, что помогает пользователям ориентироваться в окружающей обстановке с большей независимостью.
Подумай о слабовидящем человеке, который ходит по магазинам за продуктами. Выбрать нужные товары может быть непросто, но YOLO11 может помочь. По мере того как они кладут товары в корзину, система, интегрированная с YOLO11 , может быть использована для идентификации каждого предмета - например, бананов, авокадо или пакета молока - и предоставления аудиоописания в режиме реального времени. Это позволит им подтвердить свой выбор и убедиться, что они получили все необходимое. Распознавая повседневные предметы, YOLO11 может сделать шопинг более простым.
Теперь, когда мы рассмотрели основы обнаружения объектов и их разнообразные применения, давай погрузимся в то, как ты можешь начать использовать модель Ultralytics YOLO11 для таких задач, как обнаружение объектов.
Есть два простых способа использовать YOLO11: через пакет Ultralytics Python или через Ultralytics HUB. Давай рассмотрим оба способа, начав с пакета Python .
Выводы - это когда модель ИИ анализирует новые, невидимые данные, чтобы сделать предсказания, классифицировать информацию или предоставить выводы на основе того, что она узнала во время обучения. Применительно к обнаружению объектов это означает идентификацию и определение местоположения конкретных объектов на изображении или видео, рисование ограничительных рамок вокруг них и их маркировку на основе обучения модели.
Чтобы сделать вывод с помощью модели обнаружения объектов YOLO11 , тебе сначала нужно установить пакет Ultralytics Python с помощью pip, conda или Docker. Если у тебя возникнут проблемы с установкой, посмотри руководство по устранению неполадок, чтобы найти советы и рекомендации, которые помогут тебе их решить. После установки ты можешь использовать следующий код, чтобы загрузить модель обнаружения объектов YOLO11 и сделать предсказания на изображении.
YOLO11 также поддерживает индивидуальное обучение, чтобы лучше соответствовать твоим конкретным сценариям использования. Тонко настроив модель, ты сможешь приспособить ее для обнаружения объектов, имеющих отношение к твоему проекту. Например, при использовании компьютерного зрения в здравоохранении настраиваемая модель YOLO11 может использоваться для обнаружения конкретных аномалий на медицинских изображениях, таких как опухоли на снимках МРТ или переломы на рентгеновских снимках, что поможет врачам быстрее и точнее ставить диагнозы.
В приведенном ниже фрагменте кода показано, как загрузить и обучить модель YOLO11 для обнаружения объектов. Ты можешь начать с конфигурационного файла YAML или предварительно обученной модели, передать веса и обучиться на таких наборах данных, как COCO, чтобы получить более совершенные возможности обнаружения объектов.
После того как ты обучишь модель, ты также можешь экспортировать обученную модель в различные форматы для развертывания в разных средах.
Для тех, кто ищет альтернативу без кода, Ultralytics HUB предоставляет простую в использовании платформу Vision AI для обучения и развертывания YOLO моделей, включая YOLO11.
Чтобы запустить обнаружение объектов на изображениях, просто создай аккаунт, перейди в раздел "Модели" и выбери вариант модели обнаружения объектов YOLO11 . Загрузи свое изображение, и платформа отобразит обнаруженные объекты в разделе предварительного просмотра.
Сочетая гибкость пакета Python с простотой HUB, YOLO11 позволяет разработчикам и компаниям легко использовать мощь передовой технологии обнаружения объектов.
YOLO11 устанавливает новый стандарт в области обнаружения объектов, сочетая высокую точность с универсальностью для удовлетворения потребностей различных отраслей. От улучшения аналитики в розничной торговле до управления инфраструктурой умного города - YOLO11 создан для надежной работы в режиме реального времени в бесчисленных приложениях.
Благодаря возможностям индивидуального обучения и простому в использовании интерфейсу Ultralytics HUB интегрировать YOLO11 в твои рабочие процессы еще никогда не было так просто. Будь ты разработчиком, изучающим компьютерное зрение, или бизнесом, стремящимся к инновациям с помощью ИИ, YOLO11 предлагает инструменты, необходимые для достижения успеха.
Чтобы узнать больше, загляни в наш репозиторий на GitHub и присоединяйся к нашему сообществу. Изучи применение ИИ в самодвижущихся автомобилях и компьютерное зрение в сельском хозяйстве на страницах наших решений. 🚀
Начни свое путешествие с будущим машинного обучения