Зелёная проверка
Ссылка копируется в буфер обмена

Как использовать Ultralytics YOLO11 для сегментации инстансов

Пойми, как новая модель Ultralytics YOLO11 может быть использована для сегментации экземпляров, чтобы достичь более высокой точности в таких приложениях, как утилизация отходов и мониторинг факелов.

Компьютерное зрение, область искусственного интеллекта (ИИ), которая помогает машинам интерпретировать и понимать визуальную информацию, позволяет решать такие задачи, как сегментация объектов. Сегментация экземпляров может быть использована для анализа изображения или видеокадра с целью определения точных границ каждого отдельного объекта на изображении, даже если на нем присутствует несколько объектов одного типа. Благодаря высокому уровню точности сегментация экземпляров находит широкое применение: от помощи самодвижущимся автомобилям в обнаружении препятствий на дороге до идентификации опухолей на медицинских снимках.

За прошедшие годы сегментация экземпляров претерпела значительные изменения. Недавняя разработка была представлена во время Ultralytics' ежегодного гибридного мероприятия YOLO Vision 2024 (YV24) в виде модели Ultralytics YOLO11. Новая модель поддерживает те же задачи компьютерного зрения (включая сегментацию экземпляров), что и Ultralytics YOLOv8 модель, поэтому пользователи, знакомые с предыдущими версиями, смогут без проблем освоить новую модель.

Рис. 1. Пример использования модели Ultralytics YOLO11 для сегментации экземпляров.

В этой статье мы рассмотрим сегментацию экземпляров и то, чем она отличается от других задач компьютерного зрения, таких как семантическая сегментация, а также обсудим некоторые ее применения. Также мы расскажем, как можно использовать модель сегментации экземпляров YOLO11 с помощью пакетаUltralytics Python и платформы Ultralytics HUB. Давай приступим!

Что такое сегментация экземпляров?

Сегментация объектов может быть использована для того, чтобы определить объекты на изображении и очертить их на пиксельном уровне. Обычно этот процесс включает в себя сначала обнаружение объектов и рисование ограничительных рамок вокруг них. Затем алгоритм сегментации классифицирует каждый пиксель в пределах ограничительной рамки, чтобы создать точную маску для каждого объекта.

Сегментация экземпляров также отличается от таких задач, как семантическая сегментация и паноптическая сегментация. Семантическая сегментация маркирует каждый пиксель на основе общей категории объекта, не выделяя отдельные экземпляры. Паноптическая сегментация, с другой стороны, сочетает в себе как сегментацию экземпляров, так и семантическую сегментацию, маркируя каждый пиксель как классом, так и идентификатором экземпляра, идентифицируя отдельные объекты внутри каждой категории.

Рис. 2. Использование YOLO11 для обнаружения и сегментирования человека и собаки.

Возможности сегментации экземпляров могут применяться в различных сценариях, для которых могут потребоваться разные модели. Например, легкая модель может идеально подойти для обработки данных в реальном времени в мобильных приложениях, а более сложная - для высокоточных задач, таких как контроль качества на производстве.

Как и предыдущие модели, модель сегментации экземпляров YOLO11 также имеет несколько вариаций в зависимости от твоих потребностей. К этим вариациям относятся YOLO11n-seg (Nano), YOLO11s-seg (Small), YOLO11m-seg (Medium), YOLO11l-seg (Large) и YOLO11x-seg (Extra Large). Эти модели различаются по размеру, скорости обработки данных, точности и количеству требуемой вычислительной мощности. Исходя из твоих специфических требований, ты можешь выбрать модель, которая лучше всего подойдет для твоих задач.

Приложения для сегментации инстансов для YOLO11

Расширенные возможности сегментации экземпляров в YOLO11 открывают целый ряд применений в различных отраслях. Давай подробнее рассмотрим некоторые из этих приложений.

Использование сегментации YOLO11 в нефтегазовой промышленности

Добыча нефти и газа предполагает управление чрезвычайно высокими перепадами давления. Такие методы, как сжигание газа, помогают сжигать природный газ, который образуется при добыче нефти. Это необходимо по соображениям безопасности. Например, при добыче сырой нефти внезапный или значительный скачок давления может привести к взрыву. Хотя это и редкость, но промышленные аварии в нефтегазодобывающей отрасли могут привести к сильному пожару, который трудно локализовать и контролировать. Сжигание газа помогает операторам безопасно сбрасывать давление в оборудовании и справляться с непредсказуемыми, большими колебаниями давления, сжигая излишки газа.

Системы искусственного интеллекта могут улучшить этот процесс мониторинга, а риск аварий можно снизить, если использовать систему мониторинга факела на основе сегментации экземпляров. Мониторинг сжигания газа также важен по экологическим причинам, так как слишком большое количество сжигаемого газа может негативно повлиять на окружающую среду. 

Ultralytics Модели сегментации экземпляров YOLO11 можно использовать для отслеживания количества огня и дыма, вызванного факельным горением. Можно рассчитать площадь пикселя обнаруженного и сегментированного факела и дыма. Используя эту информацию, операторы могут в реальном времени получить представление о факелах и дыме, вызванных сжиганием топлива, что поможет им предотвратить аварии и негативное воздействие на окружающую среду. 

Рис. 3. Пример мониторинга факела с помощью YOLO11 в нефтегазовом производстве.

Сегментация экземпляров с помощью YOLO11 для управления пластиковыми отходами 

Работники предприятий по утилизации и переработке отходов могут использовать системы на основе сегментации экземпляров YOLO11 для идентификации пластиковых отходов. YOLO11 можно интегрировать с роботизированными системами сортировки, чтобы точно определять различные отходы, например картон и пластик (их нужно перерабатывать отдельно). Это особенно важно, учитывая, что из 7 миллиардов тонн пластиковых отходов, образующихся во всем мире, только около 10 % попадает на переработку.

Автоматизация процесса идентификации и сортировки пластиковых отходов значительно сокращает время по сравнению с традиционными методами, когда работники сортируют предметы вручную. Модели компьютерного зрения могут сегментировать даже мягкие пластики, такие как обертки и пакеты, что особенно сложно, потому что они часто запутываются. Модели YOLO11 также можно настраивать на сегментацию различных типов пластика. Подробнее о том, как ты можешь настраивать модель YOLO11, мы узнаем из следующих разделов.

Рис 4. Идентификация пластиковых отходов с помощью Ultralytics YOLO11. 

YOLO11 Сегментация в автономных транспортных средствах

Еще один интересный случай использования сегментации экземпляров - автономные автомобили. YOLO11 позволяет самодвижущимся автомобилям повысить безопасность пассажиров и окружающих на дороге за счет точного распознавания объектов на уровне пикселей. Бортовая система камер автомобиля может захватывать изображения окружающего пространства и анализировать их с помощью YOLO11 и сегментации экземпляров. Каждый объект (пешеходы, светофоры, другие автомобили и т.д.) на изображении сегментируется, и ему присваивается метка. Такой уровень точности дает автономным автомобилям возможность идентифицировать каждый объект вокруг себя. 

Рис. 5. Использование YOLO11 и сегментации экземпляров для идентификации автомобилей и пешеходов на дороге.

Пробуем сегментацию экземпляров с помощью модели YOLO11

Теперь, когда мы изучили сегментацию экземпляров и обсудили некоторые из ее применений, давай посмотрим, как ты можешь опробовать ее на примере модели Ultralytics YOLO11. 

Есть два способа сделать это: ты можешь использовать либо пакет Ultralytics Python , либо Ultralytics HUB. Мы будем изучать оба варианта, начав с пакета Python .

Выполнение умозаключений с помощью YOLO11

Выполнение вывода подразумевает использование модели для анализа новых, ранее невиданных данных. Чтобы запустить вывод с помощью модели сегментации экземпляров YOLO11 через код, нам нужно установить пакетUltralytics Python с помощью pip, conda или docker. Если в процессе установки у тебя возникнут какие-либо проблемы, ты можешь обратиться к нашему руководству по общим проблемам, чтобы получить помощь в их устранении. Как только пакет будет установлен, ты можешь запустить код, показанный ниже, чтобы загрузить модель сегментации экземпляров YOLO11 и запустить предсказания на образе.

Рис. 6. Выполнение умозаключения на изображении с помощью YOLO11n-seg.

Обучение пользовательской модели YOLO11

С помощью тех же настроек кода ты можешь обучить и пользовательскую модель YOLO11. Тонко настроив модель YOLO11, ты сможешь создать пользовательскую версию модели, которая будет лучше отвечать требованиям твоего конкретного проекта. Например, ритейлеры могут использовать пользовательскую модель для точного сегментирования физических особенностей покупателя, чтобы рекомендовать одежду, которая сидит правильно. В приведенном ниже фрагменте кода показано, как загрузить и обучить модель YOLO11 для сегментации экземпляров. Ты можешь начать с конфигурации YAML или предварительно обученной модели, передать веса и обучиться на наборе данных вроде COCO, чтобы добиться эффективной сегментации. 


from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-seg.yaml")  # build a new model from YAML
model = YOLO("yolo11n-seg.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n-seg.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)

После завершения работы ты сможешь делать выводы, используя пользовательскую модель для своих конкретных задач. Используя опцию экспорта, ты также можешь экспортировать свою пользовательскую модель в другой формат.

Сегментация экземпляров YOLO11 на Ultralytics HUB

Теперь, когда мы рассмотрели запуск умозаключений и обучение модели сегментации экземпляров YOLO11 с помощью кода, давай рассмотрим альтернативу без кода: Ultralytics HUB. Ultralytics HUB - это интуитивно понятная платформа Vision AI, которая упрощает процесс обучения и развертывания моделей YOLO , включая модели сегментации экземпляров YOLO11. 

Чтобы выполнить предсказание на изображениях, тебе нужно всего лишь создать аккаунт, перейти в раздел "Модели" и выбрать нужный вариант модели сегментации экземпляров YOLO11. Ты можешь загрузить изображение и просмотреть результаты предсказания в разделе предварительного просмотра, как показано ниже.

Рис. 7. Запуск умозаключений на Ultralytics HUB.

Основные выводы

YOLO11 предлагает надежные возможности сегментации экземпляров, которые открывают мир возможностей в различных отраслях. От повышения безопасности автономных транспортных средств и мониторинга сжигания газа в нефтегазовом секторе до автоматизации сортировки мусора на перерабатывающих предприятиях - точность на уровне пикселей делает YOLO11 идеальным решением сложных задач сегментации. 

Благодаря возможностям индивидуального обучения с помощью пакета Ultralytics Python и бескодовой настройки с помощью Ultralytics HUB пользователи могут легко интегрировать YOLO11 в свои рабочие процессы. Будь то промышленные приложения, здравоохранение, розничная торговля или мониторинг окружающей среды, YOLO11 обеспечивает гибкость и точность для удовлетворения различных потребностей в сегментации.

Чтобы узнать больше, посети наш репозиторий на GitHub и присоединяйся к нашему сообществу. Изучи применение ИИ в самодвижущихся автомобилях и сельском хозяйстве на страницах наших решений. 🚀

Логотип FacebookЛоготип ТвиттераЛоготип LinkedInСимвол копирования-ссылки

Читайте больше в этой категории

Давай вместе построим будущее
искусственного интеллекта!

Начни свое путешествие с будущим машинного обучения