Зелёная проверка
Ссылка копируется в буфер обмена

Индивидуальное обучение Ultralytics YOLO11 с помощью наборов данных компьютерного зрения

Узнай, как интеграция Roboflow может упростить пользовательское обучение Ultralytics YOLO11 , сделав наборы данных компьютерного зрения с открытым исходным кодом легкодоступными.

Обучение модели компьютерного зрения, например Ultralytics YOLO11 обычно включает в себя сбор изображений для твоего набора данных, их аннотирование, подготовку данных и тонкую настройку модели под твои конкретные требования. Хотя пакетUltralytics Python делает эти шаги простыми и удобными, разработка Vision AI все равно может отнимать много времени.

Это становится особенно актуальным, когда ты работаешь в сжатые сроки или разрабатываешь прототип. В таких ситуациях наличие инструментов или интеграций, которые упрощают некоторые части процесса - например, упрощают подготовку наборов данных или автоматизируют повторяющиеся задачи, - может иметь большое значение. Сокращая время и усилия, эти решения помогают тебе сосредоточиться на создании и доработке модели. Именно это и предлагает интеграция Roboflow .

Интеграция Roboflow позволяет тебе легко получить доступ к наборам данных из Roboflow Universe, большой библиотеки наборов данных компьютерного зрения с открытым исходным кодом. Вместо того чтобы тратить часы на сбор и организацию данных, ты можешь быстро найти и использовать существующие наборы данных, чтобы запустить свой YOLO11 процесс обучения. Такая интеграция позволяет гораздо быстрее и проще проводить эксперименты и итерации при разработке моделей компьютерного зрения.

В этой статье мы подробно рассмотрим, как ты можешь использовать интеграцию Roboflow для более быстрой разработки моделей. Давай приступим!

Что такое Roboflow Universe?

Roboflow Universe - это платформа, которую поддерживает Roboflow, компания, занимающаяся упрощением разработки компьютерного зрения. Она включает в себя более 350 миллионов изображений, 500 000 наборов данных и 100 000 точно настроенных моделей для таких задач, как обнаружение объектов, классификация изображений и сегментация. Благодаря вкладу разработчиков и исследователей со всего мира, Roboflow Universe - это центр совместной работы для тех, кто хочет начать или улучшить свои проекты в области компьютерного зрения.

Рис. 1. Примеры наборов данных по обнаружению объектов на сайте Roboflow Universe.

Roboflow Universe включает в себя следующие ключевые особенности:

  • Инструменты для изучения наборов данных: Изучай, фильтруй и визуализируй наборы данных, чтобы быстро найти ресурсы, соответствующие требованиям твоего проекта.
  • Параметры экспорта: Экспортируй данные в такие форматы, как COCO, YOLO, TFRecord, CSV и другие, чтобы они соответствовали твоему рабочему процессу.
  • Аналитика наборов данных: Получи представление о различных наборах данных с помощью инструментов аналитики, которые обеспечивают визуализацию распределений меток, дисбаланса классов и качества набора данных. 
  • Отслеживание версий: Просматривай и получай доступ к различным версиям наборов данных, загруженных участниками, что позволит тебе отслеживать обновления, сравнивать изменения и выбирать ту версию, которая лучше всего подходит для нужд твоего проекта. 

Интеграция с Roboflow поможет тебе найти нужные данные.

Поиск подходящего набора данных часто является одной из самых сложных частей построения модели компьютерного зрения. Создание набора данных обычно включает в себя сбор большого количества изображений, проверку того, что они соответствуют твоей задаче, а затем их точную маркировку. 

Этот процесс может отнять много времени и ресурсов, особенно если ты экспериментируешь с разными подходами в течение короткого периода времени. Даже найти уже существующие наборы данных может быть непросто, так как они часто разбросаны по платформам, не документированы должным образом или не имеют специфических аннотаций, которые тебе нужны.

Например, если ты создаешь приложение компьютерного зрения для обнаружения сорняков на сельскохозяйственных полях, то, возможно, захочешь протестировать различные подходы Vision AI, например обнаружение объектов против сегментации экземпляров. Это позволит тебе поэкспериментировать и выяснить, какой метод работает лучше, прежде чем тратить время и силы на сбор и маркировку собственного набора данных.

Рис. 2. Обнаружение деталей автомобиля с помощью YOLO11.

Используя интеграцию Roboflow , ты можешь просматривать различные наборы данных, связанные с сельским хозяйством, включая те, что посвящены обнаружению сорняков, здоровью посевов или мониторингу полей. Эти готовые к использованию наборы данных позволят тебе опробовать различные техники и отточить свою модель без предварительных усилий по созданию собственных данных. 

Как работает интеграция с Roboflow

Теперь, когда мы обсудили, как ты можешь использовать интеграцию Roboflow для поиска нужных наборов данных, давай посмотрим, как она вписывается в твой рабочий процесс. Выбрав набор данных из Roboflow Universe, ты можешь экспортировать или загрузить его в формате YOLO11 . После того как твой набор данных экспортирован, ты можешь использовать его для пользовательского обучения YOLO11 с помощью пакета Ultralytics Python . 

Загружая свой набор данных, ты можешь заметить, что Roboflow Universe поддерживает и другие форматы для обучения различных моделей. Так почему же ты должен выбрать для обучения Ultralytics YOLO11 ? 

YOLO11 Это последняя версия модели Ultralytics YOLO , созданная для более быстрого и точного обнаружения объектов. Она использует на 22% меньше параметров (внутренних значений, которые модель подстраивает в процессе обучения для предсказания), чем YOLOv8m, но при этом достигает более высокой средней точности (mAP) на наборе данных COCO. Такой баланс скорости и точности делает YOLO11 универсальным выбором для широкого спектра приложений компьютерного зрения, особенно при индивидуальном обучении моделей под конкретные задачи.

Вот более подробный взгляд на то, как работает пользовательский тренинг YOLO11:

  • Подача данных: Модель YOLO11 обрабатывает твой набор данных, обучаясь обнаруживать и классифицировать объекты на основе изображений и их аннотаций.
  • Предсказание и обратная связь: Модель делает предсказания об объектах на изображениях и сравнивает их с правильными ответами, представленными в наборе данных.
  • Отслеживание эффективности: Для оценки прогресса отслеживаются такие показатели, как точность (правильные обнаружения), отзыв (пропущенные обнаружения) и потеря (ошибки предсказания).
  • Итеративное обучение: Модель настраивает свои параметры в течение нескольких раундов (эпох), чтобы повысить точность обнаружения и минимизировать ошибки.
  • Финальный вывод модели: После обучения оптимизированная модель сохраняется и готова к развертыванию.

Другие интеграции, ориентированные на развитие компьютерного зрения

Изучая интеграцию Roboflow , ты заметишь и другие интеграции, упомянутые в документацииUltralytics . Мы поддерживаем множество интеграций, связанных с различными этапами развития компьютерного зрения. 

Это сделано для того, чтобы предоставить нашему сообществу различные варианты, чтобы ты мог выбрать то, что лучше всего подходит для твоего конкретного рабочего процесса.

Рис. 3. Обзор интеграций, поддерживаемых сайтом Ultralytics.

Помимо наборов данных, другие поддерживаемые Ultralytics интеграции посвящены различным частям процесса компьютерного зрения, таким как обучение, развертывание и оптимизация. Вот несколько примеров других интеграций, которые мы поддерживаем:

  • Интеграции для обучения: Такие интеграции, как Amazon SageMaker и Paperspace Gradient, упрощают рабочие процессы обучения, предлагая облачные платформы для эффективной разработки и тестирования моделей.
  • Интеграции с рабочими процессами и отслеживанием экспериментов: ClearML, MLFlow и Weights & Biases (W&B) помогают автоматизировать рабочие процессы, отслеживать эксперименты и улучшают совместную работу, облегчая управление проектами машинного обучения.
  • Интеграции для оптимизации и развертывания: CoreML, ONNX, и OpenVINO позволяют оптимизировать развертывание на различных устройствах и фреймворках, обеспечивая эффективную работу на таких платформах, как оборудование Apple и процессоры Intel .
  • Интеграции для мониторинга и визуализации: TensorBoard и Weights & Biases предоставляют инструменты для визуализации прогресса обучения и мониторинга производительности, давая подробные сведения для доработки моделей.

YOLO11 Приложения и роль интеграций

Интеграции, поддерживающие разработку компьютерного зрения, в сочетании с надежными возможностями YOLO11 облегчают решение реальных задач. Рассмотрим такие инновации, как компьютерное зрение в производстве, где искусственное зрение используется для обнаружения дефектов на производственной линии - например, царапин на металлических деталях или отсутствующих компонентов. Сбор нужных данных для таких задач часто может быть медленным и сложным, требующим доступа к специализированным средам. 

Обычно это предполагает установку камер или датчиков вдоль производственных линий для получения изображений продукции. Эти изображения должны быть сделаны в больших объемах, часто при постоянном освещении и под разными углами, чтобы обеспечить четкость и однородность. 

После съемки изображения должны быть тщательно аннотированы с точными метками для каждого типа дефектов, таких как царапины, вмятины или отсутствующие компоненты. Этот процесс требует значительного времени и ресурсов, а также опыта, чтобы убедиться, что набор данных точно отражает реальную вариативность. Такие факторы, как различные размеры, формы и материалы дефектов, должны быть учтены, чтобы создать надежный и достоверный набор данных.

Интеграции, предоставляющие готовые наборы данных, облегчают такие задачи, как промышленный контроль качества, а благодаря возможностям YOLO11по обнаружению дефектов в реальном времени производители могут контролировать производственные линии, мгновенно выявлять дефекты и повышать эффективность.

Рис. 4. Пример использования Ultraytics YOLO11 для обнаружения и подсчета выпускаемых банок.

Помимо производства, интеграция, связанная с наборами данных, может использоваться во многих других отраслях. Объединив скорость и точность YOLO11с легкодоступными наборами данных, предприятия могут быстро разрабатывать и внедрять решения, отвечающие их специфическим потребностям. Возьмем, к примеру, здравоохранение - интеграция наборов данных может помочь разработать решения для анализа медицинских изображений с целью обнаружения аномалий вроде опухолей. Аналогично, в автономном вождении такие интеграции могут помочь в идентификации транспортных средств, пешеходов и дорожных знаков для повышения безопасности.

Основные выводы

Поиск подходящего набора данных часто является одной из самых трудоемких частей построения модели компьютерного зрения. Однако интеграция Roboflow облегчает поиск наилучшего набора данных для индивидуального обучения твоих Ultralytics YOLO моделей, даже если ты новичок в компьютерном зрении. 

Благодаря доступу к огромной коллекции наборов данных для задач компьютерного зрения, таких как обнаружение объектов, классификация изображений или сегментация экземпляров, Roboflow Universe избавляет тебя от хлопот, связанных с поиском данных. Она помогает тебе быстро приступить к работе и сосредоточиться на построении модели, а не тратить время на сбор и организацию данных. Такой оптимизированный подход позволяет разработчикам более эффективно создавать прототипы, проводить итерации и разрабатывать решения для компьютерного зрения.

Чтобы узнать больше, посети наш репозиторий на GitHub и присоединяйся к нашему сообществу. Изучи инновации в таких областях, как ИИ в самодвижущихся автомобилях и компьютерное зрение в сельском хозяйстве, на страницах наших решений. 🚀

Логотип FacebookЛоготип ТвиттераЛоготип LinkedInСимвол копирования-ссылки

Читайте больше в этой категории

Давай вместе построим будущее
искусственного интеллекта!

Начни свое путешествие с будущим машинного обучения