Глоссарий

Активное обучение

Открой для себя активное обучение - экономически эффективный метод машинного обучения, который повышает точность при меньшем количестве меток. Узнай, как он преобразует обучение ИИ!

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Активное обучение - это специализированный подход в машинном обучении, при котором алгоритм играет активную роль в выборе данных, на которых он обучается. В отличие от традиционного контролируемого обучения, которое опирается на полностью помеченные наборы данных, активное обучение разумно запрашивает метки на определенных точках данных, которые оно считает наиболее информативными. Такой целенаправленный подход позволяет модели достигать высокой точности на значительно меньшем количестве помеченных примеров, что делает его экономичной и эффективной стратегией обучения моделей машинного обучения, особенно при работе с большими немаркированными наборами данных.

Как работает активное обучение

В активном обучении модель итеративно взаимодействует с оракулом (обычно это человек-аннотатор), запрашивая метки для наиболее ценных точек данных. Обычно процесс происходит следующим образом:

  1. Начальное обучение: Изначально модель обучается на небольшом наборе помеченных данных.
  2. Выборка неопределенности: Модель определяет точки данных, в которых она больше всего не уверена в правильности метки. Существуют различные стратегии для количественной оценки неопределенности, например, запрос экземпляров с наименьшей уверенностью в предсказании или там, где разные модели в ансамбле расходятся во мнениях больше всего.
  3. Запрос: Модель запрашивает у оракула метки выбранных точек данных.
  4. Обновление модели: новые помеченные данные добавляются в обучающий набор, и модель переобучается.
  5. Итерация: Шаги 2-4 повторяются до тех пор, пока не будет достигнут желаемый уровень точности или не будет исчерпан бюджет на маркировку.

Активное обучение особенно полезно, когда маркировка данных стоит дорого, отнимает много времени или требует специальных знаний. Стратегически выбирая точки данных для маркировки, активное обучение минимизирует усилия по маркировке и одновременно максимизирует производительность модели.

Основные преимущества активного обучения

Активное обучение обладает рядом преимуществ по сравнению с традиционным контролируемым обучением:

  • Снижение затрат на маркировку: Сосредоточившись на наиболее информативных точках данных, активное обучение значительно сокращает количество меченых данных, необходимых для обучения высокоэффективной модели.
  • Более быстрое обучение: Благодаря меньшему количеству необходимых помеченных примеров время обучения может быть значительно сокращено, особенно для сложных моделей.
  • Улучшенная точность модели: Активное обучение часто приводит к улучшению производительности модели по сравнению с моделями, обученными на случайно выбранных помеченных данных, так как оно отдает приоритет наиболее сложным и информативным экземплярам.
  • Эффективное использование ресурсов: Активное обучение оптимизирует использование ресурсов, минимизируя усилия, затрачиваемые на маркировку менее информативных точек данных.

Применение активного обучения в реальном мире

Активное обучение находит применение в различных сферах, где не хватает меченых данных или их дорого получить. Вот два конкретных примера:

Анализ медицинских изображений

При анализе медицинских изображений получение аннотаций от медицинских экспертов может быть дорогостоящим и отнимать много времени. Активное обучение может быть использовано для определения наиболее важных медицинских изображений, требующих экспертной маркировки, таких как изображения с неоднозначными характеристиками или редкими состояниями. Такой целенаправленный подход позволяет разрабатывать точные диагностические модели с меньшим количеством помеченных изображений, ускоряя разработку медицинских инструментов на базе ИИ.

Обнаружение объектов в автономных транспортных средствах

Обучение моделей обнаружения объектов для автономных автомобилей требует огромного количества помеченных данных, представляющих различные сценарии вождения. Активное обучение может помочь расставить приоритеты в маркировке точек данных, которые являются наиболее сложными для модели, например необычные условия освещения, скрытые объекты или редкие дорожные ситуации. Это гарантирует, что модель будет обучаться на наиболее информативных данных, что приведет к повышению безопасности и надежности систем автономного вождения. Это лишь одно из многих применений компьютерного зрения в автономных автомобилях.

Активное обучение по сравнению с другими парадигмами обучения

Важно отличать активное обучение от других родственных парадигм обучения:

  • Контролируемое обучение: В традиционном контролируемом обучении модель тренируется на фиксированном наборе данных с полными метками. Активное обучение, напротив, динамически выбирает точки данных для маркировки в процессе обучения.
  • Полусамостоятельное обучение: Полуподконтрольное обучение использует как меченые, так и немеченые данные для тренировки. Хотя и активное обучение, и полуподконтрольное обучение нацелены на использование немеченых данных, активное обучение активно запрашивает метки, тогда как полуподконтрольное обучение обычно использует немеченые данные для улучшения понимания моделью распределения данных, лежащих в основе.
  • Обучение с подкреплением: Обучение с подкреплением подразумевает, что агент учится методом проб и ошибок, взаимодействуя с окружающей средой. В отличие от активного обучения, где модель запрашивает оракул для получения меток, обучение с подкреплением фокусируется на обучении оптимальным действиям, основанным на наградах и штрафах.

Активное обучение и Ultralytics

Ultralytics предлагает самые современные решения для обнаружения объектов, включая мощные модели Ultralytics YOLO . Хотя Ultralytics в настоящее время не предлагает прямой поддержки рабочих процессов активного обучения, результаты и выводы, генерируемые моделями YOLO , могут быть использованы для реализации стратегий активного обучения. Например, оценки уверенности модели в обнаружении объектов могут быть использованы для определения неопределенных экземпляров для маркировки.

Кроме того, Ultralytics предоставляет набор инструментов и ресурсов для обучения, проверки и развертывания моделей YOLO . Эти инструменты можно интегрировать в пользовательские конвейеры активного обучения, чтобы упростить разработку систем обнаружения объектов. Подробнее изучить эти возможности ты можешь на странице документацииUltralytics .

Активное обучение представляет собой мощную парадигму для эффективного обучения моделей машинного обучения, особенно когда меченые данные скудны или дороги. Грамотно выбирая наиболее информативные точки данных для маркировки, активное обучение снижает затраты, ускоряет обучение и повышает точность модели. По мере роста спроса на ИИ-решения в различных отраслях активное обучение будет играть все более важную роль в разработке надежных и эффективных систем машинного обучения.

Читать полностью