Глоссарий

Полууправляемое обучение

Узнай, как полуподчиненное обучение объединяет меченые и немеченые данные, чтобы улучшить модели ИИ, снизить затраты на маркировку и повысить точность.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Полуконтролируемое обучение (SSL) - это разновидность методов машинного обучения (ML), которая находится между контролируемым и неконтролируемым обучением. Она использует комбинацию небольшого количества помеченных данных и большого количества немеченых данных для обучения моделей. Основная мотивация SSL - высокая стоимость и усилия, часто связанные с маркировкой данных, особенно в сложных доменах. Используя легкодоступные немеченые данные, SSL стремится улучшить производительность и обобщение моделей сверх того, что можно было бы достичь, используя только ограниченное количество меченых данных.

Как работает полуконтрольное обучение

Основной принцип Semi-Supervised Learning заключается в том, что немеченые данные, несмотря на отсутствие явных меток, содержат ценную информацию о базовой структуре и распределении данных. Алгоритмы ССЛ пытаются использовать эту структуру для улучшения процесса обучения. Распространенные подходы часто предполагают принятие предположений о данных, таких как "кластерное предположение" (точки в одном кластере, скорее всего, будут иметь одну и ту же метку) или "предположение о многообразии" (точки данных лежат на низкоразмерном многообразии).

В SSL используются такие методы, как псевдомаркировка, когда модель, обученная на исходных меченых данных, используется для предсказания меток для немеченых данных. Высокодостоверные предсказания затем рассматриваются как "псевдометки" и добавляются в обучающий набор. Другой подход включает регуляризацию согласованности, которая побуждает модель выдавать схожие результаты для возмущенных версий одних и тех же немаркированных входных данных, что часто достигается с помощью таких приемов, как увеличение данных. Эти методы помогают модели изучать более надежные характеристики, используя обширный набор немаркированных данных. Ты можешь найти хороший обзор SSL на Towards Data Science.

Применение и примеры

Полуподконтрольное обучение особенно полезно в сценариях, где получение меченых данных является узким местом. Некоторые ключевые области применения включают в себя:

  • Классификация изображений: Обучение модели для классификации изображений (например, с помощью наборов данных вроде CIFAR-10), когда вручную маркируется лишь небольшая часть изображений, но миллионы немаркированных изображений доступны из Сети.
  • Анализ медицинских изображений: Улучшение диагностических моделей путем обучения на нескольких медицинских снимках, проаннотированных экспертами, наряду с большим количеством неаннотированных снимков. Это может улучшить такие задачи, как обнаружение опухолей.
  • Классификация веб-страниц: Классифицируй веб-страницы, используя небольшой набор классифицированных вручную страниц и огромное количество некатегоризированных страниц, соскобленных из интернета. Смотри ранний пример исследования по классификации веб-контента.
  • Распознавание речи: Построение систем, использующих ограниченное количество расшифрованных аудиоданных в сочетании с большими объемами нерасшифрованной речи.
  • Обработка естественного языка (NLP): Улучшение таких задач, как анализ настроения или классификация текстов, за счет использования больших немаркированных текстовых корпораций наряду с небольшими маркированными наборами данных.

Отличия от родственных понятий

Важно отличать Semi-Supervised Learning от родственных парадигм ML:

  • Супервизорное обучение: Для обучения полностью полагается на полностью помеченные данные. SSL использует как помеченные, так и непомеченные данные.
  • Неподконтрольное обучение: Использует только немеченые данные, обычно для таких задач, как кластеризация или уменьшение размерности, без предсказания заранее определенных меток. SSL использует немеченые данные для улучшения задачи, которая решается под наблюдением.
  • Самостоятельное обучение (Self-Supervised Learning): Также использует немеченые данные, но при этом генерирует управляющие сигналы из самих данных (например, предсказывает слово с маской, раскрашивает изображение). Его часто используют для предварительного обучения моделей, которые затем дорабатываются на меченых данных, в то время как SSL обычно включает оба типа данных на основном этапе обучения.

Преимущества полуподконтрольного обучения

  • Снижение стоимости маркировки: значительно уменьшает необходимость в дорогостоящей и трудоемкой ручной аннотации данных.
  • Повышение точности: Это может привести к повышению точности модели по сравнению с обучением только на небольших наборах меченых данных за счет использования информации из немеченых данных.
  • Улучшенная генерализация: Модели, обученные с помощью SSL, часто лучше обобщаются на новые, невидимые данные за счет изучения базовых структур данных.
  • Используй огромное количество данных: Эффективно использует огромные объемы немеченых данных, доступных во многих реальных приложениях.

Полуподконтрольное обучение - это практичный и мощный подход к построению эффективных систем искусственного интеллекта (ИИ), особенно в задачах компьютерного зрения, таких как обнаружение объектов, где много немаркированных изображений или видео. Платформы вроде Ultralytics HUB облегчают управление наборами данных, которые могут включать в себя смесь меченых и немеченых данных для обучения таких моделей, как Ultralytics YOLO. Изучение методов SSL может оказаться крайне важным для проектов, столкнувшихся с ограничениями в доступности меченых данных, что подчеркивается в таких ресурсах, как записи в блогеGoogle AI Blog, посвященные SSL.

Читать полностью