Глоссарий

Полууправляемое обучение

Узнай, как полуподчиненное обучение объединяет меченые и немеченые данные, чтобы улучшить модели ИИ, снизить затраты на маркировку и повысить точность.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Полуконтролируемое обучение - это направление машинного обучения, которое преодолевает разрыв между контролируемым и неконтролируемым обучением. Оно использует как помеченные, так и непомеченные данные для обучения моделей. Во многих реальных сценариях получение меченых данных может быть дорогим и трудоемким, требующим ручного аннотирования экспертами. С другой стороны, немаркированные данные часто легко доступны в больших количествах. Методы полуподконтрольного обучения используют это обилие немеченых данных для улучшения работы моделей, особенно когда меченых данных мало.

Как работает полуконтрольное обучение

В отличие от контролируемого обучения, которое полностью опирается на меченые данные, и неконтролируемого обучения, которое использует только немеченые данные, полуконтролируемое обучение сочетает в себе и то, и другое. Основная идея заключается в том, что немеченые данные содержат ценную информацию о глубинной структуре распределения данных. Благодаря учету этой информации модели полуподчиненного обучения часто могут достигать большей точности и обобщения, чем модели, обученные исключительно на ограниченных помеченных данных.

Под зонтик полуподконтрольного обучения попадает несколько техник, в том числе:

  • Псевдомаркировка: Этот метод предполагает обучение модели на помеченных данных, а затем использование ее для предсказания меток для немеченых данных. Эти предсказанные метки, или "псевдометки", затем рассматриваются как истинные метки и используются для повторного обучения модели, часто итеративно.
  • Регуляризация согласованности: Этот подход побуждает модель выдавать одинаковые предсказания для немаркированных точек данных, даже если они слегка возмущены или дополнены. Для создания таких возмущений часто используются такие техники, как увеличение данных.
  • Методы, основанные на графе: Эти методы представляют точки данных как узлы в графе, где ребра соединяют похожие точки. Затем метки распространяются от помеченных узлов к немеченым, основываясь на структуре графа.
  • Самообучение: Подобно псевдомаркировке, самообучение итеративно расширяет набор помеченных данных, добавляя высокодостоверные предсказания на немеченых данных.

Области применения полуконтрольного обучения

Полунаблюдательное обучение ценно в различных областях, особенно когда меченые данные ограничены:

  • Анализ медицинских изображений: В анализе медицинских изображений получение меченых изображений для таких задач, как обнаружение опухолей или классификация заболеваний, часто требует привлечения экспертов-радиологов, что делает эту работу дорогой и трудоемкой. Полуподконтрольное обучение может помочь обучить точные модели, используя меньший набор меченых изображений и больший пул немаркированных сканов. Например, при обнаружении опухолей головного мозга с помощью Ultralytics YOLO для обнаружения объектов полусупервизорные методы могут повысить производительность модели при ограниченном количестве помеченных данных МРТ.
  • Обработка естественного языка (NLP): Такие задачи, как анализ настроения или распознавание именованных сущностей (NER), часто выигрывают от полусупервизорного обучения. Большие объемы текстовых данных легко доступны, но маркировка текста для конкретных задач NLP может быть трудоемкой. Полуподконтрольные методы могут использовать немаркированный текст для улучшения понимания моделью языковых нюансов и контекста.
  • Распознавание речи: Подобно NLP, системы распознавания речи могут использовать огромные объемы немаркированных аудиоданных. Полуподконтрольное обучение помогает строить надежные модели, которые хорошо обобщают даже при ограниченном количестве меченых речевых данных.
  • Классификация изображений и обнаружение объектов: В задачах компьютерного зрения, таких как классификация изображений и обнаружение объектов, полуподконтрольное обучение может быть использовано для улучшения производительности таких моделей, как Ultralytics YOLOv8 при обучении на наборах данных, где только часть изображений аннотирована ограничивающими рамками или метками. Ultralytics HUB можно использовать для управления наборами данных и обучения моделей, а полуподконтрольное обучение можно интегрировать для оптимизации обучения при ограниченном количестве помеченных данных.

Преимущества полуподконтрольного обучения

  • Повышение точности: благодаря использованию немеченых данных полуподконтрольное обучение часто приводит к созданию моделей с более высокой точностью по сравнению с контролируемым обучением с ограниченным количеством меченых данных.
  • Снижение затрат на маркировку: Это значительно снижает необходимость в обширной ручной маркировке данных, что экономит время и ресурсы.
  • Лучшее обобщение: Обучение как на меченых, так и на немеченых данных может помочь моделям научиться более надежным и обобщенным представлениям, что приведет к лучшей производительности на невидимых данных.

Полуподконтрольное обучение предлагает мощный подход к машинному обучению, особенно в тех сценариях, где меченые данные являются узким местом. Эффективно используя богатство доступных немаркированных данных, оно позволяет разрабатывать более точные и эффективные системы искусственного интеллекта для широкого спектра приложений.

Читать полностью