Активное обучение

Откройте для себя активное обучение - экономически эффективный метод машинного обучения, который позволяет повысить точность при меньшем количестве меток. Узнайте, как он преобразует обучение ИИ!

Активное обучение - это специализированная методология обучения в машинном обучении (ML), в которой алгоритм обучения может интерактивно запрашивать у пользователя или другого источника информации ("оракула") метки для новых точек данных. Основная идея заключается в том, что если модель может выбирать данные, на которых она обучается, то она может достичь более высокой точности при значительно меньшем количестве обучающих данных. Это особенно ценно в тех областях, где маркировка данных стоит дорого, занимает много времени или требует экспертных знаний. Вместо того чтобы сразу маркировать весь набор данных, активное обучение отбирает для маркировки наиболее "информативные" образцы, что делает процесс обучения модели гораздо более эффективным.

Как работает активное обучение

Процесс активного обучения цикличен и часто описывается как рабочий процесс "человек в цикле". Как правило, он состоит из следующих этапов:

Первоначальное обучение модели: Модель, например детектор Ultralytics YOLO11, сначала обучается на небольшом, изначально помеченном наборе данных.
Запрос немаркированных данных: Частично обученная модель используется для предсказаний на большом массиве неразмеченных данных. На основе этих предсказаний модель выбирает подмножество образцов, в отношении которых она наиболее "неуверенна".
Аннотация человека: Эти неопределенные образцы представляются эксперту-человеку (оракулу), который выдает правильные метки.
Расширение набора данных: Новые помеченные образцы добавляются в обучающий набор.
Переобучение: Модель заново обучается на обновленном, более крупном наборе данных. Этот цикл повторяется до тех пор, пока производительность модели не достигнет желаемого порога или пока не будет исчерпан бюджет на маркировку.

Ключ к этому процессу лежит в стратегии запроса. К распространенным стратегиям относятся выборка неопределенности (выборка случаев, в которых модель наименее уверена), запрос по комитету (использование нескольких моделей и выборка случаев, по которым они не согласны) или оценка ожидаемого изменения модели. Хороший обзор этих стратегий можно найти в этом обзоре Active Learning.

Применение в реальном мире

Активное обучение очень эффективно в специализированных областях, где экспертная аннотация является узким местом.

Анализ медицинских изображений: При обучении ИИ выявлению таких заболеваний, как рак, по медицинским снимкам могут быть доступны миллионы изображений, но время врача-рентгенолога ограничено. Вместо того чтобы заставлять их маркировать случайные изображения, система активного обучения может выделить для анализа наиболее неоднозначные или редкие случаи. Это позволяет направить усилия эксперта туда, где они наиболее необходимы, и ускорить разработку высокоточной модели для таких задач, как обнаружение опухолей мозга. Исследования в этой области показывают значительное сокращение усилий по маркировке, что подробно описано в исследованиях, подобных этому, посвященных сегментации биомедицинских изображений.
Автономное вождение: Системы восприятия в автономных автомобилях должны обучаться на обширных и разнообразных массивах данных, охватывающих бесчисленные сценарии вождения. Активное обучение позволяет выявить "крайние случаи" из собранных данных о вождении - например, пешехода, частично скрытого препятствием, или необычные погодные условия, - с которыми не справляется текущая модель обнаружения объектов. Выделяя эти сложные сцены для аннотирования, разработчики могут более эффективно повысить надежность и безопасность модели.

Активное обучение в сравнении со смежными концепциями

Важно отличать активное обучение от других парадигм обучения, в которых также используются немаркированные данные:

Полууправляемое обучение: В процессе обучения одновременно используются как помеченные, так и непомеченные данные. В отличие от активного обучения, оно обычно использует все доступные немаркированные данные пассивно, а не выборочно запрашивает конкретные экземпляры для получения меток.
Самоуправляемое обучение: Изучает представления на основе неразмеченных данных, создавая предтекстовые задачи (например, предсказание замаскированной части изображения). Оно не требует человеческой аннотации на этапе предварительного обучения, в то время как активное обучение полагается на оракула для получения меток. Компания DeepMind активно исследует эту область.
Обучение с применением подкрепления: Обучается методом проб и ошибок, взаимодействуя с окружающей средой, получая вознаграждение или наказание за свои действия. Оно не предполагает запроса явных меток, как активное обучение.
Федеративное обучение: Фокусируется на обучении моделей на децентрализованных устройствах, сохраняя данные локальными, что в первую очередь решает проблемы конфиденциальности данных. Активное обучение направлено на эффективное получение меток. Иногда эти методы можно комбинировать.

Инструменты и реализация

Реализация активного обучения часто включает в себя интеграцию ML-моделей с инструментами аннотирования и управление рабочим процессом данных. Такие фреймворки, как scikit-learn, предлагают некоторые функциональные возможности, а для решения конкретных задач существуют специализированные библиотеки. Программное обеспечение для аннотирования, такое как Label Studio, может быть интегрировано в конвейеры активного обучения, позволяя аннотаторам предоставлять метки для запрашиваемых образцов. Эффективное управление развивающимися наборами данных и обученными моделями имеет решающее значение, и такие платформы, как Ultralytics HUB, обеспечивают инфраструктуру для организации этих активов на протяжении всего жизненного цикла разработки. Изучите репозиторий Ultralytics на GitHub, чтобы получить дополнительную информацию о внедрении передовых методов ML.

Активное обучение

Гибкое решение для корпоративного лицензирования, обеспечивающее инновации

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Простое обучение моделям YOLO с помощью Ultralytics HUB

Как работает активное обучение

Применение в реальном мире

Активное обучение в сравнении со смежными концепциями

Инструменты и реализация

Подробнее в этой категории

FastVLM: Apple представила новую быструю языковую модель зрения

Машинное обучение по принципу "человек в контуре" (HITL) - объяснение

Автоматизация производства с помощью искусственного интеллекта

Присоединяйтесь к сообществу Ultralytics