Глоссарий

Контролируемое обучение

Узнай, как супервизорное обучение помогает ИИ работать с мечеными данными, обеспечивая точные предсказания и такие приложения, как обнаружение объектов и анализ настроения.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Супервизорное обучение - это фундаментальная категория машинного обучения (ML), в которой алгоритмы обучаются на наборе данных, содержащем пары входных и выходных данных, известных как помеченные данные. По сути, алгоритм является "контролируемым", потому что он обучается, сравнивая свои предсказания на входных данных с известными правильными выходами (метками), представленными в обучающих данных. Цель состоит в том, чтобы алгоритм выучил функцию отображения, которая может точно предсказывать выход для новых, невидимых входов. Этот подход занимает центральное место во многих современных приложениях искусственного интеллекта (ИИ), позволяя системам делать предсказания или принимать решения на основе исторических примеров.

Как работает контролируемое обучение

Процесс начинается с набора данных, где каждая точка данных состоит из входных признаков и соответствующей правильной выходной метки. Например, в задаче классификации изображений входными данными будут изображения, а метками - категории, к которым они относятся (например, "кошка", "собака"). Алгоритм итеративно делает предсказания на обучающих данных и настраивает свои внутренние параметры с помощью алгоритма оптимизации типа градиентного спуска, чтобы минимизировать разницу между своими предсказаниями и реальными метками, измеряемую функцией потерь. Это обучение продолжается до тех пор, пока модель не достигнет удовлетворительного уровня точности на проверочных данных.

Актуальность и применение

Супервизорное обучение невероятно универсально и позволяет решать огромное количество задач, в которых исторические данные могут предсказывать будущие события или классифицировать новую информацию. Способность обучаться непосредственно на помеченных примерах делает его подходящим для задач, требующих высокой точности. Многие задачи компьютерного зрения в значительной степени зависят от контролируемого обучения, включая те, которые выполняются такими моделями, как Ultralytics YOLO.

Вот два конкретных примера:

  1. Анализ медицинских изображений: Модели с контролируемым обучением могут быть обучены на наборах данных медицинских снимков (например, рентгеновских или магнитно-резонансных), помеченных радиологами. Например, модель может научиться обнаруживать опухоли на медицинских снимках, будучи обученной на изображениях, помеченных как "опухоль" или "отсутствие опухоли". Это помогает врачам в диагностике и планировании лечения, внося значительный вклад в развитие ИИ-решений в здравоохранении.
  2. Анализ настроений: Предприятия часто хотят понять мнение клиентов по текстовым данным, таким как отзывы или посты в социальных сетях. Можно обучить супервизорную модель на примерах текста, помеченных настроениями ("позитивный", "негативный", "нейтральный"). После обучения она может автоматически классифицировать новый текст, предоставляя ценные сведения для маркетинговых исследований и обслуживания клиентов. Узнай больше об анализе настроений.

Среди других распространенных приложений - обнаружение объектов на изображениях и видео (используется в автономных транспортных средствах и системах безопасности), фильтрация спама в электронной почте, прогнозирование цен на жилье(регрессионная задача) и распознавание лиц.

Ключевые понятия

Несколько концепций являются центральными для понимания контролируемого обучения:

  • Маркированные данные: Основа контролируемого обучения, состоящая из входных данных, сопряженных с правильными выходными метками. Качественный сбор и аннотирование данных имеют решающее значение.
  • Характеристики: Измеряемые входные переменные или характеристики, используемые моделью для составления прогнозов. Разработка характеристик может существенно повлиять на производительность.
  • Метки (или цели): Правильные выходные значения, связанные с входными признаками в обучающих данных.
  • Классификация: Тип задачи контролируемого обучения, где целью является предсказание метки дискретной категории (например, классификация писем как "спам" или "не спам", или изображений на разные классы с помощью моделей типа YOLO для классификации).
  • Регрессия: Тип задачи контролируемого обучения, где целью является предсказание непрерывного числового значения (например, предсказание температуры, цен на акции или стоимости домов с помощью алгоритмов типа линейной регрессии).
  • Общие алгоритмы: Включает такие методы, как логистическая регрессия, машины опорных векторов (SVM), деревья решений, случайные леса и различные типы нейронных сетей (NN), в частности конволюционные нейронные сети (CNN) для задач, связанных с изображениями, которые часто реализуются с помощью таких фреймворков, как PyTorch.

Сравнение с другими парадигмами обучения

Супервизорное обучение отличается от других основных парадигм машинного обучения:

  • Неподконтрольное обучение: Алгоритмы изучают закономерности на основе неразмеченных данных без явного руководства. Среди распространенных задач - кластеризация (группировка похожих точек данных) и снижение размерности (упрощение данных). Его используют, когда меченые данные недоступны или цель состоит в том, чтобы обнаружить скрытые структуры.
  • Обучение с подкреплением: Алгоритмы обучаются, взаимодействуя с окружающей средой и получая обратную связь в виде вознаграждений или наказаний. Цель - выучить политику (стратегию выбора действий), которая максимизирует кумулятивное вознаграждение с течением времени. Этот метод часто используется в робототехнике, играх и навигационных системах.

В общем, супервизорное обучение - это мощная техника, которая использует меченые данные для обучения моделей для решения прогностических задач, составляя основу многих успешных приложений ИИ, включая те, которые разрабатываются и поддерживаются Ultralytics и платформами вроде Ultralytics HUB.

Читать полностью