Глоссарий

Контролируемое обучение

Узнай, как супервизорное обучение помогает ИИ работать с мечеными данными, обеспечивая точные предсказания и такие приложения, как обнаружение объектов и анализ настроения.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Супервизорное обучение - это фундаментальная категория машинного обучения (ML), в которой алгоритмы обучаются на наборе данных, содержащем пары входных и выходных данных, известных как помеченные данные. По сути, алгоритм является "контролируемым", потому что он обучается, сравнивая свои предсказания на входных данных с известными правильными выходами (метками), представленными в обучающих данных. Цель состоит в том, чтобы алгоритм выучил функцию отображения, которая сможет точно предсказывать выход для новых, невидимых входов. Этот подход занимает центральное место во многих современных приложениях искусственного интеллекта (ИИ), позволяя системам делать предсказания или принимать решения на основе исторических примеров, найденных в эталонных или собственных наборах данных.

Как работает контролируемое обучение

Процесс начинается с тщательно подготовленного набора данных, где каждая точка данных состоит из входных признаков и соответствующей правильной выходной метки. Это часто требует значительных усилий по сбору и аннотированию данных. Например, в задаче классификации изображений входными данными будут изображения (возможно, предварительно обработанные с помощью методов из библиотек вроде OpenCV), а метками - категории, к которым они относятся (например, "кошка", "собака"). Алгоритм итеративно делает предсказания на обучающих данных и настраивает свои внутренние параметры (или веса модели) с помощью алгоритма оптимизации вроде стохастического градиентного спуска (SGD) или Адама, чтобы минимизировать разницу между своими предсказаниями и реальными метками. Эта разница измеряется функцией потерь. Это обучение продолжается, часто в течение нескольких эпох, пока модель не достигнет удовлетворительного уровня точности или других соответствующих показателей эффективности на отдельных валидных данных, гарантируя, что она хорошо обобщается на новые данные и избегает переподгонки.

Актуальность и применение

Супервизорное обучение невероятно универсально и позволяет решать огромное количество задач, в которых исторические данные могут предсказывать будущие события или классифицировать новую информацию. Его способность обучаться непосредственно на помеченных примерах делает его подходящим для задач, требующих высокой точности. Многие задачи компьютерного зрения (КВ) в значительной степени зависят от контролируемого обучения, включая те, которые выполняются такими современными моделями, как Ultralytics YOLO.

Вот два конкретных примера:

  • Анализ медицинских изображений: Модели контролируемого обучения могут быть обучены на медицинских снимках (например, МРТ или КТ), помеченных радиологами, для обнаружения опухолей на медицинских изображениях. Это помогает медицинским работникам в диагностике и является основной частью многих ИИ-решений в здравоохранении. Смотри соответствующие исследования из таких источников, как Radiology: Искусственный интеллект.
  • Анализ настроения: Алгоритмы обучаются на основе текстовых данных, помеченных категориями настроения (например, позитивные, негативные, нейтральные), чтобы автоматически определять настроения, выраженные в новом тексте, например в отзывах покупателей или постах в социальных сетях. Это ценно для маркетинговых исследований и мониторинга брендов. Узнай больше об анализе настроения.

Среди других распространенных применений - обнаружение объектов на изображениях и видео (используется в автономных автомобилях и системах безопасности), фильтрация спама в электронной почте, прогнозирование цен на жилье (задача регрессии ) и распознавание лиц. Также он применяется в ИИ для более умного управления запасами в розничной торговле и ИИ в решениях для сельского хозяйства.

Ключевые понятия

Несколько концепций являются центральными для понимания и эффективного применения контролируемого обучения:

Сравнение с другими парадигмами обучения

Супервизорное обучение отличается от других основных парадигм машинного обучения:

  • Неподконтрольное обучение: Этот подход использует немеченые данные, где алгоритм пытается самостоятельно найти закономерности или структуры, например сгруппировать похожие точки данных(кластеризация) или уменьшить размерность данных. Он не учится прямому сопоставлению входа и выхода на основе известных ответов. Прочти обзор неконтролируемого обучения.
  • Обучение с подкреплением: В этой парадигме агент учится принимать последовательность решений, взаимодействуя с окружающей средой и получая вознаграждения или наказания за свои действия. Он учится оптимальному поведению методом проб и ошибок, а не на основе заученных примеров. Изучи обзор Reinforcement Learning.

В общем, контролируемое обучение - это мощная и широко используемая техника, которая использует меченые данные для обучения моделей для решения прогностических задач. Оно лежит в основе многих успешных приложений ИИ, включая те, которые разрабатывает и поддерживает Ultralytics, и является важнейшим навыком для всех, кто работает в области науки о данных или ИИ.

Читать полностью