Глоссарий

Регуляризация

Улучши свои модели машинного обучения с помощью методов регуляризации, таких как L1 и L2, чтобы предотвратить перебор и повысить производительность в приложениях ИИ.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Регуляризация - это жизненно важная концепция машинного обучения, направленная на повышение производительности модели за счет предотвращения оверфиттинга. Переподгонка происходит, когда модель слишком хорошо изучает обучающие данные, улавливая шум и специфические закономерности, которые не обобщаются на новые данные. Регуляризация вводит штрафные условия в процесс оптимизации модели, чтобы упростить модель, побуждая ее к изучению более обобщенных паттернов.

Виды регуляризации

Несколько типов регуляризации помогают достичь этих целей, самые распространенные из них - L1 и L2 регуляризация.

  • Регуляризация L1 (регрессия Лассо) добавляет штраф, равный абсолютному значению коэффициентов. Это может привести к тому, что некоторые коэффициенты станут равными нулю, что, по сути, позволит выбрать признаки. Подробнее о методах выделения признаков.
  • Регуляризация L2 (гребневая регрессия) добавляет штраф, равный квадрату коэффициентов. Это препятствует созданию сложных моделей и обычно приводит к меньшим коэффициентам. Более подробно изучи методы L2 в нашем руководстве по методам регуляризации.

Важность в машинном обучении

Регуляризация играет важнейшую роль в балансировке компромисса между смещением и дисперсией. Применяя регуляризацию, модели могут добиться более низкой дисперсии небольшой ценой увеличения смещения, что в целом приводит к лучшей производительности на непросматриваемых данных.

В таких областях, как глубокое обучение, методы регуляризации являются неотъемлемой частью разработки моделей. Они гарантируют, что, пока модель обучается сложным представлениям, она не будет слишком сильно полагаться на шум в наборе данных.

Приложения в AI/ML

  • Распознавание изображений: Регуляризация необходима при обучении моделей для распознавания образов, когда модель в противном случае может запоминать конкретные паттерны в обучающих данных, а не обобщать их на различные изображения.
  • Обработка естественного языка (NLP): в NLP регуляризация не позволяет моделям перестраиваться на обучающем тексте, гарантируя, что они смогут эффективно обрабатывать разнообразные языковые данные.

Примеры из реальной жизни

  1. Диагностика в здравоохранении: Регуляризация используется в медицинской визуализации для создания моделей, которые могут обобщать различные данные пациентов, повышая надежность диагностики. Узнай о ее роли в ИИ в здравоохранении.

  2. Автономные транспортные средства: В самоуправляемых автомобилях регуляризация гарантирует, что модели смогут обобщать сценарии обучения до реальных условий вождения с высокими стандартами безопасности. Узнай, как она применяется в индустрии автономного вождения.

Отличие от смежных понятий

В то время как регуляризация помогает упростить модель, такие техники, как обрезка модели, физически уменьшают размер модели, не изменяя процесс обучения. Регуляризация повышает эффективность обучения за счет штрафов за сложность, в то время как обрезка нацелена на эффективность выводов за счет устранения несущественных нейронов или признаков.

Кроме того, регуляризация отличается от настройки гиперпараметров, которая предполагает оптимизацию параметров, диктующих процесс обучения, включая собственное влияние регуляризации на обучение модели.

Дальнейшее исследование

Для более глубокого изучения регуляризации и связанных с ней техник машинного обучения тебе может быть полезно изучить следующие ресурсы:

Регуляризация остается краеугольным камнем разработки надежных, обобщающих моделей ИИ в широком спектре приложений, от ИИ в производстве до передовых достижений в компьютерном зрении.

Читать полностью