Глоссарий

Нормализация

Открой для себя силу нормализации в машинном обучении! Узнай, как она улучшает обучение моделей, повышает производительность и обеспечивает надежность ИИ-решений.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Нормализация - это важнейший метод предварительной обработки в машинном обучении и науке о данных, который используется для изменения масштаба данных к стандартному диапазону, обычно между 0 и 1 или -1 и 1. Этот процесс направлен на то, чтобы все признаки вносили одинаковый вклад в обучение модели, не позволяя признакам с большими значениями доминировать над признаками с меньшими значениями. Приводя различные признаки к одинаковому масштабу, нормализация помогает алгоритмам, особенно чувствительным к масштабированию признаков, таким как методы, основанные на градиентном спуске, используемые в глубоком обучении, сходиться быстрее и эффективнее.

Почему нормализация имеет значение

В наборах данных характеристики часто имеют разные диапазоны. Например, в наборе данных, предсказывающих цены на жилье, размер дома может варьироваться от 500 до 5000 квадратных футов, а количество спален - от 1 до 5. Без нормализации модели машинного обучения могут придавать излишнюю важность признакам с большим диапазоном. Нормализация решает эту проблему, обеспечивая одинаковый подход ко всем признакам во время обучения. Это приводит к созданию более стабильных и надежных моделей, повышению производительности и сокращению времени обучения, особенно для таких алгоритмов, как нейронные сети, используемые в моделях Ultralytics YOLO .

Виды нормализации

Обычно используется несколько методов нормализации:

  • Масштабирование по принципу Min-Max: Это одна из самых распространенных техник. Он масштабирует и переводит каждый признак по отдельности так, чтобы он находился в диапазоне [0, 1]. Подробнее о масштабировании Min-Max ты можешь узнать на сайте Scikit-learn - это популярная библиотека машинного обучения на сайте Python.
  • Стандартизация Z-score: Хотя технически это стандартизация, ее часто используют как взаимозаменяемую с нормализацией. Стандартизация Z-score преобразует данные так, чтобы их среднее значение было равно 0, а стандартное отклонение - 1. Этот метод менее чувствителен к провалам по сравнению с масштабированием Min-Max.
  • Масштабирование по максимальной абсолютной величине: Этот метод масштабирует каждый признак по его максимальному абсолютному значению. Он особенно полезен для разреженных данных и гарантирует, что значения останутся в диапазоне [-1, 1].

Выбор подходящей техники нормализации зависит от набора данных и используемой модели машинного обучения. Для многих приложений глубокого обучения, включая обучение моделей Ultralytics YOLO для обнаружения объектов, нормализация является стандартным шагом предварительной обработки.

Применение нормализации

Нормализация широко применяется в различных областях AI и ML. Вот несколько примеров:

  • Обработка изображений: В компьютерном зрении изображения часто представляются в виде значений пикселей в диапазоне от 0 до 255. Нормализация этих значений пикселей до диапазона от 0 до 1 - обычная практика перед подачей их в конволюционную нейронную сеть (CNN). Это может повысить способность модели к изучению особенностей изображений, улучшая такие задачи, как обнаружение объектов с помощью Ultralytics YOLOv8 или классификация изображений. Рассмотрим, как предварительная обработка аннотированных данных играет решающую роль в проектах по компьютерному зрению для оптимальной работы модели.
  • Анализ медицинских изображений: В анализе медицинских изображений нормализация крайне важна для стандартизации диапазонов интенсивности изображений, полученных с разных сканеров или от разных пациентов. Такая стандартизация крайне важна для того, чтобы модели ИИ могли точно обнаруживать аномалии или заболевания независимо от источника медицинского изображения. Например, при обнаружении опухолей мозга с помощью Ultralytics YOLO11 в медицинской визуализации последовательная нормализация обеспечивает прочность и надежность модели в различных наборах данных.

В общем, нормализация - это фундаментальный шаг в подготовке данных для машинного обучения. Она обеспечивает справедливый вклад всех характеристик, ускоряет обучение, повышает стабильность и производительность моделей ИИ в различных приложениях, включая те, что работают на Ultralytics YOLO .

Читать полностью