Глоссарий

Кросс-валидация

Открой для себя силу кросс-валидации в машинном обучении, чтобы повысить точность модели, предотвратить перебор и обеспечить надежную работу.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Кросс-валидация - это статистический метод, используемый для оценки производительности и способности к обобщению моделей машинного обучения (ML). Вместо того чтобы просто разделить данные на обучающий и тестовый наборы, кросс-валидация систематически разбивает данные на несколько подмножеств, или "складок". Модель обучается на некоторых складках и тестируется на оставшихся, и этот процесс повторяется несколько раз, причем каждый раз для тестирования берется другая складка. Такой подход позволяет получить более надежную оценку того, как модель будет работать на невидимых данных, по сравнению с единственным разделением на обучение и тестирование, что помогает предотвратить такие проблемы, как чрезмерная подгонка.

Как работает кросс-валидация

Самый распространенный тип кросс-валидации - K-Fold Cross-Validation. Вот упрощенная схема этого процесса:

  1. Перемешай набор данных: Случайно перетасуй набор данных, чтобы обеспечить распределение точек данных без присущего им смещения порядка.
  2. Раздели на складки: Раздели набор данных на "K" равных (или почти равных) по размеру складок. Обычно для K выбирают 5 или 10.
  3. Итеративное обучение и проверка:
    • Выбери одну складку в качестве данных для проверки.
    • Обучи модель на оставшихся K-1 складках(тренировочные данные).
    • Оцени производительность модели (например, точность) на удержанной валидационной складке.
    • Повтори этот процесс K раз, используя каждую складку ровно один раз в качестве проверочного набора.
  4. Средняя производительность: Рассчитай среднее значение оценок эффективности, полученных на каждой итерации. Этот средний балл дает более надежную оценку эффективности обобщения модели.

Популярные библиотеки вроде Scikit-learn предоставляют эффективные реализации различных техник кросс-валидации.

Зачем использовать кросс-валидацию?

Кросс-валидация - это фундаментальная техника оценки моделей по нескольким причинам:

  • Надежная оценка производительности: Усреднение результатов по нескольким сплитам позволяет получить менее смещенную оценку производительности модели на новых данных по сравнению с одним сплитом тренировки/опробования.
  • Эффективное использование данных: Он позволяет использовать почти все данные как для обучения, так и для проверки в разных итерациях, что особенно полезно для небольших наборов данных.
  • Выбор и настройка моделей: Он крайне важен для сравнения различных моделей или настройки гиперпараметров, помогая выбрать конфигурацию, которая обобщает лучше всего.
  • Обнаружение избыточной/недостаточной подгонки: Он помогает определить, является ли модель слишком сложной (overfitting) или слишком простой(underfitting), наблюдая за вариациями производительности в разных складках.

Кросс-валидация против простого разделения тренировки и валидации

В то время как простое разделение на обучение и проверку предполагает выделение одной части данных исключительно для проверки, кросс-валидация использует данные более эффективно. При простом разделении метрика производительности сильно зависит от того, какие именно точки данных попадут в набор для проверки. Кросс-валидация снижает эту зависимость, гарантируя, что каждая точка данных будет использована для валидации ровно один раз, что приводит к более стабильной и достоверной оценке. Ultralytics предлагает руководство по реализации перекрестной валидации K-Fold с помощью Ultralytics YOLO.

Применение в реальном мире

Кросс-валидация широко используется в различных областях ИИ и ML:

  1. Анализ медицинских изображений: При разработке модели ИИ для обнаружения опухолей на снимках с помощью таких техник, как сегментация изображений, перекрестная валидация помогает обеспечить надежную работу модели на снимках разных пациентов и оборудования, что дает уверенность перед клиническим внедрением. Это включает в себя обучение и тестирование на различных подмножествах данных медицинских изображений пациентов.
  2. Обнаружение объектов в автономных системах: Для Ultralytics YOLO Для модели, обученной для обнаружения объектов (например, идентификации пешеходов для автономных транспортных средств), K-Fold Cross-Validation может оценить, насколько хорошо модель обобщает различные условия окружающей среды (освещение, погода), присутствующие в наборе данных, перед развертыванием модели. Платформы вроде Ultralytics HUB могут облегчить управление такими процессами обучения.

Обеспечивая надежную оценку обобщения модели, кросс-валидация является незаменимым инструментом для создания надежных и эффективных систем ИИ.

Читать полностью