Глоссарий

Аугментация данных

Узнайте, как увеличение объема данных повышает надежность модели и снижает переобучение. Изучите ключевые методы повышения производительности Ultralytics для компьютерного зрения.

Увеличение объема данных — важная техника в машинном обучении и компьютерном зрении, используемая для искусственного увеличения размера и разнообразия обучающего набора данных путем создания модифицированных версий существующих данных. Вместо сбора и маркировки совершенно новых данных, что может быть трудоемким и дорогостоящим, при расширении к исходным образцам применяются различные преобразования. Эти модификации помогают моделям машинного обучения научиться более надежно распознавать паттерны, обеспечивая их эффективную работу даже при столкновении с вариациями в реальных условиях. Подвергая модели более широкому спектру сценариев во время обучения, разработчики могут эффективно снизить переобучение и улучшить обобщение.

Актуальность в современном ИИ

В области компьютерного зрения модели часто испытывают трудности при работе с изображениями, которые немного отличаются от их обучающих данных. Различия в освещении, ориентации или фоновом беспорядке могут сбить с толку модель, которая не видела достаточно разнообразных изображений. Увеличение объема данных решает эту проблему путем программного моделирования этих различий. Например, изображение кошки может быть повернуто, отвернуто или слегка размыто, чтобы научить модель тому, что объект остается «кошкой» независимо от этих изменений.

Этот процесс является неотъемлемой частью успеха современных архитектур, таких как Ultralytics , которая опирается на богатые и разнообразные наборы данных для достижения высокой точности в таких задачах, как обнаружение объектов и сегментация изображений. Путем синтеза новых обучающих примеров, аугментация позволяет моделям обучаться инвариантным особенностям — характеристикам, которые не изменяются, несмотря на изменения во входных данных.

Общие техники и методы

Увеличение объема данных включает в себя широкий спектр методов преобразования, от простых геометрических корректировок до сложных генеративных подходов:

Геометрические преобразования: к ним относятся такие операции, как поворот, масштабирование, отражение, кадрирование и перемещение (сдвиг) изображений. Они представляют собой изменения точки зрения камеры или положения объекта.
Настройка цветового пространства: изменение яркости, контрастности, насыщенности и оттенка помогает моделям справляться с различными условиями освещения или датчиками камеры.
Введение шума: добавление случайного шума (например, гауссового шума) может сделать модели более устойчивыми к зернистым или низкокачественным входным данным.
Смешивание изображений: такие техники, как MixUp Mosaic (популярные в YOLO ), объединяют несколько изображений в один обучающий образец, заставляя модель более эффективно изучать контекст и отношения между объектами.
Генеративные подходы: передовые методы используют генеративный ИИ или диффузионные модели для создания совершенно новых синтетических обучающих образцов, которые имитируют характеристики исходного набора данных.

Применение в реальном мире

Практическое влияние увеличения объема данных распространяется на множество отраслей, где проблемой является дефицит данных или их высокая изменчивость .

Автономное вождение

При разработке автономных транспортных средств сбор данных для всех возможных погодных условий или сценариев освещения практически невозможен. Инженеры используют дополнение данных для моделирования дождя, тумана, снега или бликов на изображениях с ясной погодой. Это гарантирует, что система восприятия сможет надежно detect , дорожные знаки и другие транспортные средства независимо от факторов окружающей среды, повышая безопасность и надежность.

Медицинская визуализация

Анализ медицинских изображений часто страдает от ограниченности наборов данных из-за проблем конфиденциальности и редкости определенных заболеваний. Аугментация позволяет исследователям расширять небольшие наборы данных рентгеновских снимков или МРТ-сканов путем применения упругих деформаций, поворотов или сдвигов интенсивности. Это помогает обучать надежные диагностические модели, способные идентифицировать опухоли или переломы с высокой чувствительностью, даже когда положение пациента или качество сканирования варьируются.

Различение смежных понятий

Важно отличать увеличение объема данных от синтетических данных. Хотя и то, и другое направлено на увеличение объема набора данных, синтетические данные искусственно генерируются с нуля (часто с использованием 3D-рендеринга или симуляторов), тогда как увеличение объема данных модифицирует существующие реальные данные. Кроме того, предварительная обработка данных включает в себя очистку и форматирование данных (например, изменение размера, нормализацию), чтобы сделать их пригодными для модели, но в отличие от увеличения, она не обязательно увеличивает количество обучающих выборок.

Реализация расширения с помощью Ultralytics

Современные фреймворки интегрируют аугментацию непосредственно в конвейер обучения. Пример ниже демонстрирует, как применять аугментации, такие как переворот и масштабирование, во время обучения модели YOLO26 с использованием ultralytics пакет.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)

Регулируя эти гиперпараметры, разработчики могут адаптировать стратегию аугментации к конкретным потребностям своего набора данных и приложения, используя гибкость Ultralytics для эффективной разработки моделей.

Аугментация данных

Обучение моделям Ultralytics YOLO для оптимизации рабочих процессов в разных отраслях

Гибкое корпоративное лицензирование для развития ваших инноваций

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Актуальность в современном ИИ

Общие техники и методы

Применение в реальном мире

Автономное вождение

Медицинская визуализация

Различение смежных понятий

Реализация расширения с помощью Ultralytics

Читать больше в этой категории

12 примеров использования аэрофотоснимков с помощью компьютерного зрения

Что такое монокулярная оценка глубины? Обзор

Обзор использованияYOLO Ultralytics YOLO для обнаружения угроз с помощью искусственного интеллекта

Присоединяйтесь к сообществу Ultralytics