Глоссарий

Обучение с помощью нескольких выстрелов

Узнайте, как обучение с помощью нескольких кадров позволяет ИИ адаптироваться к минимальным данным, преобразуя такие области, как медицинская диагностика и охрана дикой природы.

Few-Shot Learning (FSL) - это подобласть машинного обучения, которая фокусируется на построении моделей, способных обобщать новые концепции на основе всего нескольких примеров. Традиционные модели глубокого обучения, особенно в компьютерном зрении, часто требуют огромных объемов маркированных обучающих данных для достижения высокой производительности. FSL решает проблему нехватки данных, создавая модели, способные эффективно обучаться в ситуациях с малым количеством данных, имитируя человеческую способность узнавать новые объекты или категории на небольшом количестве примеров. Это делает ее бесценной для приложений, где сбор и маркировка данных стоят дорого, требуют много времени или просто невозможны.

Как работает обучение по нескольким снимкам

Основная идея FSL заключается в использовании предыдущих знаний из большого и разнообразного набора данных для быстрого обучения новым, связанным с ними задачам. Вместо того чтобы учиться классифицировать конкретные категории напрямую, модель изучает более общее представление данных или учится сравнивать точки данных. Общие подходы включают:

  • Обучение на основе метрики: Эти методы используют функцию расстояния или метрику сходства для сравнения нескольких меченых изображений "поддержки" с немечеными изображениями "запроса". Затем изображению запроса присваивается класс наиболее похожего вспомогательного изображения. Популярными примерами такого подхода являются сиамские сети, которые учатся определять, относятся ли два изображения к одному классу, и прототипические сети, которые учат прототипное представление для каждого класса в метрическом пространстве.
  • Обучение на основе оптимизации: Этот подход часто ассоциируется с метаобучением (или "обучением, чтобы учиться"), он сам тренирует процесс оптимизации модели. Цель - разработать модель, которая может быстро адаптировать свои параметры к новой задаче всего за несколько шагов градиентного спуска. Влиятельным алгоритмом в этой области является Model-Agnostic Meta-Learning (MAML).
  • Обучение на основе памяти: Эти модели используют внешний компонент памяти для хранения информации из нескольких доступных примеров. При появлении нового примера модель извлекает соответствующую информацию из своей памяти, чтобы сделать прогноз. Концептуально это похоже на то, как работают алгоритмы k-Nearest Neighbors (k-NN).

Обучение с помощью нескольких кадров в сравнении со смежными понятиями

Важно отличать FSL от других парадигм обучения, которые работают с ограниченными данными:

  • Обучение с нулевым выстрелом (ZSL): ZSL является более экстремальным методом, чем FSL, поскольку требует, чтобы модель распознавала классы, которые она никогда не видела во время обучения, используя только высокоуровневые семантические описания или атрибуты. Для FSL требуется хотя бы один пример, а для ZSL - ни одного.
  • Обучение одним выстрелом (One-Shot Learning, OSL): OSL - это особый вариант FSL, в котором модели предоставляется ровно один помеченный пример для каждого нового класса. Он представляет собой наиболее сложный сценарий в рамках концепции "нескольких выстрелов".
  • Трансферное обучение: FSL - это одна из форм трансферного обучения, но эти два понятия не идентичны. Традиционное трансферное обучение часто предполагает использование модели, предварительно обученной на большом наборе данных, например ImageNet, и ее тонкую настройку на меньшем новом наборе данных. FSL специально разработана для сценариев, когда новый набор данных очень мал (например, менее 10 примеров на класс). О том, как модели, подобные Ultralytics YOLO11, используют предварительно обученные веса для трансферного обучения, вы можете узнать из нашей документации по обучению моделей.

Применение в реальном мире

FSL особенно полезен в специализированных областях, где не хватает данных.

  1. Диагностика редких заболеваний с помощью медицинской визуализации: При редких заболеваниях сбор тысяч снимков пациентов для обучения модели часто не представляется возможным. С помощью FSL модель, предварительно обученная на большом наборе данных обычных медицинских изображений, может быть адаптирована для выявления признаков редкого заболевания с использованием всего нескольких подтвержденных случаев. Это ускоряет разработку диагностических инструментов для анализа медицинских изображений.
  2. Обнаружение дефектов в промышленности: На производстве новая линейка продукции может иметь уникальные и редко встречающиеся дефекты. Вместо того чтобы останавливать производство для сбора тысяч примеров дефектов, модель FSL для обнаружения объектов можно быстро обучить на нескольких образцах, чтобы автоматизировать контроль качества, повысить эффективность и сократить количество отходов. Платформы, подобные Ultralytics HUB, помогают управлять такими специализированными наборами данных и ускоряют развертывание моделей.

Проблемы и будущие направления

Несмотря на свои перспективы, FSL сталкивается с серьезными проблемами. Основное препятствие - предотвращение чрезмерной подгонки, поскольку модель может легко запомнить несколько примеров вместо того, чтобы учиться обобщать. Производительность модели также может быть очень чувствительна к качеству и репрезентативности предоставленных вспомогательных примеров.

Текущие исследования, проводимые такими организациями, как Стэнфордский университет, Google AI и Meta AI, направлены на создание более надежных алгоритмов метаобучения и более эффективное использование методов неконтролируемого или самоконтролируемого обучения для предварительного обучения. Сочетание этих подходов позволяет создавать более гибкие и экономичные системы ИИ, расширяя границы возможного в условиях ограниченных данных. Продвинутые фреймворки, такие как PyTorch и TensorFlow, предоставляют исследователям необходимые инструменты для изучения этих передовых методов.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена