Глоссарий

Обучение с помощью нескольких выстрелов

Узнай, как обучение с помощью нескольких кадров позволяет ИИ адаптироваться при минимальном количестве данных, преображая такие области, как медицинская диагностика и охрана дикой природы.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Few-Shot Learning (FSL) - это подполе машинного обучения (ML), ориентированное на разработку моделей, которые могут обобщать на основе очень небольшого количества обучающих примеров для каждого класса, часто всего лишь горстки. Это резко контрастирует с традиционными подходами Deep Learning (DL), которые обычно требуют огромных объемов помеченных обучающих данных. Основная идея вдохновлена человеческим обучением, когда мы часто можем распознать новые понятия, увидев всего один или два примера. FSL особенно важна в тех областях, где сбор данных стоит дорого, отнимает много времени или по своей сути ограничен, что делает искусственный интеллект (ИИ) более адаптируемым и эффективным с точки зрения использования данных.

Как работает обучение с помощью нескольких выстрелов

Методы Few-Shot Learning направлены на использование предыдущих знаний для быстрого изучения новых концепций на основе ограниченного количества данных. К распространенным стратегиям относятся:

  • Метаобучение: Часто его называют "учиться учиться", метаобучение подразумевает обучение модели на различных учебных задачах на этапе метаобучения. Это позволяет модели выучить эффективный алгоритм обучения или начальные параметры, которые могут быстро адаптироваться к новой задаче на небольшом количестве примеров. Для этой цели было разработано несколько алгоритмов метаобучения.
  • Трансферное обучение: В FSL часто используют трансферное обучение, начиная с модели, предварительно обученной на большом наборе данных (например, ImageNet или COCO). Эта предварительно обученная модель, которая уже понимает общие черты из большого набора данных, затем настраивается на небольшом количестве доступных примеров для конкретной целевой задачи. Такой подход позволяет использовать общие знания, заложенные в весах модели.
  • Увеличение данных: Генерирование вариаций немногих доступных обучающих образцов с помощью методов дополнения данных может помочь расширить ограниченный набор данных, хотя его эффективность может меняться в режимах с крайне низким количеством данных. Могут потребоваться продвинутые стратегии дополнения.

Эти методы позволяют нейронным сетям (НС) достигать приемлемой производительности даже при минимальных данных о конкретной задаче.

Обучение с помощью нескольких выстрелов в сравнении с родственными концепциями

Важно отличать FSL от похожих парадигм обучения:

  • Zero-Shot Learning (ZSL): Цель ZSL - классифицировать экземпляры из классов, которые никогда не встречались во время обучения. Обычно это достигается за счет использования вспомогательной информации, такой как текстовые описания или атрибуты невидимых классов, чтобы преодолеть разрыв между видимыми и невидимыми данными. FSL, напротив, требует хотя бы несколько помеченных примеров для каждого нового класса. Обзор ZSL, FSL и Transfer Learning может дать дальнейший контекст.
  • One-Shot Learning (OSL): OSL - это экстремальный вариант FSL, в котором модель должна научиться распознавать новый класс только на одном помеченном примере. Он преследует те же цели, что и FSL, но работает в условиях еще более жестких ограничений на данные.
  • Трансферное обучение: Хотя в FSL часто используется трансферное обучение как техника, эти термины не взаимозаменяемы. Трансферное обучение - это более широкая концепция, подразумевающая использование знаний из исходной задачи для повышения эффективности выполнения целевой задачи. FSL специально решает проблему эффективного обучения, когда целевая задача имеет крайне ограниченное количество помеченных данных.

Применение обучения по нескольким снимкам

FSL позволяет применять ИИ в сценариях, где получение больших массивов данных нецелесообразно или невозможно:

  • Диагностика редких заболеваний: в анализе медицинских изображений получение большого количества примеров редких заболеваний для обучения диагностических моделей является сложной задачей. FSL позволяет моделям научиться определять такие состояния (например, конкретные типы опухолей на снимках) по небольшому набору изображений пациента, что потенциально ускоряет диагностику и исследования. Это ключевая область для ИИ в здравоохранении, исследования публикуются в таких журналах, как Radiology: Artificial Intelligence.
  • Обнаружение объектов на заказ: Представь, что тебе нужна модель обнаружения объектов для идентификации нового продукта на производственной линии или редкого вида на кадрах, снятых для сохранения дикой природы. Приобретение тысяч помеченных изображений может оказаться невыполнимой задачей. FSL позволяет обучать пользовательские модели, например адаптировать Ultralytics YOLO с помощью таких платформ, как Ultralytics HUB, используя всего несколько примеров для каждого нового класса объектов. Это ускоряет развертывание специализированных задач компьютерного зрения (CV).
  • Перевод языков с ограниченными ресурсами: Обучение моделей перевода для языков с ограниченным количеством цифровых текстов требует использования методов FSL в рамках обработки естественного языка (NLP).
  • Робототехника: Обеспечение роботам(Robotics) возможности быстро научиться распознавать и взаимодействовать с новыми объектами в незнакомой среде на основе минимального воздействия - еще одна область применения, изучаемая в исследованиях, представленных на конференциях вроде ICRA.

Проблемы и будущие направления

Несмотря на свои перспективы, FSL сталкивается с проблемами, включая чувствительность модели к конкретным немногочисленным примерам и обеспечение надежного обобщения за пределами этих примеров. Преодоление чрезмерной подгонки при таких ограниченных данных является значительным препятствием. Текущие исследования сосредоточены на разработке более надежных алгоритмов метаобучения, более эффективном использовании неконтролируемого обучения или самоконтролируемого обучения для предварительного обучения, а также на создании теоретических основ для понимания обобщения в режимах с малым количеством данных. Такие организации, как Google AI и Meta AI, активно способствуют развитию методов FSL, стремясь сделать системы ИИ более гибкими и менее требовательными к данным.

Читать полностью