Глоссарий

Обучение с помощью нескольких выстрелов

Узнай, как обучение с помощью нескольких кадров позволяет ИИ адаптироваться, используя минимум данных. Изучи техники, приложения и будущие достижения в этой преобразующей области.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Few-shot learning - это подобласть машинного обучения, которая позволяет моделям обобщать и адаптироваться к новым задачам при очень ограниченном количестве обучающих данных. В отличие от традиционных подходов к машинному обучению, которые требуют больших наборов данных для достижения высокой производительности, обучение на нескольких примерах нацелено на обучение всего на нескольких примерах, часто всего на одном или двух на класс. Эта возможность крайне важна для сценариев, в которых сбор данных стоит дорого, занимает много времени или непрактичен.

Как работает обучение с помощью нескольких выстрелов

Few-shot learning использует предыдущие знания, полученные при решении смежных задач, чтобы справиться с новыми задачами с минимальным количеством данных. Обычно это достигается с помощью таких техник, как трансферное обучение, метаобучение и использование предварительно обученных моделей. Предварительно обученные модели, например, основанные на архитектуре трансформаторов или сверточных нейронных сетей (CNN), могут быстро адаптироваться к новым задачам за счет тонкой настройки на небольшом наборе данных.

Например, подходы метаобучения, такие как "обучение для обучения", тренируют модель на распределении задач, а не на одной задаче. Это наделяет модель способностью быстро адаптироваться к новым задачам во время умозаключений.

Ключевые техники в обучении с помощью нескольких снимков

  • Метаобучение: Часто их называют "учиться, чтобы учиться", алгоритмы метаобучения, такие как MAML (Model-Agnostic Meta-Learning), тренируют модели для обобщения при выполнении нескольких задач. Узнай больше о трансферном обучении здесь.
  • Прототипические сети: Эти модели создают прототип (или центроид) для каждого класса в пространстве встраивания, который затем используется для классификации новых образцов на основе их близости.
  • Сиамские сети: Эти сети сравнивают пары входных данных, чтобы определить, принадлежат ли они к одному классу, что делает их эффективными для таких задач, как проверка лица.
  • Дополнение данных: Такие техники, как увеличение данных, искусственно расширяют набор данных за счет преобразованных версий существующих данных, чтобы улучшить обобщение модели.

Применение обучения по нескольким снимкам

Обучение с помощью нескольких кадров обладает преобразующим потенциалом в различных отраслях. Вот несколько реальных примеров:

  1. Диагностика в здравоохранении: Обучение на нескольких снимках используется для выявления редких заболеваний, когда собрать большой набор данных проблематично. Например, модель можно обучить на небольшом количестве медицинских изображений, чтобы выявить редкие опухоли. Узнай больше о применении ИИ в здравоохранении.

  2. Обработка естественного языка (NLP): Обучение с помощью нескольких выстрелов помогает в таких приложениях, как анализ настроения и классификация текстов, где может не хватать меченых данных. Такие техники, как GPT-4, используют несколько подсказок, чтобы генерировать контекстные ответы на минимальных примерах.

  3. Розничная торговля и управление запасами: Few-shot learning позволяет моделям распознавания объектов идентифицировать новые продукты на полках с помощью всего нескольких помеченных изображений, оптимизируя операции в розничной торговле, управляемой ИИ.

  4. Робототехника и автоматизация: Роботы могут адаптироваться к новым условиям и задачам на ограниченных примерах, что повышает их эффективность в таких динамичных отраслях, как производство. Изучи решения, связанные с искусственным интеллектом в производстве.

Обучение с помощью нескольких выстрелов в сравнении с родственными концепциями

  • Нулевое обучение: В то время как обучение с несколькими выстрелами опирается на небольшое количество помеченных примеров, обучение с нулевым выстрелом не требует никаких помеченных примеров для новой задачи, вместо этого используется семантическая информация или предварительно обученные вкрапления.
  • Трансферное обучение: В малоинформативном обучении часто используется трансферное обучение для быстрой адаптации предварительно обученных моделей к новым задачам. Однако в более широком смысле трансферное обучение направлено на повторное использование модели, обученной на большом наборе данных, для решения конкретной новой задачи.

Сложности в обучении с помощью нескольких выстрелов

Несмотря на свои преимущества, обучение с помощью нескольких выстрелов сопряжено с определенными трудностями:

  • Оверфиттинг: При ограниченном количестве данных модели могут чрезмерно подстраиваться под небольшое количество примеров, что снижает обобщение. Такие техники, как регуляризация, могут помочь смягчить эту проблему.
  • Дисбаланс классов: В задачах с небольшим количеством кадров часто приходится иметь дело с несбалансированными наборами данных, что усложняет достижение точных предсказаний.
  • Сложность модели: Модели обучения с несколькими выстрелами могут быть вычислительно интенсивными, что требует эффективных методов оптимизации, таких как алгоритмы метаобучения.

Будущее обучения с помощью нескольких выстрелов

Малоинформативное обучение - это быстро развивающаяся область, в которой есть достижения в таких областях, как метаобучение и генеративные модели. Такие инструменты, как Ultralytics YOLO позволяют пользователям использовать предварительно обученные модели для пользовательских приложений, снижая потребность в обширных наборах меченых данных. Такие платформы, как Ultralytics HUB, еще больше упрощают процесс развертывания и тонкой настройки моделей для сценариев малозаметного обучения.

Решая проблемы и интегрируясь с передовыми технологиями, обучение с помощью нескольких выстрелов продолжает расширять границы того, чего может достичь ИИ при минимальном количестве данных.

Читать полностью