Глоссарий

Обучение с нуля

Открой для себя Zero-Shot Learning: передовой подход ИИ, позволяющий моделям классифицировать невидимые данные, революционизируя обнаружение объектов, NLP и многое другое.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Zero-Shot Learning (ZSL) представляет собой увлекательное направление в машинном обучении (ML), в котором модель обучается распознавать и классифицировать категории данных, которые она никогда не видела в явном виде на этапе обучения. В отличие от традиционных подходов к контролируемому обучению, которые требуют маркированных примеров для каждой возможной категории, ZSL нацелено на обобщение знаний от увиденных классов к невиденным, используя общую вспомогательную информацию. Эта способность особенно ценна в реальных сценариях, где получение помеченных данных для каждой возможной категории непрактично или невозможно.

Как работает обучение с нулевым выстрелом

Основная идея ZSL заключается в обучении отображению между пространством входных признаков (например, признаков изображения или текста) и пространством семантических вкраплений. Это семантическое пространство обычно кодирует высокоуровневые описательные свойства или атрибуты, которые являются общими для видимых и невидимых классов. Например, в компьютерном зрении это могут быть визуальные атрибуты вроде "имеет полоски", "имеет мех", "имеет крылья" или текстовые описания. В обработке естественного языка (NLP) в качестве такого семантического пространства часто выступают вкрапления слов.

В процессе обучения модель учится связывать признаки увиденных классов с их соответствующими семантическими представлениями (например, атрибутами или вкраплениями). Во время умозаключения, когда тебе предъявляется экземпляр невидимого класса, модель извлекает его признаки и отображает их в выученное семантическое пространство. Сравнивая это отображение с известными семантическими представлениями невидимых классов (предоставляются отдельно), модель может предсказать метку класса даже без предварительных примеров. Модели Deep Learning, особенно использующие такие техники контрастного обучения, как CLIP, часто применяются для задач ZSL благодаря своей способности к обучению богатым представлениям признаков. Ты можешь изучить различные наборы данных, подходящие для таких задач, например те, что перечислены в документацииUltralytics Datasets.

Применение в реальном мире

Zero-Shot Learning позволяет создавать мощные приложения в различных областях:

  1. Распознавание новых объектов: При классификации изображений или обнаружении объектов ЗСЛ позволяет системам идентифицировать объекты, не присутствующие в исходных обучающих данных. Например, система мониторинга дикой природы, обученная на обычных животных, потенциально может идентифицировать редкий или недавно обнаруженный вид на основе текстового описания или набора семантических атрибутов, предоставленных экспертами. Такие модели, как Ultralytics YOLO, используют эту возможность для обнаружения открытых словарей.
  2. Динамическая категоризация контента: ZSL может классифицировать документы, новостные статьи или пользовательский контент по возникающим темам, для которых не существует предварительных помеченных данных. Система может быть обучена на существующих категориях, а затем использовать вкрапления слов или описания тем для классификации контента, связанного с непредвиденными событиями или тенденциями.

ЗСЛ против смежных парадигм обучения

Важно отличать ЗСЛ от смежных понятий:

  • Few-Shot Learning: Цель - выучить новые классы на очень небольшом количестве помеченных примеров (больше нуля).
  • One-Shot Learning: Частный случай обучения с несколькими выстрелами, когда для каждого нового класса доступен только один помеченный пример.
  • Трансферное обучение: Это использование знаний, полученных в одной задаче или области, для улучшения производительности в другой, но смежной задаче или области. Часто включает в себя тонкую настройку предварительно обученной модели на целевых данных, которые обычно включают в себя примеры целевых классов.

Ключевым отличием является то, что ZSL работает при строгом условии наличия нулевых меченых примеров для целевых классов во время обучения или адаптации. Для сравнительного обзора смотри обсуждение "Понимание Few-Shot, Zero-Shot и Transfer Learning".

Важность в искусственном интеллекте

Zero-Shot Learning значительно повышает масштабируемость и адаптивность систем ИИ. Оно снижает зависимость от исчерпывающего сбора и аннотирования данных, что часто является узким местом при разработке крупномасштабных приложений ML. Позволяя моделям рассуждать о невидимых концепциях, ZSL раздвигает границы обобщения в искусственном интеллекте (ИИ), делая системы более надежными и способными справляться с открытостью реального мира. Платформы вроде Ultralytics HUB облегчают обучение и развертывание моделей, в том числе тех, которые потенциально могут использовать принципы ZSL в будущем. Для получения более подробной информации об исследованиях в области ZSL обратись к таким ресурсам, как страница ZSL в Википедии или академические обзоры, найденные на таких платформах, как arXiv.

Читать полностью