Зелёная проверка
Ссылка копируется в буфер обмена

Понимание того, что такое обучение с несколькими выстрелами, с нулевым выстрелом и с переносом

Изучи различия между обучением с несколькими выстрелами, обучением с нулевыми выстрелами и трансферным обучением в компьютерном зрении и то, как эти парадигмы формируют обучение моделей ИИ.

Системы искусственного интеллекта (ИИ) могут решать такие сложные задачи, как распознавание лиц, классификация изображений и вождение автомобилей, при минимальном участии человека. Они делают это, изучая данные, распознавая закономерности и используя их для принятия прогнозов и решений. По мере развития ИИ мы наблюдаем все более сложные способы, с помощью которых модели ИИ могут обучаться, адаптироваться и выполнять задачи с поразительной эффективностью.

Например, компьютерное зрение - это направление ИИ, которое фокусируется на том, чтобы дать машинам возможность интерпретировать и понимать визуальную информацию из окружающего мира. Традиционная разработка моделей компьютерного зрения в значительной степени опирается на большие аннотированные наборы данных для обучения. Сбор и маркировка таких данных могут занимать много времени и быть дорогостоящими. 

Чтобы справиться с этими проблемами, исследователи внедрили такие инновационные подходы, как обучение на нескольких примерах (FSL), которое учится на ограниченных примерах; обучение на нулевых примерах (ZSL), которое идентифицирует невидимые объекты; и трансферное обучение (TL), которое применяет знания из предварительно обученных моделей к новым задачам.

В этой статье мы изучим, как работают эти парадигмы обучения, выделим их ключевые различия и рассмотрим реальные способы применения. Давай начнем!

Обзор парадигм обучения

Давай разберемся, что такое few-shot learning, zero-shot learning и transfer learning применительно к компьютерному зрению и как они работают. 

Обучение с помощью нескольких выстрелов

Few-shot learning - это метод, при котором системы учатся распознавать новые объекты, используя лишь небольшое количество примеров. Например, если ты покажешь модели несколько фотографий пингвина, пеликана и синицы (эта небольшая группа называется "набор поддержки"), она узнает, как выглядят эти птицы. 

Позже, если ты покажешь модели новую картинку, например пингвина, она сравнит ее с теми, что есть в ее наборе поддержки, и выберет наиболее близкую. Когда собрать большое количество данных сложно, этот метод выгоден тем, что система все равно может обучаться и адаптироваться, имея всего несколько примеров.

Рис. 1. Обзор того, как работает обучение с помощью нескольких выстрелов.

Обучение с нулевым результатом

Нулевое обучение - это способ, с помощью которого машины могут распознавать вещи, которые они никогда раньше не видели, не нуждаясь в примерах. Оно использует семантическую информацию, например описания, чтобы помочь установить связи.

Например, если машина узнала о таких животных, как кошки, львы и лошади, поняв такие признаки, как "маленький и пушистый", "большая дикая кошка" или "длинная морда", она может использовать эти знания для определения нового животного, например тигра. Даже если машина никогда раньше не видела тигра, она может использовать такое описание, как "львоподобное животное с темными полосами", чтобы правильно его идентифицировать. Таким образом, машинам легче учиться и адаптироваться, не нуждаясь в большом количестве примеров.

Рис. 2. Обучение с нулевого выстрела идентифицирует новые объекты с помощью описаний.

Трансферное обучение

Трансферное обучение - это парадигма обучения, при которой модель использует то, чему она научилась в ходе решения одной задачи, чтобы помочь решить аналогичную, новую задачу. Эта техника особенно полезна, когда речь идет о задачах компьютерного зрения, таких как обнаружение объектов, классификация изображений и распознавание образов. 

Например, в компьютерном зрении предварительно обученная модель может распознавать общие объекты, например животных, а затем с помощью трансферного обучения настраиваться на определение конкретных объектов, например различных пород собак. Благодаря повторному использованию знаний из предыдущих задач, трансферное обучение упрощает обучение моделей компьютерного зрения на небольших наборах данных, что экономит время и силы.

Рис. 3. Обзор того, как работает трансферное обучение.

Тебе может быть интересно, какие модели поддерживают трансферное обучение. Ultralytics YOLO11 это отличный пример модели компьютерного зрения, которая может это делать. Это современная модель обнаружения объектов, которая сначала проходит предварительное обучение на большом общем наборе данных. После этого ее можно доработать и обучить на меньшем специализированном наборе данных для решения конкретных задач.

Сравнение парадигм обучения

Теперь, когда мы поговорили об обучении с несколькими выстрелами, обучении с нулевыми выстрелами и трансферном обучении, давай сравним их, чтобы понять, чем они отличаются.

Рис. 4. Основные различия между обучением с несколькими выстрелами, обучением с нулевым выстрелом и обучением с переносом Изображение автора.

Few-shot learning полезно, когда у тебя есть лишь небольшой объем помеченных данных. Оно позволяет модели ИИ обучаться всего на нескольких примерах. Zero-shot learning, с другой стороны, не требует никаких помеченных данных. Вместо этого оно использует описания или контекст, чтобы помочь системе справиться с новыми задачами. Между тем трансферное обучение использует другой подход, применяя знания из предварительно обученных моделей, что позволяет им быстро адаптироваться к новым задачам с минимальным количеством дополнительных данных. У каждого метода есть свои сильные стороны в зависимости от типа данных и задачи, над которой ты работаешь.

Применение различных парадигм обучения в реальном мире

Эти парадигмы обучения уже приносят пользу во многих отраслях, решая сложные проблемы с помощью инновационных решений. Давай подробнее рассмотрим, как их можно применить в реальном мире.

Диагностика редких заболеваний с помощью обучения по нескольким снимкам

Few-shot learning - это геймчейнджер для сферы здравоохранения, особенно в области медицинской визуализации. Оно может помочь врачам диагностировать редкие заболевания, используя всего несколько примеров или даже описаний, не нуждаясь в большом количестве данных. Это особенно полезно, когда данные ограничены, что часто случается, потому что собрать большие массивы данных для редких заболеваний может быть непросто.

Например, SHEPHERD использует обучение на нескольких снимках и графы биомедицинских знаний для диагностики редких генетических заболеваний. Он сопоставляет информацию о пациенте, например симптомы и результаты анализов, с сетью известных генов и заболеваний. Это помогает точно определить вероятную генетическую причину и найти похожие случаи, даже если данные ограничены. 

Рис. 5. Модель Шепарда диагностирует редкие заболевания, используя минимум данных.

Улучшение обнаружения болезней растений с помощью обучения с нулевыми снимками

В сельском хозяйстве быстрое выявление болезней растений имеет огромное значение, так как задержки в их обнаружении могут привести к масштабному повреждению урожая, снижению урожайности и значительным финансовым потерям. Традиционные методы часто опираются на большие массивы данных и знания экспертов, которые не всегда могут быть доступны, особенно в отдаленных или ограниченных в ресурсах районах. Именно здесь на помощь приходят достижения в области искусственного интеллекта, такие как обучение с нулевым результатом.

Допустим, фермер выращивает помидоры и картофель и замечает такие симптомы, как пожелтение листьев или бурые пятна. Обучение на нулевых снимках может помочь выявить такие болезни, как поздняя болезнь, не требуя больших наборов данных. Используя описания симптомов, модель может классифицировать болезни, с которыми она раньше не сталкивалась. Этот подход быстрый, масштабируемый и позволяет фермерам выявлять самые разные проблемы с растениями. Он помогает им более эффективно следить за состоянием урожая, принимать своевременные меры и сокращать потери.

Рис. 6. Использование обучения с нулевого снимка для определения болезней растений.

Автономные автомобили и трансферное обучение

Автономным транспортным средствам часто приходится адаптироваться к различным условиям окружающей среды, чтобы безопасно ориентироваться. Трансферное обучение помогает им использовать предыдущие знания, чтобы быстро адаптироваться к новым условиям, не начиная обучение с нуля. В сочетании с компьютерным зрением, которое помогает автомобилям интерпретировать визуальную информацию, эти технологии обеспечивают более плавную навигацию по различным местностям и погодным условиям, делая автономное вождение более эффективным и надежным.

Хороший пример этого в действии - система управления парковкой, которая использует Ultralytics YOLO11 для мониторинга парковочных мест. YOLO11, предварительно обученная модель обнаружения объектов, может быть точно настроена с помощью трансферного обучения для определения пустых и занятых парковочных мест в режиме реального времени. Обучая модель на небольшом наборе данных изображений парковок, она учится точно определять свободные места, заполненные места и даже зарезервированные зоны.

Рис. 7. Управление парковкой с помощью Ultralytics YOLO11.

Интегрированная с другими технологиями, эта система может направлять водителей к ближайшему свободному месту, помогая сократить время поиска и уменьшить количество пробок на дорогах. Трансферное обучение делает это возможным, опираясь на существующие возможности YOLO11по обнаружению объектов, что позволяет ей адаптироваться к специфическим потребностям управления парковками, не начиная работу с нуля. Такой подход позволяет экономить время и ресурсы, создавая высокоэффективное и масштабируемое решение, которое улучшает работу парковок и повышает общий пользовательский опыт.

Новые тенденции в парадигмах обучения

Будущее парадигм обучения в компьютерном зрении склоняется в сторону разработки более интеллектуальных и устойчивых систем искусственного зрения. В частности, одной из растущих тенденций является использование гибридных подходов, сочетающих обучение с несколькими выстрелами, обучение с нулевыми выстрелами и трансферное обучение. Смешивая сильные стороны этих методов, модели могут обучаться новым задачам с минимальным количеством данных и применять свои знания в разных областях.

Интересный пример - использование адаптированных глубоких вкраплений для тонкой настройки моделей с использованием знаний из предыдущих задач и небольшого количества новых данных, что облегчает работу с ограниченными наборами данных. 

Аналогично, обучение X-shot предназначено для решения задач с разным количеством данных. В нем используется слабый контроль, когда модели учатся на ограниченных или зашумленных метках, и четкие инструкции, помогающие им быстро адаптироваться даже при небольшом количестве или полном отсутствии предыдущих примеров. Эти гибридные подходы показывают, как интеграция различных методов обучения может помочь системам ИИ эффективнее справляться с задачами.

Основные выводы

Few-shot learning, zero-shot learning и transfer learning решают специфические задачи в компьютерном зрении, поэтому подходят для разных задач. Выбор правильного подхода зависит от конкретного приложения и количества доступных данных. Например, обучение с несколькими выстрелами хорошо работает с ограниченными данными, а обучение с нулевым выстрелом отлично подходит для работы с невидимыми или незнакомыми классами.

Заглядывая в будущее, можно предположить, что комбинирование этих методов для создания гибридных моделей, объединяющих зрение, язык и аудио, станет одним из ключевых направлений. Эти достижения призваны сделать системы ИИ более гибкими, эффективными и способными решать сложные задачи, открывая новые возможности для инноваций в этой области.

Узнай больше об искусственном интеллекте, присоединившись к нашему сообществу и заглянув в наш репозиторий на GitHub. Узнай, как ИИ в самодвижущихся автомобилях и компьютерное зрение в сельском хозяйстве меняют будущее. Ознакомься с доступными вариантами лицензииYOLO , чтобы начать работу!

Логотип FacebookЛоготип ТвиттераЛоготип LinkedInСимвол копирования-ссылки

Читайте больше в этой категории

Давай вместе построим будущее
искусственного интеллекта!

Начни свое путешествие с будущим машинного обучения