Глоссарий

Тонкая настройка

Тонко настраивай модели машинного обучения вроде Ultralytics YOLO под конкретные задачи. Изучи методы, способы применения и лучшие практики здесь!

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Тонкая настройка - это популярная техника в машинном обучении (ML), которая предполагает использование модели, уже обученной на большом наборе данных (предварительно обученная модель), и дальнейшее обучение ее на меньшем, специфическом наборе данных, относящемся к конкретной задаче. Такой подход позволяет использовать общие знания, полученные моделью во время первоначального обучения, адаптируя ее для успешной работы в более специализированной области без необходимости обучать модель с нуля, что значительно экономит время и вычислительные ресурсы. Это распространенная практика в таких областях, как компьютерное зрение (КВ) и обработка естественного языка (ОЯ).

Как работает тонкая настройка

Процесс обычно начинается с выбора предварительно обученной модели, например Ultralytics YOLO модель, обученная на широком наборе данных, например COCO. Эти модели уже научились распознавать общие признаки на основе своих исходных тренировочных данных. Во время тонкой настройки веса модели корректируются на основе нового, более мелкого набора данных. Часто начальные слои сети (которые учат общие признаки) остаются "замороженными" (их веса не обновляются), в то время как последующие, более специфичные для конкретной задачи слои переобучаются. Такое переобучение обычно подразумевает использование более низкой скорости обучения, чем та, которая использовалась при первоначальном обучении, чтобы вносить меньшие коррективы в веса, сохраняя ранее полученные знания и одновременно адаптируясь к нюансам новой задачи.

Тонкая настройка по сравнению со смежными понятиями

Важно отличать тонкую настройку от похожих концепций ML:

  • Трансферное обучение: Тонкая настройка - это особый метод в рамках более широкой категории трансферного обучения. Трансферное обучение включает в себя любую технику, в которой модель, разработанная для одной задачи, повторно используется в качестве отправной точки для создания модели для второй задачи. В то время как тонкая настройка корректирует веса предварительно обученной модели, другие подходы к трансферному обучению могут использовать предварительно обученную модель исключительно как фиксированный экстрактор признаков.
  • Обучение с нуля: Это включает в себя инициализацию весов модели случайным образом и ее обучение исключительно на целевом наборе данных. Это требует значительно больше данных и вычислительных мощностей по сравнению с тонкой настройкой и часто не так хорошо работает на небольших наборах данных, так как не имеет общей базы знаний предварительно обученной модели. Советы по обучению моделей ты можешь найти в нашей документации.
  • Настройка гиперпараметров: Этот процесс направлен на поиск оптимальных параметров конфигурации (гиперпараметров, таких как скорость обучения, размер партии, выбор оптимизатора) до начала процесса обучения. Тонкая настройка, наоборот, является частью самого процесса обучения, корректируя внутренние параметры (веса) модели на основе новых данных. Такие инструменты, как Ultralytics Tuner, автоматизируют оптимизацию гиперпараметров.

Зачем использовать тонкую настройку?

Тонкая настройка дает несколько преимуществ:

  • Сокращение времени обучения: Используй существующие знания, что требует меньшего количества эпох обучения.
  • Более низкие требования к данным: Эффективен даже с небольшими, специфичными для конкретной задачи наборами данных, потому что модель не обучается всему с нуля.
  • Улучшенная производительность: Часто достигается более высокая точность при выполнении специализированных задач по сравнению с моделями, обученными с нуля на ограниченных данных.
  • Доступ к современным архитектурам: Позволяет пользователям использовать мощные, сложные модели, такие как трансформеры или продвинутые CNN, не нуждаясь в огромных ресурсах, необходимых для начального предварительного обучения.

Применение в реальном мире

Тонкая настройка широко используется в различных сферах:

  1. Специализированное обнаружение объектов: Модель Ultralytics YOLO , предварительно обученную для общего обнаружения объектов, можно доработать, используя пользовательский набор данных о конкретных промышленных деталях, чтобы создать высокопроизводительную систему обнаружения дефектов для ИИ в производстве. Точно так же ее можно точно настроить для анализа медицинских изображений, чтобы обнаруживать специфические состояния, например опухоли мозга. Ultralytics HUB предоставляет платформу для управления наборами данных и упрощает этот процесс обучения.
  2. Пользовательские языковые задачи: Такая большая языковая модель, как GPT-3, предварительно обученная OpenAI на разнообразных интернет-текстах, может быть доработана на наборе данных юридических документов, чтобы улучшить ее производительность при обобщении юридических текстов или на стенограммах обслуживания клиентов для специализированных ответов чатбота. Другой пример - тонкая настройка BERT-моделей для решения специфических задач анализа настроения в обзорах товаров или постах в социальных сетях, о чем подробно рассказывается на таких ресурсах, как Google AI Blog.

Тонкая настройка моделейYOLO от Ultralytics

Ultralytics обеспечивает надежную поддержку для тонкой настройки своих моделей YOLO . Пользователи могут легко загрузить предварительно обученные веса (например, из моделей, обученных на ImageNet или COCO) и продолжить обучение на своих собственных наборах данных для таких задач, как обнаружение, сегментация или классификация. ДокументацияUltralytics предлагает подробные руководства по процессу обучения, позволяя пользователям адаптировать современные модели, такие как YOLO11 для решения своих конкретных задач в области компьютерного зрения. Такая адаптивность - ключ к достижению оптимальной производительности в различных приложениях, от ИИ в сельском хозяйстве до робототехники. Дополнительную информацию о методах трансферного обучения можно найти на образовательных платформах вроде Coursera.

Читать полностью