Изучите возможности базовых моделей в области искусственного интеллекта. Узнайте, как адаптировать крупномасштабные модели, такие как Ultralytics , для выполнения пользовательских задач с помощью Ultralytics .
Фундаментальная модель представляет собой значительный сдвиг парадигмы в области искусственного интеллекта (ИИ). Это крупномасштабная модель машинного обучения, обученная на огромном количестве данных — часто включающих миллиарды параметров — которая может быть адаптирована к широкому спектру последующих задач. В отличие от традиционных моделей машинного обучения (МО), которые обычно создаются для конкретной, единичной цели, такой как классификация определенного вида цветов, базовая модель изучает общие закономерности, структуры и взаимосвязи на этапе предварительного обучения, требующем значительных ресурсов. Эта обширная база знаний позволяет разработчикам применять модель к новым задачам посредством переноса обучения, что значительно сокращает время и объем данных, необходимых для достижения передовых результатов.
Сила базовой модели заключается в двухэтапном процессе ее разработки: предварительной подготовке и тонкой настройке. Во время предварительной подготовки модель подвергается воздействию огромных наборов данных, таких как большие части Интернета, разнообразные библиотеки изображений или обширные репозитории кода. На этом этапе часто используется самоконтролируемое обучение — техника, при которой модель генерирует собственные метки из самой структуры данных, устраняя узкое место ручной анотации данных. Например, языковая модель может научиться предсказывать следующее слово в предложении, а модель зрения — понимать края, текстуры и постоянство объектов.
После предварительного обучения модель служит универсальной отправной точкой. С помощью процесса, называемого точной настройкой, разработчики могут корректировать веса модели на меньшем наборе данных, специфичном для конкретной области. Эта возможность имеет ключевое значение для демократизации ИИ, поскольку позволяет организациям с ограниченными вычислительными ресурсами использовать мощные архитектуры. Современные рабочие процессы часто используют такие инструменты, как Ultralytics , для оптимизации этого процесса адаптации, что позволяет эффективно обучать модель на пользовательских наборах данных без необходимости создавать нейронную сеть с нуля.
Фундаментальные модели служат основой для инноваций в различных отраслях. Их способность к обобщению позволяет применять их для решения задач от обработки естественного языка до сложного компьютерного зрения.
Разработчики могут использовать базовые модели для выполнения сложных задач с минимальным количеством кода. В следующем примере показано, как загрузить предварительно обученную модель YOLO26— базовую модель визуального восприятия, оптимизированную для приложений реального времени, — и выполнить обнаружение объектов на изображении.
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")
# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
Полезно отличать «базовую модель» от связанных с ней концепций в сфере искусственного интеллекта, чтобы понять их конкретные роли:
Эволюция базовых моделей движется в направлении мультимодального ИИ, когда одна система может одновременно обрабатывать и связывать информацию из текста, изображений, аудио и данных датчиков. Исследования таких учреждений, как Стэнфордский институт человекоцентрированного ИИ (HAI), подчеркивают потенциал этих систем в плане способности рассуждать о мире так же, как это делают люди. По мере того, как эти модели становятся более эффективными, их внедрение на периферийных вычислительных устройствах становится все более осуществимым, что позволяет напрямую использовать мощные возможности ИИ в смартфонах, дронах и датчиках IoT.