Изучите основы генеративного ИИ. Узнайте, как он создает синтетические данные, интегрируется с Ultralytics и стимулирует инновации в области компьютерного зрения.
Генеративный ИИ относится к подкатегории искусственного интеллекта (ИИ), ориентированной на создание нового контента, такого как текст, изображения, аудио, видео и компьютерный код, в ответ на запросы пользователей. В отличие от традиционных систем ИИ, которые в основном предназначены для анализа или classify данных, генеративные модели используют алгоритмы глубокого обучения (DL) для изучения базовых паттернов, структур и вероятностных распределений огромных наборов данных. После обучения эти системы могут генерировать новые результаты, которые имеют статистическое сходство с обучающими данными, но являются уникальными творениями. Эта возможность сделала генеративный ИИ краеугольным камнем современных базовых моделей, стимулируя инновации в креативных отраслях, разработке программного обеспечения и научных исследованиях.
В основе генеративного ИИ лежат сложные архитектуры нейронных сетей, которые учатся кодировать и декодировать информацию. Эти модели обычно обучаются с помощью неконтролируемого обучения на обширных корпусах данных.
Чтобы понять генеративный ИИ, очень важно отличать его от дискриминативного ИИ. Хотя они являются двумя столпами машинного обучения, их цели значительно различаются.
Универсальность генеративного ИИ позволяет применять его в различных областях, часто в сочетании с дискриминативными моделями для создания мощных рабочих процессов.
Генеративные модели искусственного интеллекта и дискриминативные модели компьютерного зрения часто функционируют как взаимодополняющие технологии. Обычный процесс включает использование генеративной модели для расширения набора данных, а затем обучение дискриминативной модели на этом улучшенном наборе данных с помощью таких инструментов, как Ultralytics .
Следующий пример на Python демонстрирует, как использовать ultralytics пакет для загрузки модели YOLO26. В
гибридном рабочем процессе вы можете использовать этот код для проверки объектов в синтетически сгенерированном изображении.
from ultralytics import YOLO
# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")
# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results to verify the synthetic data quality
results[0].show()
Несмотря на свою мощь, генеративный ИИ создает определенные проблемы, с которыми пользователям приходится сталкиваться. Модели могут иногда генерировать галлюцинации, создавая правдоподобно звучащую, но фактически неверную информацию или визуальные артефакты. Кроме того, поскольку эти модели обучаются на данных в масштабах Интернета, они могут непреднамеренно распространять предвзятость в ИИ, присутствующую в исходном материале.
Этические проблемы, связанные с авторским правом и интеллектуальной собственностью, также занимают важное место, как обсуждается в различных рамках этики ИИ. Исследователи и организации, такие как Стэнфордский институт человекоцентрированного ИИ, активно работают над методами, обеспечивающими ответственную разработку и внедрение этих мощных инструментов. Кроме того, вычислительные затраты на обучение этих массивных моделей привели к повышению интереса к квантованию моделей, чтобы сделать выводы более энергоэффективными на периферийных устройствах.