Глоссарий

Генеративный искусственный интеллект

Узнай, как генеративный ИИ создает оригинальный контент в виде текста, изображений и аудио, преобразуя отрасли с помощью инновационных приложений.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Генеративный искусственный интеллект (ИИ) - это подмножество искусственного интеллекта (ИИ), ориентированное на создание систем, способных генерировать новый контент, такой как текст, изображения, аудио, код или синтетические данные. В отличие от дискриминационных моделей ИИ, которые учатся классифицировать или предсказывать на основе входных данных (например, идентифицировать объекты на изображении), генеративные модели изучают основные закономерности и распределения в наборе данных, чтобы создавать новые, оригинальные результаты, которые похожи на обучающие данные. Последние достижения, особенно такие модели, как генеративные предварительно обученные трансформаторы (GPT) и диффузионные модели, позволили создавать очень реалистичный и сложный контент.

Как работает генеративный искусственный интеллект

Генеративные модели ИИ обычно работают, обучаясь представлению вероятностного распределения обучающих данных. Затем они могут делать выборки из этого выученного распределения, чтобы генерировать новые точки данных. К распространенным архитектурам относятся:

  • Генеративные адверсарные сети (GAN): В них две нейронные сети, генератор и дискриминатор, соревнуются друг с другом, чтобы улучшить качество генерируемых выходов.
  • Трансформеры: Широко используемые в больших языковых моделях (LLM), таких как GPT-4, эти модели используют механизмы внимания для генерации связных и контекстуально релевантных последовательностей, в первую очередь текста.
  • Вариационные автоэнкодеры (ВАЭ): Они учат сжатые представления данных и могут генерировать новые данные, декодируя точки, отобранные из латентного пространства.
  • Диффузионные модели: Эти модели работают путем постепенного добавления шума к данным, а затем учатся обращать этот процесс вспять, что позволяет создавать высокоточные изображения, особенно для изображений (например, Stable Diffusion).

Генеративный ИИ против компьютерного зрения

Хотя оба эти направления являются ветвями ИИ, генеративный ИИ и компьютерное зрение (КЗ) служат принципиально разным целям.

Как обсуждалось на YOLO Vision 2024, генеративные модели ИИ зачастую значительно больше (миллиарды параметров) по сравнению с эффективными CV-моделями, предназначенными для анализа в реальном времени (например. Ultralytics YOLOv8с моделями от нескольких миллионов параметров). Генеративный ИИ требует значительных вычислительных ресурсов для обучения и вывода, в то время как многие CV-модели оптимизированы для развертывания на стандартном оборудовании или пограничных устройствах.

Однако эти области все чаще пересекаются. Генеративный ИИ может помочь CV, создавая синтетические данные для обучения моделей обнаружения или сегментации, особенно для редких сценариев, потенциально улучшая надежность и производительность моделей.

Реальные приложения и примеры

Генеративный ИИ имеет множество применений в различных областях:

  1. Создание контента: Генерация статей, маркетинговых копий, скриптов(генерация текста), создание оригинальных изображений или артов(text-to-image), сочинение музыки или генерация видео(text-to-video). Такие инструменты, как ChatGPT для текста и Midjourney для изображений - популярные примеры.
  2. Увеличение данных: Создание искусственных образцов данных для расширения ограниченных наборов данных. Например, генерация синтетических изображений редких медицинских состояний для повышения точности диагностических систем ИИ, используемых для анализа медицинских изображений. Это помогает преодолеть нехватку данных и улучшает обобщение моделей.
  3. Открытие и разработка лекарств: Моделирование молекулярных структур и предсказание их свойств для ускорения поиска новых лекарств, что исследуют такие компании, как DeepMind.
  4. Персонализация: Питание сложных чат-ботов и виртуальных помощников, создание персонализированных учебных материалов или генерация индивидуальных рекомендаций по товарам.

Этические соображения

Мощь генеративного ИИ также порождает значительные этические проблемы. К ним относятся потенциал генерации дезинформации или вредного контента, создание убедительных deepfakes, вопросы, связанные с авторскими правами и интеллектуальной собственностью на генерируемый контент, а также присущие ему предубеждения, полученные из обучающих данных. Решение этих проблем требует тщательного рассмотрения вопросов этики ИИ, прозрачности и надежной нормативной базы. Разработка и внедрение этих технологий с ответственностью имеет решающее значение. Для управления и обучения собственных моделей ИИ рассмотри такие платформы, как Ultralytics HUB.

Читать полностью