Glossaire

L'IA générative

Découvre comment l'IA générative crée du contenu original comme du texte, des images et de l'audio, transformant les industries grâce à des applications innovantes.

L'intelligence artificielle générative (IA) représente une branche importante dans le domaine plus large de l'intelligence artificielle (IA), se concentrant spécifiquement sur la création de systèmes capables de générer un contenu entièrement nouveau et original. Ce contenu peut couvrir diverses modalités, y compris le texte, les images, l'audio, le code et même les données synthétiques. Contrairement aux modèles d'IA discriminatifs, qui sont formés pour classer ou faire des prédictions en fonction des données d'entrée (comme l'identification d'objets dans une image à l'aide de la détection d'objets), les modèles génératifs apprennent les modèles, les structures et les distributions de probabilité sous-jacents au sein d'un ensemble de données d'apprentissage. Ils utilisent ensuite ces connaissances acquises pour produire de nouveaux résultats qui imitent les caractéristiques des données d'origine. De récentes percées, notamment grâce à des architectures telles que les transformateurs génératifs pré-entraînés (GPT) et les modèles de diffusion, ont permis de créer des contenus remarquablement réalistes et complexes, repoussant ainsi les limites de la créativité des machines.

Comment fonctionne l'IA générative

L'idée centrale de la plupart des modèles génératifs est d'apprendre une représentation de la distribution des données. Une fois cette distribution apprise, le modèle peut l'échantillonner pour générer de nouveaux points de données qui sont statistiquement similaires aux données sur lesquelles il a été formé. Cela implique des architectures de réseaux neuronaux (RN) complexes et des techniques de formation sophistiquées. Parmi les architectures les plus connues, on peut citer :

Réseaux adverbiaux génératifs (GAN) : Ces modèles utilisent deux réseaux neuronaux concurrents - un générateur qui crée des données et un discriminateur qui tente de faire la distinction entre les données réelles et les données générées - pour améliorer de façon itérative la qualité des sorties générées.
Autoencodeurs variationnels (VAE) : Les VAE apprennent une représentation comprimée (espace latent) des données et peuvent ensuite générer de nouvelles données en échantillonnant des points de cet espace latent et en les décodant.
Transformateurs : Développée à l'origine pour le traitement du langage naturel (NLP), l'architecture Transformer, en particulier son mécanisme d'auto-attention, s'est avérée très efficace pour diverses tâches génératives, formant la base des grands modèles de langage (LLM) tels que GPT-4.
Modèles de diffusion : Ces modèles fonctionnent en ajoutant progressivement du bruit aux données d'entraînement, puis en apprenant à inverser ce processus, en partant du bruit pour générer des échantillons de données propres et cohérents. Les modèles tels que la diffusion stable sont des exemples marquants utilisés pour la génération de texte à partir d'images.

IA générative et vision par ordinateur

Bien qu'il s'agisse de deux sous-domaines de l'IA, l'IA générative et la vision par ordinateur (VA) ont des objectifs fondamentalement différents. La vision artificielle s'attache à permettre aux machines d'interpréter et de comprendre les informations visuelles du monde, en effectuant des tâches telles que la classification d'images, la détection d'objets et la segmentation d'instances. L'IA générative, à l'inverse, se concentre sur la création de nouveaux contenus visuels (ou autres).

Les principales différences mises en évidence lors de discussions comme celles de YOLO Vision 2024 sont notamment les suivantes :

Taille du modèle : Les modèles génératifs, en particulier les LLM et les grands modèles d'images, contiennent souvent des milliards, voire des trillions de paramètres. Les modèles CV conçus pour l'analyse en temps réel, tels que Ultralytics YOLO11sont généralement beaucoup plus petits et plus efficaces, certaines variantes ne comportant que quelques millions de paramètres(en comparant les modèles YOLO ).
Ressources informatiques : La formation et l'exécution de grands modèles génératifs nécessitent une puissance de calcul importante, impliquant souvent des grappes distribuées de GPU. De nombreux modèles CV, y compris ceux d'Ultralytics, sont optimisés pour l'efficacité et peuvent être déployés sur du matériel standard ou des appareils spécialisés en périphérie à l' aide de cadres tels que ONNX ou TensorRT.
Objectif : CV analyse les données existantes ; l'IA générative synthétise de nouvelles données.

Malgré ces différences, les domaines sont de plus en plus interconnectés. L'IA générative s'avère précieuse pour la CV en générant des données synthétiques de haute qualité. Ces données synthétiques peuvent augmenter les ensembles de données du monde réel, aidant à former des modèles de CV plus robustes et plus précis, en particulier pour les scénarios où les données réelles sont rares ou difficiles à obtenir, comme dans les simulations de conduite autonome ou l'imagerie de conditions médicales rares(IA dans le domaine de la santé).

Applications dans le monde réel

L'IA générative est en train de transformer de nombreux secteurs d'activité :

Création de contenu : Automatiser la génération d'articles, de textes marketing, de scripts(GPT-3), créer des images et des œuvres d'art uniques(Midjourney, DALL-E 3), composer de la musique et générer du contenu vidéo(OpenAI Sora).
Génération de données synthétiques : Création d'ensembles de données réalistes pour l'entraînement de modèles ML dans des domaines tels que la robotique, la finance(modèles de vision par ordinateur dans la finance) et la santé, en améliorant les performances des modèles et en réglant les problèmes de confidentialité des données. Par exemple, générer des images médicales synthétiques pour former des outils de diagnostic sans utiliser les données réelles des patients.
Découverte de médicaments et science des matériaux : Concevoir de nouvelles structures moléculaires et prédire leurs propriétés, accélérer la recherche et le développement comme le démontrent des organisations telles que Google DeepMind.
Personnalisation : Alimenter des expériences utilisateur hautement personnalisées par la génération de contenu dynamique dans les chatbots, les assistants virtuels et les moteurs de recommandation.
Développement de logiciels : Aider les développeurs en générant des extraits de code, en suggérant des corrections de bogues et même en créant des fonctions entières basées sur des descriptions en langage naturel(GitHub Copilot).

Défis et considérations éthiques

L'avancée rapide de l'IA générative s'accompagne également de défis. Garantir l'utilisation éthique de ces puissants outils est primordial, notamment en ce qui concerne les deepfakes, la désinformation, les droits de propriété intellectuelle et les biais inhérents appris à partir des données d'entraînement. Pour y remédier, il faut développer des modèles avec soin, des méthodes de détection robustes et des directives claires décrites dans les principes de l'éthique de l'IA. De plus, les importantes ressources informatiques nécessaires posent des problèmes d'environnement et d'accessibilité. Des plateformes comme Ultralytics HUB visent à rationaliser les flux de travail et à abaisser potentiellement les barrières à l'entrée pour certaines tâches d'IA.

L'IA générative

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

Solution flexible de licence d'entreprise pour alimenter ton innovation.

Entraîne des modèles d'IA en quelques secondes avec Ultralytics YOLO

Entraîne les modèles YOLO simplement avec Ultralytics HUB

Comment fonctionne l'IA générative

IA générative et vision par ordinateur

Applications dans le monde réel

Défis et considérations éthiques

Lire plus de blogs

Rejoins la communauté Ultralytics

L'IA générative

Entraîne les modèles YOLO simplementavec Ultralytics HUB

Solution flexible de licence d'entreprise pour alimenter ton innovation.

Entraîne des modèles d'IA en quelques secondes avec Ultralytics YOLO

Entraîne les modèles YOLO simplement avec Ultralytics HUB

Comment fonctionne l'IA générative

IA générative et vision par ordinateur

Applications dans le monde réel

Défis et considérations éthiques

Lire plus de blogs

Rejoins la communauté Ultralytics

Entraîne les modèles YOLO simplement
avec Ultralytics HUB