Glossaire

L'IA générative

Découvre comment l'IA générative crée du contenu original comme du texte, des images et de l'audio, transformant les industries grâce à des applications innovantes.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'intelligence artificielle (IA) générative est un sous-ensemble de l'intelligence artificielle (IA) axé sur la création de systèmes capables de générer des contenus inédits, tels que du texte, des images, du son, du code ou des données synthétiques. Contrairement aux modèles d'IA discriminative qui apprennent à classer ou à prédire en fonction des données d'entrée (par exemple, l'identification d'objets dans une image), les modèles génératifs apprennent les modèles et les distributions sous-jacents au sein d'un ensemble de données pour produire de nouveaux résultats originaux qui ressemblent aux données d'entraînement. Les progrès récents, en particulier avec des modèles tels que les transformateurs génératifs pré-entraînés (GPT) et les modèles de diffusion, ont permis la création de contenus très réalistes et complexes.

Comment fonctionne l'IA générative

Les modèles d'IA génératifs fonctionnent généralement en apprenant une représentation de la distribution de probabilité des données d'apprentissage. Ils peuvent ensuite échantillonner à partir de cette distribution apprise pour générer de nouveaux points de données. Les architectures courantes comprennent :

  • Réseaux adverbiaux génératifs (GAN): Ils impliquent deux réseaux neuronaux, un générateur et un discriminateur, en compétition l'un contre l'autre pour améliorer la qualité des sorties générées.
  • Transformateurs: Largement utilisés dans les grands modèles de langage (LLM) comme le GPT-4, ces modèles utilisent des mécanismes d'attention pour générer des séquences cohérentes et contextuellement pertinentes, principalement du texte.
  • Autoencodeurs variationnels (VAE): Ils apprennent des représentations compressées des données et peuvent générer de nouvelles données en décodant des points échantillonnés dans l'espace latent.
  • Modèles de diffusion: Ces modèles fonctionnent en ajoutant progressivement du bruit aux données, puis en apprenant à inverser le processus, ce qui permet une génération haute fidélité, en particulier pour les images (par exemple, Diffusion stable).

IA générative et vision par ordinateur

Bien qu'il s'agisse de deux branches de l'IA, l'IA générative et la vision par ordinateur (VA) ont des objectifs fondamentalement différents.

  • L'IA générative se concentre : Création de nouveaux contenus (par exemple, génération d'images à partir de descriptions textuelles, rédaction d'articles, composition de musique).
  • Vision par ordinateur Focus : Analyse et compréhension des données visuelles existantes (par exemple, détection d'objets, classification d'images, segmentation d'instances à l'aide de modèles comme Ultralytics YOLO).

Comme discuté lors de YOLO Vision 2024, les modèles d'IA générative sont souvent beaucoup plus grands (des milliards de paramètres) par rapport aux modèles CV efficaces conçus pour l'analyse en temps réel (comme... Ultralytics YOLOv8, dont les modèles commencent à partir de quelques millions de paramètres). L'IA générative nécessite des ressources informatiques importantes pour l'entraînement et l'inférence, alors que de nombreux modèles CV sont optimisés pour être déployés sur du matériel standard ou des appareils de périphérie.

Cependant, ces domaines se recoupent de plus en plus. L'IA générative peut aider la CV en créant des données synthétiques pour l'entraînement des modèles de détection ou de segmentation, en particulier pour les scénarios rares, ce qui permet potentiellement d'améliorer la robustesse et les performances des modèles.

Applications et exemples concrets

L'IA générative a de nombreuses applications dans divers domaines :

  1. Création de contenu : Générer des articles, des textes marketing, des scripts(génération de texte), créer des images ou des œuvres d'art originales(text-to-image), composer de la musique ou générer des vidéos(text-to-video). Des outils comme ChatGPT pour le texte et Midjourney pour les images sont des exemples populaires.
  2. Augmentation des données: Création d'échantillons de données artificielles pour élargir des ensembles de données limités. Par exemple, générer des images synthétiques de conditions médicales rares pour améliorer la précision des systèmes d'IA de diagnostic utilisés dans l'analyse d'images médicales. Cela permet de pallier la pénurie de données et d'améliorer la généralisation des modèles.
  3. Découverte et développement de médicaments : Simuler les structures moléculaires et prédire leurs propriétés pour accélérer la recherche de nouveaux médicaments, comme l'explorent des entreprises telles que DeepMind.
  4. Personnalisation : Alimenter des chatbots et des assistants virtuels sophistiqués, créer des supports d'apprentissage personnalisés ou générer des recommandations de produits sur mesure.

Considérations éthiques

La puissance de l'IA générative entraîne également des défis éthiques importants. Il s'agit notamment du potentiel de génération de désinformation ou de contenu nuisible, de la création de deepfakes convaincants, des questions liées au droit d'auteur et à la propriété intellectuelle du contenu généré, et des biais inhérents appris à partir des données d'entraînement. Pour y remédier, il faut examiner attentivement l'éthique de l'IA, la transparence et des cadres réglementaires solides. Il est crucial de développer et de déployer ces technologies de manière responsable. Pour gérer et former tes propres modèles d'IA, pense à des plateformes comme Ultralytics HUB.

Tout lire