Glossaire

Apprentissage à la volée

Découvre l'apprentissage Zero-Shot : une approche d'IA de pointe permettant aux modèles de classer des données inédites, révolutionnant ainsi la détection d'objets, le NLP, et bien d'autres choses encore.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'apprentissage à partir de zéro (ZSL) représente un domaine fascinant de l'apprentissage automatique où un modèle est formé pour reconnaître et classer des catégories de données qu'il n'a jamais explicitement vues au cours de la phase de formation. Contrairement aux approches traditionnelles d'apprentissage supervisé qui nécessitent des exemples étiquetés pour chaque catégorie possible, le ZSL vise à généraliser les connaissances des classes vues aux classes non vues en utilisant des informations auxiliaires partagées. Cette capacité est particulièrement précieuse dans les scénarios du monde réel où l'acquisition de données étiquetées pour chaque catégorie imaginable est peu pratique ou impossible.

Comment fonctionne l'apprentissage Zero-Shot

L'idée de base de ZSL est d'apprendre une correspondance entre l'espace des caractéristiques d'entrée (par exemple, les caractéristiques d'une image ou d'un texte) et un espace d'intégration sémantique. Cet espace sémantique code généralement des propriétés ou des attributs descriptifs de haut niveau qui sont partagés entre les classes vues et non vues. Par exemple, dans le domaine de la vision artificielle, il peut s'agir d'attributs visuels tels que "a des rayures", "a de la fourrure", "a des ailes", ou de descriptions textuelles. Dans le domaine du traitement du langage naturel (NLP), les enchâssements de mots servent souvent d'espace sémantique.

Au cours de la formation, le modèle apprend à associer les caractéristiques des classes vues à leurs représentations sémantiques correspondantes (par exemple, les attributs ou les enchâssements). Au moment de l'inférence, lorsqu'on lui présente une instance d'une classe inédite, le modèle extrait ses caractéristiques et les inscrit dans l'espace sémantique appris. En comparant ce mappage aux représentations sémantiques connues des classes inédites (fournies séparément), le modèle peut prédire l'étiquette de la classe même sans exemples préalables. Les modèles de Deep Learning, en particulier ceux qui utilisent des techniques d'apprentissage contrastif comme CLIP, sont souvent employés pour les tâches ZSL en raison de leur capacité à apprendre des représentations de caractéristiques riches. Tu peux explorer divers ensembles de données adaptés à ces tâches, comme ceux répertoriés dans la documentation sur les ensembles de donnéesUltralytics .

Applications dans le monde réel

Zero-Shot Learning permet de créer des applications puissantes dans différents domaines :

  1. Reconnaissance d'objets nouveaux : Dans la classification d'images ou la détection d'objets, ZSL permet aux systèmes d'identifier des objets qui ne sont pas présents dans les données d'entraînement initiales. Par exemple, un système de surveillance de la faune formé sur des animaux communs pourrait potentiellement identifier une espèce rare ou nouvellement découverte sur la base d'une description textuelle ou d'un ensemble d'attributs sémantiques fournis par des experts. Des modèles comme Ultralytics YOLO exploitent cette capacité pour la détection de vocabulaires ouverts.
  2. Catégorisation dynamique du contenu : ZSL peut classer des documents, des articles d'actualité ou du contenu généré par les utilisateurs dans des sujets émergents pour lesquels il n'existe pas de données étiquetées préalables. Un système pourrait être formé sur des catégories existantes, puis utiliser des enchâssements de mots ou des descriptions de sujets pour classer le contenu lié à des événements ou des tendances imprévus.

ZSL vs. paradigmes d'apprentissage apparentés

Il est important de distinguer le ZSL des concepts apparentés :

  • Apprentissage à partir d'un petit nombre d'exemples: Vise à apprendre de nouvelles classes à partir d'un très petit nombre d'exemples étiquetés (plus de zéro).
  • Apprentissage à un coup: Un cas spécifique d'apprentissage à quelques coups où un seul exemple étiqueté est disponible pour chaque nouvelle classe.
  • Apprentissage par transfert: Implique l'exploitation des connaissances acquises dans une tâche ou un domaine pour améliorer les performances d'une tâche ou d'un domaine différent mais connexe. Il s'agit souvent d'affiner un modèle pré-entraîné sur des données cibles, qui comprennent généralement des exemples des classes cibles.

La principale différence est que ZSL fonctionne sous la condition stricte de n' avoir aucun exemple étiqueté pour les classes cibles pendant la formation ou l'adaptation. Pour un aperçu comparatif, voir la discussion sur la compréhension de l'apprentissage à partir de quelques exemples, de l'apprentissage à partir de zéro et de l'apprentissage par transfert.

Importance dans l'IA

Zero-Shot Learning améliore considérablement l'évolutivité et l'adaptabilité des systèmes d'IA. Il réduit la dépendance à l'égard de la collecte et de l'annotation exhaustives des données, qui constituent souvent un goulot d'étranglement dans le développement d'applications de ML à grande échelle. En permettant aux modèles de raisonner sur des concepts inédits, ZSL repousse les limites de la généralisation dans l'intelligence artificielle (IA), rendant les systèmes plus robustes et capables de gérer la nature ouverte du monde réel. Des plateformes comme Ultralytics HUB facilitent la formation et le déploiement de modèles, y compris ceux qui exploiteront potentiellement les principes ZSL à l'avenir. Pour plus de détails sur la recherche ZSL, consulte des ressources telles que la page ZSL de Wikipédia ou des enquêtes universitaires trouvées sur des plateformes comme arXiv.

Tout lire