Contrôle vert
Lien copié dans le presse-papiers

Comprendre l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert

Explore les différences entre l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert en vision artificielle et comment ces paradigmes façonnent la formation des modèles d'IA.

Les systèmes d'intelligence artificielle (IA) peuvent effectuer des tâches complexes comme reconnaître des visages, classer des images et conduire des voitures avec un minimum d'intervention humaine. Ils y parviennent en étudiant les données, en reconnaissant des modèles et en utilisant ces modèles pour faire des prédictions ou prendre des décisions. Au fur et à mesure que l'IA progresse, nous observons des moyens de plus en plus sophistiqués par lesquels les modèles d'IA peuvent apprendre, s'adapter et effectuer des tâches avec une efficacité remarquable.

Par exemple, la vision par ordinateur est une branche de l'IA qui vise à permettre aux machines d'interpréter et de comprendre les informations visuelles du monde. Le développement traditionnel de modèles de vision par ordinateur s'appuie fortement sur de grands ensembles de données annotées pour la formation. La collecte et l'étiquetage de ces données peuvent prendre beaucoup de temps et être coûteux. 

Pour relever ces défis, les chercheurs ont introduit des approches innovantes telles que l'apprentissage à partir de quelques exemples (FSL), qui apprend à partir d'exemples limités, l'apprentissage à partir de zéro (ZSL), qui identifie des objets non vus, et l'apprentissage par transfert (TL), qui applique les connaissances des modèles préformés à de nouvelles tâches.

Dans cet article, nous allons explorer le fonctionnement de ces paradigmes d'apprentissage, mettre en évidence leurs principales différences et examiner des applications du monde réel. Commençons par le début !

Un aperçu des paradigmes d'apprentissage

Explorons ce que sont l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert en ce qui concerne la vision par ordinateur et comment ils fonctionnent. 

Apprentissage en quelques coups

L'apprentissage à partir d'un petit nombre d'images est une méthode par laquelle les systèmes apprennent à reconnaître de nouveaux objets à l'aide d'un petit nombre d'exemples. Par exemple, si tu montres à un modèle quelques photos d'un pingouin, d'un pélican et d'un macareux (ce petit groupe est appelé "ensemble de support"), il apprend à quoi ressemblent ces oiseaux. 

Plus tard, si tu montres au modèle une nouvelle image, comme un pingouin, il compare cette nouvelle image avec celles de son ensemble de soutien et choisit la correspondance la plus proche. Lorsqu'il est difficile de rassembler une grande quantité de données, cette méthode est avantageuse car le système peut encore apprendre et s'adapter avec seulement quelques exemples.

Fig 1. Vue d'ensemble du fonctionnement de l'apprentissage en quelques coups.

Apprentissage à partir de zéro

L'apprentissage à partir de zéro est un moyen pour les machines de reconnaître des choses qu'elles n'ont jamais vues auparavant sans avoir besoin d'exemples. Il utilise des informations sémantiques, comme des descriptions, pour aider à établir des connexions.

Par exemple, si une machine a appris à connaître des animaux comme les chats, les lions et les chevaux en comprenant des caractéristiques comme "petit et pelucheux", "gros chat sauvage" ou "long visage", elle peut utiliser ces connaissances pour identifier un nouvel animal, comme un tigre. Même s'il n'a jamais vu de tigre auparavant, il peut utiliser une description comme "un animal ressemblant à un lion avec des rayures sombres" pour l'identifier correctement. Cela permet aux machines d'apprendre et de s'adapter plus facilement sans avoir besoin d'un grand nombre d'exemples.

Fig 2. L'apprentissage à partir de zéro identifie de nouveaux objets à l'aide de descriptions.

Apprentissage par transfert

L'apprentissage par transfert est un paradigme d'apprentissage dans lequel un modèle utilise ce qu'il a appris lors d'une tâche pour aider à résoudre une nouvelle tâche similaire. Cette technique est particulièrement utile pour les tâches de vision artificielle telles que la détection d'objets, la classification d'images et la reconnaissance de formes. 

Par exemple, dans le domaine de la vision par ordinateur, un modèle pré-entraîné peut reconnaître des objets généraux, comme des animaux, puis être affiné grâce à l'apprentissage par transfert pour identifier des objets spécifiques, comme les différentes races de chiens. En réutilisant les connaissances acquises lors de tâches antérieures, l'apprentissage par transfert facilite la formation de modèles de vision artificielle sur des ensembles de données plus petits, ce qui permet d'économiser du temps et des efforts.

Fig 3. Vue d'ensemble du fonctionnement de l'apprentissage par transfert.

Tu te demandes peut-être quels types de modèles soutiennent l'apprentissage par transfert. Ultralytics YOLO11 est un excellent exemple de modèle de vision par ordinateur qui peut le faire. Il s'agit d'un modèle de détection d'objets de pointe qui est d'abord pré-entraîné sur un grand ensemble de données générales. Ensuite, il peut être affiné et entraîné sur mesure sur un ensemble de données plus petit et spécialisé pour des tâches spécifiques.

Comparer les paradigmes d'apprentissage

Maintenant que nous avons parlé de l'apprentissage à quelques coups, de l'apprentissage à zéro coup et de l'apprentissage par transfert, comparons-les pour voir en quoi ils diffèrent.

Fig 4. Principales différences entre l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert Image de l'auteur.

Le Few-shot learning est utile lorsque tu ne disposes que d'une petite quantité de données étiquetées. Il permet à un modèle d'intelligence artificielle d'apprendre à partir de quelques exemples seulement. L'apprentissage à partir de zéro, quant à lui, ne nécessite pas de données étiquetées. Au lieu de cela, il utilise les descriptions ou le contexte pour aider le système à gérer de nouvelles tâches. Quant à l'apprentissage par transfert, il adopte une approche différente en utilisant les connaissances de modèles pré-entraînés, ce qui leur permet de s'adapter rapidement à de nouvelles tâches avec un minimum de données supplémentaires. Chaque méthode a ses propres atouts en fonction du type de données et de la tâche sur laquelle tu travailles.

Applications concrètes de divers paradigmes d'apprentissage

Ces paradigmes d'apprentissage font déjà la différence dans de nombreux secteurs, en résolvant des problèmes complexes grâce à des solutions innovantes. Voyons de plus près comment ils peuvent être appliqués dans le monde réel.

Diagnostiquer les maladies rares grâce à l'apprentissage à petite échelle

L'apprentissage Few-shot change la donne dans le secteur de la santé, en particulier dans l'imagerie médicale. Il peut aider les médecins à diagnostiquer des maladies rares en utilisant seulement quelques exemples ou même des descriptions, sans avoir besoin de grandes quantités de données. C'est particulièrement utile lorsque les données sont limitées, ce qui est souvent le cas car la collecte de grands ensembles de données pour les maladies rares peut s'avérer difficile.

Par exemple, SHEPHERD utilise l'apprentissage à petite échelle et les graphes de connaissances biomédicales pour diagnostiquer les maladies génétiques rares. Il met en correspondance les informations du patient, telles que les symptômes et les résultats des tests, avec un réseau de gènes et de maladies connus. Cela permet d'identifier la cause génétique probable et de trouver des cas similaires, même lorsque les données sont limitées. 

Fig 5. Le modèle de Shepherd diagnostique les maladies rares en utilisant un minimum de données.

Améliorer la détection des maladies des plantes grâce à l'apprentissage à partir de zéro

En agriculture, il est essentiel d'identifier rapidement les maladies des plantes, car les retards de détection peuvent entraîner des dommages étendus aux cultures, une baisse des rendements et des pertes financières importantes. Les méthodes traditionnelles s'appuient souvent sur de vastes ensembles de données et des connaissances d'experts, qui ne sont pas toujours accessibles, en particulier dans les régions éloignées ou aux ressources limitées. C'est là que les progrès de l'IA, comme l'apprentissage à partir de zéro, entrent en jeu.

Disons qu'un agriculteur cultive des tomates et des pommes de terre et remarque des symptômes comme le jaunissement des feuilles ou des taches brunes. L'apprentissage à partir de zéro peut aider à identifier des maladies comme le mildiou sans nécessiter de grands ensembles de données. En utilisant les descriptions des symptômes, le modèle peut classer les maladies qu'il n'a jamais vues auparavant. Cette approche est rapide, évolutive et permet aux agriculteurs de détecter toute une série de problèmes liés aux plantes. Elle les aide à surveiller plus efficacement la santé des cultures, à prendre des mesures en temps voulu et à réduire les pertes.

Fig 6. Utilisation de l'apprentissage à partir de zéro pour identifier les maladies des plantes.

Véhicules autonomes et apprentissage par transfert

Les véhicules autonomes doivent souvent s'adapter à différents environnements pour naviguer en toute sécurité. L'apprentissage par transfert les aide à utiliser leurs connaissances antérieures pour s'adapter rapidement à de nouvelles conditions sans reprendre leur formation à zéro. Associées à la vision par ordinateur, qui aide les véhicules à interpréter les informations visuelles, ces technologies permettent une navigation plus fluide sur différents terrains et dans différentes conditions météorologiques, ce qui rend la conduite autonome plus efficace et plus fiable.

Un bon exemple en action est un système de gestion de parking qui utilise Ultralytics YOLO11 pour surveiller les places de stationnement. YOLO11, un modèle de détection d'objets pré-entraîné, peut être affiné à l'aide de l'apprentissage par transfert pour identifier les places de parking vides et occupées en temps réel. En entraînant le modèle sur un plus petit ensemble de données d'images de parcs de stationnement, il apprend à détecter avec précision les places ouvertes, les places pleines et même les zones réservées.

Fig 7. Gestion du stationnement à l'aide d'Ultralytics YOLO11.

Intégré à d'autres technologies, ce système peut guider les conducteurs vers la place disponible la plus proche, ce qui contribue à réduire le temps de recherche et les embouteillages. L'apprentissage par transfert rend cela possible en s'appuyant sur les capacités de détection d'objets existantes de YOLO11, ce qui lui permet de s'adapter aux besoins spécifiques de la gestion des parkings sans partir de zéro. Cette approche permet d'économiser du temps et des ressources tout en créant une solution hautement efficace et évolutive qui améliore les opérations de stationnement et l'expérience globale des utilisateurs.

Tendances émergentes dans les paradigmes d'apprentissage

L'avenir des paradigmes d'apprentissage dans le domaine de la vision par ordinateur s'oriente vers le développement de systèmes d'IA plus intelligents et plus durables. En particulier, une tendance croissante est l'utilisation d'approches hybrides qui combinent l'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert. En combinant les forces de ces méthodes, les modèles peuvent apprendre de nouvelles tâches avec un minimum de données et appliquer leurs connaissances dans différents domaines.

Un exemple intéressant consiste à utiliser des deep embeddings adaptés pour affiner les modèles en utilisant les connaissances des tâches précédentes et une petite quantité de nouvelles données, ce qui permet de travailler plus facilement avec des ensembles de données limités. 

De même, l'apprentissage X-shot est conçu pour gérer des tâches avec différentes quantités de données. Il utilise une supervision faible, où les modèles apprennent à partir d'étiquettes limitées ou bruyantes, et des instructions claires pour les aider à s'adapter rapidement, même avec peu ou pas d'exemples préalables disponibles. Ces approches hybrides montrent comment l'intégration de différentes méthodes d'apprentissage peut aider les systèmes d'IA à relever les défis plus efficacement.

Principaux enseignements

L'apprentissage à quelques coups, l'apprentissage à zéro coup et l'apprentissage par transfert répondent chacun à des défis spécifiques en matière de vision par ordinateur, ce qui les rend adaptés à différentes tâches. La bonne approche dépend de l'application spécifique et de la quantité de données disponibles. Par exemple, l'apprentissage à quelques coups fonctionne bien avec des données limitées, tandis que l'apprentissage à zéro coup est idéal pour traiter des classes non vues ou non familières.

À l'avenir, il est probable que la combinaison de ces méthodes pour créer des modèles hybrides qui intègrent la vision, le langage et l'audio sera au cœur des préoccupations. Ces avancées visent à rendre les systèmes d'IA plus flexibles, plus efficaces et plus aptes à résoudre des problèmes complexes, ouvrant ainsi de nouvelles possibilités d'innovation dans ce domaine.

Explore davantage l'IA en rejoignant notre communauté et en consultant notre dépôt GitHub. Apprends comment l 'IA dans les voitures auto-conduites et la vision par ordinateur dans l'agriculture sont en train de remodeler l'avenir. Jette un coup d'œil aux options disponibles de la licenceYOLO pour commencer !

Logo FacebookLogo de TwitterLogo LinkedInSymbole du lien de copie

Lire la suite dans cette catégorie

Construisons ensemble le futur
de l'IA !

Commence ton voyage avec le futur de l'apprentissage automatique.