Glossaire

Apprentissage en profondeur (DL)

Découvrez la puissance de l'apprentissage profond : explorez les réseaux neuronaux, les techniques d'entraînement et les applications du monde réel dans les domaines de l'IA, de la santé et plus encore.

Le Deep Learning (DL) est un sous-domaine spécialisé du Machine Learning (ML) qui utilise des réseaux neuronaux multicouches pour apprendre à partir de grandes quantités de données. Inspirés par la structure du cerveau humain, les modèles d'apprentissage profond, souvent appelés réseaux neuronaux profonds, sont conçus pour apprendre automatiquement des représentations hiérarchiques des données. Cela signifie que les couches initiales apprennent des caractéristiques simples, et que les couches suivantes les combinent pour apprendre des modèles de plus en plus complexes. Cette capacité a fait de la DL le moteur d'avancées majeures dans le domaine de l'intelligence artificielle (IA), en particulier dans des domaines complexes tels que la vision artificielle (CV) et le traitement du langage naturel (NLP).

Comment fonctionne l'apprentissage profond ?

Les réseaux neuronaux profonds sont au cœur de l'apprentissage profond. Il s'agit de réseaux neuronaux comportant plusieurs couches cachées entre les couches d'entrée et de sortie. Le terme "deep" (profond) dans Deep Learning fait référence à cette profondeur. Chaque couche contient des unités de traitement (neurones) qui appliquent une opération mathématique, régie par une fonction d'activation, à leur entrée. Pendant la formation, le réseau est alimenté par de grands ensembles de données, et un algorithme appelé rétropropagation est utilisé pour ajuster les paramètres internes du réseau, ou les poids. Ce processus d'ajustement, généralement guidé par un algorithme d'optimisation tel que la descente de gradient, minimise la différence entre les prédictions du modèle et la vérité réelle, telle que définie par une fonction de perte. Cela permet au réseau de découvrir automatiquement des modèles complexes sans être explicitement programmé pour le faire. Un article historique clé qui a contribué à populariser la DL moderne est l'article AlexNet de 2012, qui a obtenu des résultats de pointe sur l'ensemble de données ImageNet.

Apprentissage profond et apprentissage automatique Apprentissage automatique

Si l'apprentissage profond est un sous-ensemble de l'apprentissage automatique, la principale distinction réside dans l'approche de la représentation des données. Les méthodes traditionnelles d'apprentissage automatique s'appuient souvent sur l'ingénierie manuelle des caractéristiques, où les experts du domaine élaborent méticuleusement des caractéristiques à partir de données brutes pour aider le modèle à faire des prédictions précises. En revanche, les modèles DL procèdent à une extraction automatique des caractéristiques. La structure hiérarchique des réseaux profonds leur permet d'apprendre les caractéristiques pertinentes directement à partir des données. Cela rend le DL particulièrement puissant pour le traitement de données non structurées telles que les images, le texte et l'audio, où l'ingénierie manuelle des caractéristiques est souvent peu pratique. Par exemple, dans la reconnaissance d'images, un modèle DL peut apprendre à identifier les bords et les textures dans ses premières couches, puis des parties d'objets comme les yeux et le nez dans les couches intermédiaires, et enfin des objets entiers comme les visages dans les couches plus profondes.

Applications et exemples

La capacité de l'apprentissage profond à traiter des données complexes a conduit à son adoption dans de nombreux secteurs et applications. En voici deux exemples marquants :

  1. Véhicules autonomes : Les voitures autonomes s'appuient fortement sur le DL pour la perception en temps réel. Les modèles YOLO d'Ultralytics, une famille de modèles DL de pointe, sont utilisés pour la détection d'objets afin d'identifier les piétons, les autres véhicules et les panneaux de signalisation. De même, la DL est utilisée pour la segmentation d'images afin de distinguer la surface de la route praticable de son environnement, ce qui est crucial pour une navigation sûre. En savoir plus sur son utilisation dans l'IA dans les voitures auto-conduites.
  2. Analyse d'images médicales : Dans le domaine de la santé, les modèles DL aident les radiologues à analyser les scanners médicaux. Les réseaux neuronaux convolutionnels (CNN), une architecture DL populaire pour la vision, peuvent être entraînés à détecter avec une grande précision des anomalies telles que des tumeurs dans les IRM cérébrales ou des signes de maladie dans les rayons X. Cela peut conduire à un diagnostic plus précoce et à de meilleurs résultats pour les patients, comme on le voit dans des applications telles que la détection des tumeurs cérébrales. Cela peut conduire à un diagnostic plus précoce et à une amélioration des résultats pour les patients, comme on le voit dans des applications telles que la détection des tumeurs cérébrales.

Outils et cadres

Le développement de modèles de DL est facilité par diverses bibliothèques et plateformes logicielles. Les cadres de travail populaires à code source ouvert comprennent :

Des plateformes comme Ultralytics HUB fournissent des environnements intégrés pour l'entraînement de modèles personnalisés, le déploiement et la gestion de modèles DL, en particulier pour les tâches de vision par ordinateur utilisant des modèles comme YOLO11. Un développement efficace implique souvent des pratiques telles que le réglage rigoureux des hyperparamètres, la compréhension des mesures de performance et l'utilisation de l'accélération GPU pour un entraînement efficace des modèles. Le développement et le déploiement de ces systèmes complexes sont souvent gérés par des pratiques MLOps.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers