Glossaire

Réseau neuronal (NN)

Découvrez la puissance des réseaux neuronaux - la clé des innovations en matière d'IA et de ML telles que la vision par ordinateur, le NLP et les percées en matière d'apprentissage profond.

Un réseau neuronal (RN) est un modèle informatique inspiré de la structure et de la fonction du cerveau humain. Il constitue l'épine dorsale de la plupart des modèles d'apprentissage profond (DL) et est un concept fondamental de l'intelligence artificielle (IA) moderne. Les NN sont conçus pour reconnaître des modèles dans les données en traitant les informations par le biais de couches interconnectées de nœuds, ou "neurones". Cette structure leur permet d'apprendre à partir de grandes quantités de données, ce qui les rend incroyablement puissants pour des tâches complexes telles que la reconnaissance d'images et le traitement du langage naturel (NLP).

Comment fonctionnent les réseaux neuronaux ?

Un réseau neuronal se compose de trois principaux types de couches : une couche d'entrée, une ou plusieurs couches cachées et une couche de sortie. Chaque couche contient des neurones qui sont connectés aux neurones de la couche suivante.

  1. Couche d'entrée: Cette couche reçoit les données initiales, telles que les pixels d'une image ou les mots d'une phrase.
  2. Couches cachées: Il s'agit des couches intermédiaires entre l'entrée et la sortie. C'est là que se produit la majeure partie du calcul. Chaque neurone applique une transformation mathématique à ses entrées, ce qui implique l'apprentissage des poids du modèle et d'une fonction d'activation telle que ReLU ou Sigmoïde pour déterminer sa sortie. Les réseaux comportant plusieurs couches cachées sont connus sous le nom de réseaux neuronaux "profonds".
  3. Couche de sortie: Cette dernière couche produit le résultat, tel qu'une étiquette de classification ou une valeur prédite.

Le processus d'apprentissage, appelé formation, consiste à alimenter le réseau avec de grands ensembles de données. Le réseau fait une prédiction, la compare au résultat réel et calcule une erreur à l'aide d'une fonction de perte. Il utilise ensuite un algorithme appelé rétropropagation pour ajuster les poids de ses connexions afin de minimiser cette erreur au cours de nombreuses itérations, ou époques. Ce processus est guidé par un algorithme d'optimisation comme Adam.

Réseaux neuronaux et concepts connexes

Il est important de distinguer les réseaux de neurones d'autres termes apparentés :

  • Apprentissage automatique et réseaux neuronaux: L'apprentissage automatique est un vaste domaine de l'intelligence artificielle, et les réseaux neuronaux ne sont qu'un type de modèle d'apprentissage automatique. Parmi les autres modèles d'apprentissage automatique figurent les arbres de décision et les machines à vecteurs de support (SVM), qui n'utilisent pas l'architecture en couches des neurones.
  • Apprentissage profond et réseaux neuronaux: L'apprentissage profond est un sous-domaine de la ML qui utilise spécifiquement des réseaux neuronaux profonds - des réseaux neuronaux avec de nombreuses couches cachées. Par conséquent, tous les systèmes d'apprentissage profond sont basés sur des réseaux neuronaux, mais un simple réseau neuronal avec une seule couche cachée pourrait ne pas être considéré comme "profond".

Types et applications des réseaux neuronaux

Les réseaux neuronaux sont incroyablement polyvalents et ont été adaptés à diverses architectures spécialisées. En voici deux exemples clés :

  1. Vision par ordinateur (CV): Les réseaux neuronaux convolutifs (CNN) constituent la force dominante dans le domaine de la vision par ordinateur.

  2. Traitement du langage naturel (NLP): Les réseaux neuronaux, y compris les réseaux neuronaux récurrents (RNN) et les transformateurs, ont révolutionné la manière dont les machines traitent le langage.

    • Traduction automatique: Des services comme Google Translate s'appuient sur des réseaux complexes pour traduire automatiquement des textes d'une langue à l'autre avec une précision remarquable.
    • Analyse des sentiments: Les entreprises utilisent les NN pour analyser les commentaires des clients et des médias sociaux afin de déterminer le ton émotionnel (positif, négatif ou neutre), comme l'explique IBM dans cet aperçu de l'analyse des sentiments.

Outils et cadres

Le développement des NN est rendu accessible par des outils et des cadres puissants.

  • Bibliothèques: Des frameworks comme PyTorch et TensorFlow fournissent les éléments essentiels à la création et à l'entraînement des NN. Pour en savoir plus, consultez les sites officiels de PyTorch et de TensorFlow.
  • Plateformes: Ultralytics HUB offre une plateforme intégrée pour l'entraînement des modèles YOLO, la gestion des ensembles de données et la simplification du processus de déploiement des modèles.
  • Modèles pré-entraînés: De nombreux chercheurs et développeurs commencent par utiliser des modèles pré-entraînés disponibles sur des plateformes telles que Hugging Face ou au sein de l'écosystème Ultralytics. Ces modèles ne nécessitent souvent qu'une mise au point sur un ensemble de données spécifique, ce qui permet d'économiser beaucoup de temps et de ressources informatiques. Vous trouverez des comparaisons entre différents modèles YOLO dans notre documentation.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers