Glossaire

Poids des modèles

Découvre l'importance des poids des modèles dans l'apprentissage automatique, leur rôle dans les prédictions, et comment Ultralytics YOLO simplifie leur utilisation pour les tâches d'IA.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

Les poids du modèle sont les paramètres fondamentaux qu'un modèle d'apprentissage automatique apprend au cours de son processus de formation. Ces valeurs numériques représentent les connaissances acquises à partir des données de formation et sont fondamentales pour la façon dont le modèle fait des prédictions ou prend des décisions sur de nouvelles données inédites. Essentiellement, les poids déterminent la force et l'importance des connexions au sein du modèle, comme entre les neurones d'un réseau neuronal (NN).

Comprendre les poids des modèles

Imagine une machine complexe avec de nombreux boutons réglables ; les poids du modèle agissent comme ces boutons. Au cours de l'apprentissage, on montre au modèle des exemples tirés d'un ensemble de données et il fait des prédictions. La différence entre ces prédictions et les bonnes réponses réelles (vérité de terrain) est mesurée par une fonction de perte. Un algorithme d'optimisation, tel que SGD (Stochastic Gradient Descent) ou Adam, ajuste alors systématiquement ces poids pour minimiser cette perte. Ce processus est répété sur de nombreuses itérations, ou époques, en affinant progressivement les poids. Au départ, les poids sont souvent réglés sur de petites valeurs aléatoires, mais grâce à l'entraînement, ils convergent vers des valeurs qui capturent les modèles sous-jacents des données. Il est important de distinguer les poids des hyperparamètres, comme le taux d'apprentissage ou la taille du lot, qui sont définis avant l' apprentissage et guident le processus d'apprentissage lui-même, au lieu d'être appris pendant celui-ci. Les biais, un autre type de paramètre appris que l'on retrouve souvent aux côtés des poids dans les NN, représentent l'activation de base d'un neurone.

L'importance des poids des modèles

Les poids du modèle sont essentiels car ils codent les modèles et les relations appris à partir des données d'apprentissage. Des poids bien optimisés permettent à un modèle de se généraliser efficacement, en faisant des prédictions précises sur des données qu'il n'a jamais rencontrées auparavant. La qualité des poids a un impact direct sur les performances du modèle, telles que la précision et la robustesse. Des poids mal formés, souvent dus à des problèmes tels que des données insuffisantes ou un surajustement, entraînent des prédictions peu fiables.

Dans de nombreuses applications modernes de l'IA, en particulier dans le domaine de la vision par ordinateur (VA), les modèles sont souvent pré-entraînés sur de grands ensembles de données générales comme ImageNet ou COCO. Les poids qui en résultent capturent des caractéristiques visuelles générales. Ces poids pré-entraînés, tels que ceux disponibles pour les modèlesYOLO d 'Ultralytics , peuvent ensuite être utilisés directement pour l'inférence ou comme point de départ pour un réglage fin sur une tâche spécifique ou un ensemble de données personnalisé. Cette technique, connue sous le nom d'apprentissage par transfert, accélère considérablement la formation et permet souvent d'obtenir de meilleures performances, en particulier avec des données personnalisées limitées. Tu peux gérer et former des modèles avec des poids spécifiques en utilisant des plateformes comme Ultralytics HUB.

Applications dans le monde réel

Les poids des modèles sont le moteur d'innombrables applications d'intelligence artificielle :

  1. Détection d'objets dans les véhicules autonomes: Modèles comme Ultralytics YOLOv8 utilisent les poids qu'ils ont appris pour identifier et localiser des objets tels que des voitures, des piétons et des panneaux de signalisation dans des flux vidéo en temps réel, ce qui permet une navigation plus sûre. Les poids déterminent la façon dont le modèle interprète les motifs des pixels pour reconnaître ces objets spécifiques.
  2. Analyse d'images médicales pour la détection de maladies: Dans le domaine de la santé, les modèles d'IA formés sur des images médicales (comme les radiographies ou les IRM) utilisent leurs poids pour détecter des anomalies subtiles révélatrices de maladies, comme l'identification de tumeurs potentielles dans les scanners cérébraux à l'aide d'ensembles de données tels que l'ensemble de données sur les tumeurs cérébrales. Les poids codent les caractéristiques visuelles apprises à partir de milliers d'images médicales annotées. Des outils comme Weights & Biases peuvent aider à suivre les expériences qui produisent ces poids.
Tout lire