Glossaire

Modélisation prédictive

Découvre comment la modélisation prédictive s'appuie sur l'apprentissage automatique pour prévoir les résultats, optimiser les décisions et favoriser les connaissances dans divers secteurs d'activité.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La modélisation prédictive est une technique ancrée dans l'apprentissage machine (ML) et les statistiques qui utilise des données historiques et actuelles pour prévoir les résultats ou les tendances à venir. En analysant les schémas et les relations au sein des ensembles de données, la modélisation prédictive construit des modèles informatiques capables de générer des prédictions sur des événements futurs inconnus. Cette capacité est vitale pour la prise de décisions éclairées, la planification stratégique et l'optimisation des processus dans de nombreux secteurs, dépassant la simple description du passé pour anticiper l'avenir.

Comment fonctionne la modélisation prédictive

L'idée centrale de la modélisation prédictive est de créer une représentation mathématique ou informatique (un modèle) d'un processus du monde réel pour faire des prévisions. Bien que les spécificités varient grandement en fonction du problème et des données, le processus comporte généralement plusieurs étapes clés :

  1. Collecte et préparation des données : La collecte de données historiques pertinentes constitue la première étape. Ces données subissent ensuite un prétraitement, qui comprend le nettoyage des données, le traitement des valeurs manquantes, la normalisation pour mettre les données à l'échelle de manière appropriée, et l'ingénierie des caractéristiques pour créer des variables d'entrée significatives pour le modèle. La collecte et l'annotation de données de haute qualité sont cruciales.
  2. Sélection du modèle : Le choix du bon algorithme dépend de la nature de la tâche de prédiction (par exemple, prédire une catégorie par rapport à une valeur continue) et des caractéristiques des données. Les types de modèles courants comprennent la régression linéaire et la régression logistique pour les tâches plus simples, les arbres de décision, les forêts aléatoires et des méthodes plus complexes comme les modèles d'apprentissage profond (DL) tels que les réseaux neuronaux convolutifs (CNN) ou les réseaux neuronaux récurrents (RNN).
  3. Formation du modèle : Le modèle sélectionné est formé à l'aide des données historiques préparées(données de formation). Le modèle apprend des modèles en ajustant ses paramètres internes(poids du modèle) pour minimiser la différence entre ses prédictions et les résultats réels des données d'entraînement, souvent guidés par une fonction de perte. Le fait de suivre des conseils pour l'apprentissage du modèle peut améliorer considérablement les résultats. Le réglage des hyperparamètres est souvent nécessaire pour optimiser les performances.
  4. Évaluation du modèle : La capacité du modèle à se généraliser à de nouvelles données inédites est évaluée à l'aide de données de validation et de données de test distinctes. Les performances sont mesurées à l'aide de paramètres pertinents pour la tâche, tels que l'exactitude, la précision, le rappel ou le score F1. Les techniques de validation croisée peuvent fournir une évaluation plus robuste.
  5. Déploiement du modèle : Une fois validé, le modèle est déployé pour faire des prédictions sur de nouvelles données du monde réel. Il peut s'agir de l'intégrer dans des applications logicielles, des tableaux de bord ou des systèmes opérationnels. Il existe différentes options de déploiement de modèles, et le respect des meilleures pratiques en la matière garantit la fiabilité et l'efficacité.

Applications dans le monde réel

La modélisation prédictive offre une prévoyance précieuse, permettant des stratégies proactives et l'optimisation des ressources dans divers domaines. Voici deux exemples concrets :

  1. Prévision de la demande dans le commerce de détail : Les détaillants utilisent la modélisation prédictive pour prévoir la demande de produits. En analysant les données historiques sur les ventes, la saisonnalité, les événements promotionnels et même des facteurs externes comme les indicateurs météorologiques ou économiques, les modèles peuvent prédire les volumes de vente futurs. Cela permet d'optimiser les niveaux de stock, de réduire les ruptures de stock et le surstockage, ce qui permet d'atteindre l'efficacité de la vente au détail grâce à l'IA et d'améliorer la rentabilité. Des techniques comme l'analyse des séries temporelles sont courantes ici.
  2. Stratification des risques des patients dans le domaine de la santé : Dans l'IA en santé, les modèles prédictifs analysent les données des patients (données démographiques, antécédents médicaux, résultats de laboratoire, facteurs liés au mode de vie) pour identifier les personnes présentant un risque élevé de développer certaines maladies (comme le diabète ou les maladies cardiaques) ou de subir des événements indésirables (comme la réadmission à l'hôpital). Cela permet aux prestataires de soins de santé d'intervenir de manière proactive avec des mesures préventives ou des plans de traitement personnalisés, ce qui améliore les résultats pour les patients et permet de gérer les ressources de manière plus efficace.

Parmi les autres utilisations significatives de l'analyse prédictive, on peut citer la maintenance prédictive dans la fabrication, l'évaluation du crédit en IA dans la finance, la prédiction du désabonnement des clients dans les télécommunications, et même la prédiction des schémas de circulation à l'aide de données provenant de systèmes de vision artificielle (CV) effectuant le suivi d'objets avec des modèles tels que... Ultralytics YOLO11.

Modélisation prédictive et concepts connexes

Bien qu'elle soit liée à d'autres techniques analytiques, la modélisation prédictive se concentre distinctement sur la prévision des résultats futurs. Il est utile de la distinguer de :

  • Analyse descriptive : Analyse les données historiques pour résumer ce qui s'est passé (par exemple, calculer les ventes moyennes du dernier trimestre). Elle donne des indications sur le passé mais ne permet pas de faire des prévisions. Explore les différents types d'analyse.
  • Analyse diagnostique : S'attache à comprendre pourquoi quelque chose s'est produit en examinant les données passées (par exemple, chercher à savoir pourquoi les ventes ont chuté dans une région spécifique). Voir cette définition de l'analyse diagnostique.
  • Analyse prescriptive : Va au-delà de la prédiction et recommande des actions pour atteindre les résultats souhaités (par exemple, suggérer des stratégies de tarification optimales pour maximiser les profits). Elle utilise souvent les résultats des modèles prédictifs. Voir cette définition de l'analytique prescriptif.

La modélisation prédictive utilise souvent des techniques d'apprentissage supervisé, où le modèle apprend à partir de données historiques étiquetées (données dont le résultat est déjà connu).

Outils et plateformes

Le développement et le déploiement de modèles prédictifs impliquent souvent l'utilisation de bibliothèques et de plateformes logicielles spécialisées. Les bibliothèques populaires d'apprentissage automatique comme Scikit-learn, et les cadres d'apprentissage profond comme PyTorch et TensorFlow, fournissent les éléments de base de nombreux modèles prédictifs. Des plateformes comme Kaggle proposent des ensembles de données et des environnements pour l'expérimentation. Pour gérer le cycle de vie de bout en bout, des plateformes comme Ultralytics HUB fournissent des outils pour s'entraîner, gérer les ensembles de données, suivre les expériences et déployer les modèles, notamment. Ultralytics YOLO qui, bien qu'ils soient principalement utilisés pour des tâches de vision, peuvent générer des données qui alimentent des systèmes prédictifs plus larges. Des ressources telles que Machine Learning Mastery et Towards Data Science offrent des possibilités d'apprentissage supplémentaires.

Il est essentiel de comprendre la modélisation prédictive pour exploiter efficacement les données afin d'anticiper les tendances futures et de prendre des décisions proactives basées sur les données.

Tout lire