L'analyse des séries temporelles est une méthode statistique utilisée pour analyser des séquences de points de données recueillies au fil du temps. L'objectif principal est de comprendre les modèles sous-jacents, les tendances, la saisonnalité et les composantes cycliques au sein des données afin de prendre des décisions éclairées ou de faire des prédictions sur l'avenir. Cette technique est fondamentale dans divers domaines, car elle exploite les données historiques pour prévoir les valeurs futures. Il s'agit d'un domaine spécialisé de l'apprentissage machine (ML) qui se concentre spécifiquement sur les données ordonnées dans le temps.
Concepts de base
Pour comprendre les données des séries chronologiques, il faut identifier plusieurs éléments clés :
- Tendance : L'augmentation ou la diminution à long terme des données.
- Saisonnalité : Modèles qui se répètent sur une période fixe, tels que les fluctuations quotidiennes, hebdomadaires ou annuelles.
- Cycles : Fluctuations à plus long terme qui ne sont pas d'une durée fixe, souvent liées à la conjoncture économique ou commerciale.
- Bruit/irrégularité : Variations aléatoires et imprévisibles des données qui subsistent après avoir pris en compte la tendance, la saisonnalité et les cycles.
Une analyse efficace nécessite souvent des techniques de prétraitement des données, y compris le traitement des valeurs manquantes et éventuellement la transformation des données pour atteindre la stationnarité (où les propriétés statistiques telles que la moyenne et la variance restent constantes dans le temps), ce qui est une exigence pour certains modèles traditionnels tels que ARIMA.
Techniques et modèles
Diverses techniques sont employées pour l'analyse des séries temporelles :
- Méthodes classiques : Comprennent les moyennes mobiles, le lissage exponentiel (comme Holt-Winters) et les modèles de moyennes mobiles intégrées autorégressives (ARIMA). Il s'agit d'approches statistiques bien établies.
- Modèles d'apprentissage automatique : Des techniques telles que les forêts aléatoires ou le Gradient Boosting (par exemple, XGBoost) peuvent être adaptées aux prévisions de séries temporelles, souvent en créant des caractéristiques décalées.
- Modèles d'apprentissage profond : Pour les modèles complexes, le Deep Learning (DL) offre des outils puissants. Les réseaux neuronaux récurrents (RNN), notamment les LSTM et les GRU, sont conçus pour traiter les données séquentielles. Plus récemment, les architectures Transformer, initialement développées pour le traitement du langage naturel (NLP), ont montré de solides performances dans les tâches de séries temporelles. Des structures telles que PyTorch sont couramment utilisés pour construire ces modèles.
Applications concrètes de l'IA/ML
L'analyse des séries temporelles est cruciale dans de nombreuses applications d'IA et de ML :
- Prévisions financières : Prédire le cours des actions, les taux de change ou les ventes d'une entreprise en se basant sur des données financières historiques. Les algorithmes analysent les tendances passées du marché et la saisonnalité pour prévoir les mouvements futurs, ce qui facilite les stratégies d'investissement et la planification financière. En savoir plus sur l'IA dans la finance.
- Prévision de la demande : Les détaillants utilisent l'analyse des séries chronologiques pour prédire la demande de produits, optimisant ainsi la gestion des stocks et les chaînes d'approvisionnement. De même, les entreprises du secteur de l'énergie prévoient la demande d'électricité pour assurer la stabilité du réseau et l'allocation efficace des ressources, soutenant ainsi les efforts de durabilité dans le domaine des énergies renouvelables. Voir les exemples de l'Administration américaine d'information sur l'énergie (EIA).
Bien que distincts des tâches de vision par ordinateur (VA) comme la détection d'objets ou la segmentation d'images réalisées par des modèles comme Ultralytics YOLO, les concepts de séries temporelles peuvent se croiser dans l'analyse vidéo où des séquences d'images sont analysées dans le temps, bien que faisant souvent appel à des modèles spatio-temporels plutôt qu'à des méthodes de séries temporelles pures. La gestion du cycle de vie de ces modèles implique souvent des principes d'opérations d'apprentissage automatique (MLOps) et des plateformes comme Ultralytics HUB pour l'expérimentation et le déploiement. Des outils comme la bibliothèque Prophet de Meta sont également populaires pour les tâches de prévision.