L'analisi delle serie temporali è un metodo statistico utilizzato per analizzare sequenze di punti di dati raccolti nel tempo. L'obiettivo principale è quello di comprendere gli schemi sottostanti, le tendenze, la stagionalità e le componenti cicliche dei dati per prendere decisioni informate o fare previsioni sul futuro. Questa tecnica è fondamentale in diversi campi, in quanto sfrutta i dati storici per prevedere i valori futuri. Si tratta di un'area specializzata nell'ambito del Machine Learning (ML) che si concentra specificamente sui dati ordinati nel tempo.
Concetti fondamentali
La comprensione dei dati delle serie temporali implica l'identificazione di diversi componenti chiave:
- Tendenza: L'aumento o la diminuzione a lungo termine dei dati.
- Stagionalità: Modelli che si ripetono in un periodo fisso, come le fluttuazioni giornaliere, settimanali o annuali.
- Cicli: Fluttuazioni a lungo termine che non hanno un periodo fisso, spesso legate a condizioni economiche o commerciali.
- Rumore/irregolarità: Variazioni casuali e imprevedibili nei dati che rimangono dopo aver tenuto conto di tendenze, stagionalità e cicli.
Un'analisi efficace spesso richiede tecniche di pre-elaborazione dei dati, tra cui la gestione dei valori mancanti e la potenziale trasformazione dei dati per ottenere la stazionarietà (in cui le proprietà statistiche come la media e la varianza rimangono costanti nel tempo), requisito necessario per alcuni modelli tradizionali come l'ARIMA.
Tecniche e modelli
Per l'analisi delle serie temporali vengono impiegate diverse tecniche:
- Metodi classici: Includono medie mobili, lisciatura esponenziale (come Holt-Winters) e modelli di medie mobili autoregressive integrate (ARIMA). Si tratta di approcci statistici consolidati.
- Modelli di apprendimento automatico: Tecniche come le Foreste Casuali o il Gradient Boosting (ad esempio, XGBoost) possono essere adattate per la previsione delle serie temporali, spesso creando caratteristiche ritardate.
- Modelli di apprendimento profondo: Per i modelli complessi, il Deep Learning (DL) offre strumenti potenti. Le reti neurali ricorrenti (RNN), tra cui le LSTM e le GRU, sono state progettate per gestire dati sequenziali. Più recentemente, le architetture Transformer, inizialmente sviluppate per l'elaborazione del linguaggio naturale (NLP), hanno mostrato ottime prestazioni nelle attività relative alle serie temporali. Framework come PyTorch sono comunemente utilizzati per costruire questi modelli.
Applicazioni del mondo reale nell'AI/ML
L'analisi delle serie temporali è fondamentale in molte applicazioni di AI e ML:
- Previsioni finanziarie: Prevedere i prezzi delle azioni, i tassi di cambio o le vendite di un'azienda sulla base di dati finanziari storici. Gli algoritmi analizzano le tendenze passate del mercato e la stagionalità per prevedere i movimenti futuri, aiutando le strategie di investimento e la pianificazione finanziaria. Per saperne di più sull'IA nella finanza.
- Previsione della domanda: I rivenditori utilizzano l'analisi delle serie temporali per prevedere la domanda di prodotti, ottimizzando la gestione delle scorte e le catene di approvvigionamento. Allo stesso modo, le aziende del settore energetico prevedono la domanda di elettricità per garantire la stabilità della rete e l'allocazione efficiente delle risorse, sostenendo gli sforzi di sostenibilità delle energie rinnovabili. Vedi gli esempi della U.S. Energy Information Administration (EIA).
Pur essendo distinti da compiti di Computer Vision (CV) come il rilevamento di oggetti o la segmentazione di immagini eseguiti da modelli come Ultralytics YOLO, i concetti di serie temporali possono intersecarsi nell'analisi video in cui vengono analizzate sequenze di fotogrammi nel tempo, anche se spesso si tratta di modelli spazio-temporali piuttosto che di metodi di serie temporali puri. La gestione del ciclo di vita di questi modelli spesso coinvolge i principi delle Machine Learning Operations (MLOps) e piattaforme come Ultralytics HUB per la sperimentazione e la distribuzione. Anche strumenti come la libreria Prophet di Meta sono popolari per le attività di previsione.