La previsione delle serie temporali è un'area importante dell'apprendimento automatico che viene spesso trascurata.
È importante perché ci sono così tanti problemi di previsione che coinvolgono una componente temporale. Questi problemi vengono trascurati perché è questa componente temporale che rende i problemi delle serie temporali più difficili da gestire.
In questo post scoprirai la previsione delle serie temporali.
Dopo aver letto questo post, saprai:
Definizioni standard di serie temporali, analisi di serie temporali e previsioni di serie temporali.
Le componenti importanti da considerare nei dati delle serie temporali.
Esempi di serie temporali per rendere concreta la tua comprensione.
Cosa sono le Serie temporali?
Un normale set di dati di apprendimento automatico è una raccolta di osservazioni.
Per esempio:
Il tempo gioca un ruolo nei normali set di dati di apprendimento automatico.
Vengono fatte previsioni per nuovi dati quando l'esito effettivo potrebbe non essere noto fino a una data futura. Il futuro viene previsto, ma tutte le osservazioni precedenti vengono quasi sempre trattate allo stesso modo.
Un set di dati di serie temporali è diverso.
Le serie temporali aggiungono un'esplicita dipendenza dall'ordine tra le osservazioni: una dimensione temporale.
Questa dimensione aggiuntiva è sia un vincolo che una struttura che fornisce una fonte di informazioni aggiuntive.
Una serie temporale è una sequenza di osservazioni prese in sequenza nel tempo.
Per esempio:
Tempo #1, osservazione
Tempo #2, osservazione
Tempo #3, osservazione
Descrivere vs. prevedere
Abbiamo obiettivi diversi a seconda che siamo interessati a comprendere un set di dati o fare previsioni.
La comprensione di un set di dati, chiamato analisi delle serie temporali , può aiutare a fare previsioni migliori, ma non è necessario e può comportare un grande investimento tecnico in tempo e competenze non direttamente allineati con il risultato desiderato, ovvero prevedere il futuro.
Nella modellazione descrittiva, o analisi delle serie temporali, una serie storica viene modellata per determinarne le componenti in termini di modelli stagionali, tendenze, relazioni con fattori esterni e simili. … Al contrario, la previsione delle serie temporali utilizza le informazioni in una serie temporale (magari con informazioni aggiuntive) per prevedere i valori futuri di quella serie
Analisi delle serie temporali
Quando si utilizza la statistica classica, la preoccupazione principale è l'analisi delle serie temporali.
L'analisi delle serie temporali implica lo sviluppo di modelli che catturino o descrivano al meglio una serie temporale osservata al fine di comprendere le cause sottostanti. Questo campo di studio cerca il " perché " dietro un set di dati di serie temporali.
Ciò comporta spesso l'elaborazione di ipotesi sulla forma dei dati e la scomposizione delle serie temporali in componenti costitutive.
La qualità di un modello descrittivo è determinata da quanto bene descrive tutti i dati disponibili e dall'interpretazione che fornisce per informare meglio il dominio del problema.
L'obiettivo principale dell'analisi delle serie temporali è sviluppare modelli matematici che forniscano descrizioni plausibili da dati campione
Previsione di serie temporali
Fare previsioni sul futuro è chiamato estrapolazione nella classica gestione statistica dei dati delle serie temporali.
I campi più moderni si concentrano sull'argomento e si riferiscono ad esso come previsione di serie temporali.
La previsione implica l'adattamento dei modelli ai dati storici e il loro utilizzo per prevedere le osservazioni future. I modelli descrittivi possono prendere in prestito per il futuro (ad esempio per attenuare o rimuovere il rumore), cercano solo di descrivere al meglio i dati.
Una distinzione importante nella previsione è che il futuro è completamente indisponibile e deve essere stimato solo da ciò che è già accaduto.
Lo scopo dell'analisi delle serie temporali è generalmente duplice: comprendere o modellare i meccanismi stocastici che danno origine a una serie osservata e prevedere o prevedere i valori futuri di una serie sulla base della storia di quella serie
L'abilità di un modello di previsione delle serie temporali è determinata dalle sue prestazioni nel prevedere il futuro. Questo spesso va a scapito della possibilità di spiegare perché è stata fatta una previsione specifica, gli intervalli di confidenza e una comprensione ancora migliore delle cause alla base del problema.
Componenti principali delle serie temporali
L'analisi delle serie temporali fornisce un insieme di tecniche per comprendere meglio un set di dati.
Forse il più utile di questi è la scomposizione di una serie temporale in 4 parti :
Livello . Il valore della linea di base per la serie se fosse una linea retta.
Tendenza . Il comportamento opzionale e spesso lineare in aumento o diminuzione delle serie nel tempo.
Stagionalità . I modelli o cicli di comportamento ripetuti facoltativi nel tempo.
Rumore . La variabilità opzionale nelle osservazioni che non può essere spiegata dal modello.
Tutte le serie temporali hanno un livello, la maggior parte ha un rumore e l'andamento e la stagionalità sono facoltativi.
Le caratteristiche principali di molte serie temporali sono le tendenze e le variazioni stagionali... un'altra caratteristica importante della maggior parte delle serie temporali è che le osservazioni ravvicinate nel tempo tendono ad essere correlate (dipendenti in serie)
Si può pensare che questi componenti costitutivi si combinino in qualche modo per fornire le serie temporali osservate. Ad esempio, possono essere sommati per formare un modello come segue:
y = livello + trend + stagionalità + rumore
È possibile fare ipotesi su queste componenti sia nel comportamento che nel modo in cui sono combinate, il che consente di modellarle utilizzando metodi statistici tradizionali.
Questi componenti possono anche essere il modo più efficace per fare previsioni sui valori futuri, ma non sempre.
Nei casi in cui questi metodi classici non si traducono in prestazioni efficaci, questi componenti possono comunque essere concetti utili e persino input per metodi alternativi.
Previsione nelle Serie Temporali di cosa preoccuparsi?
Quando si effettuano previsioni, è importante capire il proprio obiettivo.
Usa il metodo Socratico e fai molte domande per aiutarti a ingrandire le specifiche del tuo problema di modellazione predittiva . Per esempio:
Quanti dati hai a disposizione e riesci a raccoglierli tutti insieme? Più dati sono spesso più utili, offrendo maggiori opportunità per l'analisi esplorativa dei dati, il test e l'ottimizzazione del modello e la fedeltà del modello.
Qual è l'orizzonte temporale delle previsioni richiesto? A breve, medio o lungo termine? Orizzonti temporali più brevi sono spesso più facili da prevedere con maggiore sicurezza.
Le previsioni possono essere aggiornate frequentemente nel tempo o devono essere fatte una volta e rimanere statiche? L'aggiornamento delle previsioni man mano che nuove informazioni diventano disponibili si traduce in previsioni più accurate.
Con quale frequenza temporale sono richieste le previsioni? Spesso le previsioni possono essere fatte a frequenze più basse o più alte, consentendo di sfruttare il downsampling e l'upsampling dei dati, che a loro volta possono offrire vantaggi durante la modellazione.
I dati delle serie temporali spesso richiedono pulizia, ridimensionamento e persino trasformazione.
Per esempio:
Frequenza . Forse i dati sono forniti a una frequenza troppo alta per essere modellati o sono distanziati in modo non uniforme nel tempo che richiede il ricampionamento per l'uso in alcuni modelli.
Valori anomali . Forse ci sono valori anomali corrotti o estremi che devono essere identificati e gestiti.
Mancante . Forse ci sono lacune o dati mancanti che devono essere interpolati o imputati.
Spesso i problemi delle serie temporali sono in tempo reale e forniscono continuamente nuove opportunità di previsione. Ciò aggiunge un'onestà alla previsione delle serie temporali che elimina rapidamente le ipotesi sbagliate, gli errori nella modellazione e tutti gli altri modi in cui potremmo essere in grado di ingannare noi stessi.
Esempi di previsione di serie temporali
C'è un'offerta quasi infinita di problemi di previsione delle serie temporali.
Di seguito sono riportati 10 esempi da una serie di settori per rendere più concrete le nozioni di analisi e previsione delle serie temporali.
Prevedere se un tracciato EEG in secondi indica che un paziente sta avendo una crisi o meno.
Previsione del prezzo di chiusura di un'azione ogni giorno.
Previsione del tasso di natalità in tutti gli ospedali di una città ogni anno.
Previsione delle vendite di prodotti in unità vendute ogni giorno per un negozio.
Previsione del numero di passeggeri attraverso una stazione ferroviaria ogni giorno.
Previsione della disoccupazione per uno stato ogni trimestre.
Previsione della domanda di utilizzo su un server ogni ora.
Previsione della dimensione della popolazione di conigli in uno stato ogni stagione riproduttiva.
Previsione del prezzo medio della benzina in una città ogni giorno.
Mi aspetto che sarai in grado di mettere in relazione uno o più di questi esempi con i tuoi problemi di previsione delle serie temporali che vorresti affrontare.
Conclusione
In questo post, hai scoperto la previsione delle serie temporali.
Nello specifico hai imparato:
Informazioni sui dati delle serie temporali e sulla differenza tra l'analisi delle serie temporali e la previsione delle serie temporali.
I componenti costitutivi in cui una serie storica può essere scomposta durante l'esecuzione di un'analisi.
Esempi di problemi di previsione di serie temporali per rendere concrete queste idee.
Hai domande sulla previsione delle serie temporali o su questo post? Fai le tue domande nei commenti qui sotto.
Comentarios