Sunday 12 November 2017

Previsione Mobile Media Modello


Moving Average Introduzione Previsione. Come si può immaginare che stiamo guardando alcuni degli approcci più primitive di previsione. Ma si spera che questi sono almeno un'introduzione utile per alcuni dei problemi informatici relativi all'attuazione previsioni nei fogli di calcolo. In questo filone si continuerà avviando all'inizio e iniziare a lavorare con Moving previsioni medie. Spostamento previsioni medie. Tutti conoscono lo spostamento previsioni medie indipendentemente dal fatto che credono di essere. Tutti gli studenti universitari fanno loro tutto il tempo. Pensa ai tuoi punteggi dei test in un corso dove si sta andando ad avere quattro prove durante il semestre. Consente di assumere hai un 85 sul vostro primo test. Che cosa prevedere per il secondo punteggio test Cosa pensi che la tua insegnante di prevedere per il prossimo punteggio test Cosa pensi che i tuoi amici potrebbero prevedere per il prossimo punteggio test Cosa pensi che i tuoi genitori potrebbero prevedere per il prossimo punteggio del test Indipendentemente tutto il blabbing si potrebbe fare ai tuoi amici e genitori, e il vostro insegnante è molto probabile che si aspettano di ottenere qualcosa nella zona del 85 che avete appena ottenuto. Bene, ora lascia supporre che, nonostante la vostra auto-promozione per i tuoi amici, ti sopravvalutare se stessi e capire che si può studiare meno per la seconda prova e così si ottiene un 73. Ora, che sono tutti di interessati e indifferente andare a anticipare avrete sulla vostra terza prova ci sono due approcci molto probabili per loro di sviluppare una stima indipendentemente dal fatto che condivideranno con voi. Essi possono dire a se stessi, quotThis ragazzo è sempre soffia il fumo delle sue intelligenza. Hes andando ad ottenere un altro 73 se hes fortuna. Forse i genitori cercano di essere più solidali e dire, quotWell, finora youve acquistasti un 85 e un 73, quindi forse si dovrebbe capire su come ottenere circa una (85 73) 2 79. Non so, forse se l'avete fatto meno festa e werent scodinzolante la donnola tutto il luogo e se hai iniziato a fare molto di più lo studio si potrebbe ottenere una maggiore score. quot Entrambe queste stime sono in realtà in movimento le previsioni medie. Il primo sta usando solo il tuo punteggio più recente di prevedere le prestazioni future. Questo si chiama una previsione media mobile utilizzando uno periodo di dati. Il secondo è anche una previsione media mobile ma utilizzando due periodi di dati. Lascia supporre che tutte queste persone busting sulla vostra grande mente hanno sorta di voi incazzato e si decide di fare bene sulla terza prova per le proprie ragioni e di mettere un punteggio più alto di fronte al vostro quotalliesquot. Si prende il test e il punteggio è in realtà un 89 Tutti, compreso te stesso, è impressionato. Così ora avete la prova finale del semestre in arrivo e come al solito si sente il bisogno di pungolare tutti a fare le loro previsioni su come youll fare l'ultimo test. Beh, speriamo che si vede il motivo. Ora, si spera si può vedere il modello. Quale credi sia la più accurata Whistle mentre lavoriamo. Ora torniamo alla nostra nuova impresa di pulizie ha iniziato dal sorellastra estraniato chiamato Whistle mentre lavoriamo. Hai alcuni dati di vendita del passato rappresentata dalla sezione seguente da un foglio di calcolo. Per prima cosa presentiamo i dati per un periodo di tre movimento previsione media. La voce per cella C6 dovrebbe essere Ora è possibile copiare questa formula cella verso le altre cellule C7-C11. Si noti come le mosse medi durante il più recente dei dati storici, ma utilizza esattamente i tre periodi più recenti disponibili per ogni previsione. Si dovrebbe anche notare che noi non veramente bisogno di fare le previsioni per i periodi precedenti al fine di sviluppare la nostra più recente previsione. Questo è sicuramente diverso dal modello di livellamento esponenziale. Ive ha incluso il predictionsquot quotpast perché li useremo nella pagina web successiva per misurare la previsione di validità. Ora voglio presentare i risultati analoghi per un periodo di movimento previsione media di due. La voce per cella C5 dovrebbe essere Ora è possibile copiare questa formula cella verso le altre cellule C6-C11. Notate come ora solo i due più recenti pezzi di dati storici sono utilizzati per ogni previsione. Ancora una volta ho incluso il predictionsquot quotpast a scopo illustrativo e per un uso successivo nella convalida del tempo. Alcune altre cose che sono importanti per notare. Per un periodo di m-movimento previsione media solo il m valori dei dati più recenti sono usati per fare la previsione. Nient'altro è necessario. Per un periodo di m-movimento previsione media, quando si effettua predictionsquot quotpast, si noti che la prima previsione si verifica nel periodo m 1. Entrambi questi aspetti sarà molto significativo quando sviluppiamo il nostro codice. Sviluppare la Moving Average funzione. Ora abbiamo bisogno di sviluppare il codice per la previsione media mobile che può essere utilizzato in modo più flessibile. Il codice segue. Si noti che gli ingressi sono per il numero di periodi che si desidera utilizzare nella previsione e la matrice dei valori storici. È possibile memorizzare in qualsiasi cartella di lavoro che si desidera. Media mobile Funzione (storici, NumberOfPeriods) As Single Dichiarazione e inizializzazione delle variabili ARTICOLO Dim come variante Dim contatore come Integer Dim accumulo As Single Dim HistoricalSize come numero intero inizializzazione delle variabili contatore 1 Accumulo 0 Determinazione della dimensione della matrice storica HistoricalSize Historical. Count per il contatore 1 Per NumberOfPeriods accumulare il numero appropriato di più recenti valori precedentemente osservati accumulo accumulazione storica (HistoricalSize - NumberOfPeriods Counter) media mobile accumulo NumberOfPeriods il codice verrà spiegato in classe. Si desidera posizionare la funzione sul foglio in modo che il risultato del calcolo appare dove dovrebbe come i following. sourceforge. openforecast. models Classe A MovingAverageModel modello a media mobile previsione si basa su una serie storica costruito artificialmente in cui il valore di un dato periodo di tempo viene sostituito dalla media di tale valore e i valori di un determinato numero di precedenti e successivi periodi di tempo. Come avrete intuito dalla descrizione, questo modello è più adatto ai dati di serie temporali cioè dati che cambiano nel corso del tempo. Per esempio, molte classifiche dei singoli titoli sul mercato azionario mostrano 20, 50, 100 o 200 giorni medie mobili come un modo per mostrare le tendenze. Poiché il valore del tempo per un dato periodo è una media dei periodi precedenti, allora il tempo sarà sempre sembrano restare indietro aumenta o diminuisce nei valori osservati (dipendenti). Ad esempio, se una serie di dati ha una tendenza all'aumento noticable quindi una previsione media mobile sarà generalmente fornire una sottostima dei valori della variabile dipendente. Il metodo della media mobile ha un vantaggio rispetto ad altri modelli di previsione nel senso che non smussare i picchi e le depressioni (o valli) in una serie di osservazioni. Tuttavia, ha anche diversi svantaggi. In particolare, questo modello non produce un'equazione reale. Pertanto, non è poi così utile come strumento di previsione medio-lungo raggio. Può affidabile solo essere utilizzato per prevedere uno o due periodi nel futuro. Il modello di media mobile è un caso speciale della media più generale mobile ponderata. Nella media mobile semplice, tutti i pesi sono uguali. Dal: 0.3 Autore: Steven R. Gould campi ereditati dalla classe net. sourceforge. openforecast. models. AbstractForecastingModel MovingAverageModel () Costruisce un nuovo modello a media mobile di previsione. MovingAverageModel (periodo int) Costruisce un nuovo movimento modello di previsione media, utilizzando il periodo specificato. getForecastType () Restituisce un nome di una o due parole di questo tipo di modello di previsione. init (DataSet dataSet) utilizzato per inizializzare il modello di media mobile. toString () Questo dovrebbe essere ignorato per fornire una descrizione testuale del modello di previsione attuale, per quanto possibile, eventuali parametri derivati ​​utilizzati. Metodi ereditati dalla classe net. sourceforge. openforecast. models. WeightedMovingAverageModel MovingAverageModel costruisce un nuovo modello a media mobile di previsione. Per un valido modello da costruire, si dovrebbe chiamare init e passare in un insieme di dati che contiene una serie di punti dati con la variabile tempo inizializzato per identificare la variabile indipendente. MovingAverageModel Costruisce un nuovo movimento modello di previsione media, utilizzando il nome dato come variabile indipendente. Parametri: independentVariable - il nome della variabile indipendente da utilizzare in questo modello. MovingAverageModel Costruisce un nuovo movimento modello di previsione media, utilizzando il periodo specificato. Per un valido modello da costruire, si dovrebbe chiamare init e passare in un insieme di dati che contiene una serie di punti dati con la variabile tempo inizializzato per identificare la variabile indipendente. Il valore del periodo viene utilizzato per determinare il numero di osservazioni da utilizzare per calcolare la media mobile. Ad esempio, per una media mobile a 50 giorni in cui i punti sono osservazioni giornaliere, allora il periodo dovrebbe essere fissato a 50. Il termine viene usato per determinare la quantità di periodi futuri che possono efficacemente essere previsto. Con una media mobile 50 giorni, allora non possiamo ragionevolmente - con qualsiasi grado di precisione - prevedere più di 50 giorni oltre l'ultimo periodo per il quale sono disponibili i dati. Questo può essere più vantaggioso rispetto, ad esempio un periodo di 10 giorni, dove abbiamo potuto solo ragionevolmente prevedere 10 giorni oltre l'ultimo periodo. Parametri: periodo - il numero di osservazioni da utilizzare per il calcolo della media mobile. MovingAverageModel Costruisce un nuovo movimento modello di previsione media, utilizzando il nome dato come variabile indipendente e il periodo specificato. Parametri: independentVariable - il nome della variabile indipendente da utilizzare in questo modello. periodo - il numero di osservazioni da utilizzare per il calcolo della media mobile. Utilizzato per inizializzare il modello di media mobile. Questo metodo deve essere chiamato prima di qualsiasi altro metodo nella classe. Dal momento che il modello di media mobile non deriva alcuna equazione per la previsione, questo metodo utilizza il DataSet di ingresso per calcolare i valori di previsione per tutti i valori validi della variabile tempo indipendente. Specificato da: init nell'interfaccia ForecastingModel Sostituzioni: init in classe AbstractTimeBasedModel Parametri: dataSet - un set di dati di osservazioni che possono essere utilizzate per inizializzare i parametri di previsione del modello di previsione. getForecastType Restituisce un nome di una o due parole di questo tipo di modello di previsione. Mantenere questo breve. Una descrizione più lunga dovrebbe essere attuato nel metodo toString. Questo dovrebbe essere ignorato per fornire una descrizione testuale del modello di previsione attuale, per quanto possibile, eventuali parametri derivati ​​utilizzati. Specificato da: toString in un'interfaccia ForecastingModel Sostituzioni: toString in ritorni di classe WeightedMovingAverageModel: una rappresentazione di stringa del modello di previsione corrente, e la sua parameters. In praticano la media mobile fornirà una buona stima della media della serie tempo se la media è costante o lentamente cambiando. Nel caso di una media costante, il più grande valore di m darà la migliore stima del mezzo sottostante. Un periodo di osservazione più lungo sarà mediare gli effetti della variabilità. Lo scopo di fornire una più piccola m è quello di permettere la previsione di rispondere ad un cambiamento nel processo sottostante. Per illustrare, proponiamo un insieme di dati che incorpora i cambiamenti nel mezzo di base della serie storica. La figura mostra la serie storica utilizzata per l'illustrazione insieme con la domanda media da cui è stata generata la serie. La media inizia come una costante a 10. Partendo tempo 21, aumenta di una unità in ciascun periodo fino a raggiungere il valore di 20 al momento 30. Allora diventa di nuovo costante. I dati vengono simulato aggiungendo alla media, un rumore casuale da una distribuzione normale con media nulla e deviazione standard 3. I risultati della simulazione sono arrotondati all'intero più vicino. La tabella mostra le osservazioni simulate utilizzati per l'esempio. Quando usiamo la tabella, dobbiamo ricordare che in un dato momento, solo i dati del passato sono noti. Le stime del parametro del modello, per tre diversi valori di m sono mostrati insieme con la media della serie storiche nella figura sottostante. La figura mostra la stima media mobile della media in ogni momento e senza la previsione. Le previsioni dovrebbero spostare le curve di media mobile a destra da punti. Una conclusione è immediatamente evidente dalla figura. Per tutte e tre le stime della media mobile è in ritardo rispetto l'andamento lineare, con il ritardo aumenta con m. Il ritardo è la distanza tra il modello e la stima della dimensione temporale. A causa del ritardo, la media mobile sottovaluta le osservazioni come la media è in aumento. La polarizzazione dello stimatore è la differenza in un momento specifico nel valore medio del modello e il valore medio previsto dalla media mobile. La polarizzazione quando aumenta la media è negativo. Per una media decrescente, la polarizzazione è positivo. Il ritardo nel tempo e la distorsione introdotta nella stima sono funzioni di m. Maggiore è il valore di m. maggiore è la grandezza di lag e polarizzazione. Per una serie sempre crescente con andamento a. i valori di ritardo e distorsione dello stimatore della media è data nelle equazioni seguenti. Le curve di esempio non corrispondono queste equazioni, perché il modello di esempio, non è in continuo aumento, piuttosto che inizia come una costante, modifiche a una tendenza e poi diventa di nuovo costante. Anche le curve di esempio sono influenzate dal rumore. La previsione media mobile di periodi nel futuro è rappresentato spostando le curve a destra. Il ritardo e pregiudizi aumentano proporzionalmente. Le equazioni di sotto indicano il ritardo e la polarizzazione di un periodi di previsione nel futuro rispetto ai parametri del modello. Di nuovo, queste formule sono per una serie temporale con un andamento lineare costante. Non dovremmo essere sorpresi di questo risultato. Lo stimatore media mobile è basata sull'ipotesi di una media costante, e l'esempio ha un andamento lineare nel mezzo durante una parte del periodo di studio. Poiché serie tempo reale raramente esattamente obbedire alle ipotesi di qualsiasi modello, dobbiamo essere preparati per tali risultati. Possiamo anche concludere dalla figura che la variabilità del rumore ha il più grande effetto per piccole m. La stima è molto più volatile per la media mobile 5 rispetto alla media mobile di 20. Abbiamo i desideri contrastanti per aumentare m per ridurre l'effetto della variabilità dovuta al rumore, e di diminuire m per rendere la previsione più sensibile alle variazioni in media. L'errore è la differenza tra i dati effettivi e il valore previsto. Se la serie temporale è veramente un valore costante il valore atteso dell'errore è zero e la varianza dell'errore è costituito da un termine che è una funzione di e un secondo termine che è la varianza del rumore,. Il primo termine è la varianza della media stimata con un campione di m osservazioni, assumendo i dati provengono da una popolazione con una media costante. Questo termine viene minimizzato rendendo m più grande possibile. Una grande m rende la previsione risponde ad un cambiamento nelle serie temporali sottostante. Per rendere la previsione sensibile ai cambiamenti, vogliamo M più piccolo possibile (1), ma questo aumenta la varianza dell'errore. previsione pratica richiede un valore intermedio. Previsione con Excel Il componente aggiuntivo Forecasting implementa le formule media mobile. L'esempio seguente mostra l'analisi fornita dal componente aggiuntivo per i dati di esempio nella colonna B. I primi 10 osservazioni sono indicizzati -9 attraverso 0. Rispetto alla tabella di cui sopra, gli indici di periodo sono spostati da -10. I primi dieci osservazioni forniscono i valori di avvio per la stima e vengono utilizzati per calcolare la media mobile per il periodo 0. Il MA (10) della colonna (C) mostra le medie mobili calcolate. La media mobile parametro m è nella cella C3. La parte anteriore (1) colonna (D) mostra una previsione per un periodo nel futuro. L'intervallo di previsione è in cella D3. Quando l'intervallo di tempo viene modificato in un numero maggiore i numeri nella colonna Fore sono spostati verso il basso. La colonna Err (1) (E) mostra la differenza tra l'osservazione e la previsione. Ad esempio, l'osservazione al tempo 1 è 6. Il valore previsto fatta dalla media mobile al tempo 0 è 11.1. L'errore quindi è -5.1. La deviazione standard e media deviazione media (MAD) sono calcolati in cellule E6 e E7 respectively. Moving media e modelli di livellamento esponenziale Come primo passo nel muoversi oltre i modelli medi, modelli random walk, e modelli di tendenza lineare, i modelli non stagionali e le tendenze possono essere estrapolati utilizzando un modello a media mobile o levigante. L'assunto di base dietro media e modelli di livellamento è che la serie temporale è localmente stazionario con una media lentamente variabile. Quindi, prendiamo una media mobile (locale) per stimare il valore corrente della media e poi utilizzarla come la previsione per il prossimo futuro. Questo può essere considerato come un compromesso tra il modello media e la deriva modello random walk-senza-. La stessa strategia può essere utilizzata per stimare e estrapolare una tendenza locale. Una media mobile è spesso chiamato una versione quotsmoothedquot della serie originale, perché la media a breve termine ha l'effetto di appianare i dossi nella serie originale. Regolando il grado di lisciatura (la larghezza della media mobile), possiamo sperare di colpire un qualche tipo di equilibrio ottimale tra le prestazioni dei modelli medi e random walk. Il tipo più semplice di modello di media è il. Semplice (equamente ponderate) Media mobile: Le previsioni per il valore di Y al tempo t1 che viene fatta al tempo t è pari alla media semplice dei più recenti osservazioni m: (Qui e altrove mi utilizzerà il simbolo 8220Y-hat8221 di stare per una previsione di serie temporali Y fatta quanto prima prima possibile da un dato modello.) Questa media è centrato periodo t - (m1) 2, il che implica che la stima della media locale tenderà a restare indietro il vero valore della media locale circa (m1) 2 periodi. Così, diciamo l'età media dei dati nella media mobile semplice (m1) 2 rispetto al periodo per il quale è calcolata la previsione: questa è la quantità di tempo per cui previsioni tenderanno a restare indietro ruotando punti nei dati . Ad esempio, se si sta una media degli ultimi 5 valori, le previsioni saranno circa 3 periodi in ritardo nel rispondere a punti di svolta. Si noti che se m1, il modello di media mobile semplice (SMA) è equivalente al modello random walk (senza crescita). Se m è molto grande (paragonabile alla lunghezza del periodo di stima), il modello SMA è equivalente al modello medio. Come con qualsiasi parametro di un modello di previsione, è consuetudine per regolare il valore di k per ottenere la migliore quotfitquot ai dati, cioè i più piccoli errori di previsione in media. Ecco un esempio di una serie che sembra mostrare fluttuazioni casuali intorno a una media lentamente variabile. Innanzitutto, proviamo per adattarsi con un modello casuale, che è equivalente a una media mobile semplice di 1 termine: Il modello random walk risponde molto velocemente alle variazioni della serie, ma così facendo raccoglie gran parte del quotnoisequot nel dati (le fluttuazioni casuali) e il quotsignalquot (media locale). Se invece cerchiamo una semplice media mobile di 5 termini, si ottiene un insieme più agevole dall'aspetto delle previsioni: Il 5-termine mobile semplice rese medie in modo significativo gli errori più piccoli rispetto al modello random walk in questo caso. L'età media dei dati di questa previsione è 3 ((51) 2), in modo che tende a ritardo punti di svolta da circa tre periodi. (Per esempio, una flessione sembra essersi verificato in periodo di 21, ma le previsioni non girare intorno fino a diversi periodi più tardi.) Si noti che le previsioni a lungo termine dal modello SMA sono una retta orizzontale, proprio come nel random walk modello. Pertanto, il modello SMA presuppone che vi sia alcuna tendenza nei dati. Tuttavia, mentre le previsioni del modello random walk sono semplicemente uguale all'ultimo valore osservato, le previsioni del modello di SMA sono pari ad una media ponderata dei valori ultimi. I limiti di confidenza calcolato dai Statgraphics per le previsioni a lungo termine della media mobile semplice non ottengono più ampio con l'aumento della previsione all'orizzonte. Questo ovviamente non è corretto Purtroppo, non vi è alcuna teoria statistica di fondo che ci dice come gli intervalli di confidenza deve ampliare per questo modello. Tuttavia, non è troppo difficile da calcolare le stime empiriche dei limiti di confidenza per le previsioni di più lungo orizzonte. Ad esempio, è possibile impostare un foglio di calcolo in cui il modello SMA sarebbe stato utilizzato per prevedere 2 passi avanti, 3 passi avanti, ecc all'interno del campione di dati storici. È quindi possibile calcolare le deviazioni standard campione degli errori in ogni orizzonte di previsione, e quindi la costruzione di intervalli di confidenza per le previsioni a lungo termine aggiungendo e sottraendo multipli della deviazione standard appropriato. Se cerchiamo una media del 9 termine semplice movimento, otteniamo le previsioni ancora più fluide e più di un effetto ritardo: L'età media è ora 5 punti ((91) 2). Se prendiamo una media mobile 19-termine, l'età media aumenta a 10: Si noti che, in effetti, le previsioni sono ora in ritardo punti di svolta da circa 10 periodi. Quale quantità di smoothing è meglio per questa serie Ecco una tabella che mette a confronto le loro statistiche di errore, anche compreso in media 3-termine: Modello C, la media mobile a 5-termine, i rendimenti il ​​valore più basso di RMSE da un piccolo margine su 3 - term e 9 termine medie, e le loro altre statistiche sono quasi identici. Così, tra i modelli con le statistiche di errore molto simili, possiamo scegliere se avremmo preferito un po 'più di risposta o un po' più scorrevolezza nelle previsioni. (Torna a inizio pagina.) Browns semplice esponenziale (media mobile esponenziale ponderata) Il modello a media mobile semplice di cui sopra ha la proprietà indesiderabile che tratta le ultime osservazioni k ugualmente e completamente ignora tutte le osservazioni che precedono. Intuitivamente, dati passati devono essere attualizzati in modo più graduale - per esempio, il più recente osservazione dovrebbe avere un peso poco più di 2 più recente, e la 2 più recente dovrebbe ottenere un po 'più peso che la 3 più recente, e presto. Il modello semplice di livellamento esponenziale (SES) realizza questo. Diamo 945 denotano una constantquot quotsmoothing (un numero compreso tra 0 e 1). Un modo per scrivere il modello è quello di definire una serie L che rappresenta il livello attuale (cioè il valore medio locale) della serie come stimato dai dati fino ad oggi. Il valore di L al momento t è calcolata in modo ricorsivo dal proprio valore precedente in questo modo: Così, il valore livellato corrente è una interpolazione tra il valore livellato precedente e l'osservazione corrente, dove 945 controlla la vicinanza del valore interpolato al più recente osservazione. Le previsioni per il prossimo periodo è semplicemente il valore livellato corrente: Equivalentemente, possiamo esprimere la prossima previsione direttamente in termini di precedenti previsioni e osservazioni precedenti, in una delle seguenti versioni equivalenti. Nella prima versione, la previsione è una interpolazione tra precedente meteorologiche e precedente osservazione: Nella seconda versione, la prossima previsione è ottenuta regolando la previsione precedente nella direzione dell'errore precedente di una quantità frazionaria 945. è l'errore al tempo t. Nella terza versione, la previsione è di un (cioè scontato) media mobile esponenziale ponderata con fattore di sconto 1- 945: La versione di interpolazione della formula di previsione è il più semplice da usare se si implementa il modello su un foglio di calcolo: si inserisce in un singola cellula e contiene i riferimenti di cella che puntano alla previsione precedente, l'osservazione precedente, e la cella in cui è memorizzato il valore di 945. Si noti che se 945 1, il modello SES è equivalente ad un modello random walk (senza crescita). Se 945 0, il modello SES è equivalente al modello medio, assumendo che il primo valore livellato è impostata uguale alla media. (Torna a inizio pagina). L'età media dei dati nelle previsioni semplice esponenziale-levigante è di 1 945 relativo al periodo per il quale è calcolata la previsione. (Questo non dovrebbe essere ovvio, ma può essere facilmente dimostrare valutando una serie infinita.) Quindi, la semplice previsione media mobile tende a restare indietro punti di svolta da circa 1 945 periodi. Ad esempio, quando 945 0.5 il ritardo è di 2 periodi in cui 945 0.2 il ritardo è di 5 periodi in cui 945 0.1 il ritardo è di 10 periodi, e così via. Per una data età media (cioè quantità di ritardo), il semplice livellamento esponenziale (SES) previsione è un po 'superiore alla previsione media mobile semplice (SMA) perché pone relativamente più peso sulla più recente --i. e osservazione. è leggermente più quotresponsivequot ai cambiamenti che si verificano nel recente passato. Per esempio, un modello di SMA con 9 termini e un modello di SES con 945 0,2 entrambi hanno un'età media di 5 per i dati nelle loro previsioni, ma il modello SES mette più peso sugli ultimi 3 valori di quanto non faccia il modello SMA e al contempo doesn8217t interamente 8220forget8221 sui valori più di 9 periodi vecchi, come mostrato in questo grafico: un altro importante vantaggio del modello SES sul modello SMA è che il modello SES utilizza un parametro smoothing che è continuamente variabile, in modo che possa facilmente ottimizzato utilizzando un algoritmo quotsolverquot per minimizzare l'errore quadratico medio. Il valore ottimale di 945 nel modello SES a questa serie risulta essere 0,2961, come illustrato di seguito: L'età media dei dati in questa previsione è 10.2961 3.4 periodi, che è simile a quella di una media 6 termine mobile semplice. Le previsioni a lungo termine dal modello SES sono una linea retta orizzontale. come nel modello SMA e il modello random walk senza crescita. Si noti tuttavia che gli intervalli di confidenza calcolati da Statgraphics ora divergono in modo ragionevole dall'aspetto, e che sono sostanzialmente più stretto gli intervalli di confidenza per il modello random walk. Il modello di SES presuppone che la serie è un po 'predictablequot quotmore di quanto non faccia il modello random walk. Un modello SES è in realtà un caso particolare di un modello ARIMA. così la teoria statistica dei modelli ARIMA fornisce una solida base per il calcolo intervalli di confidenza per il modello SES. In particolare, un modello SES è un modello ARIMA con una differenza nonseasonal, un MA (1) termine, e nessun termine costante. altrimenti noto come un modello quotARIMA (0,1,1) senza constantquot. Il MA (1) coefficiente nel modello ARIMA corrisponde alla quantità 1- 945 nel modello SES. Ad esempio, se si adatta un modello ARIMA (0,1,1) senza costante alla serie analizzate qui, il MA stimato (1) coefficiente risulta essere 0,7029, che è quasi esattamente un meno 0,2961. È possibile aggiungere l'assunzione di una tendenza non-zero costante lineare per un modello SES. Per fare questo, basta specificare un modello ARIMA con una differenza non stagionale e di un (1) termine MA con una costante, cioè un (0,1,1) modello ARIMA con costante. Le previsioni a lungo termine avranno quindi una tendenza che è uguale alla tendenza medio rilevato nel corso dell'intero periodo di stima. Non si può fare questo in collaborazione con destagionalizzazione, perché le opzioni di destagionalizzazione sono disattivati ​​quando il tipo di modello è impostato su ARIMA. Tuttavia, è possibile aggiungere una costante a lungo termine tendenza esponenziale ad un semplice modello di livellamento esponenziale (con o senza regolazione stagionale) utilizzando l'opzione di regolazione inflazione nella procedura di previsione. Il tasso appropriato quotinflationquot (crescita percentuale) per periodo può essere stimato come il coefficiente di pendenza in un modello trend lineare montato i dati in combinazione con una trasformazione logaritmo naturale, oppure può essere basata su altri, informazione indipendente per quanto riguarda le prospettive di crescita a lungo termine . (Ritorna all'inizio pagina.) Browns lineari (cioè doppie) modelli esponenziale La SMA e modelli di SES per scontato che non vi è alcuna tendenza di alcun tipo nei dati (che di solito è OK, o almeno non troppo male per 1- previsioni passo avanti quando i dati sono relativamente rumoroso), e possono essere modificati per includere un trend lineare costante come indicato sopra. Che dire di tendenze a breve termine Se una serie mostra un tasso variabile di crescita o un andamento ciclico che si distingue chiaramente contro il rumore, e se vi è la necessità di prevedere più di 1 periodo a venire, allora la stima di una tendenza locale potrebbe anche essere un problema. Il semplice modello di livellamento esponenziale può essere generalizzata per ottenere un modello lineare di livellamento esponenziale (LES) che calcola le stime locali sia a livello e di tendenza. Il modello di tendenza tempo-variante più semplice è Browns lineare modello di livellamento esponenziale, che utilizza due diverse serie levigato che sono centrate in diversi punti nel tempo. La formula di previsione si basa su un'estrapolazione di una linea attraverso i due centri. (Una versione più sofisticata di questo modello, Holt8217s, è discusso qui di seguito.) La forma algebrica di Brown8217s lineare modello di livellamento esponenziale, come quello del semplice modello di livellamento esponenziale, può essere espresso in una serie di forme diverse ma equivalenti. La forma quotstandardquot di questo modello è di solito espressa come segue: Sia S denotano la serie singolarmente-levigata ottenuta applicando semplice livellamento esponenziale di serie Y. Cioè, il valore di S al periodo t è dato da: (Ricordiamo che, in semplice livellamento esponenziale, questo sarebbe il tempo per Y al periodo t1) Allora che Squot denotano la serie doppiamente levigata ottenuta applicando semplice livellamento esponenziale (utilizzando lo stesso 945) per serie S:. Infine, le previsioni per Y tk. per qualsiasi kgt1, è data da: Questo produce e 1 0 (vale a dire imbrogliare un po ', e lasciare che la prima previsione uguale l'attuale prima osservazione), ed e 2 Y 2 8211 Y 1. dopo di che le previsioni sono generati usando l'equazione di cui sopra. Questo produce gli stessi valori stimati come la formula basata su S e S se questi ultimi sono stati avviati utilizzando S 1 S 1 Y 1. Questa versione del modello è usato nella pagina successiva che illustra una combinazione di livellamento esponenziale con regolazione stagionale. modello Holt8217s lineare esponenziale Brown8217s LES calcola stime locali di livello e l'andamento lisciando i dati recenti, ma il fatto che lo fa con un singolo parametro smoothing pone un vincolo sui modelli di dati che è in grado di adattarsi: il livello e tendenza non sono autorizzati a variare a tassi indipendenti. modello Holt8217s LES risolve questo problema includendo due costanti di lisciatura, uno per il livello e uno per la tendenza. In ogni momento t, come nel modello Brown8217s, il c'è una stima L t del livello locale e una T t stima della tendenza locale. Qui vengono calcolati ricorsivamente dal valore di Y osservata al tempo t e le stime precedenti del livello e l'andamento di due equazioni che si applicano livellamento esponenziale separatamente. Se il livello stimato e tendenza al tempo t-1 sono L t82091 e T t-1. rispettivamente, la previsione per Y tshy che sarebbe stato fatto al tempo t-1 è uguale a L t-1 T t-1. Quando si osserva il valore effettivo, la stima aggiornata del livello è calcolata in modo ricorsivo per interpolazione tra Y tshy e le sue previsioni, L t-1 T t-1, con pesi di 945 e 945. 1- La variazione del livello stimato, vale a dire L t 8209 L t82091. può essere interpretato come una misura rumorosa della tendenza al tempo t. La stima aggiornata del trend viene poi calcolata in modo ricorsivo interpolando tra L t 8209 L t82091 e la stima precedente del trend, T t-1. utilizzando pesi di 946 e 1-946: L'interpretazione del trend-smoothing costante 946 è analoga a quella del livello-levigatura costante 945. Modelli con piccoli valori di 946 assume che la tendenza cambia solo molto lentamente nel tempo, mentre i modelli con grande 946 supporre che sta cambiando più rapidamente. Un modello con un grande 946 ritiene che il lontano futuro è molto incerto, perché gli errori in trend-stima diventano molto importanti quando la previsione più di un periodo avanti. (Torna a inizio pagina.) Il livellamento costanti di 945 e 946 può essere stimato nel modo consueto minimizzando la media errore delle previsioni 1-step-ahead quadrato. Quando questo fatto in Statgraphics, le stime risultano essere 945 0,3048 e 946 0.008. Il valore molto piccolo di 946 significa che il modello assume molto poco cambiamento di tendenza da un periodo all'altro, in modo sostanzialmente questo modello sta cercando di stimare un trend di lungo periodo. Per analogia con la nozione di età media dei dati utilizzati nella stima del livello locale della serie, l'età media dei dati che viene utilizzato per stimare la tendenza locale è proporzionale a 1 946, anche se non esattamente uguale ad esso . In questo caso risulta essere 10,006 125. Questo isn8217t un numero molto preciso in quanto la precisione della stima di 946 isn8217t realmente 3 decimali, ma è dello stesso ordine generale di grandezza della dimensione del campione di 100, così questo modello è una media di più di un bel po 'di storia nella stima del trend. La trama meteo seguente mostra che il modello LES stima un leggermente maggiore tendenza locale alla fine della serie rispetto alla tendenza costante stimata nel modello SEStrend. Inoltre, il valore stimato di 945 è quasi identica a quella ottenuta inserendo il modello SES con o senza tendenza, quindi questo è quasi lo stesso modello. Ora, queste sembrano le previsioni ragionevoli per un modello che dovrebbe essere stimare un trend locale Se si 8220eyeball8221 questa trama, sembra che la tendenza locale si è trasformato in basso alla fine della serie Quello che è successo I parametri di questo modello sono stati stimati minimizzando l'errore quadratico delle previsioni 1-step-ahead, non le previsioni a lungo termine, nel qual caso la tendenza doesn8217t fare un sacco di differenza. Se tutti si sta guardando sono errori 1-step-avanti, non si è visto il quadro più ampio delle tendenze sopra (diciamo) 10 o 20 periodi. Al fine di ottenere questo modello più in sintonia con la nostra bulbo oculare estrapolazione dei dati, siamo in grado di regolare manualmente la tendenza-smoothing costante in modo che utilizzi una base più breve per la stima di tendenza. Ad esempio, se si sceglie di impostare 946 0.1, quindi l'età media dei dati utilizzati nella stima la tendenza locale è di 10 periodi, il che significa che ci sono in media il trend negli ultimi 20 periodi che o giù di lì. Here8217s quello che la trama del tempo si presenta come se impostiamo 946 0.1, mantenendo 945 0.3. Questo sembra intuitivamente ragionevole a questa serie, anche se probabilmente è pericoloso estrapolare questa tendenza eventuali più di 10 periodi in futuro. Che dire le statistiche di errore Ecco un confronto modello per i due modelli sopra indicati, nonché tre modelli SES. Il valore ottimale di 945.per modello SES è di circa 0,3, ma risultati simili (con leggermente più o meno reattività, rispettivamente) sono ottenute con 0,5 e 0,2. exp lineare (A) Holts. levigatura con alfa e beta 0,3048 0.008 (B) Holts exp lineare. levigatura con alpha 0.3 e beta 0.1 (C) livellamento esponenziale semplice con alfa 0,5 (D) livellamento esponenziale semplice con alpha 0.3 (E) livellamento esponenziale semplice con alpha 0.2 Le loro statistiche sono quasi identiche, quindi abbiamo davvero can8217t fare la scelta sulla base di errori di previsione 1-step-avanti all'interno del campione di dati. Dobbiamo ripiegare su altre considerazioni. Se crediamo fermamente che ha senso basare la stima attuale tendenza su quanto è successo negli ultimi 20 periodi o giù di lì, siamo in grado di fare un caso per il modello LES con 945 0,3 e 946 0.1. Se vogliamo essere agnostici sul fatto che vi è una tendenza locale, poi uno dei modelli SES potrebbe essere più facile da spiegare e darebbe anche altre previsioni middle-of-the-road per i prossimi 5 o 10 periodi. (Ritorna all'inizio pagina.) Quale tipo di trend-estrapolazione è meglio: L'evidenza empirica orizzontale o lineare suggerisce che, se sono già stati adeguati i dati (se necessario) per l'inflazione, allora può essere imprudente per estrapolare lineare a breve termine tendenze molto lontano nel futuro. Le tendenze evidenti oggi possono rallentare in futuro, dovuta a cause diverse quali obsolescenza dei prodotti, l'aumento della concorrenza, e flessioni cicliche o periodi di ripresa in un settore. Per questo motivo, semplice livellamento esponenziale spesso si comporta meglio out-of-sample che altrimenti potrebbero essere previsto, nonostante la sua quotnaivequot estrapolazione di tendenza orizzontale. modifiche di tendenza smorzato del modello di livellamento esponenziale lineare sono spesso utilizzati in pratica per introdurre una nota di conservatorismo nelle sue proiezioni di tendenza. Il modello LES smorzata-tendenza può essere implementato come un caso particolare di un modello ARIMA, in particolare, un modello (1,1,2) ARIMA. E 'possibile calcolare gli intervalli di confidenza intorno previsioni a lungo termine prodotte da modelli di livellamento esponenziale, considerandoli come casi speciali di modelli ARIMA. (Attenzione: non tutto il software calcola correttamente intervalli di confidenza per questi modelli.) La larghezza degli intervalli di confidenza dipende (i) l'errore RMS del modello, (ii) il tipo di levigatura (semplice o lineare) (iii) il valore (s) della costante di smoothing (s) e (iv) il numero di periodi avanti si prevedono. In generale, gli intervalli distribuite più veloce come 945 diventa più grande nel modello SES e si propagano molto più velocemente quando lineare piuttosto che semplice lisciatura viene utilizzato. Questo argomento è discusso ulteriormente nella sezione modelli ARIMA delle note. (Torna all'inizio della pagina.)

No comments:

Post a Comment