Friday 30 June 2017

Bewegungs Durchschnitt Saison Variation


Bewegen von Durchschnitten. Wenn diese Information auf einer Grafik gezeichnet ist, sieht es so aus. Dies zeigt, dass es eine breite Variation in der Anzahl der Besucher je nach Saison gibt es viel weniger im Herbst und Winter als Frühling und Sommer. Jedoch, Wenn wir einen Trend in der Anzahl der Besucher sehen wollten, konnten wir einen 4-Punkte-Gleitender Durchschnitt berechnen. Wir tun dies, indem wir die durchschnittliche Besucherzahl in den vier Quartalen des Jahres 2005 finden. Dann finden wir die durchschnittliche Besucherzahl in der Die letzten drei Quartale 2005 und das erste Quartal 2006. Dann die letzten beiden Quartale des Jahres 2005 und die ersten beiden Quartale von 2006.Hinweis, dass der letzte Durchschnitt finden wir für die letzten zwei Quartale 2006 und die ersten beiden Quartale des Jahres 2007. Wir zeichnen die gleitenden Durchschnitte auf einer Grafik, so dass jeder Durchschnitt in der Mitte der vier Quartiere, die es deckt aufgetragen wird. Wir können jetzt sehen, dass es einen sehr leichten Abwärtstrend in Besucher. Spreadsheet Umsetzung der saisonalen Anpassung und exponentielle Glättung. Es ist geradeaus Um eine saisonale Anpassung vorzunehmen und exponentielle Glättungsmodelle mit Excel zu platzieren. Die Bildschirmbilder und Diagramme unten sind aus einer Tabellenkalkulation entnommen, die eingerichtet wurde, um eine multiplikative saisonale Anpassung und eine lineare exponentielle Glättung auf den folgenden vierteljährlichen Verkaufsdaten von Outboard Marine zu veranschaulichen Kopie der Tabellenkalkulation selbst, hier klicken Die Version der linearen exponentiellen Glättung, die hier zum Zwecke der Demonstration verwendet wird, ist die Brown-Version, nur weil sie mit einer einzigen Spalte von Formeln implementiert werden kann und es nur eine Glättungskonstante zu optimieren gibt Normalerweise ist es besser, die Holt-Version zu verwenden, die getrennte Glättungskonstanten für Level und Trend hat. Der Prognoseprozess verläuft wie folgt: Zuerst werden die Daten saisonbereinigt ii, dann werden Prognosen für die saisonbereinigten Daten über lineare exponentielle Glättung und iii schließlich die Saisonbereinigte Prognosen werden reseasonalisiert, um Prognosen für die Origi zu erhalten Nal-Serie Der saisonale Anpassungsprozess wird in den Spalten D bis G durchgeführt. Der erste Schritt in der saisonalen Anpassung besteht darin, einen zentrierten gleitenden Durchschnitt zu berechnen, der hier in Spalte D durchgeführt wird. Dies kann durch den Durchschnitt von zwei einjährigen Mittelwerten erreicht werden Werden um eine Periode relativ zueinander versetzt. Eine Kombination von zwei Offset-Mittelwerten anstelle eines einzigen Mittelwerts wird für Zentrierungszwecke benötigt, wenn die Anzahl der Jahreszeiten gerade ist. Der nächste Schritt ist, das Verhältnis zum gleitenden Durchschnitt zu berechnen - die ursprünglichen Daten geteilt Durch den gleitenden Durchschnitt in jeder Periode - die hier in Spalte E durchgeführt wird. Dies wird auch als Trendzykluskomponente des Musters bezeichnet, insofern als Trend - und Konjunktureffekte als alles verbleiben, was nach einer Mittelung über ein Ganzes bleibt Jahres-Daten-Daten Natürlich können Monate-zu-Monat-Änderungen, die nicht auf Saisonalität zurückzuführen sind, durch viele andere Faktoren bestimmt werden, aber der 12-Monats-Durchschnitt glättet über sie zu einem großen Teil Die geschätzten saisonalen inde X für jede Saison wird berechnet, indem zuerst alle Verhältnisse für die jeweilige Jahreszeit berechnet werden, die in Zellen G3-G6 mit einer AVERAGEIF-Formel durchgeführt wird. Die durchschnittlichen Verhältnisse werden dann neu skaliert, so dass sie auf genau das 100-fache der Anzahl der Perioden in einer Saison summieren , Oder 400 in diesem Fall, die in den Zellen H3-H6 durchgeführt wird. Unterhalb der Spalte F werden VLOOKUP-Formeln verwendet, um den entsprechenden Saisonindexwert in jede Zeile der Datentabelle einzufügen, je nach dem Quartal des Jahres, in dem es steht Gleitender Durchschnitt und die saisonbereinigten Daten am Ende so aussehen. Hinweis, dass der gleitende Durchschnitt sieht in der Regel wie eine glattere Version der saisonbereinigten Serien, und es ist kürzer an beiden Enden. Ein anderes Arbeitsblatt in der gleichen Excel-Datei zeigt die Anwendung der Lineares exponentielles Glättungsmodell zu den saisonbereinigten Daten, beginnend im Spalten-GA-Wert für die Glättungskonstante alpha, wird hier in der Zelle H9 oberhalb der Prognosespalte eingegeben und zur Bequemlichkeit wird der Ran zugeordnet Ge name Alpha Der Name wird mit dem Befehl "Name erstellen" zugewiesen Das LES-Modell wird initialisiert, indem die ersten beiden Prognosen gleich dem ersten Istwert der saisonbereinigten Serie gesetzt werden. Die hier verwendete Formel für die LES-Prognose ist das rekursive Formularelement Des Browns-Modells. Diese Formel wird in die Zelle eingegeben, die der dritten Periode hier entspricht, Zelle H15 und von dort abgemeldet. Beachten Sie, dass die LES-Prognose für die aktuelle Periode auf die beiden vorhergehenden Beobachtungen und die beiden vorherigen Prognosefehler hinweist Im Hinblick auf den Wert von alpha So bezieht sich die Prognoseformel in Zeile 15 nur auf Daten, die in Zeile 14 und früher verfügbar waren. Natürlich, wenn wir einfach anstelle der linearen exponentiellen Glättung verwenden wollten, könnten wir hier die SES-Formel ersetzen Könnte auch Holt s eher als Brown s LES-Modell verwenden, die zwei weitere Spalten von Formeln erfordern würde, um das Niveau und den Trend zu berechnen, die in der Prognose verwendet werden. Die Fehler werden berechnet In der nächsten Spalte hier Spalte J durch Subtrahieren der Prognosen aus den Istwerten Der route Mittelquadratfehler wird als Quadratwurzel der Varianz der Fehler plus dem Quadrat des Mittels berechnet. Dies folgt aus der mathematischen Identität MSE VARIANCE Fehler AVERAGE Fehler 2 Bei der Berechnung des Mittelwertes und der Varianz der Fehler in dieser Formel sind die ersten beiden Perioden ausgeschlossen, weil das Modell eigentlich nicht mit der Prognose beginnt, bis die dritte Periode Zeile 15 auf der Kalkulationstabelle Der optimale Wert von alpha kann entweder durch manuelles Ändern von alpha gefunden werden Bis das Minimum RMSE gefunden wird, oder Sie können den Solver verwenden, um eine exakte Minimierung durchzuführen. Der Wert von alpha, den der Solver gefunden hat, ist hier alpha 0 471. Es ist in der Regel eine gute Idee, die Fehler des Modells in transformierten Einheiten zu zeichnen Und auch zu berechnen und plotten ihre Autokorrelationen bei Verzögerungen von bis zu einer Saison Hier ist eine Zeitreihenfolge der saisonbereinigten Fehler. Die Fehlerautokorrelationen werden mit Hilfe der CORREL-Funktion zur Berechnung der Korrelationen der Fehler mit sich selbst verzögert um eine oder mehrere Perioden - Details sind im Tabellenkalkulationsmodell dargestellt Hier ist eine Auftragung der Autokorrelationen der Fehler bei den ersten fünf Verzögerungen. Die Autokorrelationen bei den Verzögerungen 1 bis 3 sind Sehr nahe an Null, aber die Spitze bei lag 4, deren Wert 0 35 ist, ist etwas lästig - es deutet darauf hin, dass der saisonale Anpassungsprozess nicht vollständig erfolgreich war. Allerdings ist es eigentlich nur marginal signifikante 95 Signifikanzbänder für die Prüfung, ob Autokorrelationen signifikant sind Abweichend von null sind etwa plus-oder-minus 2 SQRT nk, wobei n die Stichprobengröße und k die Verzögerung ist. Hierbei ist n 38 und k von 1 bis 5, also die Quadratwurzel-von-n-minus-k Ist etwa 6 für alle von ihnen, und daher sind die Grenzen für die Prüfung der statistischen Signifikanz von Abweichungen von Null etwa plus-oder-minus 2 6 oder 0 33 Wenn Sie den Wert von Alpha von Hand in diesem Excel-Modell variieren, können Sie Beobachten Sie die Wirkung auf die Zeitreihen Und Autokorrelationsdiagramme der Fehler sowie auf den root-mean-squared-Fehler, der unten dargestellt wird. Am unteren Teil der Kalkulationstabelle wird die Prognoseformel durch die bloße Substitution von Prognosen für Istwerte an der Stelle bootstrapiert Wo die eigentlichen Daten ablaufen - also wo die Zukunft beginnt Mit anderen Worten, in jeder Zelle, wo ein zukünftiger Datenwert stattfinden würde, wird eine Zellreferenz eingefügt, die auf die Prognose für diesen Zeitraum hinweist. Alle anderen Formeln werden einfach kopiert Von oben. Notice, dass die Fehler für Prognosen der Zukunft sind alle berechnet, um null Dies bedeutet nicht, dass die tatsächlichen Fehler null sein wird, sondern vielmehr nur die Tatsache, dass für die Zwecke der Vorhersage sind wir davon ausgehen, dass die zukünftigen Daten gleich sein wird Die Prognosen im Durchschnitt Die daraus resultierenden LES-Prognosen für die saisonbereinigten Daten sehen so aus. Mit diesem besonderen Wert von Alpha, der für eine Periodenvorhersage optimal ist, ist der projizierte Trend gering Nach oben, was den lokalen Trend widerspiegelt, der in den letzten 2 Jahren beobachtet wurde. Für andere Werte von Alpha könnte eine ganz andere Trendprojektion erzielt werden. Es ist in der Regel eine gute Idee zu sehen, was mit der langfristigen Trendprojektion bei Alpha passiert Ist vielfältig, weil der Wert, der für die kurzfristige Prognose am besten ist, nicht unbedingt der beste Wert für die Vorhersage der weiter entfernten Zukunft ist. Beispielsweise ist hier das Ergebnis, das erhalten wird, wenn der Wert von alpha manuell auf 0 25 gesetzt wird Der projizierte langfristige Trend ist nun eher negativ als positiv Mit einem kleineren Wert von Alpha setzt das Modell bei der Einschätzung des aktuellen Standes und des Tendenzes auf ältere Daten, und seine langfristigen Prognosen spiegeln den Abwärtstrend wider Letzte 5 Jahre statt der jüngsten Aufwärtstrend Diese Grafik zeigt auch deutlich, wie das Modell mit einem kleineren Wert von Alpha langsamer ist, um auf Wendepunkte in den Daten zu reagieren und daher dazu neigt, einen Fehler desselben zu machen Ign für viele Perioden in einer Reihe Seine 1-Schritt-voraus Prognose Fehler sind im Durchschnitt größer als die vor RMSE von 34 4 statt 27 4 und stark positiv autokorreliert Die Lag-1 Autokorrelation von 0 56 übersteigt deutlich den Wert von 0 33 Oben berechnet für eine statistisch signifikante Abweichung von null Als Alternative zum Anfahren des Wertes von alpha, um mehr Konservatismus in langfristige Prognosen einzuführen, wird dem Modell manchmal ein Trenddämpfungsfaktor hinzugefügt, um den projizierten Trend abzubauen Nach ein paar Perioden. Der letzte Schritt bei der Erstellung des Prognosemodells besteht darin, die LES-Prognosen durch Multiplikation mit den entsprechenden saisonalen Indizes zu verwerten. Somit sind die neu gestellten Prognosen in Spalte I einfach das Produkt der Saisonindizes in Spalte F und saisonbereinigt LES-Prognosen in Spalte H. Es ist relativ einfach zu berechnen Konfidenz-Intervalle für ein Schritt-voraus-Prognosen von diesem Modell zuerst berechnen die RMSE root-mean - Quadratischer Fehler, der nur die Quadratwurzel des MSE ist und dann ein Konfidenzintervall für die saisonbereinigte Prognose berechnen, indem es das Zweifache des RMSE addiert und subtrahiert. Im Allgemeinen ist ein 95-Konfidenzintervall für eine Prognose von einer Periode voraus ungefähr gleich Punkt-Prognose plus-oder-minus-zwei mal die geschätzte Standardabweichung der Prognosefehler, vorausgesetzt, die Fehlerverteilung ist annähernd normal und die Stichprobengröße ist groß genug, z. B. 20 oder mehr Hier ist die RMSE eher als die Stichprobenabweichung von Die Fehler sind die beste Schätzung der Standardabweichung der zukünftigen Prognosefehler, da es Bias sowie zufällige Variationen berücksichtigt. Die Vertrauensgrenzen für die saisonbereinigte Prognose werden dann zusammen mit der Prognose neu vervielfacht, indem sie mit den entsprechenden saisonalen Indizes multipliziert werden Fall der RMSE ist gleich 27 4 und die saisonbereinigte Prognose für die erste zukünftige Periode Dez-93 ist 273 2 so die saisonbereinigte 95 vertrauen Nt Intervall ist von 273 2-2 27 4 218 4 bis 273 2 2 27 4 328 0 Die Multiplikation dieser Grenzwerte bis zum Dezember s saisonalen Index von 68 61 erhalten wir niedrigere und obere Konfidenzgrenzen von 149 8 und 225 0 um den Dez-93-Punkt Prognose von 187 4.Confidence-Limits für Prognosen, die mehr als eine Periode im Vorfeld werden, wird sich mit zunehmender Unsicherheit über das Niveau und den Trend sowie die saisonalen Faktoren generell erweitern, aber es ist schwierig, sie im Allgemeinen durch analytische Methoden zu berechnen Der richtige Weg, um die Vertrauensgrenzen für die LES-Prognose zu berechnen, ist die Verwendung der ARIMA-Theorie, aber die Unsicherheit in den saisonalen Indizes ist eine andere Frage Wenn Sie ein realistisches Konfidenzintervall für eine Prognose von mehr als einer Periode haben wollen, unter Berücksichtigung aller Fehlerquellen , Ihre beste Wette ist es, empirische Methoden zum Beispiel zu verwenden, um ein Konfidenzintervall für eine 2-Schritt voraus Prognose zu erhalten, könnten Sie eine weitere Spalte auf der Kalkulationstabelle erstellen, um eine 2-Schritt-voraus Prognose für jeden Zeitraum von b zu berechnen Ootstrapping the one-step-ahead-prognose Dann berechnen Sie die RMSE der 2-Schritt-voraus Prognose Fehler und verwenden Sie diese als Grundlage für ein 2-Schritt-Ahead-Konfidenz Intervall. Moving Durchschnitt. Mean Zeitreihen Daten Beobachtungen gleich beabstandet in der Zeit Aus mehreren aufeinanderfolgenden Perioden Aufgerufen zu bewegen, weil es kontinuierlich neu berechnet wird, wenn neue Daten verfügbar werden, geht es fort, indem sie den frühesten Wert fallen lässt und den letzten Wert addiert. Beispielsweise kann der gleitende Durchschnitt von sechsmonatigen Verkäufen berechnet werden, indem man den Durchschnitt des Umsatzes abgibt Januar bis Juni, dann der Durchschnitt der Verkäufe von Februar bis Juli, dann von März bis August, und so weiter Moving-Mittelwerte 1 reduzieren die Wirkung von temporären Variationen in Daten, 2 verbessern die Anpassung der Daten an eine Linie ein Prozess namens Glättung zu zeigen Die Daten s Trend klarer, und 3 markieren Sie jeden Wert über oder unter dem Trend. Wenn Sie berechnen etwas mit sehr hoher Varianz das Beste, was Sie in der Lage zu tun ist, ist herauszufinden, die gleitenden Durchschnitt. Ich wollte wissen, was die Gleitender Durchschnitt war von den Daten, also würde ich ein besseres Verständnis davon haben, wie wir es machten. Wenn Sie versuchen, herauszufinden, einige Zahlen, die sich ändern, oft das Beste, was Sie tun können, ist die gleitenden Durchschnitt zu berechnen. Box Jenkins B-J Modelle.

No comments:

Post a Comment