Inhaltsverzeichnis
Nach den unterschiedlichen Verfahren kommen wir zur Zeitreihenzerlegung. Die Anwendung der Zeitreihenzerlegung ist auch leichter verständlich, wenn diese anhand konkreter Zahlen erfolgt. Dazu folgendes Beispiel.
Beispiel
Beispiel 65:
Für die Auftragseingänge
Monat | 2019 | 2020 | 2021 |
Januar | 35 | 36 | 35 |
Februar | 37 | 38 | 38 |
März | 39 | 41 | 41 |
April | 41 | 38 | 37 |
Mai | 40 | 41 | 39 |
Juni | 46 | 49 | 46 |
Juli | 49 | 51 | 49 |
August | 51 | 53 | 53 |
September | 46 | 45 | 46 |
Oktober | 41 | 41 | 41 |
November | 39 | 38 | 39 |
Dezember | 36 | 37 | 38 |
Die Werte
- Sind die Auftragseingänge ausschließlich zeitabhängig?
- Lässt sich ein Trend erkennen, so dass z.B. die Anzahl der Aufträge in den Jahren 2019, 2020 und 2021 ansteigt, unabhängig vom jeweiligen genauen Wert in den Monaten?
- Werden die Daten von einem Zyklus überlagert, so dass z.B. ein Konjunkturtief in 2021 für grundsätzlich niedrigere Werte sorgt als ein Hoch in 2019?
- Lassen sich Saisoneffekte erkennen, so dass die Anzahl der Aufträge in den Wintermonaten beispielsweise geringer ist als in den Sommermonaten?
Trendkomponente, zyklische Komponente, Saisonkomponente
Sinn der folgenden Überlegungen ist es, die Werte durch Zerlegung zu erklären, und zwar in die schon angedeutete
- Trendkomponente
- diese wird durch langfristig wirkende Faktoren bedingt
- oftmals durch KQ-Schätzungen erklärt
- die zyklische Komponente
- sie wird durch Konjunkturzyklen bedingt
- sie ist oftmals wellenförmig
- die Saisonkomponente
- hier werden Saisoneinflüsse beobachtet
- wie z.B. im vorliegenden Fall verminderte Auftragseingänge im Baugewerbe
- die irreguläre Komponente
- die Ursachen sind keinen der o.e. Gründe zuzurechnen.
- die Werte der irregulären Komponente (= Störvariable, = Zufallsschwankung, = unerklärter Rest) werden als relativ klein angenommen
- und als unsystematisch um null schwankend verstanden
Hinweis
Oftmals fasst man den Trend und die zyklische Komponente zur sog. glatten Komponente
Additive Zerlegung und multiplikative Zerlegung
Es werden nun mehrere Arten von Zeitreihenmodellen unterschieden:
- Die additiven Modelle mit der Zerlegung (= Überlagerung)
oder die
- multiplikativen Modelle mit der Zerlegung
Wir betrachten im Folgenden ausschließlich das additive Modell.
-
Ermittlung der Zeitreihen-Komponenten:
- Ermittlung der Trendkomponente
(oftmals mit einer linearen Regression). Fasse die Zeitreihen-Werte auf als Werte, die sich aus dem Ansatz ergeben. (Man kann den Trend aber auch mit der Methode der gleitenden Durchschnitte ausrechnen.) - Berechnung der zyklischen Komponente
. Schätze zunächst die Trendwerte mit Hilfe des in Schritt 1 ermittelten Trends, bilde dann die glatte Komponente mit Hilfe gleitender Durchschnitte der ursprünglichen Zeitreihe. Errechne den Zyklus als Differenz der glatten Komponente und der Trendwerte, also als - Berechnung der Saisonkomponente
Die Werte aus Schritt 2 werden gemittelt gemäßDiese Werte werden normiert durch Hierbei ist k die Anzahl der Werte
ist eine Schätzung für die (monatstypische, quartalstypische,...) Abweichung, die saisonbereinigte Zeitreihe ist dann die Differenz.
Merke
Im zweiten Schritt funktioniert die Bildung der glatten Komponente unabhängig und losgelöst vom ersten Schritt. Für die glatte Komponente ist also die Trend-Berechnung uninteressant, erst für den Zyklus muss sie um den Trend bereinigt werden.
Zeitreihenzerlegung am Beispiel
Anwendung auf das Beispiel 65 damit wie folgt.
Schätzung des Trends
Die Trendkomponente
Es ist im vorliegenden Beispiel
Also rechnet man die Steigung a aus als
Der Ordinatenabschnitt b ist:
Man erhält also als Trendgerade
Setzt man z.B. für t = 3 ein, so erhält man den Trendwert für den März des Jahres 2019 durch:
2019 | Trendkomponente | 2020 | Trendkomponente | 2021 | Trendkomponente | |
Januar | 24 | 41,1156 | 25 | 41,6840 | 24 | 42,2523 |
Februar | 26 | 41,1630 | 27 | 41,7313 | 27 | 42,2997 |
März | 28 | 41,2103 | 30 | 41,7787 | 30 | 42,3470 |
April | 30 | 41,2577 | 27 | 41,8260 | 26 | 42,3944 |
Mai | 29 | 41,3051 | 30 | 41,8734 | 28 | 42,4417 |
Juni | 35 | 41,3524 | 38 | 41,9208 | 35 | 42,4891 |
Juli | 38 | 41,3998 | 40 | 41,9681 | 38 | 42,5365 |
August | 40 | 41,4471 | 42 | 42,0155 | 42 | 42,5838 |
September | 35 | 41,4945 | 34 | 42,0628 | 35 | 42,6312 |
Oktober | 30 | 41,5419 | 30 | 42,1099 | 30 | 42,6785 |
November | 28 | 41,5892 | 27 | 42,1576 | 28 | 42,7259 |
Dezember | 25 | 41,6366 | 26 | 42,2049 | 27 | 42,7733 |
Schätzung der glatten Komponente
Zur Ermittlung der zyklischen Komponente bedient man sich der Methode der gleitenden Durchschnitte. Wir schätzen die glatte Komponente als gleitenden Durchschnitt 12. Ordnung, d.h. k = 6 (wegen der Monatsdaten). Man verwendet die Formel
die speziell für k = 6 dann lautet:
Die möglichen t-Werte starten damit bei t = 7, damit in der Klammer mit
Die anderen Werte werden errechnet und die Arbeitstabelle 53 eingetragen. Man erhält damit die Zahlen der glatten Komponente.
2019 | glatte Komponente | 2020 | glatte Komponente | 2021 | glatte Komponente | |
Januar | 24 | - | 25 | 42,1667 | 24 | 41,6667 |
Februar | 26 | - | 27 | 42,3333 | 27 | 41,5833 |
März | 28 | - | 30 | 42,3750 | 30 | 41,6250 |
April | 30 | - | 27 | 42,3333 | 26 | 41,6667 |
Mai | 29 | - | 30 | 42,2917 | 28 | 41,7083 |
Juni | 35 | - | 38 | 42,2917 | 35 | 41,7917 |
Juli | 38 | 41,7083 | 40 | 42,2917 | 38 | - |
August | 40 | 41,7917 | 42 | 42,2500 | 42 | - |
September | 35 | 41,9167 | 34 | 42,2500 | 35 | - |
Oktober | 30 | 41,8750 | 30 | 42,2083 | 30 | - |
November | 28 | 41,7917 | 27 | 42,0833 | 28 | - |
Dezember | 25 | 41,9583 | 26 | 41,8750 | 27 | - |
Alsdann bildet man die Differenz aus den tatsächlichen Zahlen yt und den Werten der glatten Komponente
2019 | | 2020 | 2021 | |||
Januar | 24 | - | 25 | - 6,1667 | 24 | - 6,6667 |
Februar | 26 | - | 27 | - 4,3333 | 27 | - 3,5833 |
März | 28 | - | 30 | - 1,3750 | 30 | - 0,6250 |
April | 30 | - | 27 | - 4,3333 | 26 | - 4,6667 |
Mai | 29 | - | 30 | - 1,2919 | 28 | - 2,7083 |
Juni | 35 | - | 38 | 6,7083 | 35 | 4,2083 |
Juli | 38 | 7,2917 | 40 | 8,7083 | 38 | - |
August | 40 | 9,2083 | 42 | 10,7500 | 42 | - |
September | 35 | 4,0833 | 34 | 2,7500 | 35 | - |
Oktober | 30 | - 0,8750 | 30 | - 1,2083 | 30 | - |
November | 28 | - 2,7917 | 27 | - 4,0833 | 28 | - |
Dezember | 25 | - 5,9583 | 26 | - 4,8750 | 27 | - |
Danach ordnet man zur besseren Übersicht die zum jeweils gleichen Monat passenden Daten spaltenweise an:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | |
2019 | - | - | - | - | - | - | 7,292 | 9,208 | 4,083 | - 0,875 | - 2,792 | - 5,958 |
2020 | - 6,167 | - 4,333 | - 1,375 | - 4,333 | - 1,292 | 6,708 | 8,708 | 10,750 | 2,750 | - 1,208 | - 4,083 | - 4,875 |
2021 | - 6,667 | - 3,583 | - 0,625 | - 4,667 | - 2,708 | 4,208 | - | - | - | - | - | - |
Schließlich werden die Zahlen aus Schritt 3 spaltenweise (!) gemittelt gemäß der Formel
Genau andersrum verhält es sich bei
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | |
2019 | - | - | - | - | - | - | 7,292 | 9,208 | 4,083 | - 0,875 | - 2,792 | - 5,958 |
2020 | - 6,167 | - 4,333 | - 1,375 | - 4,333 | - 1,292 | 6,708 | 8,708 | 10,750 | 2,750 | - 1,208 | - 4,083 | - 4,875 |
2021 | - 6,667 | - 3,583 | - 0,625 | - 4,667 | - 2,708 | 4,208 | - | - | - | - | - | - |
- 6,417 | - 3,958 | - 1,000 | - 4,500 | - 2,000 | 5,458 | 8,000 | 9,979 | 3,417 | - 1,042 | - 3,438 | - 5,417 |
Wenn die Summe der
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | |
2019 | - | - | - | - | - | - | 7,292 | 9,208 | 4,082 | - 0,875 | - 2,792 | - 5,958 |
2020 | - 6,167 | - 4,333 | - 1,375 | - 4,333 | - 1,292 | 6,708 | 8,708 | 10,75 | 2,750 | - 1,208 | - 4,083 | - 4,875 |
2021 | - 6,667 | - 3,583 | - 0,625 | - 4,667 | - 2,708 | 4,208 | - | - | - | - | - | - |
- 6,417 | - 3,958 | - 1,000 | - 4,500 | - 2,000 | 5,458 | 8,000 | 9,979 | 3,417 | - 1,042 | - 3,438 | - 5,417 | |
- 6,340 | - 3,882 | - 0,924 | - 4,424 | - 1,924 | 5,535 | 8,076 | 10,056 | 3,493 | - 0,965 | - 3,361 | - 5,340 |
Saisonbereinigte Zeitreihe
Die eigentliche saisonbereinigte Zeitreihe ergibt sich dann durch Subtraktion der Werte aus Schritt 4 und der beobachteten Werte aus der Original-Zeitreihe.
2019 | saisonber. ZR | 2020 | saisonber. ZR | 2021 | saisonber. ZR | |
Januar | 35 | 41,3403 | 36 | 42,3403 | 35 | 42,3403 |
Februar | 37 | 40,8819 | 41,8819 | 38 | 42,8819 | |
März | 39 | 39,9236 | 41 | 41,9236 | 41 | 41,9236 |
April | 41 | 34,4236 | 38 | 42,4236 | 37 | 41,4236 |
Mai | 40 | 41,9236 | 41 | 42,9236 | 39 | 40,9236 |
Juni | 46 | 40,4653 | 49 | 43,4653 | 46 | 40,4653 |
Juli | 49 | 40,9236 | 51 | 42,9236 | 49 | 40,9236 |
August | 51 | 40,9444 | 53 | 42,9444 | 53 | 42,9444 |
September | 46 | 42,5069 | 45 | 41,5069 | 46 | 42,5069 |
Oktober | 41 | 41,9653 | 41 | 41,9653 | 41 | 41,9653 |
November | 39 | 42,3611 | 38 | 41,3611 | 39 | 42,3611 |
Dezember | 36 | 41,3403 | 37 | 42,3403 | 38 | 43,3403 |
Hinweis
Die obigen Überlegungen gelten nur bei folgenden einschränkenden Annahmen:
- die glatte Komponente kann innerhalb eines Zeitraums von m + 1 Perioden durch eine lineare Schätzung angenähert werden,
- die Saisonfigur, also das Tupel
, ist in der Summe null, d.h. . Konkret heißt dies bei Monatsdaten (bei Quartalsdaten), dass die Monatswerte (die Quartalswerte) eines Jahres in der Summe gleich null ergeben. Sollte dies nicht der Fall sein, dann muss man zunächst durch Normierung dafür sorgen, dass dies gilt. - die Werte der Saisonkomponente
sind jeweils identisch für die gleichnamigen Perioden (sog. Konstanz der Saisonfigur, eine variable Saisonfigur wird hier nicht angesprochen) bei Monatswerten
bei Quartalswerten.
Weitere interessante Inhalte zum Thema
-
Bravais-Pearsonscher Korrelationskoeffizient
Vielleicht ist für Sie auch das Thema Bravais-Pearsonscher Korrelationskoeffizient (Korrelationsanalyse) aus unserem Online-Kurs SPSS Software interessant.
-
Methode der gleitenden Durchschnitte
Vielleicht ist für Sie auch das Thema Methode der gleitenden Durchschnitte (Zeitreihenanalyse) aus unserem Online-Kurs Deskriptive Statistik interessant.