Kursangebot | Deskriptive Statistik | Zeitreihenzerlegung

Deskriptive Statistik

Zeitreihenzerlegung

Nach den unterschiedlichen Verfahren kommen wir zur Zeitreihenzerlegung. Die Anwendung der Zeitreihenzerlegung ist auch leichter verständlich, wenn diese anhand konkreter Zahlen erfolgt. Dazu folgendes Beispiel.

Beispiel

Hier klicken zum Ausklappen

Beispiel 65:

Für die Auftragseingänge im Baugewerbe der norddeutschen Stadt Elmshorn werden in den Jahren 2019 – 2021 im jeweiligen Monat die folgenden Werte gemessen.

Monat 2019 2020 2021
Januar353635
Februar373838
März394141
April413837
Mai404139
Juni464946
Juli495149
August515353
September464546
Oktober414141
November393839
Dezember363738

Die Werte hängen also primär von der Zeit ab, t gibt hierbei den Zeitindex an. Es stellen sich mehrere Fragen:

  1. Sind die Auftragseingänge ausschließlich zeitabhängig?
  2. Lässt sich ein Trend erkennen, so dass z.B. die Anzahl der Aufträge in den Jahren 2019, 2020 und 2021 ansteigt, unabhängig vom jeweiligen genauen Wert in den Monaten?
  3. Werden die Daten von einem Zyklus überlagert, so dass z.B. ein Konjunkturtief in 2021 für grundsätzlich niedrigere Werte sorgt als ein Hoch in 2019?
  4. Lassen sich Saisoneffekte erkennen, so dass die Anzahl der Aufträge in den Wintermonaten beispielsweise geringer ist als in den Sommermonaten?

Trendkomponente, zyklische Komponente, Saisonkomponente

Sinn der folgenden Überlegungen ist es, die Werte durch Zerlegung zu erklären, und zwar in die schon angedeutete

  • Trendkomponente
    • diese wird durch langfristig wirkende Faktoren bedingt
    • oftmals durch KQ-Schätzungen erklärt

  • die zyklische Komponente
    • sie wird durch Konjunkturzyklen bedingt
    • sie ist oftmals wellenförmig

  • die Saisonkomponente
    • hier werden Saisoneinflüsse beobachtet
    • wie z.B. im vorliegenden Fall verminderte Auftragseingänge im Baugewerbe

  • die irreguläre Komponente
    • die Ursachen sind keinen der o.e. Gründe zuzurechnen.
    • die Werte der irregulären Komponente (= Störvariable, = Zufallsschwankung, = unerklärter Rest) werden als relativ klein angenommen
    • und als unsystematisch um null schwankend verstanden

Hinweis

Hier klicken zum Ausklappen

Oftmals fasst man den Trend und die zyklische Komponente zur sog. glatten Komponente zusammen.

Additive Zerlegung und multiplikative Zerlegung

Es werden nun mehrere Arten von Zeitreihenmodellen unterschieden:

  • Die additiven Modelle mit der Zerlegung (= Überlagerung)

oder die

  • multiplikativen Modelle mit der Zerlegung

Wir betrachten im Folgenden ausschließlich das additive Modell.

-

Hier klicken zum Ausklappen

Ermittlung der Zeitreihen-Komponenten:

  1. Ermittlung der Trendkomponente (oftmals mit einer linearen Regression). Fasse die Zeitreihen-Werte auf als Werte, die sich aus dem Ansatz ergeben. (Man kann den Trend aber auch mit der Methode der gleitenden Durchschnitte ausrechnen.)

  2. Berechnung der zyklischen Komponente . Schätze zunächst die Trendwerte mit Hilfe des in Schritt 1 ermittelten Trends, bilde dann die glatte Komponente mit Hilfe gleitender Durchschnitte der ursprünglichen Zeitreihe. Errechne den Zyklus als Differenz der glatten Komponente und der Trendwerte, also als

  3. Berechnung der Saisonkomponente
    Die Werte aus Schritt 2 werden gemittelt gemäß Diese Werte werden normiert durch Hierbei ist k die Anzahl der Werte
    ist eine Schätzung für die (monatstypische, quartalstypische,...) Abweichung, die saisonbereinigte Zeitreihe ist dann die Differenz.

Merke

Hier klicken zum Ausklappen

Im zweiten Schritt funktioniert die Bildung der glatten Komponente unabhängig und losgelöst vom ersten Schritt. Für die glatte Komponente ist also die Trend-Berechnung uninteressant, erst für den Zyklus muss sie um den Trend bereinigt werden.

Zeitreihenzerlegung am Beispiel

Anwendung auf das Beispiel 65 damit wie folgt.


Schätzung des Trends

Die Trendkomponente wird mit der KQ-Methode geschätzt, die schon aus vorherigen Kapiteln bekannt ist. Wichtig ist allerdings, dass nun die Zeit der Regressor ist, also gilt. Alle übrigen Komponenten, also und , sind hier das Residuum.

Es ist im vorliegenden Beispiel , das arithmetische Mittel der Zeitdaten ist , das Produkt .

Also rechnet man die Steigung a aus als

Der Ordinatenabschnitt b ist:

.

Man erhält also als Trendgerade .

Setzt man z.B. für t = 3 ein, so erhält man den Trendwert für den März des Jahres 2019 durch: . Die anderen Trendwerte sind in der folgenden Tabelle wiedergegeben:

  2019 Trend­komponente 2020 Trend­komponente 2021 Trend­komponente
Januar2441,11562541,68402442,2523
Februar2641,16302741,73132742,2997
März2841,21033041,77873042,3470
April3041,25772741,82602642,3944
Mai2941,30513041,87342842,4417
Juni3541,35243841,92083542,4891
Juli3841,39984041,96813842,5365
August4041,44714242,01554242,5838
September3541,49453442,06283542,6312
Oktober3041,54193042,10993042,6785
November2841,58922742,15762842,7259
Dezember2541,63662642,20492742,7733

Schätzung der glatten Komponente

Zur Ermittlung der zyklischen Komponente bedient man sich der Methode der gleitenden Durchschnitte. Wir schätzen die glatte Komponente als gleitenden Durchschnitt 12. Ordnung, d.h. k = 6 (wegen der Monatsdaten). Man verwendet die Formel

die speziell für k = 6 dann lautet:

Die möglichen t-Werte starten damit bei t = 7, damit in der Klammer mit die Zählung begonnen werden kann. Damit rechnet man z.B.

Die anderen Werte werden errechnet und die Arbeitstabelle 53 eingetragen. Man erhält damit die Zahlen der glatten Komponente.

  2019 glatte
Komponente
2020 glatte
Komponente
2021 glatte
Komponente
Januar24-2542,16672441,6667
Februar26-2742,33332741,5833
März28-3042,37503041,6250
April30-2742,33332641,6667
Mai29-3042,29172841,7083
Juni35-3842,29173541,7917
Juli3841,70834042,291738-
August4041,79174242,250042-
September3541,91673442,250035-
Oktober3041,87503042,208330-
November2841,79172742,083328-
Dezember2541,95832641,875027-

Alsdann bildet man die Differenz aus den tatsächlichen Zahlen yt und den Werten der glatten Komponente , d.h. die um die glatte Komponente bereinigte Zeitreihe :

 2019 20202021
Januar24-25- 6,166724- 6,6667
Februar26-27- 4,333327- 3,5833
März28-30- 1,375030- 0,6250
April30-27- 4,333326- 4,6667
Mai29-30- 1,291928- 2,7083
Juni35-386,7083354,2083
Juli387,2917408,708338-
August409,20834210,750042-
September354,0833342,750035-
Oktober30- 0,875030- 1,208330-
November28- 2,791727- 4,083328-
Dezember25- 5,958326- 4,875027-

Danach ordnet man zur besseren Übersicht die zum jeweils gleichen Monat passenden Daten spaltenweise an:

  1 2 3 4 5 6 7 8 9 10 11 12
2019------7,2929,2084,083- 0,875- 2,792- 5,958
2020- 6,167- 4,333- 1,375- 4,333- 1,2926,7088,70810,7502,750- 1,208- 4,083- 4,875
2021- 6,667- 3,583- 0,625- 4,667- 2,7084,208------

Schließlich werden die Zahlen aus Schritt 3 spaltenweise (!) gemittelt gemäß der Formel

ist die Menge der Jahre, für die dann die um die glatte Komponente bereinigte Zeitreihe gebildet wird. Die Zahl ist hierbei die Anzahl der Jahre, für die man die um die glatte Komponente bereinigte Zeitreihe berechnen kann. Also ist , weil nur für das 2. und 3. Jahr der Wert gebildet werden kann, denn dadurch dass am Anfang sechs Monate herausfallen, sind die Werte für die Monate Januar bis Juni nur aus den Jahren 2 und 3 zu berechnen. Der Parameter ist dabei , nämlich die Anzahl der Elemente der Mengen .

Genau andersrum verhält es sich bei . Dadurch, dass am Ende (im Jahr 2003) sechs Monate wegfallen, sind für die Monate Juli bis Dezember nur die Jahre 2019 und 2020, also 1 und 2, brauchbar. Also ist , wie oben die Zahl auch, . Man erhält also

  1 2 3 4 5 6 7 8 9 10 11 12
2019------7,2929,2084,083- 0,875- 2,792- 5,958
2020- 6,167- 4,333- 1,375- 4,333- 1,2926,7088,70810,7502,750- 1,208- 4,083- 4,875
2021- 6,667- 3,583- 0,625- 4,667- 2,7084,208------
- 6,417- 3,958- 1,000- 4,500- 2,0005,4588,0009,9793,417- 1,042- 3,438- 5,417

Wenn die Summe der nicht null ergibt bzw. nicht hinreichend nahe bei null liegt, muss man noch ein Korrekturglied ermitteln, nämlich das arithmetische Mittel der -Werte: es ist hier . Dieses Korrekturglied wird von den -Werten jeweils abgezogen, man erhält die normierten Schätzwerte für die monatstypische Abweichung .

  1 2 3 4 5 6 7 8 9 10 11 12
2019------7,2929,2084,082- 0,875- 2,792- 5,958
2020- 6,167- 4,333- 1,375- 4,333- 1,2926,7088,70810,752,750- 1,208- 4,083- 4,875
2021- 6,667- 3,583- 0,625- 4,667- 2,7084,208------
- 6,417- 3,958- 1,000- 4,500- 2,0005,4588,0009,9793,417- 1,042- 3,438- 5,417
- 6,340- 3,882- 0,924- 4,424- 1,9245,5358,07610,0563,493- 0,965- 3,361- 5,340

Saisonbereinigte Zeitreihe

Die eigentliche saisonbereinigte Zeitreihe ergibt sich dann durch Subtraktion der Werte aus Schritt 4 und der beobachteten Werte aus der Original-Zeitreihe.

 2019 saisonber. ZR2020 saisonber. ZR2021 saisonber. ZR
Januar3541,34033642,34033542,3403
Februar3740,8819 41,88193842,8819
März3939,92364141,92364141,9236
April4134,42363842,42363741,4236
Mai4041,92364142,92363940,9236
Juni4640,46534943,46534640,4653
Juli4940,92365142,92364940,9236
August5140,94445342,94445342,9444
September4642,50694541,50694642,5069
Oktober4141,96534141,96534141,9653
November3942,36113841,36113942,3611
Dezember3641,34033742,34033843,3403
Abb.36

 

Hinweis

Hier klicken zum Ausklappen

Die obigen Überlegungen gelten nur bei folgenden einschränkenden Annahmen:

  • die glatte Komponente kann innerhalb eines Zeitraums von m + 1 Perioden durch eine lineare Schätzung angenähert werden,

  • die Saisonfigur, also das Tupel , ist in der Summe null, d.h. . Konkret heißt dies bei Monatsdaten (bei Quartalsdaten), dass die Monatswerte (die Quartalswerte) eines Jahres in der Summe gleich null ergeben. Sollte dies nicht der Fall sein, dann muss man zunächst durch Normierung dafür sorgen, dass dies gilt.

  • die Werte der Saisonkomponente sind jeweils identisch für die gleichnamigen Perioden (sog. Konstanz der Saisonfigur, eine variable Saisonfigur wird hier nicht angesprochen)

  • bei Monatswerten
    bei Quartalswerten.
Lerne erfolgreich mit unseren Online-Kursen

This browser does not support the video element.

Sichere dir jetzt das kompakte Wissen mit unserem Vollzugriff Komplettpaket für wiwi-Studenten


  • Alle Lernmaterialien komplett mit 470 Videos, 3814 interaktiven Übungsaufgaben und 1747 Lerntexten
  • Günstiger als bei Einzelbuchung nur 14,90 € mtl. bei 1 Monaten Mindestvertragslaufzeit
Jetzt entdecken

This browser does not support the video element.

Einzelkurs: Deskriptive Statistik


  • Die besten Lernmaterialien: 95 Texte, 105 Abbildungen, 25 Videos und 212 Übungsaufgaben.
Jetzt entdecken

This browser does not support the video element.

Webinare: Du brauchst Hilfe? Frage unsere Dozenten im Webinar!


  • Perfekt vorbereitet auf die Präsentation in der mündlichen Prüfung
  • Am 10.05.2024 ab 18:00 Uhr
  • In diesem zweistündigen Webinar gibt Ihnen CMA Natalia Menzel einen Überblick über die Vorbereitungen auf die mündliche Prüfung.
Jetzt teilnehmen