Jetzt neu: Steuerrecht online lernen auf steuerkurse.de!
ZU DEN KURSEN!

Stichprobentheorie - Geschichtete Stichproben

Kursangebot | Stichprobentheorie | Geschichtete Stichproben

Stichprobentheorie

Geschichtete Stichproben

Inhaltsverzeichnis

Geschichtete Stichproben

Eingeführt wird zu Beginn die allgemeine Theorie der Schichtung.
Es ist vollkommen natürlich, dass es häufig zu einem Zerfall der Teilmengen in der Grundgesamtheit kommt. Die bevorzugte Begrifflichkeit ist die der Teilmengen oder eben Schicht. Beide Begriffe sind äquivalent zueinander.
Anders ausgedrückt: Die Grundgesamtheit zerfällt in einzelne Schichten.

Hier einige Beispiele, um das Beschriebene etwas deutlicher zu machen: Aufteilung von Städten in Stadtbezirke, ein Unternehmen mit unterschiedlichen Abteilungen, EU bestehend aus einzelnen Ländern.

Bei einer geschichteten Stichprobe werden zunächst einmal Stichproben innerhalb der einzelnen Schichten vorgenommen, bevor die gesammelten Daten zuletzt zusammengeführt und ausgewertet werden.

Das folgende Beispiel dient hier zur praktischen Anschauung:

Geschichtete Stichprobe

Beispiel

Hier klicken zum Ausklappen

Die Aufgabe besteht darin, den durchschnittlichen Quadratmeterpreis einer Fläche innerhalb einer ländlichen Region des Westerwalds zu ermitteln. Zwar könnte hier die Ziehung in Form einer einfachen Stichprobe erfolgen, jedoch unterschiedet sich nach den Aussagen der Landwirte die Fruchtbarkeit der Fläche in der Region erheblich. Demnach hängt diese davon ab, wo sie gelegen ist. Aus diesem Grund soll es zu einer Ziehen auf drei verschiedenen Flächen kommen, unterteilt in die folgenden Regionen:

 1. Äußerst fruchtbare Fläche

2. Fruchtbare Fläche

3. Weniger fruchtbare Fläche

Wenn somit eine Stichprobe aus allen drei Flächen gezogen wird, ermöglicht es den Quadratmeterpreis hinreichend genauer zu bestimmen. Darüber hinaus ermöglicht das Vorgehen das Gesamtmittel des Quadratmeter-Mietpreises besser zu schätzen. Damit fällt die Varianz deutlich geringer aus.

Beispiel zur Verhältnisschätzung:
Wenn die Information zur Aufteilung der Fläche in drei Regionen als Sekundärinformation angesehen werden kann, ist von einem Schichtungsmerkmal die Rede. Darüber hinaus können auch andere Schichtungsmerkmale hinzugefügt werden.

Ein Schichtungsmerkmal könnte auch beispielsweise die Anbindung an eine vorhandene Infrastruktur sein.

Dabei ist es für die Auswertung von Nöten, dass die Schichtzugehörigkeit und der Umfang der Schichten in der Grundgesamtheit bekannt ist.

Am geläufigsten ist bei Untersuchungen solcher Art die geschichtete Stichprobe.

Gründe für die Anwendung von geschichteten Stichproben

  1. Es besteht die Möglichkeit Daten separat innerhalb der einzelnen Schichten auszuwerten. Es kann jedoch auch der Fall sein, dass in den einzelnen Stichproben nur eine sehr geringe Anzahl an Elementen vorhanden ist. Die geschichtete Stichprobe gewährleistet somit, dass der Stichprobenumfang für jede Schicht einzeln vernommen wird.

  2. Es besteht die Möglichkeit bei dem Gesamtmittelwert einen sichtbaren Effizienzgewinn zu erreichen, wenn bestimmte Bedingungen berücksichtigt werden. Das bedeutet vor allem, dass sich die Varianz des entsprechenden Schätzers verringert.

  3. Die Stichprobe weist dann eine Repräsentativität in Bezug auf das Schichtmerkmal auf und entspricht somit mehr dem Ideal, wenn in den einzelnen Schichten die Stichprobenumfänge proportional zu den Schichtgrößen in der Grundgesamtheit gewählt wurden.
    Je größer die Schicht ist, desto größer ist die Größe der einzelnen Stichproben zu wählen.

    Repräsentativität bedeutet, dass die Stichprobe ein beinnahe ideales Abbild der Grundgesamtheit darstellt. Bei einer Wahl von zehn Schichten wird jeweils nach Altersgruppen und Geschlecht unterteilt. Wenn nun aus jeder Schicht der Anteil an der Gesamtbevölkerung Stichproben gezogen werden, entspreche dann die Alters- und Geschlechtsverteilung der geschichteten Stichprobe die der Population.

Der dritte Punkt bezieht sich ausschließlich auf die geschichtete Stichprobe mit proportionaler Aufteilung.

Es kommt öfter vor, dass die Aufteilung anders erfolgt, als wie es oben beschrieben wurde. Allerdings gibt es dabei die Möglichkeit auf die Grundgesamtheit zu schließen.

Als Beispiel sei hier der Direktvertrieb von Tiefkühlkost und Speisen zu nennen.
In bekannten Bezirken ist das Kaufverhalten beinahe stabil und gleich hoch. Mittels einer kleinen Stichprobe ist es möglich, dies zu ermitteln. Da ein gewisses Vorwissen über die Zielgruppe besteht, ist das Kaufverhalten in Bezirken in denen tendenziell mehr jüngere Menschen als Rentner leben, nicht genau absehbar. Dazu müsste eine größere Stichprobe vorgenommen werden, um eine genauere Aussage darüber treffen zu können. Die gegebene, ungleiche Gewichtung ist hierbei zu berücksichtigen.

Dazu die folgenden Beispiele:

Beispiel

Hier klicken zum Ausklappen

1. Beispiel

Die statistische Untersuchung soll dabei Helfen den durchschnittlichen Wohnraum von Familien in einem ländlichen Kreis zu ermitteln. Hierzu wird eine Umfrage unter 100 zufällig ausgewählten Familien eingeleitet. Wenn es sich um eine einfache Stichprobe handeln würde, würden die Stichproben nach gleich großen Wahrscheinlichkeiten jeder Familie sortiert werden.
Jedoch sind hier Sekundärinformationen gegeben, bei denen es ratsam wäre, diese auch hinzuzuziehen. Einen erheblichen Einflussfaktor auf die Größe des Wohnbereichs bietet hierbei das Einkommen jenes Familienmitglieds, welches für das Haupteinkommen verantwortlich ist. Es gibt jedoch auch die Möglichkeit, dass das Einkommen mittels Schichten berücksichtigt werden. Tendenziell kann demnach gesagt werden, dass der Wohnraum in gehobenen Gegenden größer ist, im Vergleich zu denen, in den Arbeiterbezirken. Diese beiden Gegensätze können bereits nach Schichten aufgeteilt werden. Dabei geht es fortlaufend nicht darum, dass einfache Zufallsstichproben gezogen werden, sondern dass beide Schichten gleichermaßen berücksichtigt werden. Das zentrale Ziel besteht darin, dass die Varianz des Schätzers so niedrig wie möglich bleibt. Das Hauptziel ist hierbei nicht die repräsentative Stichprobe.

Beispiel

Hier klicken zum Ausklappen

2. Beispiel

Eine Erlebnistherme möchte gerne wissen, wie häufig und in welchem zeitlichen Umfang die neue Infrarot-Sauna genutzt wird. Aus diesem Grund soll eine Stichprobe gezogen werden. Vorab liegen allerdings Sekundärinformationen vor:

jüngere Besucher

ältere Besucher

  • befinden sich nur hin und wieder in der Infrarotkabine.

  • befinden sich recht lang und häufig in der Infrarotkabine. Vermutete wird dabei die nachsagende, gesundheitsfördernde Wirkung.

Zu Beginn sollen hier einmal die Nachteile der einfachen Zufallsstichprobe kurz beschrieben werden:

  • Bei der Anwendung einer einfachen Stichprobe besteht die Gefahr, dass die zufällig gewählten Personen alle entweder etwas älter oder alle etwas jünger sind.

  • Dadurch könne eine falsche Schlussfolgerung resultieren. Dabei könnte es entweder dazu kommen, dass eine übermäßige Nutzung oder eine sehr geringfügige Nutzung der Infrarot-Sauna eingeschätzt wird.

Die geschichtete Stichprobe ermöglicht es die o. g. Fehlanalysen zu umgehen.

Beispiel

Hier klicken zum Ausklappen

3. Beispiel

Ein neues Produkt wird in einer Stadt getestet, in der viele verschiedene Nationalitäten vertreten sind. Aus vorherigen Tests ist bereits bekannt, dass unter einigen Nationalitäten das neue Produkt nicht beliebt ist bzw. nicht gekauft wird. Empfehlenswert ist es hier, die vorhandenen Nationalitäten in Schichten aufzuteilen, Darunter zählen hier beispielsweise: Albaner, Ukrainer, Araber, Rumänen etc.

Der Nutzen der geschichteten Stichprobe wird im nächsten Beispiel zur Debatte gestellt.

Nützlichkeit

Beispiel

Hier klicken zum Ausklappen

4. Beispiel

Ausgehend von einer vorliegenden Grundgesamtheit von fünf Elementen, gehen die folgenden Werte einher: $Y_1 = 9$, $Y_2 = 10$, $Y_3 = 11$, $Y_4 = 18$, $Y_5 = 22$

Der Mittelwert der Grundgesamtheit liegt vor durch: $\overline Y=\frac 1 5(9+10+11+18+22)=14.$

Aus der Menge wird im Rahmen der einfachen Stichprobe ein Stichprobenumfang von n = 3 entnommen. Der einfachen Stichprobe liegt zugrunde, dass eine gleich große Wahrscheinlichkeit für alle möglichen Stichproben besteht.
Demnach resultieren daraus die folgenden, möglichen Stichproben:

$Y_{i\text =}$

$Y_{i\text =}$

$Y_{i\text =}$

Mittelwert der Stichprobe $\overline y_i\text =$

Wahrscheinlichkeit

1

2

3

10

0,1

1

2

4

12,33

0,1

1

2

5

13,67

0,1

1

3

4

12,67

0,1

1

3

5

14

0,1

1

4

5

16,33

0,1

2

3

4

13

0,1

2

3

5

14,33

0,1

2

4

5

16,67

0,1

3

4

5

17

0,1

Es ergibt sich der Mittelwert der ersten Stichprobe zu: $\frac 1 3(Y_1+Y_2+Y_3)=\frac 1 3(9+10+11)=10.$
Alle weiteren werden auf ähnliche Weise berechnet. Für die Verteilung von $\overline y$ sind folgende Werte zu entnehmen:

$\overline y_i$

10

12,33

12,67

13

13,67

14

14,33

16,33

16,67

17

$P(\overline y)$

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

Wir bekommen für den Erwartungswert von $\overline y$ : $E(\overline y)=\frac 1{10}(10+12,33+12,67+13+13,67+14+14,33+16,33+16,67+17)=14.$ 

Gleichermaßen erhalten wir für die Varianz: $\mathit{VAR}(\overline y)=\frac 1{10}\sum _{i=1}^{10}(\overline y_i-14)^2=\frac 1{10}\left((10-14)^2+(12,33-14)^2+...+(17-14)^2\right)=4,33.$

 

An diesem Punkt kann überlegt werden, ob die Varianz durch die gezielte Wahl von n = 3 Ziehungen verringert werden kann.
Die Annahme besteh darin, dass die Sekundärinformation der Grund ist, weswegen die  Population in zwei Schichten bzw. Gruppen vorliegt. Die vorliegenden Werte für die erste Gruppe lauten: $Y_1$, $Y_2$ und $Y_3$ und für die zweite: $Y_4$ und $Y_5.$

Der Vorteil der Zerlegung ist der, dass die Werte $Y_i$ in jeder Gruppe eng beieinander liegen. Somit kann schlussgefolgert werden, dass eine offensichtliche Abhängigkeit von Niveau $Y_i$ und der Gruppe vorliegt. Die Schichtung kommt durch die Aufteilung der Population in Gruppen zustande.
Da auch in diesem Kontext die Begriffe Gruppe und Schicht äquivalent zueinander sind, wird nur noch der Begriff der Schicht verwendet.

Eine einfache Zufallsprobe wird nun aus jeder Schicht gezogen.
Das Vorgehen kann als geschichtete Stichprobe beschrieben werden. Ausgehend von den Werten von $Y_i$ erscheint die folgende Unterteilung in Schichten logisch:

Schicht 1

$Y_1=9$$Y_2=10$$Y_3=11$

Schicht 2

$Y_4=18$$Y_5=22$ 

Zugunsten der Annäherung der jeweiligen Menge der gegebenen Werte in den einzelnen Schichten, kommt es in der ersten Schicht zu einer Ziehung von zwei Elementen und in der zweiten Schicht zu der Zeitung von einem Element.

Daraus resultieren allumfassend die folgenden Möglichkeiten für die einzelnen Ziehungen:

Schicht 1Schicht 2

Gezogene Indizes

Gezogene Indizes

Mittelwert der Stichprobe

Gezogene Indizes

Mittelwert der Stichprobe

1

2

(9+10)/2=9,5

4

18

1

3

10

5

22

2

3

10,5

  

Das Hauptziel besteht darin, dass es zu einer möglichst realitätsnahen Kombination des jeweiligen Mittelwerts und des Schätzers kommt. Die Aufgabe des Schätzers ist es, das Populationsmittel $\overline Y$ zu schätzen.

Für das Erreichen unseres Ziels ist es von Bedeutung, dass die Auswahlwahrscheinlichkeiten der einzelnen Individuen berechnet werden.

Bevor es zu den Notationen bzw. Aufzeichnungen kommt, sollten einige Vorbereitungen erfolgen.

Geschichtete Stichproben

In M wird die Grundgesamtheit paarweise in disjunkte Schichten aufgeteilt. Dadurch erfolgt die Unterteilung in Schichten, indem auch jede Schicht $N_h$ Elemente erhält.

Im Rahmen der einfachen Zufallsstichprobe werden $n_h$ Elemente aus der entsprechenden Schicht gezogen.

Notationen

Es gelten die folgenden Notationen in der Grundgesamtheit:

Größe

Bedeutung

$N_h,h=1,...,M$

Populationsumfang in der h-ten Schicht

$N=\sum _{h=1}^MN_h$

Gesamt-Populationsumfang

$Y_{hi},i=1,...,N_h$

Variable oder Merkmal des i-ten Individuums in der h-ten Schicht

$\overline Y_h=\frac 1{N_h}\sum _{i=1}^{N_h}Y_{\mathit{hi}}$

Mittelwert der Variablen in der h-ten Schicht

$\pi _{\mathit{hi}}=\frac{n_h}{N_h}$

Auswahlwahrscheinlichkeit für das i-te Individuum in der h-ten Schicht

$S_h^2=\frac{\sum _{i=1}^{N_h}(Y_{hi}-\overline Y_h)^2}{N_h}$

Varianz in der h-ten Schicht

Es gilt in der Stichprobe: 

Größe

Bedeutung

$n_h,h=1,...,M$

Stichprobenumfang in der h-ten Schicht

$n=\sum _{h=1}^Mn_h$

Gesamt-Stichprobenumfang

$y_{hk},k=1,...,n_h$

Variable oder Merkmal des k-ten Individuums in der h-ten Schicht

$\overline y_h=\frac 1{n_h}\sum _{k=1}^{n_h}y_{hk}$

Mittelwert der Variablen in der h-ten Schicht

$\pi _{hk}=\frac{n_h}{N_h}$

Auswahlwahrscheinlichkeit für das k-te gezogene Individuum in der h-ten Schicht

$s_h^2=\frac{\sum _{k=1}^{n_h}(y_{hk}-\overline y_h)^2}{n_h-1}$

Varianz in der h-ten Schicht

Es sei nochmals darauf hingewiesen, dass in M paarweise disjunkte Schichten vorliegen und diese die Unterteilung der Grundgesamtheit bilden.

 

Merke

Hier klicken zum Ausklappen

Es werden M einfache Zufallsstichproben im Rahmen einer geschichteten Stichprobe gezogen. Dabei entstammt jede einzelne Zufallsstichprobe aus genau je einer der vorliegenden Schichten.

Es wird besonders deutlich, dass die Wahrscheinlichkeitsgröße bei $\frac{n_h}{N_h}$ liegt. Diese entspricht dem, dass ein Individuum aus der h-ten Schicht gezogen wird.

Es ergibt sich demnach eine Auswahlwahrscheinlichkeit des i-ten Individuums aus der h-ten  Schicht von: $\pi _{\mathit{hi}}=\frac{n_h}{N_h},$

Der Schätzte für die geschichtete Stichprobe resultiert nach der Verwendung der jeweiligen Gleichungen zu:
$\hat{\overline Y}_{\mathit{GS}}=\frac 1 N\sum _{h=1}^M\sum _{k=1}^{n_h}\frac{y_{hk}}{\pi _{\mathit{hk}}}=\sum _{h=1}^M\frac{N_h} N\overline y_h.$

Der Schätzer für den Mittelwert in der h-ten Schicht entspricht $\overline y_h=\sum _{k=1}^{n_h}\frac{y_{\mathit{hk}}}{n_h}.$ Weil sich der Schätzer aus den Mittelwertschätzern der anderen einzelnen Schichten zusammensetzt, wird dieser auch geschichteter Schätzer genannt.

 

Beispiel

Hier klicken zum Ausklappen

5. Beispiel

Hierbei wird das erste Beispiel zur Verhältnisschätzung weiter fortgeführt, da nun die Voraussetzungen gegeben sind.
Es werden zu Beginn alle Stichproben die möglich sind, in den Schichten tabellarisch notiert.
Dabei erhalten wir die folgenden Möglichkeiten:

Gezogene Einheiten
(gezogen werden nach der obigen Vereinbarung zwei Elemente bzw. Einheiten)
Gezogene Einheit
(gezogen wird nach obiger Vereinbarung ein Element bzw. Einheit)
Schicht 1Schicht 2

1  2

4

1  3

4

2  3

4

1  2

5

1  3

5

2  3

5

Bei der Berechnung des Schätzers für die geschichtete Stichprobe bekommen wir:

Gezogene Einheiten
(gezogen werden nach der obigen Vereinbarung zwei Elemente bzw. Einheiten)
Gezogene Einheit
(gezogen wird nach der obigen Vereinbarung ein Element bzw. Einheit)
   

Schicht 1

Schicht 2

$\overline y_1$$\overline y_2$$\hat{\overline Y}_{\mathit{GS}_i}$

1  2

4

$\frac 1 2(Y_1+Y_2)$
=9,5
$Y_4=18$$\frac 3 59,5+\frac 2 5\ast 18=12,9$

1  3

4

$\frac 1 2(Y_1+Y_3)$
=10
$Y_4=18$$\frac 3 510+\frac 2 5\ast 18=13,2$

2  3

4

$\frac 1 2(Y_2+Y_3)$
=10,5

$Y_4=18$$\frac 3 510,5+\frac 2 5\ast 18=13,5$

1  2

5

$\frac 1 2(Y_1+Y_2)$
=9,5
$Y_5=22$$\frac 3 59,5+\frac 2 5\ast 22=14,5$

1  3

5

$\frac 1 2(Y_1+Y_3)$
=10
$Y_5=22$$\frac 3 510+\frac 2 5\ast 22=14,8$

2  3

5

$\frac 1 2(Y_2+Y_3)$
=10,5
$Y_5=22$$\frac 3 510,5+\frac 2 5\ast 22=15,1$

Berechnet werden kann nun der Erwartungswert für $\hat{\overline Y}_{\mathit{GS}}$:

$E\left(\hat{\overline Y}_{\mathit{GS}}\right)=\frac 1 6\sum _{i=1}^6\hat{\overline Y}_{\mathit{GS}_i}=\frac 1 6(12,9+13,2+13,5+14,5+14,8+15,1)=14.$

Folglich können wir auch die Variante von $\hat{\overline Y}_{\mathit{GS}}$ ermitteln: $\mathit{VAR}\left(\hat{\overline Y}_{\mathit{GS}}\right)=\frac 1 6\sum _{i=1}^6\left(\hat{\overline Y}_{\mathit{GS}_i}-E\left(\hat{\overline Y}_{\mathit{GS}}\right)\right)^2=\frac 1 6\left((12,9-14)^2+(13,2-14)^2+...+(15,1-14)^2\right)=0,7.$

Zu sehen ist dabei, dass der geschichtete Schätzer erwartungstreu ist für $\overline y$ : $E\left(\hat{\overline Y}_{\mathit{GS}}\right)=\overline y.$ 

Der erwartungstreue Schätzer wurde von uns selbst entwickelt.

Dabei fällt äußerst positiv auf, dass die berechnete Varianz zu 0,7 wesentlich niedriger ist im Vergleich zu der, in der einfachen Zufallsstichprobe, denn diese lag bei 4,33.
Die Ursache für die extrem niedrige Varianz besteht darin, dass die Schichten gezielt so verteilt wurden, dass die kleinen $Y_i$-Werte in die Schicht 1 kamen und die großen $Y_i$-Werte in die Schicht 2. Erzielt wurde damit eine Ähnlichkeit der Elemente in den einzelnen Schichten.

Achtung! Es darf keine Verwechslungsgefahr in der Hinsicht bestehen, dass die Schichten sich einander ähneln. Die Schichten an sich sind unterschiedlich bzw. disjunkt.

In Anlehnung an die vorgenommenen Untersuchungen ist nun das Schichtungsprinzip zu formulieren:

Schichtungs-Prinzip

Merke

Hier klicken zum Ausklappen

Die Variablen bzw. Merkmalsträger für die einzelnen Schichten sind so auszuwählen, dass diese sich innerhalb einer Schicht so ähnlich wie möglich sind.
Jedoch sollten demzufolge die Schichten untereinander so unterschiedlich bzw. disjunkt wie nur möglich sein!

-> Durch die örtliche Nähe der Merkmalsträger ist das Schichtungsprinzip meist schon automatisch erfüllt.

 

Beispiele zum Schichtungs-Prinzip

Beispiel

Hier klicken zum Ausklappen

1. Beispiel

Als Schichtungsmerkmal könnte beispielsweise innerhalb eines Bundeslandes eine Stadt fungieren. Das könnte aufgrund dessen erfolgen, da die Bevölkerung in den Städten tendenziell sehr ähnliche Eigenschaften aufweisen. Erfolgt die Schichtung auf diese Weise, so wird diese einen positiven Anwendungseffekt innehaben.

Beispiel

Hier klicken zum Ausklappen

2. Beispiel

Wenn es zu einer Umfrage in einer Stadt- und Landregion zu einem bestimmten Thema kommt, sollte bei der Durchführung darauf geachtet werden, dass die Bevölkerung in der Stadt bzw. auf dem Land hinreichend homogen ist bzw. diese innerhalb der „Gruppe“ wenige Unterschiede aufweisen.

Zu guter Letzt werden die wichtigsten Formeln hinsichtlich der geschichteten Stichproben aufgelistet:

Formelsammlung

Schätzer für den Mittelwert und die Varianz einer geschichteten Stichprobe

Aufteilung der Population in M disjunkte Schichten vom Umfang $N_h,h=1,...,M.$

Es sei in jeder Schicht eine einfache Zufallsstichprobe zu ziehen, mit einem Umfang von $n_h,h=1,...,M$

Die Ziehungen in den Schichten sind unabhängig voneinander.

Es liegt ein erwartungstreuer Schätzer für den Mittelwert der Population durch den geschichteten Schätzer vor:
$\hat{\overline Y}_{\mathit{GS}}=\sum _{h=1}^M\frac{N_h} N\overline y_h.$

Die Schätzung der Varianz kann folgendermaßen erfolgen:
$\hat{\mathit{VAR}\left(\hat{\overline Y}_{\mathit{GS}}\right)}=\sum _{h=1}^M\left(\frac{N_h} N\right)^2\frac{N_h-n_h}{N_h}\frac{s_h^2}{n_h}.$


Die geschätzte Varianz in der h-ten Schicht entspricht der Größe $s_h^2.$