ZU DEN KURSEN!

Stichprobentheorie - Geschichtete Stichproben

Kursangebot | Stichprobentheorie | Geschichtete Stichproben

Stichprobentheorie

Geschichtete Stichproben

Inhaltsverzeichnis

Geschichtete Stichproben

Eingeführt wird zu Beginn die allgemeine Theorie der Schichtung.
Es ist vollkommen natürlich, dass es häufig zu einem Zerfall der Teilmengen in der Grundgesamtheit kommt. Die bevorzugte Begrifflichkeit ist die der Teilmengen oder eben Schicht. Beide Begriffe sind äquivalent zueinander.
Anders ausgedrückt: Die Grundgesamtheit zerfällt in einzelne Schichten.

Hier einige Beispiele, um das Beschriebene etwas deutlicher zu machen: Aufteilung von Städten in Stadtbezirke, ein Unternehmen mit unterschiedlichen Abteilungen, EU bestehend aus einzelnen Ländern.

Bei einer geschichteten Stichprobe werden zunächst einmal Stichproben innerhalb der einzelnen Schichten vorgenommen, bevor die gesammelten Daten zuletzt zusammengeführt und ausgewertet werden.

Das folgende Beispiel dient hier zur praktischen Anschauung:

Geschichtete Stichprobe

Beispiel

Hier klicken zum Ausklappen

Die Aufgabe besteht darin, den durchschnittlichen Quadratmeterpreis einer Fläche innerhalb einer ländlichen Region des Westerwalds zu ermitteln. Zwar könnte hier die Ziehung in Form einer einfachen Stichprobe erfolgen, jedoch unterschiedet sich nach den Aussagen der Landwirte die Fruchtbarkeit der Fläche in der Region erheblich. Demnach hängt diese davon ab, wo sie gelegen ist. Aus diesem Grund soll es zu einer Ziehen auf drei verschiedenen Flächen kommen, unterteilt in die folgenden Regionen:

 1. Äußerst fruchtbare Fläche

2. Fruchtbare Fläche

3. Weniger fruchtbare Fläche

Wenn somit eine Stichprobe aus allen drei Flächen gezogen wird, ermöglicht es den Quadratmeterpreis hinreichend genauer zu bestimmen. Darüber hinaus ermöglicht das Vorgehen das Gesamtmittel des Quadratmeter-Mietpreises besser zu schätzen. Damit fällt die Varianz deutlich geringer aus.

Beispiel zur Verhältnisschätzung:
Wenn die Information zur Aufteilung der Fläche in drei Regionen als Sekundärinformation angesehen werden kann, ist von einem Schichtungsmerkmal die Rede. Darüber hinaus können auch andere Schichtungsmerkmale hinzugefügt werden.

Ein Schichtungsmerkmal könnte auch beispielsweise die Anbindung an eine vorhandene Infrastruktur sein.

Dabei ist es für die Auswertung von Nöten, dass die Schichtzugehörigkeit und der Umfang der Schichten in der Grundgesamtheit bekannt ist.

Am geläufigsten ist bei Untersuchungen solcher Art die geschichtete Stichprobe.

Gründe für die Anwendung von geschichteten Stichproben

  1. Es besteht die Möglichkeit Daten separat innerhalb der einzelnen Schichten auszuwerten. Es kann jedoch auch der Fall sein, dass in den einzelnen Stichproben nur eine sehr geringe Anzahl an Elementen vorhanden ist. Die geschichtete Stichprobe gewährleistet somit, dass der Stichprobenumfang für jede Schicht einzeln vernommen wird.

  2. Es besteht die Möglichkeit bei dem Gesamtmittelwert einen sichtbaren Effizienzgewinn zu erreichen, wenn bestimmte Bedingungen berücksichtigt werden. Das bedeutet vor allem, dass sich die Varianz des entsprechenden Schätzers verringert.

  3. Die Stichprobe weist dann eine Repräsentativität in Bezug auf das Schichtmerkmal auf und entspricht somit mehr dem Ideal, wenn in den einzelnen Schichten die Stichprobenumfänge proportional zu den Schichtgrößen in der Grundgesamtheit gewählt wurden.
    Je größer die Schicht ist, desto größer ist die Größe der einzelnen Stichproben zu wählen.

    Repräsentativität bedeutet, dass die Stichprobe ein beinnahe ideales Abbild der Grundgesamtheit darstellt. Bei einer Wahl von zehn Schichten wird jeweils nach Altersgruppen und Geschlecht unterteilt. Wenn nun aus jeder Schicht der Anteil an der Gesamtbevölkerung Stichproben gezogen werden, entspreche dann die Alters- und Geschlechtsverteilung der geschichteten Stichprobe die der Population.

Der dritte Punkt bezieht sich ausschließlich auf die geschichtete Stichprobe mit proportionaler Aufteilung.

Es kommt öfter vor, dass die Aufteilung anders erfolgt, als wie es oben beschrieben wurde. Allerdings gibt es dabei die Möglichkeit auf die Grundgesamtheit zu schließen.

Als Beispiel sei hier der Direktvertrieb von Tiefkühlkost und Speisen zu nennen.
In bekannten Bezirken ist das Kaufverhalten beinahe stabil und gleich hoch. Mittels einer kleinen Stichprobe ist es möglich, dies zu ermitteln. Da ein gewisses Vorwissen über die Zielgruppe besteht, ist das Kaufverhalten in Bezirken in denen tendenziell mehr jüngere Menschen als Rentner leben, nicht genau absehbar. Dazu müsste eine größere Stichprobe vorgenommen werden, um eine genauere Aussage darüber treffen zu können. Die gegebene, ungleiche Gewichtung ist hierbei zu berücksichtigen.

Dazu die folgenden Beispiele:

Beispiel

Hier klicken zum Ausklappen

1. Beispiel

Die statistische Untersuchung soll dabei Helfen den durchschnittlichen Wohnraum von Familien in einem ländlichen Kreis zu ermitteln. Hierzu wird eine Umfrage unter 100 zufällig ausgewählten Familien eingeleitet. Wenn es sich um eine einfache Stichprobe handeln würde, würden die Stichproben nach gleich großen Wahrscheinlichkeiten jeder Familie sortiert werden.
Jedoch sind hier Sekundärinformationen gegeben, bei denen es ratsam wäre, diese auch hinzuzuziehen. Einen erheblichen Einflussfaktor auf die Größe des Wohnbereichs bietet hierbei das Einkommen jenes Familienmitglieds, welches für das Haupteinkommen verantwortlich ist. Es gibt jedoch auch die Möglichkeit, dass das Einkommen mittels Schichten berücksichtigt werden. Tendenziell kann demnach gesagt werden, dass der Wohnraum in gehobenen Gegenden größer ist, im Vergleich zu denen, in den Arbeiterbezirken. Diese beiden Gegensätze können bereits nach Schichten aufgeteilt werden. Dabei geht es fortlaufend nicht darum, dass einfache Zufallsstichproben gezogen werden, sondern dass beide Schichten gleichermaßen berücksichtigt werden. Das zentrale Ziel besteht darin, dass die Varianz des Schätzers so niedrig wie möglich bleibt. Das Hauptziel ist hierbei nicht die repräsentative Stichprobe.

Beispiel

Hier klicken zum Ausklappen

2. Beispiel

Eine Erlebnistherme möchte gerne wissen, wie häufig und in welchem zeitlichen Umfang die neue Infrarot-Sauna genutzt wird. Aus diesem Grund soll eine Stichprobe gezogen werden. Vorab liegen allerdings Sekundärinformationen vor:

jüngere Besucher

ältere Besucher

  • befinden sich nur hin und wieder in der Infrarotkabine.

  • befinden sich recht lang und häufig in der Infrarotkabine. Vermutete wird dabei die nachsagende, gesundheitsfördernde Wirkung.

Zu Beginn sollen hier einmal die Nachteile der einfachen Zufallsstichprobe kurz beschrieben werden:

  • Bei der Anwendung einer einfachen Stichprobe besteht die Gefahr, dass die zufällig gewählten Personen alle entweder etwas älter oder alle etwas jünger sind.

  • Dadurch könne eine falsche Schlussfolgerung resultieren. Dabei könnte es entweder dazu kommen, dass eine übermäßige Nutzung oder eine sehr geringfügige Nutzung der Infrarot-Sauna eingeschätzt wird.

Die geschichtete Stichprobe ermöglicht es die o. g. Fehlanalysen zu umgehen.

Beispiel

Hier klicken zum Ausklappen

3. Beispiel

Ein neues Produkt wird in einer Stadt getestet, in der viele verschiedene Nationalitäten vertreten sind. Aus vorherigen Tests ist bereits bekannt, dass unter einigen Nationalitäten das neue Produkt nicht beliebt ist bzw. nicht gekauft wird. Empfehlenswert ist es hier, die vorhandenen Nationalitäten in Schichten aufzuteilen, Darunter zählen hier beispielsweise: Albaner, Ukrainer, Araber, Rumänen etc.

Der Nutzen der geschichteten Stichprobe wird im nächsten Beispiel zur Debatte gestellt.

Nützlichkeit

Beispiel

Hier klicken zum Ausklappen

4. Beispiel

Ausgehend von einer vorliegenden Grundgesamtheit von fünf Elementen, gehen die folgenden Werte einher: ,

Der Mittelwert der Grundgesamtheit liegt vor durch:

Aus der Menge wird im Rahmen der einfachen Stichprobe ein Stichprobenumfang von n = 3 entnommen. Der einfachen Stichprobe liegt zugrunde, dass eine gleich große Wahrscheinlichkeit für alle möglichen Stichproben besteht.
Demnach resultieren daraus die folgenden, möglichen Stichproben:

Mittelwert der Stichprobe 

Wahrscheinlichkeit

1

2

3

10

0,1

1

2

4

12,33

0,1

1

2

5

13,67

0,1

1

3

4

12,67

0,1

1

3

5

14

0,1

1

4

5

16,33

0,1

2

3

4

13

0,1

2

3

5

14,33

0,1

2

4

5

16,67

0,1

3

4

5

17

0,1

Es ergibt sich der Mittelwert der ersten Stichprobe zu:
Alle weiteren werden auf ähnliche Weise berechnet. Für die Verteilung von sind folgende Werte zu entnehmen:

10

12,33

12,67

13

13,67

14

14,33

16,33

16,67

17

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

Wir bekommen für den Erwartungswert von :  

Gleichermaßen erhalten wir für die Varianz:

 

An diesem Punkt kann überlegt werden, ob die Varianz durch die gezielte Wahl von n = 3 Ziehungen verringert werden kann.
Die Annahme besteh darin, dass die Sekundärinformation der Grund ist, weswegen die  Population in zwei Schichten bzw. Gruppen vorliegt. Die vorliegenden Werte für die erste Gruppe lauten: , und und für die zweite: und

Der Vorteil der Zerlegung ist der, dass die Werte in jeder Gruppe eng beieinander liegen. Somit kann schlussgefolgert werden, dass eine offensichtliche Abhängigkeit von Niveau und der Gruppe vorliegt. Die Schichtung kommt durch die Aufteilung der Population in Gruppen zustande.
Da auch in diesem Kontext die Begriffe Gruppe und Schicht äquivalent zueinander sind, wird nur noch der Begriff der Schicht verwendet.

Eine einfache Zufallsprobe wird nun aus jeder Schicht gezogen.
Das Vorgehen kann als geschichtete Stichprobe beschrieben werden. Ausgehend von den Werten von erscheint die folgende Unterteilung in Schichten logisch:

Schicht 1

Schicht 2

 

Zugunsten der Annäherung der jeweiligen Menge der gegebenen Werte in den einzelnen Schichten, kommt es in der ersten Schicht zu einer Ziehung von zwei Elementen und in der zweiten Schicht zu der Zeitung von einem Element.

Daraus resultieren allumfassend die folgenden Möglichkeiten für die einzelnen Ziehungen:

Schicht 1Schicht 2

Gezogene Indizes

Gezogene Indizes

Mittelwert der Stichprobe

Gezogene Indizes

Mittelwert der Stichprobe

1

2

(9+10)/2=9,5

4

18

1

3

10

5

22

2

3

10,5

  

Das Hauptziel besteht darin, dass es zu einer möglichst realitätsnahen Kombination des jeweiligen Mittelwerts und des Schätzers kommt. Die Aufgabe des Schätzers ist es, das Populationsmittel zu schätzen.

Für das Erreichen unseres Ziels ist es von Bedeutung, dass die Auswahlwahrscheinlichkeiten der einzelnen Individuen berechnet werden.

Bevor es zu den Notationen bzw. Aufzeichnungen kommt, sollten einige Vorbereitungen erfolgen.

Geschichtete Stichproben

In M wird die Grundgesamtheit paarweise in disjunkte Schichten aufgeteilt. Dadurch erfolgt die Unterteilung in Schichten, indem auch jede Schicht Elemente erhält.

Im Rahmen der einfachen Zufallsstichprobe werden Elemente aus der entsprechenden Schicht gezogen.

Notationen

Es gelten die folgenden Notationen in der Grundgesamtheit:

Größe

Bedeutung

Populationsumfang in der h-ten Schicht

Gesamt-Populationsumfang

Variable oder Merkmal des i-ten Individuums in der h-ten Schicht

Mittelwert der Variablen in der h-ten Schicht

Auswahlwahrscheinlichkeit für das i-te Individuum in der h-ten Schicht

Varianz in der h-ten Schicht

Es gilt in der Stichprobe: 

Größe

Bedeutung

Stichprobenumfang in der h-ten Schicht

Gesamt-Stichprobenumfang

Variable oder Merkmal des k-ten Individuums in der h-ten Schicht

Mittelwert der Variablen in der h-ten Schicht

Auswahlwahrscheinlichkeit für das k-te gezogene Individuum in der h-ten Schicht

Varianz in der h-ten Schicht

Es sei nochmals darauf hingewiesen, dass in M paarweise disjunkte Schichten vorliegen und diese die Unterteilung der Grundgesamtheit bilden.

 

Merke

Hier klicken zum Ausklappen

Es werden M einfache Zufallsstichproben im Rahmen einer geschichteten Stichprobe gezogen. Dabei entstammt jede einzelne Zufallsstichprobe aus genau je einer der vorliegenden Schichten.

Es wird besonders deutlich, dass die Wahrscheinlichkeitsgröße bei liegt. Diese entspricht dem, dass ein Individuum aus der h-ten Schicht gezogen wird.

Es ergibt sich demnach eine Auswahlwahrscheinlichkeit des i-ten Individuums aus der h-ten  Schicht von:

Der Schätzte für die geschichtete Stichprobe resultiert nach der Verwendung der jeweiligen Gleichungen zu:


Der Schätzer für den Mittelwert in der h-ten Schicht entspricht Weil sich der Schätzer aus den Mittelwertschätzern der anderen einzelnen Schichten zusammensetzt, wird dieser auch geschichteter Schätzer genannt.

 

Beispiel

Hier klicken zum Ausklappen

5. Beispiel

Hierbei wird das erste Beispiel zur Verhältnisschätzung weiter fortgeführt, da nun die Voraussetzungen gegeben sind.
Es werden zu Beginn alle Stichproben die möglich sind, in den Schichten tabellarisch notiert.
Dabei erhalten wir die folgenden Möglichkeiten:

Gezogene Einheiten
(gezogen werden nach der obigen Vereinbarung zwei Elemente bzw. Einheiten)
Gezogene Einheit
(gezogen wird nach obiger Vereinbarung ein Element bzw. Einheit)
Schicht 1Schicht 2

1  2

4

1  3

4

2  3

4

1  2

5

1  3

5

2  3

5

Bei der Berechnung des Schätzers für die geschichtete Stichprobe bekommen wir:

Gezogene Einheiten
(gezogen werden nach der obigen Vereinbarung zwei Elemente bzw. Einheiten)
Gezogene Einheit
(gezogen wird nach der obigen Vereinbarung ein Element bzw. Einheit)
   

Schicht 1

Schicht 2

1  2

4


=9,5

1  3

4


=10

2  3

4


=10,5

1  2

5


=9,5

1  3

5


=10

2  3

5


=10,5

Berechnet werden kann nun der Erwartungswert für :



Folglich können wir auch die Variante von ermitteln:

Zu sehen ist dabei, dass der geschichtete Schätzer erwartungstreu ist für :  

Der erwartungstreue Schätzer wurde von uns selbst entwickelt.

Dabei fällt äußerst positiv auf, dass die berechnete Varianz zu 0,7 wesentlich niedriger ist im Vergleich zu der, in der einfachen Zufallsstichprobe, denn diese lag bei 4,33.
Die Ursache für die extrem niedrige Varianz besteht darin, dass die Schichten gezielt so verteilt wurden, dass die kleinen -Werte in die Schicht 1 kamen und die großen -Werte in die Schicht 2. Erzielt wurde damit eine Ähnlichkeit der Elemente in den einzelnen Schichten.

Achtung! Es darf keine Verwechslungsgefahr in der Hinsicht bestehen, dass die Schichten sich einander ähneln. Die Schichten an sich sind unterschiedlich bzw. disjunkt.

In Anlehnung an die vorgenommenen Untersuchungen ist nun das Schichtungsprinzip zu formulieren:

Schichtungs-Prinzip

Merke

Hier klicken zum Ausklappen

Die Variablen bzw. Merkmalsträger für die einzelnen Schichten sind so auszuwählen, dass diese sich innerhalb einer Schicht so ähnlich wie möglich sind.
Jedoch sollten demzufolge die Schichten untereinander so unterschiedlich bzw. disjunkt wie nur möglich sein!

-> Durch die örtliche Nähe der Merkmalsträger ist das Schichtungsprinzip meist schon automatisch erfüllt.

 

Beispiele zum Schichtungs-Prinzip

Beispiel

Hier klicken zum Ausklappen

1. Beispiel

Als Schichtungsmerkmal könnte beispielsweise innerhalb eines Bundeslandes eine Stadt fungieren. Das könnte aufgrund dessen erfolgen, da die Bevölkerung in den Städten tendenziell sehr ähnliche Eigenschaften aufweisen. Erfolgt die Schichtung auf diese Weise, so wird diese einen positiven Anwendungseffekt innehaben.

Beispiel

Hier klicken zum Ausklappen

2. Beispiel

Wenn es zu einer Umfrage in einer Stadt- und Landregion zu einem bestimmten Thema kommt, sollte bei der Durchführung darauf geachtet werden, dass die Bevölkerung in der Stadt bzw. auf dem Land hinreichend homogen ist bzw. diese innerhalb der „Gruppe“ wenige Unterschiede aufweisen.

Zu guter Letzt werden die wichtigsten Formeln hinsichtlich der geschichteten Stichproben aufgelistet:

Formelsammlung

Schätzer für den Mittelwert und die Varianz einer geschichteten Stichprobe

Aufteilung der Population in M disjunkte Schichten vom Umfang 

Es sei in jeder Schicht eine einfache Zufallsstichprobe zu ziehen, mit einem Umfang von

Die Ziehungen in den Schichten sind unabhängig voneinander.

Es liegt ein erwartungstreuer Schätzer für den Mittelwert der Population durch den geschichteten Schätzer vor:

Die Schätzung der Varianz kann folgendermaßen erfolgen:



Die geschätzte Varianz in der h-ten Schicht entspricht der Größe

Lerne erfolgreich mit unseren Online-Kursen

This browser does not support the video element.

Sichere dir jetzt das kompakte Wissen mit unserem Vollzugriff Komplettpaket für wiwi-Studenten


  • Alle Lernmaterialien komplett mit 470 Videos, 3814 interaktiven Übungsaufgaben und 1747 Lerntexten
  • Günstiger als bei Einzelbuchung nur 14,90 € mtl. bei 1 Monaten Mindestvertragslaufzeit
Jetzt entdecken

This browser does not support the video element.

Einzelkurs: Stichprobentheorie


  • Die besten Lernmaterialien: 40 Texte, 34 Abbildungen, 18 Videos und 159 Übungsaufgaben.
Jetzt entdecken

This browser does not support the video element.

Webinare: Du brauchst Hilfe? Frage unsere Dozenten im Webinar!


  • Perfekt vorbereitet auf die Präsentation in der mündlichen Prüfung
  • Am 10.05.2024 ab 18:00 Uhr
  • In diesem zweistündigen Webinar gibt Ihnen CMA Natalia Menzel einen Überblick über die Vorbereitungen auf die mündliche Prüfung.
Jetzt teilnehmen