ZU DEN KURSEN!

Stichprobentheorie - Geschichteten Stichproben: Aufgaben, Beispiele und Berechnungen

Kursangebot | Stichprobentheorie | Geschichteten Stichproben: Aufgaben, Beispiele und Berechnungen

Stichprobentheorie

Geschichteten Stichproben: Aufgaben, Beispiele und Berechnungen

1. Aufgabe

Es liegt eine Population von fünf Elementen vor: $Y_1=23,\text{   }Y_2=12,\text{   }Y_3=10,\text{   }Y_4=20,\text{   }Y_5=11.$

Alle Stichproben die zu ziehen sind, sollen den Umfang von n = 3 haben.

a) Der Mittelwert der Grundgesamtheit ist zu berechnen.
b) Die Wahrscheinlichkeitsverteilung von  $\overline y$ ist zu ermitteln.
c) Als Grundlage der Berechnung dienen die Erwartungswerte und die Werte der Varianz
d) Zu wählen ist eine logische Unterteilung der Population. Zugunsten der Auswahl, dienen die folgenden Punkte:

  • (1) Welche Mittelwerte sind zu den einzelnen Schichten bekannt?
  • (2) Welche Schätzer liegen bereits für die jeweiligen Schichten vor?
  • (3) Der Erwartungswert und die Varianz sind für den geschichteten Schätzer zu ermitteln.
  • (4) Was kann über den geschichteten Schätzer gesagt werden?
  • (5) Das letzte Ergebnis ist ausführlich zu kommentieren.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Zu vernehmen ist eine Population mit insgesamt fünf Elementen:
$Y_1=23$, $Y_2=12$, $Y_3=10$, $Y_4=20$, $Y_5=11$

zu a)
Der Mittelwert der Grundgesamtheit liegt vor $\overline Y=\frac 1 5(Y_1+Y_2+Y_3+Y_4+Y_5)=\frac 1 5(23+12+10+20+11)$=15,2

zu b) und c)
Nach Voraussetzung wird aus der Population je eine einfache Zufallsstichprobe mit einem Stichprobenumfang von n = 3 entnommen.

Deutlich wird dadurch, dass die selbe Wahrscheinlichkeit von 0,1 für jede der zehn möglichen Zufallsstichproben besteht.

$\dbinom{5}{3}$ = ${5!}\over{3!2!}$ = ${4*5}\over 2$ = 10


Genauer formuliert ergeben sich die folgenden zehn möglichen Stichproben:

$Y_{i\text =}$

$Y_{i\text =}$

$Y_{i\text =}$

Mittelwert der Stichprobe $\overline y_i\text =$

Wahrscheinlichkeit

23

12

10

15

0,1

23

12

20

18,33

0,1

23

12

11

15,33

0,1

23

10

20

17,67

0,1

23

10

11

14,67

0,1

23

20

11

18

0,1

12

10

20

14

0,1

12

10

11

11

0,1

12

20

11

14,33

0,1

10

20

11

13,67

0,1

Für die erste Stichprobe ergibt sich ein Mittelwert zu: $\frac 1 3(23+12+10)=\frac 1 3(9+10+11)=15.$

Alle anderen sich entsprechend gleich auszurechnen.

Die Eintrittswahrscheinlichkeit liegt bereits vor.

Für die Verteilung von $\overline y$ liegen diese Werte vor:

$\overline y_i$

15

18,33

15,33

17,67

14,67

18

14

11

14,33

13,67

$P(\overline y)$

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

0,1

$\overline y =$         

15,2

Für den Erwartungswert von $\overline y$ bekommen wir:
$E(\overline y)=\frac 1{10}(15+18,33+15,33+17,67+14,67+18+14+11+14,33+13,67)=15,2.$
Somit ergibt sich gleichermaßen für die Varianz:
$\mathit{VAR}(\overline y)=\frac 1{10}\sum _{i=1}^{10}(\overline y_i-15,2)^2=\frac 1{10}\left((15-15,2)^2+(18,33-15,2)^2+...+(13,67-15,2)^2\right)=4,6253\approx 4,63.$

Zu d)

Durch die gezielte Festlegung des Stichprobenumfangs von n = 3 Ziehungen ist es möglich, die Varianz zu verkleinern. Diese Tatsache konnten wir bereits schon häufiger beobachten. Es wird davon ausgegangen, dass die Sekundärinformation jene ist, die Auskunft darüber gibt, dass die Population in zwei Schichten vorliegt. Dabei setzt sich die erste Schicht aus den Werten $Y_2$, $Y_3$ und $Y_5$ zusammen und die zweite Schicht aus $Y_1$ und $Y_4$.
Die Aufteilung ermöglicht eine Annäherung der Werte $Y_i$. An diesem Punkt liegt die Vermutung nah, dass eine Abhängigkeit des Niveaus von $Y_i$ und der Gruppe besteht.  Wir erhalten eine Schichtung durch die Aufteilung der Population in zwei Schichten.

Es wird nun aus jeder Schicht eine geschichtete Stichprobe entnommen.

Die Folgende Schichtunterteilung ergibt sich durch die entsprechenden Werte von $Y_i$:

Schicht 1

$Y_2=12$$Y_3=10$$Y_5=11$

Schicht 2

$Y_1=23$$Y_4=20$ 

Es werden aus der ersten Schicht zwei und aus der zweiten Schicht ein Element approximativ gemäß der Menge der enthaltenen Werte in den einzelnen Schichten entnommen.

Allumfassend können die folgenden Möglichkeiten für die einzelnen Ziehungen vernommen werden:

Zu d) (1):

Schicht 1Schicht 2

Gezogene Indizes

Gezogene Indizes

Mittelwert der Stichprobe

Gezogene Indizes

Mittelwert der Stichprobe

12

10

11

20

20

12

11

11,5

23

23

10

11

10,5

  

Zu d) (2):

Die Zielsetzung besteht nun darin, die einzelnen Mittelwerte mit dem Schätzer zu kombinieren und realitätsnah zu verbinden. Das Populationsmittel $\overline Y$ ist von dem Schätzer zu schätzen.

Wenn vorerst die Auswahlwahrscheinlichkeiten der einzelnen Individuen berechnet werden, ist das Ziel schon fast erreicht. Diese werden etwas später hinzugezogen.

Vorerst erfolgt eine gebündelte Auflistung aller möglichen Stichproben der beiden Schichten.

Daraus resultieren diese Möglichkeiten:

Gezogene Einheiten
(gezogen werden nach der obigen Vereinbarung zwei Elemente bzw. Einheiten)
Gezogene Einheit
(gezogen wird nach der obigen Vereinbarung ein Element bzw. Einheit)
Schicht 1Schicht 2

2  3

1

2  5

1

3  5

1

2  3

4

2  5

4

2  5

4

Ermittelt wird der jeweilige Schätzer der geschichteten Stichprobe. Es ergibt sich Folgendes:
Gezogene Einheiten
(gezogen werden nach der obigen Vereinbarung zwei Elemente bzw. Einheiten)
Gezogene Einheit
(gezogen wird nach der obigen Vereinbarung ein Element bzw. Einheit)
   

Schicht 1

Schicht 2

$\overline y_1$$\overline y_2$$\hat{\overline Y}_{\mathit{GS}_i}$

12  10

23

1123$\frac 3 511+\frac 2 523=15,8$

12  11

23

11,523$\frac 3 511,5+\frac 2 523=16,1$

10  11

23

10,5

23$\frac 3 510,5+\frac 2 523=15,5$

12  10

20

1120$\frac 3 511+\frac 2 520=14,6$

12  11

20

11,520$\frac 3 511,5+\frac 2 520=14,9$

10  11

20

10,520$\frac 3 510,5+\frac 2 520=14,3$

Direkt berechnet werden kann der Erwartungswert des geschichteten Schätzers $\hat{\overline Y}_{\mathit{GS}}$

Für diesen gilt: $E\left(\hat{\overline Y}_{\mathit{GS}}\right)=\frac 1 6\sum _{i=1}^6\hat{\overline Y}_{\mathit{GS}_i}=\frac 1 6(15,8+16,1+15,5+14,6+14,9+14,3)$= 15,2

Zu d) (3):

Folglich ist es uns möglich die Varianz von $\hat{\overline Y}_{\mathit{GS}}$ zu ermitteln.

Genau gesagt bedeutet es: $\mathit{VAR}\left(\hat{\overline Y}_{\mathit{GS}}\right)=\frac 1 6\sum _{i=1}^6\left(\hat{\overline Y}_{\mathit{GS}_i}-E\left(\hat{\overline Y}_{\mathit{GS}}\right)\right)^2=\frac 1 6\left((15,8-15,2)^2+(16,1-15,2)^2+...+(14,3-15,2)^2\right)=0,42.$

Zu d) (4):

Es wird direkt deutlich, dass der geschichtete Schätzer eine erwartungstreue aufweist $\overline y$,

das bedeutet $E\left(\hat{\overline Y}_{\mathit{GS}}\right)=\overline y.$

Zu d) (5):

Der erwartungstreue Schätzer wurde von uns selbst entwickelt.

2. Aufgabe

Diese Übungsaufgabe entspricht einer Multiple Choice Aufgabe, bei der die richtige Aussage zu wählen ist:

Wenn sich für eine Ziehung in einer geschichteten Stichprobe entschieden wird…

a) kommt es zu einer zufälligen Ziehung einer Stichprobe von den Schichten.

b) kommt es zunächst zu der Ziehung einer zufälligen Stichprobe von Schichten und danach zu der Ziehung einer zufälligen Stichprobe innerhalb der jeweiligen Schichten.

c) kommt es erst nach einer rechtmäßigen Aufteilung der Population in Schichten aus der einzelnen Schicht zu einer Ziehung der Zufallsstichprobe.

d) kommt es zu einer zufälligen Einteilung der Grundgesamtheit in Schichten und einer anschließenden Ziehung aus der Zufallsstichprobe.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Die Lösung ist c).

3. Aufgabe

Wähle und begründe deine Antwort:

1) Für welche der gegebenen Größen ist die Verwendung eines Schichtungsfaktors ungeeignet?

a) Wahlregionen
b) Wohngebiete
c) psychische Störungen
d) bildende Institute mit staatlicher Anerkennung

2) Wie häufig darf ein und das selbe Element (nach der Aufteilung der Grundgesamtheit in Schichten) maximal in den jeweiligen Schichten enthalten sein?

Vertiefung

Hier klicken zum Ausklappen
Lösung:

a) Im Falle dessen, dass Informationen über die Grundgesamtheit gegeben sind, kann diese in Schichten aufgeteilt werden. Die wichtigsten Informationen zur Grundgesamtheit können annähern immer aus den Registern oder Datenbanken bezogen werden.

Direkt wird deutlich, dass die Verwendung einer Größe (Variable) als Schichtungsfaktor dann keinen Sinn macht, wenn bereits bekannt ist, dass dazu nur wenige oder keine greifbaren Informationen zur Grundgesamtheit bestehen.

Die Option der psychischen Störungen disqualifiziert sich demnach.

b) Die Grundgesamtheit wird zunächst zerlegt und dann in disjunkte Schichten aufgeteilt. Demnach darf bei exakter Zerlegung ein Element nur einer Schicht zugeteilt werden.

4. Aufgabe

Was sind die Vorteile einer geschichteten Zufallsstichprobe?

a) die Kosten fallen hier am geringsten aus.

b) es handelt sich um optimiertere Schätzungen in Bezug auf die enthaltenen Untersuchungsmerkmale

c) die Schätzungen von Parametern der Population fallen genauer aus im Gegensatz zu der einfachen Zufallsstichprobe.

d) es kommt zu einer Verbesserung der Gleichheiten in den einzelnen Schichten.

e) es werden auch kleinere Teilgesamtheiten einbezogen und hinreichend beachtet.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Die richtigen Antworten sind c) und e).

5. Aufgabe

Geben sie eine Antwort auf die folgenden Fragen:

a) Worin besteht der Unterschied zwischen einer proportional und nicht proportional geschichteten Zufallsstichprobe.

b) Was bedeutet es, wenn von einer „optimalen nicht proportionalen Aufteilung“ die Rede ist? 

Vertiefung

Hier klicken zum Ausklappen
Lösung:
a) Wenn der Anteil einer Schicht an der Gesamtstichprobe dem Anteil dieser Schicht an der Grundgesamtheit entspricht, handelt es sich um eine proportional geschichtete Stichprobe.

Wenn jedoch eine Abweichung zwischen den Anteilen eines Merkmals in der Grundgesamtheit und in der Stichprobe vorliegt, so handelt es sich um eine nicht proportional geschichtete Stichprobe.

b) Von einer „optimalen nicht proportionalen Aufteilung“ ist dann die Rede, wenn für eine vorliegende Stichprobe vom Umfang n die Zerlegung des gesamten Umfangs der Stichprobe auf die jeweiligen Schichten so erfolgt, dass sich die Varianz des Schätzers maximal verringert.