ZU DEN KURSEN!

Stichprobentheorie - Aufgaben 51 bis 55 zur Stichprobentheorie

Kursangebot | Stichprobentheorie | Aufgaben 51 bis 55 zur Stichprobentheorie

Stichprobentheorie

Aufgaben 51 bis 55 zur Stichprobentheorie

51. Aufgabe

Welche Vorteile ergeben sich dadurch, wenn vorliegende Beobachtungseinheiten, welche sich in wichtigen Eigenschaften ähneln, als eine Schicht zusammengefasst werden?

1. Mit Hilfe dieses Vorgehens sind systematische Fehler gänzlich zu vermeiden.
2. Es dient der Übersichtlichkeit von Gruppen.
3. Die Wahrscheinlichkeit eines zufälligen Fehlers kann minimiert werden.
4. Der Versicherungsfehler wird allumfassend kleiner. 
5. Unterschiede der einzelnen Schichten werden überschaubarer.

a) Ganz sicher 1 - 5.
b) Möglich sind nur die Antworten 2 und 3.
c) Möglich sind nur die Antworten 2 - 4.
d) Möglich sind nur die Antworten 2 - 5.
e) Bei genauer Betrachtung 1 - 3.

Zufälliger Fehler: Es kann selbst bei gänzlicher Ausschaltung aller systematischen Fehler und bei mehrmaliger Messung der selben physikalischen Größen, zu geringen unterschiedlichen Messergebnissen kommen. Darin besteht der Begriff des zufälligen Fehlers.

Versuchsfehler: Bestehen aus der Zusammensetzung eines systematischen und zufälligen Fehlers.

Vertiefung

Lösung

Schichten bieten eine bessere Übersicht der einzelnen Gruppen. Die Unterschiede innerhalb der Gruppen sind allerdings auf Grund des Schichtungsprinzips minimal, wodurch eine Einheitlichkeit in der Gruppe entstehen kann. Eine Reduktion des zufälligen Fehlers geht damit gleichermaßen einher. Zu sehen ist damit auch, dass es zu einer Minimierung des Versuchungsfehlers kommt, da sich dieser aus dem systematischen und zufälligen Fehler zusammensetzt. Anhand der genannten Schlussfolgerung wird deutlich, dass die offensichtlichen Unterschiede zwischen den Schichten zu sehen sind. Demnach sind die Antwortmöglichkeit d) 2 - 5 richtig.

52. Aufgabe

Im Rahmen der Untersuchung eines Dorfs, soll nach drei Merkmalen geschichtet werden:

1. Unterteilt nach Geschlecht.
2. Unterteilt nach Alter in drei Bereiche (bis 30, bis 60, bis 90).
3. Nach Vermögen (mittel, gut, sehr gut situiert).

Um wie viele Schichten handelt es sich bei dieser Verfahrensweise?

a) Logisch betrachtet neun.
b) Nach gründlicher Überlegung 17.
c) Es handelt sich um acht.
d) Ganz sicher 18.

Vertiefung

Lösung

Die richtige Antwort lautet d) 18 Schichten.
Zu begründen sei diese Antwort damit: Die Schichtung wird für ein Geschlecht (m) vorgenommen, welche gleichermaßen für das andere gilt. Es resultieren für das männliche Geschlecht neun Schichten, demnach 2 * 9 = 18 Schichten.

53. Aufgabe

Wodurch ist eine zufällige Zuteilung in zwei Gruppen am ehesten möglich?

a) Mit Hilfe eines Würfels oder einer Zufallszahl.
b) Indem die Person selbst entscheiden kann, welcher Gruppe sie zugehörig sein möchte.
c) Durch die Zuteilung einer erfahrenen und qualifizierten Person.
d) Indem eine Person eine Zahl zwischen eins und acht nennt und nachfolgend eine qualifizierte Person gemäß der genannten Zahlen die Gruppen einteilt (beispielsweise alle gerade Zahlen zu Gruppe eins und alle ungeraden Zahlen zu Gruppe zwei).

Vertiefung

Lösung

Richtig ist Antwort a), denn ausschließlich der Würfel sorgt durch das erzeugen einer Zufallszahl für eine zufällige Einteilung in die jeweiligen Gruppen.
Alle anderen Antwortmöglichkeiten unterliegen einem bestimmten System bei der Zuteilung in Gruppen. So basieren Gruppenzuteilungen häufig auf unbewussten oder subjektiven Einflüssen, weswegen die Antworten b) und c) auszuschließen sind.
Statistische Erfahrungswerte zeigten bereits in der Vergangenheit, dass die Zahl 7 zu den beliebtesten Zahlen zählt und aus diesem Grund am häufigsten gewählt wird, wenn eine Zahl zwischen eins und acht zu wählen ist. Demnach kann ebenso Antwort d) ausgeschlossen werden.

54. Aufgabe

Bei einer Versicherung treffen jährlich 25000 Rechnungen ein, wovon 125 zufällig ausgewählt werden. Diese werden im Anschluss von der Versicherung überprüft, welcher Anteil bzw. welcher Betrag davon übernommen wird. Der Versicherung liegen Informationen zu jedem Kunden vor, wie hoch das jährliche Einkommen ist. Auf dieser Grundlage, werden die Einkommensunterschiede in Gruppen gestaffelt.
Aus der Stichprobe resultierten die folgenden Werte:

  • $\overline x=80000\text{€}$
  • $s=20000\text{€}$
  • 25 von den 125 Einkommen verfügen unter 60000 €.

Im zweiten Schritt geht es darum ein 95 %-iges Konfidenzintervall der Grundgesamtheit der 25000 eingereichten Rechnungen zu ermitteln für…

a) Die Höhe des durchschnittlich auftretenden Einkommens.
b) Das gesamte auftretende Einkommen.
c) Den Anteil der Einkommen unter 60000 €, die zu berücksichtigen sind.
d) Die gesamte Anzahl der Einkommen unter 60000€, die zu versteuern sind.

Vertiefung

Lösung

Zu a):
Mit Hilfe des Baumschemas gelangen wir zu Schema 5.

1. Das Konfidenzniveau liegt bei:  $1-\alpha =95{\%}<=>\alpha =5{\%}.$

2. Demnach $1-\frac{0,05} 2=0,975.$

3. Die Bestimmung des 0,975-Fraktils z der N(0,1) -Verteilung z liegt vor durch: z= 1,96.

4. Gegeben ist $\overline x=80000\text{€}.$
Es wird $\hat{\sigma }=20000\text{€}$ verwendet, weil die Varianz in der Grundgesamtheit nicht bekannt ist.

5. Die halbe Breite des Konfidenzintervalls wird berechnet, d.h.

$\frac{20000\ast 1,96}{\sqrt{125}}$         =3506,15.

6. Schlussendlich resultiert das Konfidenzintervall für die gegebene Stichprobe zu:

$\mathit{KI}=\left[80000-3506,15;80000+3506,15\right]=[76493,85;83506,15]$

Zu b):
Wir können problemlos feststsellen, dass der Erwartungswert der Grundgesamtheit (N) vorliegt durch: $\mu =\frac{\mathit{Summe}\mathit{aller}\mathit{Einkommen}} N.$

Festzuhalten wäre dies folgendermaßen:

$\mathit{Summe}\mathit{aller}\mathit{Enkommen}=N\frac{\mathit{Summe}\mathit{aller}\mathit{Einkommen}} N=N\mu$
 
Die Schätzfunktion für $N\mu $   kann direkt für    $N\overline X$ gegeben werden.

Eindeutig gilt:

$E(N\overline x)=NE(\overline x)=N\mu \text{ }\text{und}\text{ }\mathit{VAR}(N\overline x)=N^2\mathit{VAR}(\overline x)=N^2\frac{\sigma ^2} n.$

Das arithmetische Mittel ist $\overline x$      

Die Schätzfunktion ist nach dem zentralen Grenzwertsatz ansatzweise

$\left(N\ast \mu ;\frac{N\ast s}{\sqrt n}\right)$        - normalverteilt.

Von Interesse ist das Kofidenzintervall für $N\mu $   bei normalverteilter Grundgesamtheit und bekannter Varianz.

Somit sei Schema 1 anzuwenden.

Demnach folgt für das Konfidenzintervall für $N\mu$   zum Konfidenzniveau 95 %

1. $1-\alpha =95{\%}<=>\alpha =5{\%}.$

2. $1-\frac{\alpha } 2=0,975.$

3. Das 0,975-Fraktil z der Standardnormalverteilung ist  z = 1,96.

4. Zu bestimmen ist das arithmetische Mittel zu

$N\overline x=25000\ast 80000$                 =2000000000.

5. $\frac{\sigma Nz}{\sqrt n}=20000\ast 25000\frac{1,96}{\sqrt{125}}$                      =87653864,72.

6. $\mathit{KI}=\left[2000000000-87653864,72;2000000000-87653864,72\right]$              
=[1912346135,28;2087653864,72].

Zu c):
Das Schema 6 hilft dabei, das $\gamma $  des zu versteuernden Einkommens unter 60000 €  in der Grundgesamtheit zu bestimmen.

1. $1-\alpha =95{\%}.$

2. $1-\frac{5{\%}} 2=0,975.$

3. $\overline x=\frac{25}{125}=0,2$          nach Voraussetzung.

4. Das 0,975-Fraktil der Standardardnormalverteilung liegt vor durch z= 1,96.

Demnach gilt:  $n\overline x=125\ast 80000\geqslant 5\text{ }\text{und}\text{ }125\ast 80000\leqslant 80000-5=79995.$

5. $\hat{\sigma }=\sqrt{0,2(1-0,2)}=0,4.$    

6.  $\frac{\hat{\sigma }z}{\sqrt n}=\frac{0,4\ast 1,96}{\sqrt{125}}$        =0,07.

7. Wir bekommen für das Konfidenzintervall der gegebenen Stichprobe:

KI=[0,2-0,07;0,2+0,07] =[0,13;0,27].  

Für die berücksichtigten Einkommen unter 60000 € liegt der Anteil zwischen 13 % und 27 % vor.


Zu d):
Die Zahl beträgt insgesamt $N\gamma $ für die zu versteuernden Einkommen unter 60000€ .

Mittels der Funktion $N\overline X$ kann dieser Wert geschätzt werden.  Gemäß des zentralen Grenzwertsatzes ist diese Funktion approximativ $N\left(N\overline X;N\sqrt{\frac{\overline X(1-\overline X)} n}\right).$
Bei einem 5%-igen Signifikanzniveau ergibt sich das Konfidenzintervall für $N\gamma :$

$\mathit{KI}=[N\ast \overline x-z\ast N\sqrt{\frac{\overline x(1-\overline x)} n};N\ast \overline x+z\ast N\sqrt{\frac{\overline x(1-\overline x)} n}]$

$\mathit{KI}=[25000\ast 0,2-1,96\ast 25000\ast 0,07;25000\ast 0,2+1,96\ast 25000\ast 0,07]$       
= [1570;8430].

Die Gesamtzahl befindet sich zwischen 1570 und 8430 für die zu versteuernden Einkommen unter 60000 €.

55. Aufgabe

Im Rahmen einer Umfrage, wurden 300 zufällig gewählte Personen darüber befragt, welche Zeitschriften sie über welches bevorzugte Themengebiet lesen. Daraus resultierten die folgenden Werte:

Frauen:

Politik20
Journale100
Kultur30
Freizeit10
Sport25

Männer:

Politik40
Journale5
Kultur10
Freizeit20
Sport40

Welches Testverfahren ist auszuwählen, wenn aufgezeigt werden soll, dass sich die Interessen von Frauen und Männern zueinander unterscheiden?
Das gewählte Testverfahren soll daraufhin angewendet werden. Vorgegeben wird eine 5%-iges Signifikanzniveau.

Vertiefung

Lösung

Zu empfehlen sei selbstverständlich der Chi-quadrat-Unabhängigkeitstest.
Zugunsten einer besseren Übersicht, werden die einzelnen Werte in einer Tabelle wie folgt angeordnet:

InteresseFrauenMänner
Politik2040
Journale1005
Kultur3010
Freizeit1020
Sport2540

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?
-> Es sind nach Voraussetzung zwei verbundene Stichproben gegeben.
Die Interessensgebiete hängen maßgeblich vom Geschlecht ab.
-> Folglich ist Schema c) anzuwenden.

2. Bezieht sich die Hypothese auf einen Parametervergleich von Verteilungen oder auf die Abhängigkeit der beiden Merkmale X und Y?
-> Die Hypothese betrifft die Abhängigkeit der beiden Merkmale X und Y.
-> Folglich können die Tests 3.4.4  und 3.4.5  in Erwägung gezogen werden.

3. Was genau ist zu testen?
-> Getestet werden soll die Unabhängigkeit von X und Y.
-> Folglich ist der Test 3.4.4 anzuwenden.

1. Anwendungsvoraussetzungen

Diese sind gegeben, da es sich bei beiden um beliebig verteilte Grundgesamtheiten handelt.

2. Wahl der Hypothese

$H_0:$    Es liegt eine Unabhängigkeit der beiden Merkmale von Geschlecht X und Interesse Y der Grundgesamtheit vor.

$H_1:$    Es liegt eine Abhängigkeit beider Merkmale vor.

3. Signifikanzniveau

$\alpha =5{\%}.$

4. Kontingenztabelle

Die zugehörige Kontingenztabelle lautet:

Für die Prüfgröße v erhalten wir somit:

$\begin{gathered}v=\frac{(20-37)^2}{37}+\frac{(100-64,75)^2}{64,75}+\frac{(30-24,67)^2}{24,67}+\frac{(10-18,5)^2}{18,5}+\frac{(25-40,1)^2}{40,1}\\\text{ }\text +\frac{(40-23)^2}{23}+\frac{(5-40,25)^2}{40,25}+\frac{(10-15,33)^2}{15,33}+\frac{(20-11,5)^2}{11,5}+\frac{(40-24,91)^2}{24,91} \end{gathered}$

= 98,46

5. Verwerfungsbereich

Gegeben sind zwei Merkmale, männlich und weiblich.
Es handelt sich um fünf Ausprägungen, bei denen die Interessen von Politik bis Sport gehen.
Demnach: k = 5 und l = 2.

$B=\text (x_{1-\alpha };\infty \text ).$

Es ist x das Fraktil der $\chi _{0,95}^2((5-1)(2-1))=\chi ^2(4)$                  -Verteilung.

Demnach $B=\text (9,49;\infty \text ).$

6.  Testentscheidung

Auf Grund von $98,46=v\in \mathit{B.}$ wird $H_0$ verworfen.

7. Deutung:

Auf der Grundlage eines 5%-igen Signifikanzniveaus konnte nicht verdeutlicht werden, dass die beiden Merkmale Geschlecht X und Interesse Y der Grundgesamtheit unabhängig sind. Demnach wird schlussgefolgert, dass Geschlecht X und Interesse Y abhängig zueinander sind.