ZU DEN KURSEN!

Stichprobentheorie - Aufgaben 16 bis 20 zur Stichprobentheorie

Kursangebot | Stichprobentheorie | Aufgaben 16 bis 20 zur Stichprobentheorie

Stichprobentheorie

Aufgaben 16 bis 20 zur Stichprobentheorie

16. Aufgabe

Der Geschäftsführer eines Modehauses schiebt die Unzufriedenheit der Kunden auf die Wetterverhältnisse bzw. auf den regnerischen Oktober, in dem die Kundenbefragung stattgefunden hat. Aus diesem Grund soll zum Sommerbeginn die selbe Befragung nochmals durchgeführt werden. Ausgehen davon, dass die Varianz die selbe bleibt, werden im Mittel 50 unzufriedene Kunden zielgenau herausgezogen. Bei der Lösung der Fragestellung soll der geschätzte Mittelwert als bekannter Populationsparameter vorausgesetzt werden.

Frage: Kann bewiesen werden, dass die Theorie des Geschäftsführers stimmt?

Vertiefung

Hier klicken zum Ausklappen
Lösung

 

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?
-> Gegeben ist eine einfache Stichprobe von n = 32 Kunden. Die Kunden sind unabhängig voneinander, da davon ausgegangen wird, dass sie keinen Einfluss aufeinander ausüben.
-> Folglich ist Schema a) anzuwenden.

2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft die durchschnittliche Anzahl unzufriedener Kunden und bezieht sich demnach auf einen Parameter.
-> Folglich wären die Tests  3.2.1-3.2.6. anwendbar.

3. Worin liegt der Vergleich?
Verglichen werden soll die durchschnittliche Anzahl unzufriedener Kunden in Form eines Tests in Bezug auf den Erwartungswert.
-> Folglich wären die Tests  3.2.1 -3.2.4. anzuwenden.

4. Um welche Verteilung der Grundgesamtheiten handelt es sich?
-> Es handelt sich um eine normalverteilte Grundgesamtheit.
Folglich ist der Test  3.2.1 oder 3.2.2. anwendbar.

5. Liegt die Standardabweichung der Grundgesamtheit vor?
-> Nein, es liegt nur die Stichprobenstandardabweichung vor.
-> Folglich ist der Test 3.3.2. anzuwenden.

 1. Anwendungsvoraussetzungen

Diese sind gegeben.

 2. Wahl der Hypothese

$H_0:$ Die Grundgesamtheit ergibt sich gleichermaßen aus den Kunden im Sommer und Oktober. In diesem Fall würde sich die mittlere Kundenzufriedenheit im Sommer nicht erheblich von der im Oktober unterscheiden. Außerdem wäre es auch denkbar, dass die Kunden im Sommer noch schlechter eingestellt waren, als wie im Oktober. Darüber hinaus könnte eine andere Begründung sein, dass nicht alle Faktoren von den  Untersuchenden mit einbezogen wurden.

$H_1:$    Im Sommer zeigte sich, dass die Kunden wesentlich weniger unzufrieden waren.
b) $H_0:\mu \geqslant 54,125$                     gegen     $H_1:\mu <54,125$      
    

 3. Signifikanzniveau

Gemäß der Aufgabenstellung beträgt das Konfidenzniveau 95 %, d.h.

$1-\alpha =95{\%}<=>\alpha =0,05$


 4. Testfunktionswert

In Anlehnung an die vorherige Aufgabe c) entspricht es  $\text v=\frac{50-55,68}{4,2}\approx -1,35.$       

5. Verwerfungsbereich

Passend zur Hypothesenwahl wird der Verwerfungsbereich gewählt. Das 95 %  Fraktil der t(31-1) Verteilung liegt vor durch:

$t_{0,95}(30)=1,7.$

Demnach ist:     $B=\text (-\infty ;-1,7\text ).$

 6. Testentscheidung

Weil $\text v\notin \mathit{B.}$ wird es nicht verworfen.

7. Deutung

Auf der Grundlage eines 5%-igen Signifikanzniveaus konnte nicht nachgewiesen werden, dass die Kunden im Sommer wesentlich weniger unzufrieden gewesen sind, als wie im Oktober. Demnach wird hier die Nullhypothese akzeptiert.

17. Aufgabe

Bei dem folgenden Beispiel handelt es sich um eine selbst gewichtende Stichprobe. Was es mit „selbst gewichtend“ auf sich hat, kann in den Aufgaben 2.3.1 (6. Aufgabe) nachgelesen werden.

Welche dieser Antwort(en) ist richtig?
                                                                                                                                                              

Von einer gewichtenden Stichprobe ist dann die Rede, wenn

a) die Gewichte im Anschluss einer ordentlich begründeten Prüfung selbst festgelegt wurden.
b) die Gewichtungsfaktoren in Anlehnung an zielgerichtet hergeleitete Formeln so zu berechnen sind, dass die Schätzung optimal wird.
c) auf eine Gewichtung verzichtet werden kann, aufgrund des Schichtungseffekts.
d) im Grunde genommen keine unterschiedlichen Gewichtungsfaktoren bei Schätzungen zu berücksichtigen sind.

  

Vertiefung

Hier klicken zum Ausklappen
Lösung

Antwort d) ist richtig.

18. Aufgabe

Bei der Aufgabe geht es um die Ziehung einer geschichteten Stichprobe.                                                                            

Im Jahre 1989 konnte in einem Betrieb eine Grundgesamtheit der Angestellten Männer und Frauen von 1960 Männer und 1150 Frauen vernommen werden. Von Interesse für den Betrieb ist die Information über die geleisteten Überstunden. Hierzu wird eine geschichtete, proportionale Stichprobe nach Geschlecht von 100 Angestellten gezogen.
                                                                                                      

Informationen über die Grundgesamtheit erhalten wir gemäß den Angaben aus dem Jahr 1989.                    

Welche Anzahl an Männer und Frauen...  

a) konnte in der Grundgesamtheit vernommen werden?
b) konnte an der Grundgesamtheit vernommen werden?

Welchen Anteil nehmen die Männer und Frauen...  

c) an der Stichprobe ein?
d) in der Stichprobe ein?

Vertiefung

Hier klicken zum Ausklappen
Lösung

Es ergeben sich für die Anzahl in der Stichprobe die folgenden Werte:

Männer:

$100\ast \frac{1960}{3110}$   = 63,02

Frauen:

$100\ast \frac{1150}{3110}$   = 36,98

Das bedeutet:

19. Aufgabe

Zu Beginn soll es zu einer Begriffserklärung der „formalen Sicht “ kommen.

Zu verstehen ist damit, dass keine Berücksichtigung der Interpretation der Resultate stattfindet.
                                                                                                                            Welche Grundlage unterliegt aus formaler Sicht jedem prüfstatistische Verfahren, mit dem ein Unterschied in der zentralen Tendenz der Daten nachgewiesen werden soll?

Vertiefung

Hier klicken zum Ausklappen
Lösung

Ersichtlich wird, dass jedes prüfstatistische Verfahren die folgenden Komponenten als Grundgerüst umfasst:

20. Aufgabe

Im Rahmen einer Stichprobe soll ein standardisierter Konzentrationstest von GesamtschülerInnen einer Schule gemacht werden. Dabei werden die Gesamtschülerinnen und Schülerin in A und B unterteilt. Die Schüler aus der Stichprobe A kommen aus einer Akademikerfamilie, wohingegen die Schüler aus der Stichprobe B aus einer Arbeiterfamilien kommen. Dabei ist die Grundgesamtheit normalverteilt. Das Signifikanzniveau liegt bei fünf Prozent.

Dargestellt werden die getesteten Leistungen folgendermaßen:
$n_A=21,\text{ }x_A=67,\text{ }s_A=13$   und   $n_B=14,\text{ }x_B=77,\text{ }s_B=12.$

a) Welche Voraussetzungen müssen gegeben sein, damit ein Vergleich beider Stichproben in Bezug auf die Stichprobenmittelwerte und die Stichprobenvarianzen gelingen kann?

b) Zu testen ist die Stichprobenvarianzen hinsichtlich der Konformität.

Hinweis

Hier klicken zum Ausklappen

Es ist möglich die Varianz mittels der Formel einer Stichprobe vom Umfang n mit der Stichprobenstandardabweichung s zu schätzen.
Diese lautet wie folgt:

$\hat{\sigma }=s\sqrt{\frac n{n-1}}$

c) Wie wäre die Alternativ- und Nullhypothese auszudrücken, wenn geprüft werden soll, ob die bessere Leistung der Stichprobe B rein zufällig zustande gekommen ist?

Vertiefung

Hier klicken zum Ausklappen
Lösung

Zu a):
Zu untersuchen ist hier das Ergebnis (die Leistung) des Konzentrationstests, woraus sich das Merkmal ergibt.
Es hat den Anspruch zumindest intervallskaliert zu sein, d.h. dass eine Zuordnung zu einem Skalenniveau möglich ist. Das Beispiel zeigt, dass das gegeben ist, aufgrund der Punkte- oder Zahlenskala, durch welche die Ergebnisse zu bewerten sind. Außerdem ist die Leistung im Konzentrationstest in den Gesamtmenge vergleichbarer Jugendlicher normalverteilt.

Zu b):
Zu prüfen ist, ob eine Abweichung der Stichprobenvarianzen vorliegt.

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?
-> Gegeben sind zwei einfache Stichproben nach Voraussetzung vom Umfang

$n_A=21\text{ }\text{und}\text{ }n_B=14$

-> Die Schüler aus den Akademikerfamilien üben keinen Einfluss auf die Schüler der   Arbeiterfamilien.
-> Folglich ist Schema b) anzuwenden.

2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Parameter „Varianzen“.
-> Folglich wären die Tests  3.3.1 bis  3.3.6  anwendbar.

3. Worin liegt der Vergleich?
-> Zu vergleichen sind die („unbekannten“) Varianzen.
-> Folglich ist Test  3.3.5 unter Vorbehalt anwendbar.

4. Welche Verteilung der beiden Grundgesamtheiten liegt vor?
-> Es handelt sich bei beiden um normalverteilte Grundgesamtheiten.
-> Folglich ist Test 3.3.5. anzuwenden.

1. Anwendungsvoraussetzungen

Es wurde ersichtlich, dass diese gegeben sind.

2. Wahl der Hypothese
a) $H_0:\sigma _1^2=\sigma _2^2$                          gegen     $H_1:\sigma _1^2\neq \sigma _2^2.$                      
                                           
3. Signifikanzniveau

$\alpha =5\text{\%}$

4. Testfunktionswert

Dafür bedarf es etwas Vorarbeit. Uns ist bekannt, dass die einzelnen Varianzen durch die gegebene Formel geschätzt werden können. Demnach
$\hat{\sigma }_A=s_A\sqrt{\frac{n_A}{n_A-1}}=13\sqrt{\frac{21}{21-1}}$                  =13,32

und 

$\hat{\sigma }_B=s_B\sqrt{\frac{n_B}{n_B-1}}=12\sqrt{\frac{14}{14-1}}$                    =12,45.

Als Prüfgroße erhalten wir:
$\text v=\frac{\hat{\sigma }_A^2}{\hat{\sigma }_B^2}$                 = 1,14.

5. Verwerfungsbereich

$B=\left[0;\frac 1{x_{0,975}}\right)\cup \text (x_{0,975}^{'};\infty \text )=\left[0;\frac 1{2,64}\right)\cup \text (2,95;\infty \text )=\left[0;0,38\right)\cup \text (2,95;\infty \text )$

Es ist $x^{'}$ das jeweilige Fraktil der-Verteilung und x das jeweilige Fraktil der $F(20,13)$          -Verteilung.

6. Testentscheidung

$H_0$ wird nicht verworfen, weil $1,14=v\notin B$

7. Deutung

Auf der Grundlage eines 5%-igen Signifikanzniveaus konnte nicht deutlich werden, dass die Varianzen ungleich sind. Auf Grund der vorliegenden Konformität, wird die Nullhypothese akzeptiert.


Zu c):
c)   $H_0:\mu _A\geqslant \mu _B$                          gegen     $H_1:\mu _A<\mu _B.$ 

$H_1:$   Von Interesse ist das Merkmal der besseren mittleren Leistung von Stichprobe B.