ZU DEN KURSEN!

Stichprobentheorie - Aufgaben 16 bis 20 zur Stichprobentheorie

Kursangebot | Stichprobentheorie | Aufgaben 16 bis 20 zur Stichprobentheorie

Stichprobentheorie

Aufgaben 16 bis 20 zur Stichprobentheorie

Aufgabe 16

Zum Zeitpunkt der Umfrage war das Wetter meistens sehr schlecht. Dies deswegen, weil das Novemberwetter damals sehr schlecht ausgefallen war. Der Inhaber des Supermarktes begründet die Unzufriedenheit der Kunden durch das Wetter. Deswegen wird im Frühling die gleiche Umfrage nochmals durchgeführt. Bei gleich bleibender Varianz werden dabei im Mittel 50 Unzufriedene Kunden gefunden. Der geschätzte Mittelwert soll bei der Lösung der Aufgabe als ein bekannter Populationsparameter vorausgesetzt werden.   

Können Sie bestätigen, ob der Geschäftsführer richtig liegt ?

Vertiefung

Hier klicken zum Ausklappen
Lösung

Auswahl des richtigen Tests

1. Frage: Wie viele Stichproben liegen vor ?
Antwort: Es liegt eine einfache Stichprobe von n = 32 Kunden vor. Die einzelnen Kunden haben keinen Einfluß aufeinander, womit wir diese als unabhängig voneinander ansehen können.
Folgerung: Somit können wir uns sofort Schema a) zuwenden.

2. Frage: Betrifft die Hypothese einen Parameter oder eine Verteilung ?

Antwort: Die Hypothese bezieht sich auf die durchschnittliche Anzahl unzufriedener Kunden, d.h.
auf einen Parameter.
Folgerung:  Tests  3.2.1-3.2.6.

3 Frage: Was wird verglichen ?
Antwort: Es soll die durchschnittliche Anzahl unzufriedener Kunden verglichen werden, also ein Test bezüglich des Erwartungswertes
Folgerung: Tests  3.2.1 -3.2.4.

4. Frage: Wie sind die Grundgesamtheiten verteilt ?
Antwort: Die Grundgesamtheit ist normalverteilt.
Folgerung: Test  3.2.1 oder Test  3.2.2.

5. Frage: Ist die Standardabweichung der Grundgesamtheit bekannt ?
Antwort: Nein. Dafür ist aber die Stichprobenstandardabweichung bekannt.
Folgerung: Test 3.3.2.

 1. Schritt: Anwendungsvoraussetzungen

Diese sind erfüllt.

 2. Schritt: Hypothesenwahl

$H_0:$ Die Kunden im Frühjahr und November gehören zur selben Grundgesamtheit. In diesem Fall würde die mittlere Kundenzufriedenheit im Frühjahr sich nicht signifikant von derjenigen November unterscheiden. Es besteht dann auch die Möglichkeit, dass die Kunden im Frühjahr eine noch schlechtere Einstellung hatten als im Novenmber. Der Grund dafür kann zum Beispiel darin liegen, dass von den Untersuchungsleitern einige relevante Größen nicht beachtet wurden.

$H_1:$    Im Frühjahr zeigen die Kunden signifikant weniger unzufriedenheit.
b) $H_0:\mu \geqslant 54,125$                     gegen     $H_1:\mu <54,125$      

 3. Schritt: Signifikanzniveau

Nach Aufgabenstellung beträgt das Konfidenzniveau 95 %, d.h.

$1-\alpha =95{\%}<=>\alpha =0,05$


 4. Schritt: Testfunktionswert

Es ist $\text v=\frac{50-55,68}{4,2}\approx -1,35.$             in Anlehnung an c)
der vorherigen Aufgabe.

 5. Schritt: Verwerfungsbereich

Der Verwerfungsbereich wird in Anlehnung an die Hypothesenwahl gewählt.
Das 95 %  Fraktil der t(31-1) Verteilung ist gegeben durch  

$t_{0,95}(30)=1,7.$

Also ist:     $B=\text (-\infty ;-1,7\text ).$

 6. Schritt: Testentscheidung

 wird nicht verworfen, da $\text v\notin \mathit{B.}$

Interpretation:

Auf einem Signifikanzniveau von fünf Prozent kann nicht gezeigt werden, dass die Kunden im Frühjahr signifikant weniger Unzufriedenheit zeigen als im November.
Also werden wir die Nullhypothese akzeptieren.

Aufgabe 17

In diesem Beispiel geht es um eine selbst gewichtende Stichprobe. Der Leser wende sich den Aufgaben 2.3.1 sechste. Aufgabe zu, zur Erinnerung des Begriffs „selbst gewichtende.“                               

Welche der vorgegebenen Antwort(en) ist richtig ?
                                                                                                                                                                        

Eine Stichprobe wird selbst gewichtende Stichprobe genannt, falls

a) man die Gewichte nach ordentlicher begründeter Prüfung selbst vergeben kann.
b) die Gewichtungsfaktoren -nach speziell hergeleiteten Formeln- so berechnet werden müssen, dass
die Schätzung optimal wird.
c) sozusagen keine unterschiedlichen Gewichtungsfaktoren bei Schätzungen berücksichtigt werden
müssen.
d) dank des Schichtungseffekts auf eine Gewichtung verzichtet werden kann.   

Vertiefung

Hier klicken zum Ausklappen
Lösung

Die richtige Antwort ist c).

Aufgabe 18

Nun geht es um, das Ziehen einer geschichteten Stichporbe.                                                                            

In  einem Unternehmen betrug die Grundgesamtheit aller Erwerbstätigen Männer und Frauen im Jahre 1995: 1960 Männer und 1150 Frauen. Das Unternehmen möchte nun gerne Informationen über die geleisteten Wochenenddienste erhalten. Dazu wird eine nach Geschlecht geschichtete proportionale Stichprobe gezogen, von 100 Erwerbstätigen.                                                                                                         

Die Informationen über die Grundgesamtheit liefern dabei die Informationen aus dem Jahr 1995.                    

Wie groß ist die Anzahl der Männer und Frauen  

a) in der Grundgesamtheit ?
b) an der Grundgesamtheit ?

Wie groß ist der Anteil der Männer und Frauen  

c) an der Stichprobe ?
d) in der Stichprobe ?

Vertiefung

Hier klicken zum Ausklappen
Lösung

Für die Anzahl in der Stichprobe ergeben sich folgende Werte.

Männer:

$100\ast \frac{1960}{3110}$   = 63,02

Frauen:

$100\ast \frac{1150}{3110}$   = 36,98

Das heißt:

Aufgabe 19

Für die folgende Aufgabe wird zunächst der Begriff „formaler Sicht “ erklärt.

Unter diesem Begriff versteht man, dass keine Berücksichtigung der Interpretation der Resultate stattfindet.
                                                                                                                                                                                        Was hat aus formaler Sicht jedes prüfstatistische Verfahren, mit dem ein Unterschied in der zentralen Tendenz der Daten nachgewiesen  werden soll, als Fundament ?

Vertiefung

Hier klicken zum Ausklappen
Lösung

Jedes prüfstatistische Verfahren hat folgende Komponenten als Grundgerüst:

Aufgabe 20

Es werden zwei Stichproben von Gymnasialschülern mit einem genormten Konzentrationstest konfrontiert. Die Gymnasiasten aus Stichprobe A sind in einer grosstädtischen, diejenigen aus Stichprobe B in einer eher ländlichen Umgebung groß geworden. Die Grundgesamtheiten seien normalverteilt. Das Signifikanzniveau beträgt fünf Prozent.
Die in den beiden Stichproben erhobenen Testleistungen können wie folgt explizit dargestellt werden:

$n_A=21,\text{ }x_A=67,\text{ }s_A=13$   und   $n_B=14,\text{ }x_B=77,\text{ }s_B=12.$


a) Welche Voraussetzungen müssen gestellt werden, damit ein Vergleich der beiden Stichproben
bezüglich der Stichprobenmittelwerte und der Stichprobenvarianzen durchgeführt werden kann ?
b) Testen Sie die Stichprobenvarianzen auf  Konformität.


Tipp: Die Varianz kann -anhand einer Stichprobe vom Umfang n mit der Stichprobenstandardabweichung s- durch folgende Formel geschätzt werden:

$\hat{\sigma }=s\sqrt{\frac n{n-1}}$

c) Wie müßte die Nullhypothese und Alternativhypothese formuliert werden, falls geprüft werden soll, ob das bessere Resultat der Stichprobe B auch zufällig zustande gekommen sein kann.

Vertiefung

Hier klicken zum Ausklappen
Lösung

Zu a):
Das Merkmal, welches hier Untersucht werden soll ist die Leistung im Konzentrationstest.
Diese muss mindestens intervallskaliert sein. Damit ist gemeint, dass eine Zuordnung zu einem Skalenniveau möglich sein muss. In diesem Beispiel ist dies möglich, da die Leistungen mit Punkten (Zahlen) bewertet werden.
Des Weiteren muss die Leistung im Konzentrationstest in den Populationen vergleichbarer Jugendlicher  normalverteilt sein.  


Zu b):
Wir prüfen also, ob die Stichprobenvarianzen voneinander abweichen.

Auswahl des richtigen Tests

1. Frage: Wie viele Stichproben liegen vor ?
Antwort: Es liegen nach Voraussetzung zwei einfache Stichproben vom Umfang

$n_A=21\text{ }\text{und}\text{ }n_B=14$

vor. Die „ländlichen“ Schüler üben keinen Einfluß auf die in der Grosstadt aus oder umgekehrt.
Folgerung: Das heißt Schema b).

2. Frage: Betrifft die Hypothese einen Parameter oder eine Verteilung ?
Antwort: Die Hypothese  bezieht sich auf die Parameter „Varianzen“.
Folgerung: Es kommen Tests  3.3.1 bis  3.3.6  in Betracht.

3. Frage: Was soll verglichen werden ?
Antwort: Es sollen die („unbekannten“) Varianzen verglichen werden.
Folgerung: Entweder Test  3.3.5 unter vorbehalt.

4. Frage: Wie sind die beiden Grundgesamtheiten verteilt ?
Antwort: Die beiden Grundgesamtheiten sind normalverteilt.
Folgerung: Also Test 3.3.5.

1. Schritt: Anwendungsvoraussetzungen

Wir stellten gerade fest, dass diese erfüllt sind.

2. Schritt: Hypothesenwahl
a) $H_0:\sigma _1^2=\sigma _2^2$                          gegen     $H_1:\sigma _1^2\neq \sigma _2^2.$                      
                                           
3. Schritt: Signifikanzniveau

$\alpha =5\text{\%}$

4. Schritt:  Testfunktionswert

Hier sind nun einige Vorbereitungen erforderlich. Wir wissen, dass wir die einzelnen Varianzen durch die angegebene Formel schätzen können. Also
$\hat{\sigma }_A=s_A\sqrt{\frac{n_A}{n_A-1}}=13\sqrt{\frac{21}{21-1}}$                  =13,32

und 

$\hat{\sigma }_B=s_B\sqrt{\frac{n_B}{n_B-1}}=12\sqrt{\frac{14}{14-1}}$                    =12,45.

Dann erhalten wir für die Prüfgröße:
$\text v=\frac{\hat{\sigma }_A^2}{\hat{\sigma }_B^2}$                 = 1,14.

5. Schritt: Verwerfungsbereich

$B=\left[0;\frac 1{x_{0,975}}\right)\cup \text (x_{0,975}^{'};\infty \text )=\left[0;\frac 1{2,64}\right)\cup \text (2,95;\infty \text )=\left[0;0,38\right)\cup \text (2,95;\infty \text )$

Es ist $x^{'}$ das jeweilige Fraktil der-Verteilung und x das jeweilige Fraktil der $F(20,13)$          -Verteilung.

6. Schritt: Testentscheidung

Da $1,14=v\notin B$          wird        $H_0$  nicht verworfen.

Interpretation:

Auf einem Signifikanzniveau von fünf Prozent können wir nicht zeigen, dass die Varianzen nicht gleich sind. Wir akzeptieren somit die Nullhypothese, dass Konformität vorliegt.


Zu c):
c)   $H_0:\mu _A\geqslant \mu _B$                          gegen     $H_1:\mu _A<\mu _B.$ 

$H_1:$   Das uns interessierende Merkmal ist die bessere mittlere Leistung von Stichprobe B.

#