Jetzt neu: Steuerrecht online lernen auf steuerkurse.de!
ZU DEN KURSEN!

Stichprobentheorie - Testverteilungen

Kursangebot | Stichprobentheorie | Testverteilungen

Stichprobentheorie

Testverteilungen

In diesem Kapitel lernen wir mit Hilfe von Hypothesentests und Konfidenzintervallen Testverteilungen kennen und diese anzuwenden.

Dazu werden vorerst einige Verteilungen vorgestellt.

Chi-Quadrat-Verteilung

Im Falle dessen, dass es sich bei $X_1,X_2,X_3,…,X_n$ um unabhängige und standardnormalverteilte Zufallsvariablen handelt, lautet die Zufallsvariable $Y=\sum _{i=1}^nX_i^2$

Die n Freiheitsgrade werden durch das Chi-quadrat verteilt. Abgekürzt können die n Freiheitsgrade durch die Notation $Y\text{\~{}}\chi ^2(n)$ einhergehen.

Es ergeben sich die folgenden Werte für den Erwartungswert und der Varianz einer Chi-quadrat-verteilten Zufallsvariable:

Erwartungswert: E(Y) = n

Varianz: VAR(Y) = 2n.

 

Merke

Hier klicken zum Ausklappen

Ab n > 100  kann die Chi-quadrat-Verteilung durch die Normalverteilung mit den Parametren $n\text{ und }\sqrt{2n}$ ansatzweise genau approximiert werden. Dabei ist jedoch Y für die jeweilige Zusatzvariable einzusetzen.

$Y\text{\~{}}N(n;\sqrt{2n})$ ab n >100.

Falls für n nur die Werte zwischen 30 und 100 angenommen werden, kann es zu einer Annäherung der Fraktile der Chi-Quadrat-Verteilung kommen durch:  $x_{\alpha }=0,5\left(x_{\alpha }^{'}+(2n-1^{0,5})\right)^2.$
Das passende Fraktil der Standardnormalverteilung N(0;1) ist dann $x_{\alpha }^{'}$

T-Verteilung

Dazu müssen die folgenden Bedingungen erfüllt sein:

  • Unabhängigkeit der Zufallsvariablen X und Y. Die Zufallsvariable ist dann $T=\frac Z{\sqrt{\frac 1 nY}}$ t(n)-verteilt. Die Abkürzung erfolgt durch die Schreibweise T~ t(n).

  • Normalverteilung der Zufallsvariable Z, beispielsweise Z~N(0;1). Chi-Quadrat-verteilt mit n Freiheitsgraden $Y\text{\~{}}\chi ^2(n)$ entspricht der Zufallsvariable Y.

Merke

Hier klicken zum Ausklappen

Symmetrisch ist die Dichefunktion der t-Verteilung zur Y-Ordinate. Die Dichtefunktion kann für n> 30 durch die Standardnormalverteilung N(0;1) angenähert werden.

Bezüglich des Erwartungswerts und der vorausgesetzten Varianz von n > 2 gilt:

E(T) = 0 und $\mathit{VAR}(T)=\frac n{n-2}$ 

F-Verteilung

Wenn es sich bei X und Y um unabhängige Zufallsvariablen handelt, dann gelte: $X\text{\~{}}\chi ^2(m)$ $Y\text{\~{}}\chi ^2(n).$
Für die Zufallsvariable gilt dann: H=\frac{\frac 1 mX}{\frac 1 nY} F – verteilt mit den Freiheitsgraden m und n. Die Abkürzung erfolgt durch die Schreibweise:  H ~ F(m;n)

Bezüglich der Erwartungswerts und der Varianz ergeben sich die Werte:

$E(H)=\frac n{n-2}\text{für}n>2$ $\mathit{VAR}(H)=\frac{2n^2(n+m-2)}{m(n-4)(n-2)^2},\text{für} n>4.$

Aufgaben zur Testtheorie

Im Folgenden werden verschiedene Aufgaben beispielhaft angeführt und die dazugehörigen Lösungswege aufgezeigt.

1. Aufgabe

Bei der Apfelernte stellt der Bauer Ulrich fest, dass sich das Gewicht der Ernte zu den Ernten davor unterscheidet und vermutet, dass dies mit den Temperaturen in Verbindung steht. Beschrieben werden die Elstaräpfel mit Hilfe der Zufallsvariablen $X_1,…,X_n,$ die gleichermaßen unabhängig voneinander verteilt sind.

Aus Erfahrungen weiß der Bauer, dass das Gewicht der Äpfel einer $N(\mu ,100)$-Verteilung folgt, wenngleich die Abnehmer davon überzeugt sind, dass das Gewicht im Durchschnitt weniger als 100 g beträgt.

Zu Gunsten der Überprüfung wird eine Stichprobe vom Umfang n= 30 erhoben. Es ergaben sich folgende Werte in Gramm:
105, 103, 107, 105, 105, 102, 109, 104, 104, 103, 106, 106, 107, 100, 111, 110, 102, 108, 99, 103, 101, 103, 109, 106, 104, 104, 101, 106, 107, 110

Es ist ein entsprechender Test durchzuführen, um herauszufinden, ob die Abnehmer mit ihrer Behauptung recht haben. Auszugehen ist von einem Signifikanzniveau von $\alpha =0,0401.$

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 30.
-> Folglich ist Schema a) anzuwenden.

2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese bezieht sich auf die Behauptung der Abnehmer in Bezug auf das durchschnittliche Gewicht der Äpfel in Gramm, beziehungsweise die Größe $\mu$.
-> Folglich sind wahlweise die Tests 3.2.1 bis 3.2.4 hinzuzuziehen.

3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich gemäß der Aufgabenstellung um eine normalverteilte Grundgesamtheit.
-> Folglich ist der Test 3.2.1 oder 3.2.2. anzuwenden.

4. Ist die Standardabweichung der Grundgesamtheit bekannt ?
-> Ja sie ist bekannt: $\sigma = 10$.
-> Folglich ist der Einstichproben Gaustest anzuwenden (Test 3.2.1).

 

  1. Anwendungsvoraussetzungen

    Durch die Fragen konnte festgestellt werden, dass die Anwendungsvoraussetzungen gegeben sind.

  2. Wahl der Hypothese

    Es liegt die Behauptung vor, dass das durchschnittliche Gewicht der Äpfel weniger als 100 g beträgt, d.h. b) $H_0:\mu \geqslant 100$ gegen $H_1:\mu <100$

  3. Signifikanzniveau

    Das Signifikanzniveau beträgt gemäß der Aufgebanstellung $\alpha = 0,0401$.

  4. Testfunktionswert

    Der Testfunktionswert wird berechnet: $\text v=\frac{\overline x-\mu _0}{\sigma }\sqrt n.$}

    Aus der Stichprobe gehen folgende Mittelwerte einher:

    $\overline x=\sum _{i=1}^{30}\frac{X_i}{30}=\frac{105+...+101+...+110}{30}=105.$
    Also $\text v=\frac{105-100}{10}\sqrt{30}=0,548\ast 5\approx 2,74.$

  5. Verwerfungsbereich

    Anlehnend an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt.

    Somit ist es $z_{1-\alpha }=z_{1-0,0401}=z_{0,9599}=1,75.$

    Damit ist der Verwerfungsbereich: $B=\text (-\infty ;-1,75\text ).$

  6. Testentscheidung

    Weil $\text v=2,74\notin \mathit{B.}$ kommt es zu keiner Verwerfung von $H_0$ 

  7. Deutung
    Es konnte auf der Grundlage von dem Signifikanzniveau von 4,01 % nicht widerlegt werden, dass das durchschnittliche Gewicht der Äpfel mehr als 100 g entspricht.

2. Aufgabe 

Ein Großabnehmer unterstellt einem Schokoladenhersteller, dass die neu eingeführte XL Tafelschokolade mit getrockneten Acai-Beeren aus dem nordöstlichen Brasilien keine 300 g wiegen würde. Der Schokoladenhersteller wehrt sich und fordert Beweise. Aus diesem Grund lässt das Unternehmen eine Stichprobe durchführen. Auch hier stehen die Zufallsvariablen $X_1,…,X_n$ für das Gewicht einer Schokoladentafel, angegeben in Gramm.

Die Erfahrungen besagen, dass die Zufallsvariablen $X_1,…,X_n,$ unabhängig gleich $N(\mu ;\sigma^2 )$-verteilt sind. Unbekannt sind dabei auch $\mu$ und $\alpha$.

Zugunsten der einfachen Stichprobe wird ein Umfang von n = 12 hinzugezogen.
Hierfür kamen folgende Stichprobenwerte zustande: 298, 293, 300, 299, 301, 299, 302, 295, 303, 297, 298, 291

Überprüfen Sie, ob die Schokoladenfabrik das Gewicht falsch angegeben hat.
Für die Testung dient ein Signifikanzniveau von $\alpha = 0,05$.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 12. 
-> Folglich ist Schema a) anzuwenden.

2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese bezieht sich auf die Behauptung des Großabnehmers und das durchschnittliche Gewicht der Tafel Schokolade, beziehungsweise die Größe $\mu$.
-> Folglich kommen dafür die Tests 3.2.1 bis 3.2.4 in Frage.

3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Gemäß der Aufgabenstellung, handelt es sich um eine normalverteilte Grundgesamtheit.
-> Folglich ist dafür der Test 3.2.1 oder 3.2.2 anzuwenden.

4. Ist die Standardabweichung der Grundgesamtheit bekannt?
-> Nein, sie ist nicht bekannt.
-> Folglich ist der Einstichproben t-Test dafür anzuwenden.

  1. Anwendungsvoraussetzungen

    Es wurde deutlich, dass diese gegeben sind.

  2. Wahl der Hypothese

    Der Großabnehmer ist der Meinung, dass die Tafel im Durchschnitt keine 300 g wiegen würde. Deswegen ist:
    a) $H_0:\mu =300$ gegen $H_1:\mu \neq 300$
    Dabei wird deutlich, dass ein zweiseitiger Test vorliegt.

  3. Signifikanzniveau

    Es hat ein Signifikanzniveau von: $\alpha = 0,05$.

  4. Testfunktionswert

    Der Testfunktionswert ist zu berechnen: $\text v=\frac{\overline x-\mu _0} s\sqrt n.$

    Demnach ist es: $\overline x=\frac 1{12}\sum _{i=1}^{12}X_i=\frac 1{12}(298+293+...+291)=298.$

298

298

0

293

298

-5

300

298

-2

299

298

1

301

298

3

299

298

1

302

298

4

295

298

-3

303

298

5

297

298

-1

298

298

0

291

298

-7

$s^2=\frac 1{11}\sum _{i=1}^{12}(X_i-\overline x)^2=\frac 1{11}(0+(-5)^2+(-2)^2+...+(-7)^2)=\frac{140}{11}\approx 12,7.$

Das Ergebniss des Testfunktionswertes ist: $\text v=\frac{(298-300)}{\sqrt{12,7}}\sqrt{12}\approx -1,94.$

5. Verwerfungsbereich

Anlehnend an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt.

Zuerst ist: $t_{1-\frac{\alpha } 2}=t_{0,975}=2,1778\approx 2,2.$

$B=\text (-\infty ;-2,2\text )\cup \text (2,2;\infty \text )$

6. Testentscheidung

Weil -1,94 $\text v\notin \mathit{B.}$ kann die Nullhypothese nicht verworfen werden.

7. Deutung:

Es kann auf einem Signifikanzniveau von fünf Prozent nicht bewiesen werden, dass der Schokoladenhersteller seinem Sollwert von 300 g nicht nachgekommen sei.

3. Aufgabe

Ein Gegenstandskörper wird mit einer hoch sensiblen Feinwaage gewogen. Die Zufallsvariablen $X_1,…,X_n,$ stellen die verschiedenen, sehr geringen Messwerte  gemessen in Mikrogramm nach mehrfachen wiegen auf. Dabei unterliegen diese ebenso einer unabhängig identischen $N(\mu ;\sigma ^2)$  Verteilung. Unbekannt sind die Parameter $\mu $ und $\sigma ^2$.

Mit Hilfe eines Tests soll ersichtlich werden, ob die vom Hersteller angegebene Varianz $\sigma ^2=100$ für Messungen tragbar ist. Käufer des Produktes behaupten allerdings, dass die Varianz nicht $\sigma ^2=100$ entsprechen kann.
Zur Testung wird ein Stichprobenumfang von 16 Wägungen des Gegenstandkörpers (n=16) durchgeführt. Angegeben werden diese in Mikrogramm. Dabei konnten die folgenden Stichprobewerte vernommen werden. Zudem wurden die Streuungen bzw. Abweichungen untereinander gleichermaßen vernommen, denn das erste gemessene Gewicht lag bei $\text{}x_1\text{):}$

$x_1,x_1-9,x_1+5,x_1-6,x_1+29,x_1+15,x_1+27,x_1,x_1+21,x_1+17,x_1-4,x_1+23,x_1-12,$
$x_1+11,x_1+20,x_1+7.$

Zu testen ist nach dem Signifikanzniveau $\alpha = 0,05.$

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Auswahl des richtigen Tests

1.Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein einfacher Stichprobenumfang von n = 16 
-> Folglich ist Schema a) anzuwenden.

2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft die angegebene Varianz des Herrstellers, demnach den Parameter $\sigma^2$.
-> Der Test 3.2.6 ist unter Vorbehalt einsetzbar.

3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Gemäß der Aufgabenstellung, handelt es sich um eine normalverteilte Grundgesamtheit.
-> Folglich kann eindeutig der Chi – Quadrat – Test für die Varianz (Test 3.2.6) eingesetzt werden. 

  1. Anwendungsvoraussetzungen

    Es wurde ersichtlich, dass die Anwendungsvoraussetzungen gegeben sind.

  2. Wahl der Hypothese

    Einige Käufer des Produktes sind davon überzeugt, dass die Varianz nicht gleich 100 ist, demnach

    a) $H_0:\sigma ^2=\sigma _0^2=100$ gegen $H_1:\sigma ^2\neq \sigma _0^2.$

  3. Signifikanzniveau

    Gemäß der Aufgabenstellung ist $\alpha = 0,05$.

  4. Testfunktionswert

    Der Testfunktionswert wird berechnet, wenngleich $\mu$ nicht bekannt ist:

    Für $\overline x$ bekommen wir: $\overline x=\frac 1{16}(x_1+x_1-9+x_1+5+...+x_1-12+x_1+11)=x_1+9.$

    $\text v=\frac{\sum _{i=1}^{16}(x_i-\overline x)^2}{\sigma _0^2}$

    $\text{ }\text =\frac{\left((-9)^2+(-18)^2+(-4)^2+(-15)^2+20^2+6^2+18^2+12^2+8^2+..+(-2)^2\right)}{100}=\frac{2630}{100}=26,3.$

  5. Verwerfungsbereich
    Anlehnend an die Wahl der Hypothese, wird der Verwerfungsbereich bestimmt.

    Somit ist x das jeweilige Fraktil der- Verteilung, d.h. $B=\left[0;x_{\frac{\alpha } 2}\right)\cup \left(x_{1-\frac{\alpha } 2};\infty \right).$
    Das Fraktil der $\chi ^2(n-1)${}- Verteilung ist x, d.h. $x_{0,025}(15)=6,262\text{und}x_{0,975}(15)=27,488.$ und somit $B=\text (0;6,262\text )\cup \text (27,488;\infty \text )$

  6. Testentscheidung
    Weil $\text v\notin \mathit{B.}$ wird $H_0$ nicht verworfen.

  7. Deutung
    Das Signifikanzniveau von 5% kann nicht zeigen, dass die Varianz der Waage nicht $100g^2$ entspricht. Somit ist die Nullhypothese akzeptabel.

4. Aufgabe

Bei einer Umfrage im Jahr 2000 konnte anhand einer Stichprobe festgestellt werden, dass von den 3000 Befragten 43,5 % vor hatten, für die Regierungsspitze der damaligen Zeit zu stimmen. Ist es möglich anhand dieser Stichprobe die Aussage zu treffen, dass die Partei damals schon über eine absolute Mehrheit verfügte?
Ausgegangen wird hier von einem Signifikationsniveau von 5 %.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 3000.
-> Folglich ist Schema a) anzuwenden.

2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese betrifft den prozentualen Anteil s der Wähler, welche für die Regierungsspitze stimmten.

3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich gemäß der Aufgabenstellung um eine binominale Verteilung, da die Grundgesamtheit dichotom ist (es besteht nur die Möglichkeit zwischen dem Wählen der Regierungsspitze oder dem nicht Wählen).
-> Folglich ist der Test 3.2.5 anzuwenden.

  1. Anwendungsvoraussetzungen

    Anzuwenden ist: $3000\ast 0,435=1305\geqslant 5\text{   }\text{und}\text{   }3000\ast 0,435\leqslant 3000-5=2995.$

    Es kann festgestellt werden, dass die Anwendungsvoraussetzungen hinreichend gegeben sind.

  2. Wahl der Hypothese
    c) $H_0:p\leqslant p_0=50\text{%}.$ Der Stimmenanteil der Regierungsspitze in der Bevölkerung s beträgt entweder 50 % oder weniger, gegen $H_1:p>50\text{%}.$ Der Stimmenanteil der Regierungsspitze in der Bevölkerung s ist größer als 50 %. Demnach ergebe das, dass sie mehr als 50 % der Stimmen bekommen haben.

  3. Signifikanzniveau

    Gemäß der Aufgabenstellung ist $\alpha = 0,05$.

  4. Testfunktionswert
    Der Testfunktionswert wird berechnet $\text v=\frac{0,435-0,5}{\sqrt{0,5(1-0,5)}}\ast \sqrt{3000}=-7,12.$

  5. Verwerfungsbereich

    In Anlehnung an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt, demnach $B=(z_{1-\alpha };\infty )$

    Gegeben ist das 0,95-Fraktil der Standardnormalverteilung für: $z_{0,95}=1,65.$ Also $B=(1,65;\infty )$

  6. Testentscheidung

    $H_0$ nicht verworfen, weil $\text v=-7,12\notin B=\text (1,65;\infty \text )$

  7. Deutung
    Auf der Grundlage des Signifikanzniveaus von 5% konnte dem nicht widersprochen werden, dass die Regierungsspitze im Jahr 2000 gleich viele oder weniger als 50 % der Stimmen hatte.

5. Aufgabe

Bei einer Qualitätskontrolle wurde die mittlere Länge spezifischer Leitplanken verglichen. Dabei wurden im Rahmen einer einfachen Stichprobe 58 Leitplanken hinzugezogen (Stichprobenumfang n=58). Dabei wurde deutlich, dass sich die 58 Exemplare erheblich $(\alpha =0,05)$ von dem Sollwert  μ = 8,5 [m] unterscheiden, weswegen die weitere Produktion gestoppt werden soll. Nun soll für eine exaktere Produktion die vorherrschenden Einstellungen geprüft werden.

Bei Stichprobe der 58 Messerwerte kam folgendes heraus $\overline x=9\text{[m]}$ und s = 0,4 [m].

Um ein genaues Urteil bezüglich der Wartung fällen zu können, bedarf es der Durchführung eines geeigneten Tests.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 58.
-> Folglich ist Schema a) anzuwenden.

2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Parameter.
-> Folglich kommen die Tests 3.2.1 bis 3.2.5 in Frage.

3. Um welchen Parameter handelt es sich?
-> Die Hypothese betrifft den Parameter.
-> Folglich kommen die Tests 3.2.1 bis 3.2.4 in Frage.

4. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Die Verteilung der Grundgesamtheit ist nicht bekannt.
-> Folglich ist der Test 3.4.3 oder 3.2.4 zu wählen.

5. Um welche Standardabweichung handelt es sich?
-> Die Standardabweichung ist nicht bekannt, nur die Stichprobenvarianz.
-> Folglich ist der Test 3.2.4 anzuwenden.

  1. Anwendungsvoraussetzungen

    Da 58 > 30, sind die Anwendungsvoraussetzungen gegeben.

  2. Wahl der Hypothese
    a) $H_0:\mu =8,5$ gegen $H_1:\mu \neq 8,5.$

  3. Signifikanzniveau

    Gemäß der Aufgabenstellung ist $\alpha = 0,05$.

  4. Testfunktionswert

    Der Testfunktionswert ist zu berechnen: $\text v=\frac{9-8,5}{0,4}\ast \sqrt{58}=9,51.$

  5. Verwerfungsbereich

    Für die Standardabweichung ist das $1-\frac{\alpha } 2=1-0,025=0,975$-Fraktil  zu: $z_{0,975}\approx 1,96$ gegeben.

    Bei der Wahl der Hypothese ist zu beachten: $B=(-\infty ;-1,96)\cup (1,96;\infty )$

  6.  Testentscheidung

    Wird $H_0$ verworfen, weil $\text v=9,51\in B$ 

  7. Deutung
    Es wird durch den Signifikationswert von 5 % ersichtlich, dass die mittlere Länge der spezifischen Leitplanken erheblich vom Sollwert von 8,5 m abweicht. Demnach sei die Produktion dringen zu stoppen und die Einstellungen zu überarbeiten.

6. Aufgabe

Zu untersuchen ist, ob sich bei zwei verschiedenen, jedoch ähnlichen Hamsterrassen das Gewicht des ersten Wurfs voneinander unterscheidet. Die beiden Rassen werden hier Y und Z genannt.
Es wurde bereits bei beiden Rassen eine einfache Stichprobe durchgeführt.

Vernommen werden konnte für die Rasse Y ein Wurfumfang von $n_1=16$ und bei Rasse Z ein Wurfumfang von $n_2=14.$

Rasse Y

Rasse Z

$\overline x=17,5$$\overline y=15$
$s_x=4$$s_y=3$
$n_1=16$$n_2=14$

Vermutet wird, dass die Rasse Y einer $N(\mu _x;\sigma ^2)$ −verteilten Grundgesamtheit unterliegt und Rasse Z einer $N(\mu _y;\sigma ^2)$ −verteilten Grundgesamtheit.

Getestet werden soll, ob das mittlere Wurfgewicht von der Rasse abhängig ist, ausgehend von dem zu auszugehenden Niveau von $\alpha = 0,05$.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?
-> Gegeben sind nach Voraussetzung zwei einfache Stichproben  $n_1=16\text{und}n_2=14.$
-> Folglich ist Schema b) anzuwenden.

2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Vergleich der Parameter $\mu _1\text{   }\mathit{und}\text{   }\mu _2.$
-> Gegeben sind zwei unabhängige Stichproben.
-> Folglich kommen die Tests 3.3.1 bis 3.3.3 in Frage.

3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich um eine normalverteilte Grundgesamtheit.
-> Folglich sind die Tests 3.3.1 oder 3.3.2 zu wählen.

4. Ist die Standardabweichung der Grundgesamtheit gegeben?
-> Die Standardabweichung ist in der Aufgabenstellung nicht gegeben. Jedoch ist es $\sigma _1=\sigma _2.$
-> Folglich ist der Zweistichproben t -Test anzuwenden (Test 3.3.2).

  1. Anwendungsvoraussetzungen

    Die Anwendungsvoraussetzungen sind gegeben.

  2. Wahl der Hypothese

    a) $H_0:\mu _1=\mu _2$ gegen $H_1:\mu _1\neq \mu _2.$

  3. Festlegung des Signifikanzniveaus

    Gemäß der Aufgabenstellung ist $\alpha = 0,05$.

  4. Testfunktionswert

    Somit ist $\text v=\frac{\overline x_1-\overline x_2}{\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}\frac{n_1+n_2}{n_1n_2}}}=\frac{17,5-15}{\sqrt{\frac{(16-1)16+(14-1)9}{16+14-2}\frac{16+14}{16\ast 14}}}=\frac{2,5}{\sqrt{\frac{15\ast 16+13\ast 9}{28}\frac{30}{224}}}.$

    $\text v=\frac{2,5}{\sqrt{\frac{357}{28}\frac{30}{224}}}\approx 1,91.$

  5. Verwerfungsbereich

    $B=\text (-\infty ;-t_{1-\frac{\alpha } 2}\text )\cup .\text (t_{1-\frac{\alpha } 2};\infty \text )$
    $t_{1-\frac{\alpha } 2}(28)=t_{0,975}(28)=2,0484.$
    Also ist $B=\text (-\infty ;-2,0484\text )\cup \text (2,0484;\infty \text )$

  6. Testentscheidung

    Weil $\text v\notin \mathit{B.}$ kann die Hypothese $H_0$ verworfen werden. 

  7. Deutung

    Es konnte auf der Grundlage des Signifikanzniveaus von 5% nicht widerlegt werden, dass sich die Wurfgewichte der beiden Hamsterrassen erheblich voneinander unterscheiden.

7. Aufgabe

Auf einer Ausstellung werden mehrere Maschinen vorgestellt, die zum Verkauf bereitstehen. Ein Shampoohersteller sieht diesen Anlass als Gelegenheit sich eine neue Abfüllmaschine zuzulegen, da sich diese, gemäß den Angaben, mehr als seine alte Maschine lohnen würde. Dennoch möchte er prüfen, ob die neue Maschine tatsächlich genauer abfüllt. Dabei weiß der Hersteller, dass die alte Maschine um sechs Gramm streut, wenn sie auf das Sollgewicht eingestellt ist. Die neue Maschine soll demnach bei fester Einstellung des Sollgewichts mittels einer einfachen Stichprobe von n = 20 überprüft werden.

Angegeben wird das erhaltene Füllgewicht mit $(X_1,…,X_n)$. Es wird von einer normalverteilten Füllmenge ausgegangen.
Aus der Stichprobe gehen folgende Werte einher: $s^2=22,18g^2,(\text{also} s=\sqrt{22,18g^2}=4,7g.)$

Ein Signifikanzniveau von 2,5 % wird für sinnvoll gehalten. Die Frage stellt sich demnach, ob die Streuung der neuen Maschine geringer ausfällt im Vergleich zur alten Maschine.

Um diese Frage zu beantworten, ist nun der entsprechende Test durchzuführen.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Wahl des richtigen Tests

1. Wie viele Stichproben sind gegeben?

-> Gegeben sind nach Voraussetzung zwei einfache Stichprobe vom Umfang n = 20. 
-> Folglich ist Schema b) anzuwenden.

2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Parameter $\sigma^2$ (Streuung der Maschinen)
-> Der Test 3.2.6 kann unter Vorbehalt in Betracht gezogen werden.

3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich um eine normalverteilte Grundgesamtheit.
-> Folglich ist es ganz sicher der Test 3.2.6.

  1. Anwendungsvoraussetzungen
    Wie sich herausstellte, sind diese gegeben.

  2. Wahl der Hypothese
    b) $H_0:\sigma ^2\geqslant 36$ gegen $H_1:\sigma ^2<36$

  3. Signifikanzniveau
    $\alpha =2,5\text{\%}=0,025.$

  4. Testfunktionswert
    Weil  $\mu $ nicht bekannt ist: $\text v=\frac{\sum _{i=1}^n(x_i-\overline x)^2}{\sigma _0^2}=(n-1)\frac{s^2}{\sigma _0^2}=(20-1)\frac{22,18}{36}=11,71.$

  5. Verwerfungsbereich

    Anlehnend an die Wahl der Hypothese, wird der Verwerfungsbereich gewählt, somit ist es $B=\text [0;x_{\alpha }\text )$

    Weil $\mu $ unbekannt ist, handelt es sich beim jeweilige Fraktil der $\chi ^2(n-1)${}-Verteilung um x.

    Als Ergebnis für das Signifikanzniveau 0,025 ergibt sich: $x_{0,025}(19)=8,907.$

    Demnach ist $B=\text [0;8,907\text ).$

  6. Testentscheidung

    Weil $\text v\notin \mathit{B.}$ wird $H_0$ nicht verworfen.

  7. Interpretation:

    Auf der Basis des Signifikanzniveaus von 2,5 % konnte nicht kenntlich gemacht werden, dass die Streuung der neuen Maschine kleiner als die der alten Maschine ist.

8. Aufgabe

Diese Aufgabe beschäftigt sich mit der Frage, ob es eine Verbindung zwischen der Einkaufszeit (z) und dem Geschlecht (x) gibt:
Es wird davon ausgegangen, dass bei einer einfachen Zufallsstichprobe von n = 1985 Berufstätige in Wiesbaden die folgenden Werte in der Kontingenztabelle einhergehen:

(x) Geschlecht(z) Einkaufszeit
 

$z<30$

$30\leqslant z\leqslant 60$

$60<z$

männlich

500

422

241

weiblich

485

223

114

Gibt es eine Abhängigkeit zwischen X und Z ? Führen Sie den entsprechenden Test durch, um zu einer Entscheidung zu gelangen. Eine Unsicherheit von 2,5 % besteht.

Vertiefung

Hier klicken zum Ausklappen
Lösung:

Wahl des richtigen Tests

1.Wie viele Stichproben sind gegeben?
-> Gegeben sind zwei verbundene Stichproben, da die Einkaufszeit (z) in Minuten und das Geschlecht (x) in Verbindung stehen.
-> Folglich ist Schema c) anzuwenden.

2. Worauf genau bezieht sich der Test?
-> Der Test betrifft die Unabhängigkeit, da die verteilte Grundgesamtheit unbekannt ist.
-> Folglich ist der Test 3.4.4 anzuwenden.

Chi-Quadrat-Unabhängigkeits-Test

  1. Anwendungsvoraussetzungen

    Die Anwendungsvoraussetzungen sind gegeben.

  2. Wahl der Hypothese

    $H_0:$ X, Z sind unabhängig (mit k=2 bzw. r=3 verschiedenen Ausprägungen)
    $H_1:$ X, Z sind abhängig

  3. Signifikanzniveau
    $\alpha = 2,5\%$

  4. Testfunktionswert

(x) Geschlecht(Z) Einkaufszeit in minRandhäufigkeit
 

$z<30$

$30\leqslant z\leqslant 60$

$60<z$

 

männlich

500

422

241

1163

weiblich

485

223

114

822

 

Σ 985

Σ 645

Σ 355

Σ 1985

Dargestellt wird fortlaufend die Häufigkeiten unter der Annahme der Unabhängigkeit.

 

$z<30$

$30\leqslant z\leqslant 60$

$60<z$

 

männlich

(500)

985*1163/1985=577,1

(422)

645*1163/1985=377,9

(241)

355*1163/1985=207,99

1163

weiblich

(485)

985*822/1985=407,89

(223)

645*822/1985=267,1

(114)

355*822/1985=147

822

 

Σ 985

Σ 645

Σ 355

Σ 1985

, k = 2, r = 3

$\text v=\frac{(500-577,1)^2}{577,1}+\frac{(422-377,9)^2}{377,9}+\frac{(241-207,99)^2}{207,99}$ $+\frac{(485-407,89)^2}{407,89}+\frac{(223-267,1)^2}{267,1}+\frac{(114-147)^2}{147}=10,3+5,15+5,24+14,58+7,28+7,4=49,95.$

 

5. Verwerfungsbereich:

$B=(x_{1-0,025};\infty )=(x_{0,975};\infty )$

Gegeben sind zwei Eigenschaften und drei Ausprägungen,  d.h. k = 2 und r = 3
Auf dieser Grundlage wird das 2,5 % Fraktil der $\chi ^2(2)$ - Verteilung bestimmt. Demnach ist: $x_{0,975}=7,378.$

6. Testentscheidung:

$B=\text (7,378;\infty \text ).$
Weil $\text v\in \mathit{B.}$ wird $H_0$ verworfen.

7. Deutung:

Es wird ersichtlich, dass die Merkmale von Geschlecht und Einkaufszeit bei einem Signifikanzniveau von 2,5 % erheblich voneinander abhängen.