Inhaltsverzeichnis
In diesem Kapitel lernen wir mit Hilfe von Hypothesentests und Konfidenzintervallen Testverteilungen kennen und diese anzuwenden.
Dazu werden vorerst einige Verteilungen vorgestellt.
Chi-Quadrat-Verteilung
Im Falle dessen, dass es sich bei $X_1,X_2,X_3,…,X_n$ um unabhängige und standardnormalverteilte Zufallsvariablen handelt, lautet die Zufallsvariable $Y=\sum _{i=1}^nX_i^2$
Die n Freiheitsgrade werden durch das Chi-quadrat verteilt. Abgekürzt können die n Freiheitsgrade durch die Notation $Y\text{\~{}}\chi ^2(n)$ einhergehen.
Es ergeben sich die folgenden Werte für den Erwartungswert und der Varianz einer Chi-quadrat-verteilten Zufallsvariable:
Erwartungswert: E(Y) = n
Varianz: VAR(Y) = 2n.
Merke
Ab n > 100 kann die Chi-quadrat-Verteilung durch die Normalverteilung mit den Parametren $n\text{ und }\sqrt{2n}$ ansatzweise genau approximiert werden. Dabei ist jedoch Y für die jeweilige Zusatzvariable einzusetzen.
$Y\text{\~{}}N(n;\sqrt{2n})$ ab n >100.
Falls für n nur die Werte zwischen 30 und 100 angenommen werden, kann es zu einer Annäherung der Fraktile der Chi-Quadrat-Verteilung kommen durch: $x_{\alpha }=0,5\left(x_{\alpha }^{'}+(2n-1^{0,5})\right)^2.$
Das passende Fraktil der Standardnormalverteilung N(0;1) ist dann $x_{\alpha }^{'}$
T-Verteilung
Dazu müssen die folgenden Bedingungen erfüllt sein:
Unabhängigkeit der Zufallsvariablen X und Y. Die Zufallsvariable ist dann $T=\frac Z{\sqrt{\frac 1 nY}}$ t(n)-verteilt. Die Abkürzung erfolgt durch die Schreibweise T~ t(n).
Normalverteilung der Zufallsvariable Z, beispielsweise Z~N(0;1). Chi-Quadrat-verteilt mit n Freiheitsgraden $Y\text{\~{}}\chi ^2(n)$ entspricht der Zufallsvariable Y.
Merke
Symmetrisch ist die Dichefunktion der t-Verteilung zur Y-Ordinate. Die Dichtefunktion kann für n> 30 durch die Standardnormalverteilung N(0;1) angenähert werden.
Bezüglich des Erwartungswerts und der vorausgesetzten Varianz von n > 2 gilt:
E(T) = 0 und $\mathit{VAR}(T)=\frac n{n-2}$
F-Verteilung
Wenn es sich bei X und Y um unabhängige Zufallsvariablen handelt, dann gelte: $X\text{\~{}}\chi ^2(m)$ $Y\text{\~{}}\chi ^2(n).$
Für die Zufallsvariable gilt dann: H=\frac{\frac 1 mX}{\frac 1 nY} F – verteilt mit den Freiheitsgraden m und n. Die Abkürzung erfolgt durch die Schreibweise: H ~ F(m;n)
Bezüglich der Erwartungswerts und der Varianz ergeben sich die Werte:
$E(H)=\frac n{n-2}\text{für}n>2$ $\mathit{VAR}(H)=\frac{2n^2(n+m-2)}{m(n-4)(n-2)^2},\text{für} n>4.$
Aufgaben zur Testtheorie
Im Folgenden werden verschiedene Aufgaben beispielhaft angeführt und die dazugehörigen Lösungswege aufgezeigt.
1. Aufgabe
Bei der Apfelernte stellt der Bauer Ulrich fest, dass sich das Gewicht der Ernte zu den Ernten davor unterscheidet und vermutet, dass dies mit den Temperaturen in Verbindung steht. Beschrieben werden die Elstaräpfel mit Hilfe der Zufallsvariablen $X_1,…,X_n,$ die gleichermaßen unabhängig voneinander verteilt sind.
Aus Erfahrungen weiß der Bauer, dass das Gewicht der Äpfel einer $N(\mu ,100)$-Verteilung folgt, wenngleich die Abnehmer davon überzeugt sind, dass das Gewicht im Durchschnitt weniger als 100 g beträgt.
Zu Gunsten der Überprüfung wird eine Stichprobe vom Umfang n= 30 erhoben. Es ergaben sich folgende Werte in Gramm:
105, 103, 107, 105, 105, 102, 109, 104, 104, 103, 106, 106, 107, 100, 111, 110, 102, 108, 99, 103, 101, 103, 109, 106, 104, 104, 101, 106, 107, 110
Es ist ein entsprechender Test durchzuführen, um herauszufinden, ob die Abnehmer mit ihrer Behauptung recht haben. Auszugehen ist von einem Signifikanzniveau von $\alpha =0,0401.$
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 30.
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese bezieht sich auf die Behauptung der Abnehmer in Bezug auf das durchschnittliche Gewicht der Äpfel in Gramm, beziehungsweise die Größe $\mu$.
-> Folglich sind wahlweise die Tests 3.2.1 bis 3.2.4 hinzuzuziehen.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich gemäß der Aufgabenstellung um eine normalverteilte Grundgesamtheit.
-> Folglich ist der Test 3.2.1 oder 3.2.2. anzuwenden.
4. Ist die Standardabweichung der Grundgesamtheit bekannt ?
-> Ja sie ist bekannt: $\sigma = 10$.
-> Folglich ist der Einstichproben Gaustest anzuwenden (Test 3.2.1).
Anwendungsvoraussetzungen
Durch die Fragen konnte festgestellt werden, dass die Anwendungsvoraussetzungen gegeben sind.
Wahl der Hypothese
Es liegt die Behauptung vor, dass das durchschnittliche Gewicht der Äpfel weniger als 100 g beträgt, d.h. b) $H_0:\mu \geqslant 100$ gegen $H_1:\mu <100$
Signifikanzniveau
Das Signifikanzniveau beträgt gemäß der Aufgebanstellung $\alpha = 0,0401$.
Testfunktionswert
Der Testfunktionswert wird berechnet: $\text v=\frac{\overline x-\mu _0}{\sigma }\sqrt n.$}
Aus der Stichprobe gehen folgende Mittelwerte einher:
$\overline x=\sum _{i=1}^{30}\frac{X_i}{30}=\frac{105+...+101+...+110}{30}=105.$
Also $\text v=\frac{105-100}{10}\sqrt{30}=0,548\ast 5\approx 2,74.$Verwerfungsbereich
Anlehnend an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt.
Somit ist es $z_{1-\alpha }=z_{1-0,0401}=z_{0,9599}=1,75.$
Damit ist der Verwerfungsbereich: $B=\text (-\infty ;-1,75\text ).$
Testentscheidung
Weil $\text v=2,74\notin \mathit{B.}$ kommt es zu keiner Verwerfung von $H_0$
Deutung
Es konnte auf der Grundlage von dem Signifikanzniveau von 4,01 % nicht widerlegt werden, dass das durchschnittliche Gewicht der Äpfel mehr als 100 g entspricht.
2. Aufgabe
Ein Großabnehmer unterstellt einem Schokoladenhersteller, dass die neu eingeführte XL Tafelschokolade mit getrockneten Acai-Beeren aus dem nordöstlichen Brasilien keine 300 g wiegen würde. Der Schokoladenhersteller wehrt sich und fordert Beweise. Aus diesem Grund lässt das Unternehmen eine Stichprobe durchführen. Auch hier stehen die Zufallsvariablen $X_1,…,X_n$ für das Gewicht einer Schokoladentafel, angegeben in Gramm.
Die Erfahrungen besagen, dass die Zufallsvariablen $X_1,…,X_n,$ unabhängig gleich $N(\mu ;\sigma^2 )$-verteilt sind. Unbekannt sind dabei auch $\mu$ und $\alpha$.
Zugunsten der einfachen Stichprobe wird ein Umfang von n = 12 hinzugezogen.
Hierfür kamen folgende Stichprobenwerte zustande: 298, 293, 300, 299, 301, 299, 302, 295, 303, 297, 298, 291
Überprüfen Sie, ob die Schokoladenfabrik das Gewicht falsch angegeben hat.
Für die Testung dient ein Signifikanzniveau von $\alpha = 0,05$.
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 12.
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese bezieht sich auf die Behauptung des Großabnehmers und das durchschnittliche Gewicht der Tafel Schokolade, beziehungsweise die Größe $\mu$.
-> Folglich kommen dafür die Tests 3.2.1 bis 3.2.4 in Frage.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Gemäß der Aufgabenstellung, handelt es sich um eine normalverteilte Grundgesamtheit.
-> Folglich ist dafür der Test 3.2.1 oder 3.2.2 anzuwenden.
4. Ist die Standardabweichung der Grundgesamtheit bekannt?
-> Nein, sie ist nicht bekannt.
-> Folglich ist der Einstichproben t-Test dafür anzuwenden.
Anwendungsvoraussetzungen
Es wurde deutlich, dass diese gegeben sind.
Wahl der Hypothese
Der Großabnehmer ist der Meinung, dass die Tafel im Durchschnitt keine 300 g wiegen würde. Deswegen ist:
a) $H_0:\mu =300$ gegen $H_1:\mu \neq 300$
Dabei wird deutlich, dass ein zweiseitiger Test vorliegt.Signifikanzniveau
Es hat ein Signifikanzniveau von: $\alpha = 0,05$.
Testfunktionswert
Der Testfunktionswert ist zu berechnen: $\text v=\frac{\overline x-\mu _0} s\sqrt n.$
Demnach ist es: $\overline x=\frac 1{12}\sum _{i=1}^{12}X_i=\frac 1{12}(298+293+...+291)=298.$
298 | 298 | 0 |
293 | 298 | -5 |
300 | 298 | -2 |
299 | 298 | 1 |
301 | 298 | 3 |
299 | 298 | 1 |
302 | 298 | 4 |
295 | 298 | -3 |
303 | 298 | 5 |
297 | 298 | -1 |
298 | 298 | 0 |
291 | 298 | -7 |
$s^2=\frac 1{11}\sum _{i=1}^{12}(X_i-\overline x)^2=\frac 1{11}(0+(-5)^2+(-2)^2+...+(-7)^2)=\frac{140}{11}\approx 12,7.$
Das Ergebniss des Testfunktionswertes ist: $\text v=\frac{(298-300)}{\sqrt{12,7}}\sqrt{12}\approx -1,94.$
5. Verwerfungsbereich
Anlehnend an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt.
Zuerst ist: $t_{1-\frac{\alpha } 2}=t_{0,975}=2,1778\approx 2,2.$
$B=\text (-\infty ;-2,2\text )\cup \text (2,2;\infty \text )$
6. Testentscheidung
Weil -1,94 $\text v\notin \mathit{B.}$ kann die Nullhypothese nicht verworfen werden.
7. Deutung:
Es kann auf einem Signifikanzniveau von fünf Prozent nicht bewiesen werden, dass der Schokoladenhersteller seinem Sollwert von 300 g nicht nachgekommen sei.
3. Aufgabe
Ein Gegenstandskörper wird mit einer hoch sensiblen Feinwaage gewogen. Die Zufallsvariablen $X_1,…,X_n,$ stellen die verschiedenen, sehr geringen Messwerte gemessen in Mikrogramm nach mehrfachen wiegen auf. Dabei unterliegen diese ebenso einer unabhängig identischen $N(\mu ;\sigma ^2)$ Verteilung. Unbekannt sind die Parameter $\mu $ und $\sigma ^2$.
Mit Hilfe eines Tests soll ersichtlich werden, ob die vom Hersteller angegebene Varianz $\sigma ^2=100$ für Messungen tragbar ist. Käufer des Produktes behaupten allerdings, dass die Varianz nicht $\sigma ^2=100$ entsprechen kann.
Zur Testung wird ein Stichprobenumfang von 16 Wägungen des Gegenstandkörpers (n=16) durchgeführt. Angegeben werden diese in Mikrogramm. Dabei konnten die folgenden Stichprobewerte vernommen werden. Zudem wurden die Streuungen bzw. Abweichungen untereinander gleichermaßen vernommen, denn das erste gemessene Gewicht lag bei $\text{}x_1\text{):}$
$x_1,x_1-9,x_1+5,x_1-6,x_1+29,x_1+15,x_1+27,x_1,x_1+21,x_1+17,x_1-4,x_1+23,x_1-12,$
$x_1+11,x_1+20,x_1+7.$
Zu testen ist nach dem Signifikanzniveau $\alpha = 0,05.$
Vertiefung
Lösung:
Auswahl des richtigen Tests
1.Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein einfacher Stichprobenumfang von n = 16
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft die angegebene Varianz des Herrstellers, demnach den Parameter $\sigma^2$.
-> Der Test 3.2.6 ist unter Vorbehalt einsetzbar.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Gemäß der Aufgabenstellung, handelt es sich um eine normalverteilte Grundgesamtheit.
-> Folglich kann eindeutig der Chi – Quadrat – Test für die Varianz (Test 3.2.6) eingesetzt werden.
Anwendungsvoraussetzungen
Es wurde ersichtlich, dass die Anwendungsvoraussetzungen gegeben sind.
Wahl der Hypothese
Einige Käufer des Produktes sind davon überzeugt, dass die Varianz nicht gleich 100 ist, demnach
a) $H_0:\sigma ^2=\sigma _0^2=100$ gegen $H_1:\sigma ^2\neq \sigma _0^2.$
Signifikanzniveau
Gemäß der Aufgabenstellung ist $\alpha = 0,05$.
Testfunktionswert
Der Testfunktionswert wird berechnet, wenngleich $\mu$ nicht bekannt ist:
Für $\overline x$ bekommen wir: $\overline x=\frac 1{16}(x_1+x_1-9+x_1+5+...+x_1-12+x_1+11)=x_1+9.$
$\text v=\frac{\sum _{i=1}^{16}(x_i-\overline x)^2}{\sigma _0^2}$
$\text{ }\text =\frac{\left((-9)^2+(-18)^2+(-4)^2+(-15)^2+20^2+6^2+18^2+12^2+8^2+..+(-2)^2\right)}{100}=\frac{2630}{100}=26,3.$
Verwerfungsbereich
Anlehnend an die Wahl der Hypothese, wird der Verwerfungsbereich bestimmt.
Somit ist x das jeweilige Fraktil der- Verteilung, d.h. $B=\left[0;x_{\frac{\alpha } 2}\right)\cup \left(x_{1-\frac{\alpha } 2};\infty \right).$
Das Fraktil der $\chi ^2(n-1)${}- Verteilung ist x, d.h. $x_{0,025}(15)=6,262\text{und}x_{0,975}(15)=27,488.$ und somit $B=\text (0;6,262\text )\cup \text (27,488;\infty \text )$Testentscheidung
Weil $\text v\notin \mathit{B.}$ wird $H_0$ nicht verworfen.Deutung
Das Signifikanzniveau von 5% kann nicht zeigen, dass die Varianz der Waage nicht $100g^2$ entspricht. Somit ist die Nullhypothese akzeptabel.
4. Aufgabe
Bei einer Umfrage im Jahr 2000 konnte anhand einer Stichprobe festgestellt werden, dass von den 3000 Befragten 43,5 % vor hatten, für die Regierungsspitze der damaligen Zeit zu stimmen. Ist es möglich anhand dieser Stichprobe die Aussage zu treffen, dass die Partei damals schon über eine absolute Mehrheit verfügte?
Ausgegangen wird hier von einem Signifikationsniveau von 5 %.
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 3000.
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese betrifft den prozentualen Anteil s der Wähler, welche für die Regierungsspitze stimmten.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich gemäß der Aufgabenstellung um eine binominale Verteilung, da die Grundgesamtheit dichotom ist (es besteht nur die Möglichkeit zwischen dem Wählen der Regierungsspitze oder dem nicht Wählen).
-> Folglich ist der Test 3.2.5 anzuwenden.
Anwendungsvoraussetzungen
Anzuwenden ist: $3000\ast 0,435=1305\geqslant 5\text{ }\text{und}\text{ }3000\ast 0,435\leqslant 3000-5=2995.$
Es kann festgestellt werden, dass die Anwendungsvoraussetzungen hinreichend gegeben sind.
Wahl der Hypothese
c) $H_0:p\leqslant p_0=50\text{%}.$ Der Stimmenanteil der Regierungsspitze in der Bevölkerung s beträgt entweder 50 % oder weniger, gegen $H_1:p>50\text{%}.$ Der Stimmenanteil der Regierungsspitze in der Bevölkerung s ist größer als 50 %. Demnach ergebe das, dass sie mehr als 50 % der Stimmen bekommen haben.Signifikanzniveau
Gemäß der Aufgabenstellung ist $\alpha = 0,05$.
Testfunktionswert
Der Testfunktionswert wird berechnet $\text v=\frac{0,435-0,5}{\sqrt{0,5(1-0,5)}}\ast \sqrt{3000}=-7,12.$Verwerfungsbereich
In Anlehnung an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt, demnach $B=(z_{1-\alpha };\infty )$
Gegeben ist das 0,95-Fraktil der Standardnormalverteilung für: $z_{0,95}=1,65.$ Also $B=(1,65;\infty )$
Testentscheidung
$H_0$ nicht verworfen, weil $\text v=-7,12\notin B=\text (1,65;\infty \text )$
Deutung
Auf der Grundlage des Signifikanzniveaus von 5% konnte dem nicht widersprochen werden, dass die Regierungsspitze im Jahr 2000 gleich viele oder weniger als 50 % der Stimmen hatte.
5. Aufgabe
Bei einer Qualitätskontrolle wurde die mittlere Länge spezifischer Leitplanken verglichen. Dabei wurden im Rahmen einer einfachen Stichprobe 58 Leitplanken hinzugezogen (Stichprobenumfang n=58). Dabei wurde deutlich, dass sich die 58 Exemplare erheblich $(\alpha =0,05)$ von dem Sollwert μ = 8,5 [m] unterscheiden, weswegen die weitere Produktion gestoppt werden soll. Nun soll für eine exaktere Produktion die vorherrschenden Einstellungen geprüft werden.
Bei Stichprobe der 58 Messerwerte kam folgendes heraus $\overline x=9\text{[m]}$ und s = 0,4 [m].
Um ein genaues Urteil bezüglich der Wartung fällen zu können, bedarf es der Durchführung eines geeigneten Tests.
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 58.
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Parameter.
-> Folglich kommen die Tests 3.2.1 bis 3.2.5 in Frage.
3. Um welchen Parameter handelt es sich?
-> Die Hypothese betrifft den Parameter.
-> Folglich kommen die Tests 3.2.1 bis 3.2.4 in Frage.
4. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Die Verteilung der Grundgesamtheit ist nicht bekannt.
-> Folglich ist der Test 3.4.3 oder 3.2.4 zu wählen.
5. Um welche Standardabweichung handelt es sich?
-> Die Standardabweichung ist nicht bekannt, nur die Stichprobenvarianz.
-> Folglich ist der Test 3.2.4 anzuwenden.
Anwendungsvoraussetzungen
Da 58 > 30, sind die Anwendungsvoraussetzungen gegeben.
Wahl der Hypothese
a) $H_0:\mu =8,5$ gegen $H_1:\mu \neq 8,5.$Signifikanzniveau
Gemäß der Aufgabenstellung ist $\alpha = 0,05$.
Testfunktionswert
Der Testfunktionswert ist zu berechnen: $\text v=\frac{9-8,5}{0,4}\ast \sqrt{58}=9,51.$
Verwerfungsbereich
Für die Standardabweichung ist das $1-\frac{\alpha } 2=1-0,025=0,975$-Fraktil zu: $z_{0,975}\approx 1,96$ gegeben.
Bei der Wahl der Hypothese ist zu beachten: $B=(-\infty ;-1,96)\cup (1,96;\infty )$
Testentscheidung
Wird $H_0$ verworfen, weil $\text v=9,51\in B$
Deutung
Es wird durch den Signifikationswert von 5 % ersichtlich, dass die mittlere Länge der spezifischen Leitplanken erheblich vom Sollwert von 8,5 m abweicht. Demnach sei die Produktion dringen zu stoppen und die Einstellungen zu überarbeiten.
6. Aufgabe
Zu untersuchen ist, ob sich bei zwei verschiedenen, jedoch ähnlichen Hamsterrassen das Gewicht des ersten Wurfs voneinander unterscheidet. Die beiden Rassen werden hier Y und Z genannt.
Es wurde bereits bei beiden Rassen eine einfache Stichprobe durchgeführt.
Vernommen werden konnte für die Rasse Y ein Wurfumfang von $n_1=16$ und bei Rasse Z ein Wurfumfang von $n_2=14.$
Rasse Y | Rasse Z |
---|---|
$\overline x=17,5$ | $\overline y=15$ |
$s_x=4$ | $s_y=3$ |
$n_1=16$ | $n_2=14$ |
Vermutet wird, dass die Rasse Y einer $N(\mu _x;\sigma ^2)$ −verteilten Grundgesamtheit unterliegt und Rasse Z einer $N(\mu _y;\sigma ^2)$ −verteilten Grundgesamtheit.
Getestet werden soll, ob das mittlere Wurfgewicht von der Rasse abhängig ist, ausgehend von dem zu auszugehenden Niveau von $\alpha = 0,05$.
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben sind nach Voraussetzung zwei einfache Stichproben $n_1=16\text{und}n_2=14.$
-> Folglich ist Schema b) anzuwenden.
2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Vergleich der Parameter $\mu _1\text{ }\mathit{und}\text{ }\mu _2.$
-> Gegeben sind zwei unabhängige Stichproben.
-> Folglich kommen die Tests 3.3.1 bis 3.3.3 in Frage.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich um eine normalverteilte Grundgesamtheit.
-> Folglich sind die Tests 3.3.1 oder 3.3.2 zu wählen.
4. Ist die Standardabweichung der Grundgesamtheit gegeben?
-> Die Standardabweichung ist in der Aufgabenstellung nicht gegeben. Jedoch ist es $\sigma _1=\sigma _2.$
-> Folglich ist der Zweistichproben t -Test anzuwenden (Test 3.3.2).
Anwendungsvoraussetzungen
Die Anwendungsvoraussetzungen sind gegeben.
Wahl der Hypothese
a) $H_0:\mu _1=\mu _2$ gegen $H_1:\mu _1\neq \mu _2.$
Festlegung des Signifikanzniveaus
Gemäß der Aufgabenstellung ist $\alpha = 0,05$.
Testfunktionswert
Somit ist $\text v=\frac{\overline x_1-\overline x_2}{\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}\frac{n_1+n_2}{n_1n_2}}}=\frac{17,5-15}{\sqrt{\frac{(16-1)16+(14-1)9}{16+14-2}\frac{16+14}{16\ast 14}}}=\frac{2,5}{\sqrt{\frac{15\ast 16+13\ast 9}{28}\frac{30}{224}}}.$
$\text v=\frac{2,5}{\sqrt{\frac{357}{28}\frac{30}{224}}}\approx 1,91.$
Verwerfungsbereich
$B=\text (-\infty ;-t_{1-\frac{\alpha } 2}\text )\cup .\text (t_{1-\frac{\alpha } 2};\infty \text )$
$t_{1-\frac{\alpha } 2}(28)=t_{0,975}(28)=2,0484.$
Also ist $B=\text (-\infty ;-2,0484\text )\cup \text (2,0484;\infty \text )$Testentscheidung
Weil $\text v\notin \mathit{B.}$ kann die Hypothese $H_0$ verworfen werden.
Deutung
Es konnte auf der Grundlage des Signifikanzniveaus von 5% nicht widerlegt werden, dass sich die Wurfgewichte der beiden Hamsterrassen erheblich voneinander unterscheiden.
7. Aufgabe
Auf einer Ausstellung werden mehrere Maschinen vorgestellt, die zum Verkauf bereitstehen. Ein Shampoohersteller sieht diesen Anlass als Gelegenheit sich eine neue Abfüllmaschine zuzulegen, da sich diese, gemäß den Angaben, mehr als seine alte Maschine lohnen würde. Dennoch möchte er prüfen, ob die neue Maschine tatsächlich genauer abfüllt. Dabei weiß der Hersteller, dass die alte Maschine um sechs Gramm streut, wenn sie auf das Sollgewicht eingestellt ist. Die neue Maschine soll demnach bei fester Einstellung des Sollgewichts mittels einer einfachen Stichprobe von n = 20 überprüft werden.
Angegeben wird das erhaltene Füllgewicht mit $(X_1,…,X_n)$. Es wird von einer normalverteilten Füllmenge ausgegangen.
Aus der Stichprobe gehen folgende Werte einher: $s^2=22,18g^2,(\text{also} s=\sqrt{22,18g^2}=4,7g.)$
Ein Signifikanzniveau von 2,5 % wird für sinnvoll gehalten. Die Frage stellt sich demnach, ob die Streuung der neuen Maschine geringer ausfällt im Vergleich zur alten Maschine.
Um diese Frage zu beantworten, ist nun der entsprechende Test durchzuführen.
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben sind nach Voraussetzung zwei einfache Stichprobe vom Umfang n = 20.
-> Folglich ist Schema b) anzuwenden.
2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Parameter $\sigma^2$ (Streuung der Maschinen)
-> Der Test 3.2.6 kann unter Vorbehalt in Betracht gezogen werden.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich um eine normalverteilte Grundgesamtheit.
-> Folglich ist es ganz sicher der Test 3.2.6.
Anwendungsvoraussetzungen
Wie sich herausstellte, sind diese gegeben.Wahl der Hypothese
b) $H_0:\sigma ^2\geqslant 36$ gegen $H_1:\sigma ^2<36$Signifikanzniveau
$\alpha =2,5\text{\%}=0,025.$Testfunktionswert
Weil $\mu $ nicht bekannt ist: $\text v=\frac{\sum _{i=1}^n(x_i-\overline x)^2}{\sigma _0^2}=(n-1)\frac{s^2}{\sigma _0^2}=(20-1)\frac{22,18}{36}=11,71.$Verwerfungsbereich
Anlehnend an die Wahl der Hypothese, wird der Verwerfungsbereich gewählt, somit ist es $B=\text [0;x_{\alpha }\text )$
Weil $\mu $ unbekannt ist, handelt es sich beim jeweilige Fraktil der $\chi ^2(n-1)${}-Verteilung um x.
Als Ergebnis für das Signifikanzniveau 0,025 ergibt sich: $x_{0,025}(19)=8,907.$
Demnach ist $B=\text [0;8,907\text ).$
Testentscheidung
Weil $\text v\notin \mathit{B.}$ wird $H_0$ nicht verworfen.
Interpretation:
Auf der Basis des Signifikanzniveaus von 2,5 % konnte nicht kenntlich gemacht werden, dass die Streuung der neuen Maschine kleiner als die der alten Maschine ist.
8. Aufgabe
Diese Aufgabe beschäftigt sich mit der Frage, ob es eine Verbindung zwischen der Einkaufszeit (z) und dem Geschlecht (x) gibt:
Es wird davon ausgegangen, dass bei einer einfachen Zufallsstichprobe von n = 1985 Berufstätige in Wiesbaden die folgenden Werte in der Kontingenztabelle einhergehen:
(x) Geschlecht | (z) Einkaufszeit | ||
$z<30$ | $30\leqslant z\leqslant 60$ | $60<z$ | |
männlich | 500 | 422 | 241 |
weiblich | 485 | 223 | 114 |
Gibt es eine Abhängigkeit zwischen X und Z ? Führen Sie den entsprechenden Test durch, um zu einer Entscheidung zu gelangen. Eine Unsicherheit von 2,5 % besteht.
Vertiefung
Lösung:
Wahl des richtigen Tests
1.Wie viele Stichproben sind gegeben?
-> Gegeben sind zwei verbundene Stichproben, da die Einkaufszeit (z) in Minuten und das Geschlecht (x) in Verbindung stehen.
-> Folglich ist Schema c) anzuwenden.
2. Worauf genau bezieht sich der Test?
-> Der Test betrifft die Unabhängigkeit, da die verteilte Grundgesamtheit unbekannt ist.
-> Folglich ist der Test 3.4.4 anzuwenden.
Chi-Quadrat-Unabhängigkeits-Test
Anwendungsvoraussetzungen
Die Anwendungsvoraussetzungen sind gegeben.
Wahl der Hypothese
$H_0:$ X, Z sind unabhängig (mit k=2 bzw. r=3 verschiedenen Ausprägungen)
$H_1:$ X, Z sind abhängigSignifikanzniveau
$\alpha = 2,5\%$Testfunktionswert
(x) Geschlecht | (Z) Einkaufszeit in min | Randhäufigkeit | ||
$z<30$ | $30\leqslant z\leqslant 60$ | $60<z$ | ||
männlich | 500 | 422 | 241 | 1163 |
weiblich | 485 | 223 | 114 | 822 |
Σ 985 | Σ 645 | Σ 355 | Σ 1985 |
Dargestellt wird fortlaufend die Häufigkeiten unter der Annahme der Unabhängigkeit.
$z<30$ | $30\leqslant z\leqslant 60$ | $60<z$ | ||
männlich | (500) 985*1163/1985=577,1 | (422) 645*1163/1985=377,9 | (241) 355*1163/1985=207,99 | 1163 |
weiblich | (485) 985*822/1985=407,89 | (223) 645*822/1985=267,1 | (114) 355*822/1985=147 | 822 |
Σ 985 | Σ 645 | Σ 355 | Σ 1985 |
, k = 2, r = 3
$\text v=\frac{(500-577,1)^2}{577,1}+\frac{(422-377,9)^2}{377,9}+\frac{(241-207,99)^2}{207,99}$ $+\frac{(485-407,89)^2}{407,89}+\frac{(223-267,1)^2}{267,1}+\frac{(114-147)^2}{147}=10,3+5,15+5,24+14,58+7,28+7,4=49,95.$
5. Verwerfungsbereich:
$B=(x_{1-0,025};\infty )=(x_{0,975};\infty )$
Gegeben sind zwei Eigenschaften und drei Ausprägungen, d.h. k = 2 und r = 3
Auf dieser Grundlage wird das 2,5 % Fraktil der $\chi ^2(2)$ - Verteilung bestimmt. Demnach ist: $x_{0,975}=7,378.$
6. Testentscheidung:
$B=\text (7,378;\infty \text ).$
Weil $\text v\in \mathit{B.}$ wird $H_0$ verworfen.
7. Deutung:
Es wird ersichtlich, dass die Merkmale von Geschlecht und Einkaufszeit bei einem Signifikanzniveau von 2,5 % erheblich voneinander abhängen.
Weitere interessante Inhalte zum Thema
-
Wahl der Hypothese
Vielleicht ist für Sie auch das Thema Wahl der Hypothese (Testtheorie) aus unserem Online-Kurs Stichprobentheorie interessant.
-
Verteilungsfunktion
Vielleicht ist für Sie auch das Thema Verteilungsfunktion (Eindimensionale Verteilungen (ohne Namen)) aus unserem Online-Kurs Wahrscheinlichkeitsrechnung interessant.