Inhaltsverzeichnis
In diesem Kapitel lernen wir mit Hilfe von Hypothesentests und Konfidenzintervallen Testverteilungen kennen und diese anzuwenden.
Dazu werden vorerst einige Verteilungen vorgestellt.
Chi-Quadrat-Verteilung
Im Falle dessen, dass es sich bei
Die n Freiheitsgrade werden durch das Chi-quadrat verteilt. Abgekürzt können die n Freiheitsgrade durch die Notation
Es ergeben sich die folgenden Werte für den Erwartungswert und der Varianz einer Chi-quadrat-verteilten Zufallsvariable:
Erwartungswert: E(Y) = n
Varianz: VAR(Y) = 2n.
Merke
Ab n > 100 kann die Chi-quadrat-Verteilung durch die Normalverteilung mit den Parametren
Falls für n nur die Werte zwischen 30 und 100 angenommen werden, kann es zu einer Annäherung der Fraktile der Chi-Quadrat-Verteilung kommen durch:
Das passende Fraktil der Standardnormalverteilung N(0;1) ist dann
T-Verteilung
Dazu müssen die folgenden Bedingungen erfüllt sein:
Unabhängigkeit der Zufallsvariablen X und Y. Die Zufallsvariable ist dann
t(n)-verteilt. Die Abkürzung erfolgt durch die Schreibweise T~ t(n). Normalverteilung der Zufallsvariable Z, beispielsweise Z~N(0;1). Chi-Quadrat-verteilt mit n Freiheitsgraden
entspricht der Zufallsvariable Y.
Merke
Symmetrisch ist die Dichefunktion der t-Verteilung zur Y-Ordinate. Die Dichtefunktion kann für n> 30 durch die Standardnormalverteilung N(0;1) angenähert werden.
Bezüglich des Erwartungswerts und der vorausgesetzten Varianz von n > 2 gilt:
E(T) = 0 und
F-Verteilung
Wenn es sich bei X und Y um unabhängige Zufallsvariablen handelt, dann gelte:
Für die Zufallsvariable gilt dann: H=\frac{\frac 1 mX}{\frac 1 nY} F – verteilt mit den Freiheitsgraden m und n. Die Abkürzung erfolgt durch die Schreibweise: H ~ F(m;n)
Bezüglich der Erwartungswerts und der Varianz ergeben sich die Werte:
Aufgaben zur Testtheorie
Im Folgenden werden verschiedene Aufgaben beispielhaft angeführt und die dazugehörigen Lösungswege aufgezeigt.
1. Aufgabe
Bei der Apfelernte stellt der Bauer Ulrich fest, dass sich das Gewicht der Ernte zu den Ernten davor unterscheidet und vermutet, dass dies mit den Temperaturen in Verbindung steht. Beschrieben werden die Elstaräpfel mit Hilfe der Zufallsvariablen
Aus Erfahrungen weiß der Bauer, dass das Gewicht der Äpfel einer
Zu Gunsten der Überprüfung wird eine Stichprobe vom Umfang n= 30 erhoben. Es ergaben sich folgende Werte in Gramm:
105, 103, 107, 105, 105, 102, 109, 104, 104, 103, 106, 106, 107, 100, 111, 110, 102, 108, 99, 103, 101, 103, 109, 106, 104, 104, 101, 106, 107, 110
Es ist ein entsprechender Test durchzuführen, um herauszufinden, ob die Abnehmer mit ihrer Behauptung recht haben. Auszugehen ist von einem Signifikanzniveau von
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 30.
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese bezieht sich auf die Behauptung der Abnehmer in Bezug auf das durchschnittliche Gewicht der Äpfel in Gramm, beziehungsweise die Größe
-> Folglich sind wahlweise die Tests 3.2.1 bis 3.2.4 hinzuzuziehen.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich gemäß der Aufgabenstellung um eine normalverteilte Grundgesamtheit.
-> Folglich ist der Test 3.2.1 oder 3.2.2. anzuwenden.
4. Ist die Standardabweichung der Grundgesamtheit bekannt ?
-> Ja sie ist bekannt:
-> Folglich ist der Einstichproben Gaustest anzuwenden (Test 3.2.1).
Anwendungsvoraussetzungen
Durch die Fragen konnte festgestellt werden, dass die Anwendungsvoraussetzungen gegeben sind.
Wahl der Hypothese
Es liegt die Behauptung vor, dass das durchschnittliche Gewicht der Äpfel weniger als 100 g beträgt, d.h. b)
gegen Signifikanzniveau
Das Signifikanzniveau beträgt gemäß der Aufgebanstellung
. Testfunktionswert
Der Testfunktionswert wird berechnet:
} Aus der Stichprobe gehen folgende Mittelwerte einher:
AlsoVerwerfungsbereich
Anlehnend an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt.
Somit ist es
Damit ist der Verwerfungsbereich:
Testentscheidung
Weil
kommt es zu keiner Verwerfung von Deutung
Es konnte auf der Grundlage von dem Signifikanzniveau von 4,01 % nicht widerlegt werden, dass das durchschnittliche Gewicht der Äpfel mehr als 100 g entspricht.
2. Aufgabe
Ein Großabnehmer unterstellt einem Schokoladenhersteller, dass die neu eingeführte XL Tafelschokolade mit getrockneten Acai-Beeren aus dem nordöstlichen Brasilien keine 300 g wiegen würde. Der Schokoladenhersteller wehrt sich und fordert Beweise. Aus diesem Grund lässt das Unternehmen eine Stichprobe durchführen. Auch hier stehen die Zufallsvariablen
Die Erfahrungen besagen, dass die Zufallsvariablen
Zugunsten der einfachen Stichprobe wird ein Umfang von n = 12 hinzugezogen.
Hierfür kamen folgende Stichprobenwerte zustande: 298, 293, 300, 299, 301, 299, 302, 295, 303, 297, 298, 291
Überprüfen Sie, ob die Schokoladenfabrik das Gewicht falsch angegeben hat.
Für die Testung dient ein Signifikanzniveau von
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 12.
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese bezieht sich auf die Behauptung des Großabnehmers und das durchschnittliche Gewicht der Tafel Schokolade, beziehungsweise die Größe
-> Folglich kommen dafür die Tests 3.2.1 bis 3.2.4 in Frage.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Gemäß der Aufgabenstellung, handelt es sich um eine normalverteilte Grundgesamtheit.
-> Folglich ist dafür der Test 3.2.1 oder 3.2.2 anzuwenden.
4. Ist die Standardabweichung der Grundgesamtheit bekannt?
-> Nein, sie ist nicht bekannt.
-> Folglich ist der Einstichproben t-Test dafür anzuwenden.
Anwendungsvoraussetzungen
Es wurde deutlich, dass diese gegeben sind.
Wahl der Hypothese
Der Großabnehmer ist der Meinung, dass die Tafel im Durchschnitt keine 300 g wiegen würde. Deswegen ist:
a)gegen
Dabei wird deutlich, dass ein zweiseitiger Test vorliegt.Signifikanzniveau
Es hat ein Signifikanzniveau von:
. Testfunktionswert
Der Testfunktionswert ist zu berechnen:
Demnach ist es:
298 | 298 | 0 |
293 | 298 | -5 |
300 | 298 | -2 |
299 | 298 | 1 |
301 | 298 | 3 |
299 | 298 | 1 |
302 | 298 | 4 |
295 | 298 | -3 |
303 | 298 | 5 |
297 | 298 | -1 |
298 | 298 | 0 |
291 | 298 | -7 |
Das Ergebniss des Testfunktionswertes ist:
5. Verwerfungsbereich
Anlehnend an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt.
Zuerst ist:
6. Testentscheidung
Weil -1,94
7. Deutung:
Es kann auf einem Signifikanzniveau von fünf Prozent nicht bewiesen werden, dass der Schokoladenhersteller seinem Sollwert von 300 g nicht nachgekommen sei.
3. Aufgabe
Ein Gegenstandskörper wird mit einer hoch sensiblen Feinwaage gewogen. Die Zufallsvariablen
Mit Hilfe eines Tests soll ersichtlich werden, ob die vom Hersteller angegebene Varianz
Zur Testung wird ein Stichprobenumfang von 16 Wägungen des Gegenstandkörpers (n=16) durchgeführt. Angegeben werden diese in Mikrogramm. Dabei konnten die folgenden Stichprobewerte vernommen werden. Zudem wurden die Streuungen bzw. Abweichungen untereinander gleichermaßen vernommen, denn das erste gemessene Gewicht lag bei
Zu testen ist nach dem Signifikanzniveau
Vertiefung
Lösung:
Auswahl des richtigen Tests
1.Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein einfacher Stichprobenumfang von n = 16
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft die angegebene Varianz des Herrstellers, demnach den Parameter
-> Der Test 3.2.6 ist unter Vorbehalt einsetzbar.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Gemäß der Aufgabenstellung, handelt es sich um eine normalverteilte Grundgesamtheit.
-> Folglich kann eindeutig der Chi – Quadrat – Test für die Varianz (Test 3.2.6) eingesetzt werden.
Anwendungsvoraussetzungen
Es wurde ersichtlich, dass die Anwendungsvoraussetzungen gegeben sind.
Wahl der Hypothese
Einige Käufer des Produktes sind davon überzeugt, dass die Varianz nicht gleich 100 ist, demnach
a)
gegen Signifikanzniveau
Gemäß der Aufgabenstellung ist
. Testfunktionswert
Der Testfunktionswert wird berechnet, wenngleich
nicht bekannt ist: Für
bekommen wir: Verwerfungsbereich
Anlehnend an die Wahl der Hypothese, wird der Verwerfungsbereich bestimmt.
Somit ist x das jeweilige Fraktil der- Verteilung, d.h.
Das Fraktil der{}- Verteilung ist x, d.h. und somit Testentscheidung
Weilwird nicht verworfen. Deutung
Das Signifikanzniveau von 5% kann nicht zeigen, dass die Varianz der Waage nichtentspricht. Somit ist die Nullhypothese akzeptabel.
4. Aufgabe
Bei einer Umfrage im Jahr 2000 konnte anhand einer Stichprobe festgestellt werden, dass von den 3000 Befragten 43,5 % vor hatten, für die Regierungsspitze der damaligen Zeit zu stimmen. Ist es möglich anhand dieser Stichprobe die Aussage zu treffen, dass die Partei damals schon über eine absolute Mehrheit verfügte?
Ausgegangen wird hier von einem Signifikationsniveau von 5 %.
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 3000.
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese betrifft den prozentualen Anteil s der Wähler, welche für die Regierungsspitze stimmten.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich gemäß der Aufgabenstellung um eine binominale Verteilung, da die Grundgesamtheit dichotom ist (es besteht nur die Möglichkeit zwischen dem Wählen der Regierungsspitze oder dem nicht Wählen).
-> Folglich ist der Test 3.2.5 anzuwenden.
Anwendungsvoraussetzungen
Anzuwenden ist:
Es kann festgestellt werden, dass die Anwendungsvoraussetzungen hinreichend gegeben sind.
Wahl der Hypothese
c)Der Stimmenanteil der Regierungsspitze in der Bevölkerung s beträgt entweder 50 % oder weniger, gegen Der Stimmenanteil der Regierungsspitze in der Bevölkerung s ist größer als 50 %. Demnach ergebe das, dass sie mehr als 50 % der Stimmen bekommen haben. Signifikanzniveau
Gemäß der Aufgabenstellung ist
. Testfunktionswert
Der Testfunktionswert wird berechnetVerwerfungsbereich
In Anlehnung an die Wahl der Hypothese wird der Verwerfungsbereich bestimmt, demnach
Gegeben ist das 0,95-Fraktil der Standardnormalverteilung für:
Also Testentscheidung
nicht verworfen, weil Deutung
Auf der Grundlage des Signifikanzniveaus von 5% konnte dem nicht widersprochen werden, dass die Regierungsspitze im Jahr 2000 gleich viele oder weniger als 50 % der Stimmen hatte.
5. Aufgabe
Bei einer Qualitätskontrolle wurde die mittlere Länge spezifischer Leitplanken verglichen. Dabei wurden im Rahmen einer einfachen Stichprobe 58 Leitplanken hinzugezogen (Stichprobenumfang n=58). Dabei wurde deutlich, dass sich die 58 Exemplare erheblich
Bei Stichprobe der 58 Messerwerte kam folgendes heraus
Um ein genaues Urteil bezüglich der Wartung fällen zu können, bedarf es der Durchführung eines geeigneten Tests.
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben ist nach Voraussetzung ein Stichprobenumfang von n = 58.
-> Folglich ist Schema a) anzuwenden.
2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Parameter.
-> Folglich kommen die Tests 3.2.1 bis 3.2.5 in Frage.
3. Um welchen Parameter handelt es sich?
-> Die Hypothese betrifft den Parameter.
-> Folglich kommen die Tests 3.2.1 bis 3.2.4 in Frage.
4. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Die Verteilung der Grundgesamtheit ist nicht bekannt.
-> Folglich ist der Test 3.4.3 oder 3.2.4 zu wählen.
5. Um welche Standardabweichung handelt es sich?
-> Die Standardabweichung ist nicht bekannt, nur die Stichprobenvarianz.
-> Folglich ist der Test 3.2.4 anzuwenden.
Anwendungsvoraussetzungen
Da 58 > 30, sind die Anwendungsvoraussetzungen gegeben.
Wahl der Hypothese
a)gegen Signifikanzniveau
Gemäß der Aufgabenstellung ist
. Testfunktionswert
Der Testfunktionswert ist zu berechnen:
Verwerfungsbereich
Für die Standardabweichung ist das
-Fraktil zu: gegeben. Bei der Wahl der Hypothese ist zu beachten:
Testentscheidung
Wird
verworfen, weil Deutung
Es wird durch den Signifikationswert von 5 % ersichtlich, dass die mittlere Länge der spezifischen Leitplanken erheblich vom Sollwert von 8,5 m abweicht. Demnach sei die Produktion dringen zu stoppen und die Einstellungen zu überarbeiten.
6. Aufgabe
Zu untersuchen ist, ob sich bei zwei verschiedenen, jedoch ähnlichen Hamsterrassen das Gewicht des ersten Wurfs voneinander unterscheidet. Die beiden Rassen werden hier Y und Z genannt.
Es wurde bereits bei beiden Rassen eine einfache Stichprobe durchgeführt.
Vernommen werden konnte für die Rasse Y ein Wurfumfang von
Rasse Y | Rasse Z |
---|---|
Vermutet wird, dass die Rasse Y einer
Getestet werden soll, ob das mittlere Wurfgewicht von der Rasse abhängig ist, ausgehend von dem zu auszugehenden Niveau von
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben sind nach Voraussetzung zwei einfache Stichproben
-> Folglich ist Schema b) anzuwenden.
2. Bezieht sich die Hypothese auf ein Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Vergleich der Parameter
-> Gegeben sind zwei unabhängige Stichproben.
-> Folglich kommen die Tests 3.3.1 bis 3.3.3 in Frage.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich um eine normalverteilte Grundgesamtheit.
-> Folglich sind die Tests 3.3.1 oder 3.3.2 zu wählen.
4. Ist die Standardabweichung der Grundgesamtheit gegeben?
-> Die Standardabweichung ist in der Aufgabenstellung nicht gegeben. Jedoch ist es
-> Folglich ist der Zweistichproben t -Test anzuwenden (Test 3.3.2).
Anwendungsvoraussetzungen
Die Anwendungsvoraussetzungen sind gegeben.
Wahl der Hypothese
a)
gegen Festlegung des Signifikanzniveaus
Gemäß der Aufgabenstellung ist
. Testfunktionswert
Somit ist
Verwerfungsbereich
Also istTestentscheidung
Weil
kann die Hypothese verworfen werden. Deutung
Es konnte auf der Grundlage des Signifikanzniveaus von 5% nicht widerlegt werden, dass sich die Wurfgewichte der beiden Hamsterrassen erheblich voneinander unterscheiden.
7. Aufgabe
Auf einer Ausstellung werden mehrere Maschinen vorgestellt, die zum Verkauf bereitstehen. Ein Shampoohersteller sieht diesen Anlass als Gelegenheit sich eine neue Abfüllmaschine zuzulegen, da sich diese, gemäß den Angaben, mehr als seine alte Maschine lohnen würde. Dennoch möchte er prüfen, ob die neue Maschine tatsächlich genauer abfüllt. Dabei weiß der Hersteller, dass die alte Maschine um sechs Gramm streut, wenn sie auf das Sollgewicht eingestellt ist. Die neue Maschine soll demnach bei fester Einstellung des Sollgewichts mittels einer einfachen Stichprobe von n = 20 überprüft werden.
Angegeben wird das erhaltene Füllgewicht mit
Aus der Stichprobe gehen folgende Werte einher:
Ein Signifikanzniveau von 2,5 % wird für sinnvoll gehalten. Die Frage stellt sich demnach, ob die Streuung der neuen Maschine geringer ausfällt im Vergleich zur alten Maschine.
Um diese Frage zu beantworten, ist nun der entsprechende Test durchzuführen.
Vertiefung
Lösung:
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Gegeben sind nach Voraussetzung zwei einfache Stichprobe vom Umfang n = 20.
-> Folglich ist Schema b) anzuwenden.
2. Bezieht sich die Hypothese auf eine Verteilung oder einen Parameter?
-> Die Hypothese betrifft den Parameter
-> Der Test 3.2.6 kann unter Vorbehalt in Betracht gezogen werden.
3. Was für eine Verteilung der Grundgesamtheit liegt vor?
-> Es handelt sich um eine normalverteilte Grundgesamtheit.
-> Folglich ist es ganz sicher der Test 3.2.6.
Anwendungsvoraussetzungen
Wie sich herausstellte, sind diese gegeben.Wahl der Hypothese
b)gegen Signifikanzniveau
Testfunktionswert
Weilnicht bekannt ist: Verwerfungsbereich
Anlehnend an die Wahl der Hypothese, wird der Verwerfungsbereich gewählt, somit ist es
Weil
unbekannt ist, handelt es sich beim jeweilige Fraktil der {}-Verteilung um x. Als Ergebnis für das Signifikanzniveau 0,025 ergibt sich:
Demnach ist
Testentscheidung
Weil
wird nicht verworfen. Interpretation:
Auf der Basis des Signifikanzniveaus von 2,5 % konnte nicht kenntlich gemacht werden, dass die Streuung der neuen Maschine kleiner als die der alten Maschine ist.
8. Aufgabe
Diese Aufgabe beschäftigt sich mit der Frage, ob es eine Verbindung zwischen der Einkaufszeit (z) und dem Geschlecht (x) gibt:
Es wird davon ausgegangen, dass bei einer einfachen Zufallsstichprobe von n = 1985 Berufstätige in Wiesbaden die folgenden Werte in der Kontingenztabelle einhergehen:
(x) Geschlecht | (z) Einkaufszeit | ||
männlich | 500 | 422 | 241 |
weiblich | 485 | 223 | 114 |
Gibt es eine Abhängigkeit zwischen X und Z ? Führen Sie den entsprechenden Test durch, um zu einer Entscheidung zu gelangen. Eine Unsicherheit von 2,5 % besteht.
Vertiefung
Lösung:
Wahl des richtigen Tests
1.Wie viele Stichproben sind gegeben?
-> Gegeben sind zwei verbundene Stichproben, da die Einkaufszeit (z) in Minuten und das Geschlecht (x) in Verbindung stehen.
-> Folglich ist Schema c) anzuwenden.
2. Worauf genau bezieht sich der Test?
-> Der Test betrifft die Unabhängigkeit, da die verteilte Grundgesamtheit unbekannt ist.
-> Folglich ist der Test 3.4.4 anzuwenden.
Chi-Quadrat-Unabhängigkeits-Test
Anwendungsvoraussetzungen
Die Anwendungsvoraussetzungen sind gegeben.
Wahl der Hypothese
X, Z sind unabhängig (mit k=2 bzw. r=3 verschiedenen Ausprägungen) X, Z sind abhängig Signifikanzniveau
Testfunktionswert
(x) Geschlecht | (Z) Einkaufszeit in min | Randhäufigkeit | ||
männlich | 500 | 422 | 241 | 1163 |
weiblich | 485 | 223 | 114 | 822 |
Σ 985 | Σ 645 | Σ 355 | Σ 1985 |
Dargestellt wird fortlaufend die Häufigkeiten unter der Annahme der Unabhängigkeit.
männlich | (500) 985*1163/1985=577,1 | (422) 645*1163/1985=377,9 | (241) 355*1163/1985=207,99 | 1163 |
weiblich | (485) 985*822/1985=407,89 | (223) 645*822/1985=267,1 | (114) 355*822/1985=147 | 822 |
Σ 985 | Σ 645 | Σ 355 | Σ 1985 |
, k = 2, r = 3
5. Verwerfungsbereich:
Gegeben sind zwei Eigenschaften und drei Ausprägungen, d.h. k = 2 und r = 3
Auf dieser Grundlage wird das 2,5 % Fraktil der
6. Testentscheidung:
Weil
7. Deutung:
Es wird ersichtlich, dass die Merkmale von Geschlecht und Einkaufszeit bei einem Signifikanzniveau von 2,5 % erheblich voneinander abhängen.
Weitere interessante Inhalte zum Thema
-
Wahl der Hypothese
Vielleicht ist für Sie auch das Thema Wahl der Hypothese (Testtheorie) aus unserem Online-Kurs Stichprobentheorie interessant.
-
Verteilungsfunktion
Vielleicht ist für Sie auch das Thema Verteilungsfunktion (Eindimensionale Verteilungen (ohne Namen)) aus unserem Online-Kurs Wahrscheinlichkeitsrechnung interessant.