Inhaltsverzeichnis
51. Aufgabe
Welche Vorteile ergeben sich dadurch, wenn vorliegende Beobachtungseinheiten, welche sich in wichtigen Eigenschaften ähneln, als eine Schicht zusammengefasst werden?
1. Mit Hilfe dieses Vorgehens sind systematische Fehler gänzlich zu vermeiden.
2. Es dient der Übersichtlichkeit von Gruppen.
3. Die Wahrscheinlichkeit eines zufälligen Fehlers kann minimiert werden.
4. Der Versicherungsfehler wird allumfassend kleiner.
5. Unterschiede der einzelnen Schichten werden überschaubarer.
a) Ganz sicher 1 - 5.
b) Möglich sind nur die Antworten 2 und 3.
c) Möglich sind nur die Antworten 2 - 4.
d) Möglich sind nur die Antworten 2 - 5.
e) Bei genauer Betrachtung 1 - 3.
Zufälliger Fehler: Es kann selbst bei gänzlicher Ausschaltung aller systematischen Fehler und bei mehrmaliger Messung der selben physikalischen Größen, zu geringen unterschiedlichen Messergebnissen kommen. Darin besteht der Begriff des zufälligen Fehlers.
Versuchsfehler: Bestehen aus der Zusammensetzung eines systematischen und zufälligen Fehlers.
Vertiefung
Lösung
Schichten bieten eine bessere Übersicht der einzelnen Gruppen. Die Unterschiede innerhalb der Gruppen sind allerdings auf Grund des Schichtungsprinzips minimal, wodurch eine Einheitlichkeit in der Gruppe entstehen kann. Eine Reduktion des zufälligen Fehlers geht damit gleichermaßen einher. Zu sehen ist damit auch, dass es zu einer Minimierung des Versuchungsfehlers kommt, da sich dieser aus dem systematischen und zufälligen Fehler zusammensetzt. Anhand der genannten Schlussfolgerung wird deutlich, dass die offensichtlichen Unterschiede zwischen den Schichten zu sehen sind. Demnach sind die Antwortmöglichkeit d) 2 - 5 richtig.
52. Aufgabe
Im Rahmen der Untersuchung eines Dorfs, soll nach drei Merkmalen geschichtet werden:
1. Unterteilt nach Geschlecht.
2. Unterteilt nach Alter in drei Bereiche (bis 30, bis 60, bis 90).
3. Nach Vermögen (mittel, gut, sehr gut situiert).
Um wie viele Schichten handelt es sich bei dieser Verfahrensweise?
a) Logisch betrachtet neun.
b) Nach gründlicher Überlegung 17.
c) Es handelt sich um acht.
d) Ganz sicher 18.
Vertiefung
Lösung
Die richtige Antwort lautet d) 18 Schichten.
Zu begründen sei diese Antwort damit: Die Schichtung wird für ein Geschlecht (m) vorgenommen, welche gleichermaßen für das andere gilt. Es resultieren für das männliche Geschlecht neun Schichten, demnach 2 * 9 = 18 Schichten.
53. Aufgabe
Wodurch ist eine zufällige Zuteilung in zwei Gruppen am ehesten möglich?
a) Mit Hilfe eines Würfels oder einer Zufallszahl.
b) Indem die Person selbst entscheiden kann, welcher Gruppe sie zugehörig sein möchte.
c) Durch die Zuteilung einer erfahrenen und qualifizierten Person.
d) Indem eine Person eine Zahl zwischen eins und acht nennt und nachfolgend eine qualifizierte Person gemäß der genannten Zahlen die Gruppen einteilt (beispielsweise alle gerade Zahlen zu Gruppe eins und alle ungeraden Zahlen zu Gruppe zwei).
Vertiefung
Lösung
Richtig ist Antwort a), denn ausschließlich der Würfel sorgt durch das erzeugen einer Zufallszahl für eine zufällige Einteilung in die jeweiligen Gruppen.
Alle anderen Antwortmöglichkeiten unterliegen einem bestimmten System bei der Zuteilung in Gruppen. So basieren Gruppenzuteilungen häufig auf unbewussten oder subjektiven Einflüssen, weswegen die Antworten b) und c) auszuschließen sind.
Statistische Erfahrungswerte zeigten bereits in der Vergangenheit, dass die Zahl 7 zu den beliebtesten Zahlen zählt und aus diesem Grund am häufigsten gewählt wird, wenn eine Zahl zwischen eins und acht zu wählen ist. Demnach kann ebenso Antwort d) ausgeschlossen werden.
54. Aufgabe
Bei einer Versicherung treffen jährlich 25000 Rechnungen ein, wovon 125 zufällig ausgewählt werden. Diese werden im Anschluss von der Versicherung überprüft, welcher Anteil bzw. welcher Betrag davon übernommen wird. Der Versicherung liegen Informationen zu jedem Kunden vor, wie hoch das jährliche Einkommen ist. Auf dieser Grundlage, werden die Einkommensunterschiede in Gruppen gestaffelt.
Aus der Stichprobe resultierten die folgenden Werte:
- $\overline x=80000\text{€}$
- $s=20000\text{€}$
- 25 von den 125 Einkommen verfügen unter 60000 €.
Im zweiten Schritt geht es darum ein 95 %-iges Konfidenzintervall der Grundgesamtheit der 25000 eingereichten Rechnungen zu ermitteln für…
a) Die Höhe des durchschnittlich auftretenden Einkommens.
b) Das gesamte auftretende Einkommen.
c) Den Anteil der Einkommen unter 60000 €, die zu berücksichtigen sind.
d) Die gesamte Anzahl der Einkommen unter 60000€, die zu versteuern sind.
Vertiefung
Lösung
Zu a):
Mit Hilfe des Baumschemas gelangen wir zu Schema 5.
1. Das Konfidenzniveau liegt bei: $1-\alpha =95{\%}<=>\alpha =5{\%}.$
2. Demnach $1-\frac{0,05} 2=0,975.$
3. Die Bestimmung des 0,975-Fraktils z der N(0,1) -Verteilung z liegt vor durch: z= 1,96.
4. Gegeben ist $\overline x=80000\text{€}.$
Es wird $\hat{\sigma }=20000\text{€}$ verwendet, weil die Varianz in der Grundgesamtheit nicht bekannt ist.
5. Die halbe Breite des Konfidenzintervalls wird berechnet, d.h.
$\frac{20000\ast 1,96}{\sqrt{125}}$ =3506,15.
6. Schlussendlich resultiert das Konfidenzintervall für die gegebene Stichprobe zu:
$\mathit{KI}=\left[80000-3506,15;80000+3506,15\right]=[76493,85;83506,15]$
Zu b):
Wir können problemlos feststsellen, dass der Erwartungswert der Grundgesamtheit (N) vorliegt durch: $\mu =\frac{\mathit{Summe}\mathit{aller}\mathit{Einkommen}} N.$
Festzuhalten wäre dies folgendermaßen:
$\mathit{Summe}\mathit{aller}\mathit{Enkommen}=N\frac{\mathit{Summe}\mathit{aller}\mathit{Einkommen}} N=N\mu$
Die Schätzfunktion für $N\mu $ kann direkt für $N\overline X$ gegeben werden.
Eindeutig gilt:
$E(N\overline x)=NE(\overline x)=N\mu \text{ }\text{und}\text{ }\mathit{VAR}(N\overline x)=N^2\mathit{VAR}(\overline x)=N^2\frac{\sigma ^2} n.$
Das arithmetische Mittel ist $\overline x$
Die Schätzfunktion ist nach dem zentralen Grenzwertsatz ansatzweise
$\left(N\ast \mu ;\frac{N\ast s}{\sqrt n}\right)$ - normalverteilt.
Von Interesse ist das Kofidenzintervall für $N\mu $ bei normalverteilter Grundgesamtheit und bekannter Varianz.
Somit sei Schema 1 anzuwenden.
Demnach folgt für das Konfidenzintervall für $N\mu$ zum Konfidenzniveau 95 %
1. $1-\alpha =95{\%}<=>\alpha =5{\%}.$
2. $1-\frac{\alpha } 2=0,975.$
3. Das 0,975-Fraktil z der Standardnormalverteilung ist z = 1,96.
4. Zu bestimmen ist das arithmetische Mittel zu
$N\overline x=25000\ast 80000$ =2000000000.
5. $\frac{\sigma Nz}{\sqrt n}=20000\ast 25000\frac{1,96}{\sqrt{125}}$ =87653864,72.
6. $\mathit{KI}=\left[2000000000-87653864,72;2000000000-87653864,72\right]$
=[1912346135,28;2087653864,72].
Zu c):
Das Schema 6 hilft dabei, das $\gamma $ des zu versteuernden Einkommens unter 60000 € in der Grundgesamtheit zu bestimmen.
1. $1-\alpha =95{\%}.$
2. $1-\frac{5{\%}} 2=0,975.$
3. $\overline x=\frac{25}{125}=0,2$ nach Voraussetzung.
4. Das 0,975-Fraktil der Standardardnormalverteilung liegt vor durch z= 1,96.
Demnach gilt: $n\overline x=125\ast 80000\geqslant 5\text{ }\text{und}\text{ }125\ast 80000\leqslant 80000-5=79995.$
5. $\hat{\sigma }=\sqrt{0,2(1-0,2)}=0,4.$
6. $\frac{\hat{\sigma }z}{\sqrt n}=\frac{0,4\ast 1,96}{\sqrt{125}}$ =0,07.
7. Wir bekommen für das Konfidenzintervall der gegebenen Stichprobe:
KI=[0,2-0,07;0,2+0,07] =[0,13;0,27].
Für die berücksichtigten Einkommen unter 60000 € liegt der Anteil zwischen 13 % und 27 % vor.
Zu d):
Die Zahl beträgt insgesamt $N\gamma $ für die zu versteuernden Einkommen unter 60000€ .
Mittels der Funktion $N\overline X$ kann dieser Wert geschätzt werden. Gemäß des zentralen Grenzwertsatzes ist diese Funktion approximativ $N\left(N\overline X;N\sqrt{\frac{\overline X(1-\overline X)} n}\right).$
Bei einem 5%-igen Signifikanzniveau ergibt sich das Konfidenzintervall für $N\gamma :$
$\mathit{KI}=[N\ast \overline x-z\ast N\sqrt{\frac{\overline x(1-\overline x)} n};N\ast \overline x+z\ast N\sqrt{\frac{\overline x(1-\overline x)} n}]$
$\mathit{KI}=[25000\ast 0,2-1,96\ast 25000\ast 0,07;25000\ast 0,2+1,96\ast 25000\ast 0,07]$
= [1570;8430].
Die Gesamtzahl befindet sich zwischen 1570 und 8430 für die zu versteuernden Einkommen unter 60000 €.
55. Aufgabe
Im Rahmen einer Umfrage, wurden 300 zufällig gewählte Personen darüber befragt, welche Zeitschriften sie über welches bevorzugte Themengebiet lesen. Daraus resultierten die folgenden Werte:
Frauen:
Politik | 20 |
Journale | 100 |
Kultur | 30 |
Freizeit | 10 |
Sport | 25 |
Männer:
Politik | 40 |
Journale | 5 |
Kultur | 10 |
Freizeit | 20 |
Sport | 40 |
Welches Testverfahren ist auszuwählen, wenn aufgezeigt werden soll, dass sich die Interessen von Frauen und Männern zueinander unterscheiden?
Das gewählte Testverfahren soll daraufhin angewendet werden. Vorgegeben wird eine 5%-iges Signifikanzniveau.
Vertiefung
Lösung
Zu empfehlen sei selbstverständlich der Chi-quadrat-Unabhängigkeitstest.
Zugunsten einer besseren Übersicht, werden die einzelnen Werte in einer Tabelle wie folgt angeordnet:
Interesse | Frauen | Männer |
Politik | 20 | 40 |
Journale | 100 | 5 |
Kultur | 30 | 10 |
Freizeit | 10 | 20 |
Sport | 25 | 40 |
Wahl des richtigen Tests
1. Wie viele Stichproben sind gegeben?
-> Es sind nach Voraussetzung zwei verbundene Stichproben gegeben.
Die Interessensgebiete hängen maßgeblich vom Geschlecht ab.
-> Folglich ist Schema c) anzuwenden.
2. Bezieht sich die Hypothese auf einen Parametervergleich von Verteilungen oder auf die Abhängigkeit der beiden Merkmale X und Y?
-> Die Hypothese betrifft die Abhängigkeit der beiden Merkmale X und Y.
-> Folglich können die Tests 3.4.4 und 3.4.5 in Erwägung gezogen werden.
3. Was genau ist zu testen?
-> Getestet werden soll die Unabhängigkeit von X und Y.
-> Folglich ist der Test 3.4.4 anzuwenden.
1. Anwendungsvoraussetzungen
Diese sind gegeben, da es sich bei beiden um beliebig verteilte Grundgesamtheiten handelt.
2. Wahl der Hypothese
$H_0:$ Es liegt eine Unabhängigkeit der beiden Merkmale von Geschlecht X und Interesse Y der Grundgesamtheit vor.
$H_1:$ Es liegt eine Abhängigkeit beider Merkmale vor.
3. Signifikanzniveau
$\alpha =5{\%}.$
4. Kontingenztabelle
Die zugehörige Kontingenztabelle lautet:
Für die Prüfgröße v erhalten wir somit:
$\begin{gathered}v=\frac{(20-37)^2}{37}+\frac{(100-64,75)^2}{64,75}+\frac{(30-24,67)^2}{24,67}+\frac{(10-18,5)^2}{18,5}+\frac{(25-40,1)^2}{40,1}\\\text{ }\text +\frac{(40-23)^2}{23}+\frac{(5-40,25)^2}{40,25}+\frac{(10-15,33)^2}{15,33}+\frac{(20-11,5)^2}{11,5}+\frac{(40-24,91)^2}{24,91} \end{gathered}$
= 98,46
5. Verwerfungsbereich
Gegeben sind zwei Merkmale, männlich und weiblich.
Es handelt sich um fünf Ausprägungen, bei denen die Interessen von Politik bis Sport gehen.
Demnach: k = 5 und l = 2.
$B=\text (x_{1-\alpha };\infty \text ).$
Es ist x das Fraktil der $\chi _{0,95}^2((5-1)(2-1))=\chi ^2(4)$ -Verteilung.
Demnach $B=\text (9,49;\infty \text ).$
6. Testentscheidung
Auf Grund von $98,46=v\in \mathit{B.}$ wird $H_0$ verworfen.
7. Deutung:
Auf der Grundlage eines 5%-igen Signifikanzniveaus konnte nicht verdeutlicht werden, dass die beiden Merkmale Geschlecht X und Interesse Y der Grundgesamtheit unabhängig sind. Demnach wird schlussgefolgert, dass Geschlecht X und Interesse Y abhängig zueinander sind.
Weitere interessante Inhalte zum Thema
-
Zentraler Grenzwertsatz
Vielleicht ist für Sie auch das Thema Zentraler Grenzwertsatz (Gesetz der großen Zahlen) aus unserem Online-Kurs Wahrscheinlichkeitsrechnung interessant.