Inhaltsverzeichnis
Kennzahlen | Fälle zusammenfassen | Deskriptive Statistiken | Häufigkeiten | Explorative Datenanalyse |
Mittelwert | X | X | X | X |
Summe | X | X | X |
|
Median | X |
| X | X |
Gruppierter Median | X |
| X |
|
Quartile |
|
| X |
|
Perzentile |
|
| X | X |
Modus |
|
| X |
|
Standardabweichung | X | X | X | X |
Varianz | X | X | X | X |
Standardfehler | X | X | X | X |
Minimum | X | X | X | X |
Maximum | X | X | X | X |
Spannweite | X | X | X | X |
Quartilsabstand |
|
|
| X |
Kurtosis | X | X | X | X |
Standardfehler der Kurtosis | X | X | X | X |
Schiefe | X | X | X | X |
Standardfehler der Schiefe | X | X | X | X |
Konfidenzintervall |
|
|
| X |
Harmonisches Mittel | X |
|
|
|
Geometrisches Mittel | X |
|
|
|
M-Schätzer |
|
|
| X |
Ausreißer |
|
|
| X |
Gestutzter Mittelwert |
|
|
| X |
(Die rot und dick markierten Kennzahlen schauen wir uns in diesem Kapitel an)
Die Funktion „Fallzusammenfassung“ ist eine weitere Möglichkeit von SPSS, sich Kennziffern anzeigen zu lassen. Hierbei gibt es die zusätzliche Option, sich die Fälle im Ausgabenviewer mit ausgeben zu lassen. Das kann vorteilhaft sein, wenn man diese Ergebnisse inklusive der Fälle exportieren möchte. Folgendermaßen würde das dann aussehen:
Es ist möglich, die Variablen zu gruppieren und z.B. nach männlich und weiblich zu differenzieren. Was genau das ist, lernen wir in einem späteren Kapitel. Behalten Sie nur im Hinterkopf, dass es durchaus auch möglich ist, über diese Funktion eine Gruppierung vorzunehmen.
Nachdem die zu analysierenden Variablen ausgewählt wurden, sollte man noch die Statistiken wählen:
Hier ist eine Vielzahl von statistischen Kennzahlen berechenbar, wir wollen uns aber nur jene anschauen, die für uns „neu“ sind.
Harmonisches Mittel
Bestehen die Merkmalswerte aus Brüchen, verwendet man das harmonische Mittel, wenn der Zähler oder der Nenner nicht gegeben sind.
Beispiel 1
Der Student D fährt mit seinem neuen Auto eines namhaften süddeutschen Autobauers die folgenden Strecken mit den gegebenen Geschwindigkeiten:
Strecke | 1 | 2 | 3 | 4 |
Distanz | 100 km | 140 km | 50 km | 150 km |
Geschwindigkeit | 50 km/h | 100 km/h | 80 km/h | 150 km/h |
Wie lange hat er insgesamt gebraucht? Mit welcher Durchschnittsgeschwindigkeit ist er insgesamt gefahren?
Der Begriff Geschwindigkeit ist definiert als Weg s pro Zeit t, d.h. in Buchstaben $\ v = {s \over t} $ . Man errechnet, dass der Student D folgende Zeiten auf den einzelnen Strecken benötigt hat:
Strecke | 1 | 2 | 3 | 4 |
Zeit | 2 h | 1,4 h | 0,625 h | 1 h |
So ist er z.B. auf Strecke 2 die Distanz von 140 km mit 100 km/h gefahren, hat also
$\ {140km \over 100km/h} = 1,4kmh/km = 1,4h $
benötigt. Insgesamt war er also 5,025 h unterwegs. Bezogen auf eine Distanz von 440 km bedeutet dies, dass er eine Durchschnittsgeschwindigkeit von $\ {440km \over 5,025h} =87,55622 $ km/h hatte.
Beispiel 2
Besagter Student gibt nun lediglich an, wie lange er für die einzelnen Strecken brauchte und mit welcher Geschwindigkeit er fuhr, nicht aber, wie lange die Distanz war:
Strecke | 5 | 6 | 7 | 8 |
Zeit | 1,5 h | 2 h | 1 h | 0,6 h |
Geschwindigkeit | 120 km/h | 100 km/h | 80 km/h | 110 km/h |
Welche Strecke ist er insgesamt gefahren? Mit welcher Durchschnittsgeschwindigkeit fuhr er?
Wir berechnen zunächst die Distanzen der einzelnen Strecken, so ist z.B. der Weg 8 insgesamt $\ {110 km/h \cdot 0,6h} = 66 $ km lang.
Strecke | 5 | 6 | 7 | 8 |
Distanz | 180 km | 200 km | 80 km | 66 km |
Insgesamt fuhr der Student also 526 km in einer Zeit von 5,1 Stunden. Das ergibt eine Durchschnittsgeschwindigkeit von $\ \overline v = {526 \over 5,1} = 103,137 $ km/h.
Formel harmonisches Mittel
Wenn man also das Mittel aus Brüchen $\ {a_i \over b_i} $ ausrechnen möchte, ist die direkte Methode, den gesamten Zähler und den gesamten Nenner zu berechnen, durch die Formel „Mittelwert bei direkter Methode“
$$\ \overline v ={\sum_{i=1}^n a_i \over \sum_{i=1}^n b_i} $$
gegeben. Genau dies haben wir gemacht. Im ersten Beispiel waren die Nenner $\ b_i $, also die Zeiten, nicht gegeben, im zweiten Beispiel waren die Zähler $\ a_i $ unbekannt, nämlich die Distanzen. Beide wurden zunächst berechnet, um dann den Mittelwert zu berechnen. Es gibt aber auch eine indirekte Methode, mit der nicht zunächst Zähler oder Nenner ausgerechnet werden müssen. Diese Methode nennen wir harmonisches Mittel $\ \overline x _h $.
Expertentipp
Mittelwerte bei Brüchen:
Gegeben seien die Beziehungszahlen $\ x_i ={a_i \over b_i} $.
Wir berechnen das Mittel aus diesen Werten
- wenn die einzelnen Nenner $\ b_i $ unbekannt sind durch: $$\ \overline x_h= { \sum_{i=1}^n a_i \over \sum_{i=1}^n {a_i \over x_i}} $$
- wenn die einzelnen Zähler $\ a_i $ unbekannt sind durch: $$\ \overline x_h={\sum_{i=1}^n x_i \cdot b_i \over \sum_{i=1}^n b_i} $$
Angewendet auf die o.e. Beispiele errechnet man für das Beispiel 1:
$$\ \begin{align} \overline x_h & ={(100km+140km+50km+150km) \over {100km \over 50 km/h} + {140km \over 100 km/h} + {50km \over 80 km/h}+ {150km \over 150 km/h}} \\ & = {440km \over (2h+1,4h+0,625h+1h)} \\ & = {440km \over 5,025h} \\ & = 87,562 km/h \end{align} $$ und für das Beispiel 41:
$$\ \begin{align} \overline x_h & ={{120km/h \cdot 1,5h} + {100km/h \cdot 2h}+{80km/h \cdot 1h}+{110km/h \cdot 0,6h} \over (1,5h+2h+1h+0,6h)} \\ & = {180km+200km+80km+66km) \over 5,1h} \\ & ={526km \over 5,1h} =103,137 km/h \end{align} $$ Durch das ausführliche Aufschreiben sieht man, dass die indirekte Methode, also das Rechnen mit dem harmonischen Mittel, in Wahrheit nichts anderes ist als die direkte, nämlich das Ausrechnen entweder des Zählers oder des Nenners.
Oftmals schreibt man die Formel für das harmonische Mittel folgendermaßen: $$\ \overline x_H= {n \over \sum_{i=1}^k {m_i \over x_i}} $$ bzw. $$\ \overline x_H= {1 \over \sum_{i=1}^k {h_i \over x_i}} $$ Hierbei sind die xi die o.g. Beziehungszahlen, also z.B. die Geschwindigkeitsangaben. Die linke Formel entspricht exakt Methode 1, nämlich das Ausrechnen eines Mittelwertes bei bekanntem Zähler ai, aber unbekanntem Nenner $\ N_i $ . Wenn man hierbei durch n kürzt, erhält man den rechten Ausdruck. Der Parameter $\ h_i $ ist also $\ h_i = {n_i \over n} $ und gibt den jeweiligen Anteil an.
Im Beispiel 1 ist z.B. $\ n = n_1 + n_2 + n_3 + n_4 = 100 + 140 + 50 + 150 = 440 $ [km] und es gilt $\ h_1 = {100 \over 440}= 0,2273,\ h_2 = {140 \over 440}= 0,3182,\ h_3 = 0,1136,\ h_4=0,3409 $. Damit errechnet man das harmonische Mittel als $$\ \overline x_H= {1 \over \sum_{i=1}^k {h_i \over x_i}}= {1 \over {0,2273 \over 50}{0,3182 \over 100}{0,1136 \over 80}{0,3404 \over 150}}={1 \over 0,0114} =87,56km/h $$
also genau das gleiche Ergebnis wie oben.
Mittelwerte und Skalenniveau
Merke
Skala | Lageparameter |
Nominalskala | Modus |
Ordinalskala | Median |
Intervallskala | arithmetisches Mittel |
Verhältnisskala | geometrisches Mittel |
Geometrisches Mittel
Wenn Merkmalswerte aus Wachstums- oder Aufzinsungsfaktoren bestehen, die über unterschiedliche Perioden hinweg betrachtet werden, sollte man das geometrische Mittel verwenden.
Zwei Wege gibt es dieses zu berechnen.
Direkter Weg: Man erhält die mittlere Wachstumsrate auf direktem Wege durch die Formel $$\ \overline x_g ( \sqrt [n]{K_n \over K_0} -1 ) \cdot 100 $$
Den indirekten Weg entnehmen Sie bitte unseren weiteren Statistikkursen.
Output
Im Ausgabeviewer gibt SPSS an die beiden folgenden Tabellen aus:
Zusammenfassung der Fallverarbeitung | ||||||
| Fälle | |||||
Eingeschlossen | Ausgeschlossen | Gesamtsumme | ||||
H | Prozent | H | Prozent | H | Prozent | |
6400 | 100,0% | 0 | 0,0% | 6400 | 100,0% | |
... | ... | ... | ... | ... | ... | ... |
Internetanschluss | 6145 | 96,0% | 255 | 4,0% | 6400 | 100,0% |
... | ... | ... | ... | ... | ... | ... |
Geschlecht | 6400 | 100,0% | 0 | 0,0% | 6400 | 100,0% |
(Die Tabelle wurde gekürzt, um den Kurs besser zu gestalten)
In dieser Tabelle zeigt SPSS, welche Werte bei der Analyse ein- bzw. ausgeschlossen wurden. In der markierten Zeile hat SPSS die Fälle ausgeschlossen.
Zusammenfassung von Fällen | |||
| H | Geometrisches Mittel | Harmonisches Mittel |
Alter in Jahren | 6400 | 40,23 | 38,37 |
Verheiratet | 6400 | ,00 | .a |
Jahre unter der aktuellen Adresse | 6400 | ,00 | .a |
Haushaltseinkommen in Tausend | 6400 | 49,1248 | 37,9211 |
Einkommensklassen in Tausend | 6400 | 2,2774 | 2,0184 |
Preis des hauptsächlich genutzten Autos | 6400 | 23,6062 | 18,7560 |
Preisklassen des hauptsächlich genutzten Autos | 6400 | 1,8936 | 1,7113 |
Schulabschluss | 6400 | 2,29 | 1,99 |
Jahre beim aktuellen Arbeitgeber | 6400 | ,00 | .a |
Verrentung | 6400 | ,00 | .a |
Jahre beim aktuellen Arbeitgeber in Klassen | 6400 | 1,77 | 1,60 |
Zufriedenheit mit der Arbeit | 6400 | 2,69 | 2,28 |
Haushaltsgröße | 6400 | 1,95 | 1,65 |
Schnurloses Telefon | 6400 | ,00 | .a |
ISDN-Anschluss | 6400 | ,00 | .a |
Anrufbeantworter | 6400 | ,00 | .a |
Funkrufempfangsservice | 6400 | ,00 | .a |
Internetanschluss | 6145 | ,00 | .a |
Anruferidentität bekannt | 6400 | ,00 | .a |
Warteschleife | 6400 | ,00 | .a |
Fernseher im Haushalt vorhanden | 6400 | ,00 | .a |
Videorecorder im Haushalt vorhanden | 6400 | ,00 | .a |
Stereoanlage im Haushalt vorhanden | 6400 | ,00 | .a |
Palm Pilot im Haushalt vorhanden | 6400 | ,00 | .a |
Computer im Haushalt vorhanden | 6400 | ,00 | .a |
Faxgerät im Haushalt vorhanden | 6400 | ,00 | .a |
Zeitungsabonnement | 6400 | ,00 | .a |
Antwort | 6400 | ,00 | .a |
Geschlecht | 6400 |
|
|
a. Die Daten enthalten negative und positive Werte und möglicherweise Nullwerte. |
Als Fallzusammenfassung gibt SPSS dann die obige Tabelle aus. Hierbei haben wir allerdings eine Änderung vorgenommen und die Tabelle gedreht.
Zum besseren Verständnis hier nochmal die Definitionen von IBM:
Merke
„Geometrisches Mittel. Die n-te Wurzel aus dem Produkt der Datenwerte, wobei n der Anzahl der Fälle entspricht.“
„Harmonisches Mittel. Wird verwendet, um die durchschnittliche Gruppengröße zu bestimmen, wenn der Stichprobenumfang in den einzelnen Gruppen unterschiedlich ist. Das harmonische Mittel ist gleich der Gesamtzahl der Stichproben geteilt durch die Summe der reziproken Werte der Stichprobengrößen.“
Wieder ist hier anzumerken, dass SPSS nahezu alles für einen rechnet. Man muss IMMER und bei ALLEM was man macht hinterfragen, wie richtig und sinnig diese Operationen bzw. Rechnungen sind!
Weitere interessante Inhalte zum Thema
-
Harmonisches Mittel
Vielleicht ist für Sie auch das Thema Harmonisches Mittel (Verteilungsmaße) aus unserem Online-Kurs Deskriptive Statistik interessant.
-
Geometrisches Mittel
Vielleicht ist für Sie auch das Thema Geometrisches Mittel (Verteilungsmaße) aus unserem Online-Kurs Deskriptive Statistik interessant.