Kursangebot | Deskriptive Statistik | Arithmetisches Mittel

Deskriptive Statistik

Arithmetisches Mittel

wiwiweb JETZT WEITER LERNEN!

Weitere Lernvideos sowie zahlreiche Materialien erwarten dich:
Komplettpaket für wiwi-Studenten


1676 Lerntexte mit den besten Erklärungen

335 weitere Lernvideos von unseren erfahrenen Dozenten

3840 Übungen zum Trainieren der Inhalte

2129 informative und einprägsame Abbildungen

Als nächstes wollen wir das arithmetische Mittel als Lagemaß besprechen:

Auch wenn es nicht immer zu sinnvollen (aussagekräftigen) Ergebnissen führt (wie das Beispiel $\ {33°C \over 11°C} = 3 $) ist es jedoch grundsätzlich gestattet bei metrischen Skalen alle Grundrechenarten anzuwenden. Obwohl erst bei Verhältnisskalen die Division ohne Probleme anwendbar ist. Darum nutzt man für den Mittelwert bei metrischen Skalen das arithmetische Mittel: $\ \overline x $ mit $$\ \overline x = {1 \over n} (x_1+x_2+...+x_n) $$

Dieses gewöhnliche arithmetisches Mittel wird auch ungewogenes arithmetisches Mittel genannt.

Beispiel

Hier klicken zum Ausklappen

Beispiel 36 - Arithmetisches Mittel:

Das Alter von sechs Menschen sind: 23, 45, 67, 19, 5, 51

Das mittle Alter wäre dann $$\overline x={1 \over n} \sum_{i=1}^n x_i = {1 \over 6} \cdot (23 + 45 + 67 + 19 + 5 + 51) = 35 Jahre $$

Formel arithmetisches Mittel

Es werden zwei verschiedene Formen des arithmetischen Mittels unterschieden, die anders aussehen, es allerdings nicht sind:

Das ungewogene arithmetische Mittel

$\ \overline x= {1 \over n} \sum_{i=1}^n x_i $

Jeder einzelne Beobachtungswert hat das gleiche Gewicht für (jeweils mit $\ {1 \over n} $ gewichtet) das arithmetische Mittel $\ \overline x $ .

Das gewogene arithmetische Mittel

$\ \overline x = \sum_{j=1}^m f(a_j) \cdot a_j= {1 \over n} \cdot \sum_{j=1}^m h(a_j) \cdot a_j $

Diese Formel wird benutzt, wenn einzelne Beobachtungswerte, also einzelne $\ x_i $, mehrfach vorkommen.

Gewogenes arithmetisches Mittel berechnen

Beispiel

Hier klicken zum Ausklappen

Beispiel 37:

Es soll das arithmetische Mittel der folgenden Zahlen ausgerechnet werden:

1, 4, 4, 5, 2, 8, 8, 8, 11, 3

Mit dem ungewogenen arithmetischen Mittel wird jeder Beobachtungswert $x_i$ gleich gewichtet. Es ist $\ x_1 = 1, x_2 = 4, x_3 = 4, ... , x_{10} = 3 $.

Man rechnet also $$\ \overline x= {1 \over n} \sum_{j=1}^n x_i= {1 \over {10}} \sum_{i=1}^{10} x_i= {1 \over {10}}(1 + 4 + 4 + ... + 11 + 3) = 5,4 $$

Beim gewogenen arithmetischen Mittel wird gewichtet. Es wird also nicht mehr mit den Beobachtungswerten $x_i$, die sich häufen können gerechnet, sondern mit den Merkmalsprägungen $a_j$, welche mehrfach vorkommen können, jedoch immer verschieden sind. Hier ist es:
$$\ a_1 = 1, a_2 = 2, a_3 = 3, a_4 = 3, a_5 = 5, a_6 = 8, a_7 = 11$$

j 1 2 3 4 5 6 7
$a_j $12345811
$h(a_j)$1112131
$f(a_j)$$1\over{10}$$1\over{10}$$1\over{10}$$2\over{10}$$1\over{10}$$3\over{10}$$1\over{10}$

Der Wert $\ a_4 = 4 $ tritt zweimal auf, deshalb ist die absolute Häufigkeit $\ h(a_4) = h(4) = 2 $. Die relative Häufigkeit lautet demnach $\ f(a_4)=f(4)= {1 \over n} \cdot h(4) = {1 \over {10}} \cdot 4= {2 \over 10} $.

Gleiche Werte werden also zusammengefasst und so kann das arithmetische Mittel schneller  berechnet werden:

$\ \overline x= {1 \over n} \sum_{j=1}^m h(a_j)\cdot a_j = {1 \over {10}} \cdot (1 \cdot 1 + 1 \cdot 2 + 1 \cdot 3 + 3 \cdot 8 +...+ 1 \cdot 11)= {{54}\over {10}} = 5,4$

bzw.

$\ \overline x= \sum_{j=1}^m f(a_j)\cdot a_j= {1 \over {10}} \cdot 1 + {1 \over {10}} \cdot 2+...+{1 \over {10}} \cdot 11=  5,4 $

Merke

Hier klicken zum Ausklappen

Wichtig zu beachten ist, dass die Menge m der Merkmalsausprägungen $\ a_j $ (in unserem Fall m=7) immer kleiner gleich der Menge n an Beobachtungswerten $\ x_i $ (hier n = 10) zu sein hat.

Das gewogene arithmetische Mittel hat den Vorteil, dass der Rechenaufwand geringer ist, für den Fall, dass alle Beobachtungswerte vorliegen.

 

Eigenschaften des arithmetischen Mittels

Vorsicht

Hier klicken zum Ausklappen

Das arithmetische Mittel ist anfälliger für Ausreißer als es der Median oder der Modus ist.

Das folgende Beispiel soll dieses zeigen:

Beispiel

Hier klicken zum Ausklappen

Beispiel 38:

Für den Jahresabschluss eines Unternehmens sollen folgende Buchungen ins System eingetragen werden: 250€, 350€, 250€, 450€ und 500€. Allerdings wird aus Versehen an die letzte Zahl eine Null zu viel drangehangen (also 5000€ statt 500€).

Wie ändern sich dadurch die jeweiligen Mittelwerte?

Die geordnete Urliste wäre normalerweise 250€, 250€, 350€, 450€, 500€, sie ist jedoch 250€, 250€, 350€, 450€ und 5.000€. Sowohl der Modus als auch der Median bleiben von dem Fehler unberührt, sie lauten weiterhin 250€ bzw. 350€.

Nur das arithmetische Mittel $\ \overline x $ verändert sich von $\ \overline x = 360€ $ auf $\overline x = 1.260€$

Das arithmetische Mittel zeichnet sich aus durch die

  1. Ersatzwerteigenschaft
  2. Nulleigenschaft
  3. Optimalitätseigenschaft

Die Eigenschaften bedeuten im Einzelnen:

Mit Ersatzwerteigenschaft ist gemeint, dass $\ {n \cdot \overline x} = \sum_{i=1}^n x $ gilt, was sich geradewegs aus der Definition des arithmetischen Mittels ergibt. Multipliziert man $\overline x $ mit der Anzahl n der statistischen Masse, ist die gleich der Merkmalssumme $\sum_{i=1}^n x $.
Bezogen auf das Beispiel 36 der Alter, wird diese Gleichheit so bestimmt: $\ {n \cdot \overline x}= {6 \cdot 35} = 210 $ und $\ \sum_{i=1}^n x_i = 23 + 45 + 67 + 19 + 5 + 51 = 210 $.

Die Nulleigenschaft sagt aus, dass $\sum_{i=1}^n (x_i - \overline x) =0$ ist, was durch die Rechnung deutlich wird. $$\sum_{i=1}^n (x_i - \overline x)= \sum_{i=1}^n x_i - \sum_{i=1}^n \overline x = n \cdot {1 \over n} \cdot \sum_{i=1}^n x_i- n \cdot \overline x = {n \cdot \overline x} - {n \cdot \overline x}=0 $$.
Die Summe aller Abweichungen ist also gleich null. Für das Beispiel 36 der Alter heißt dies $\sum_{i=1}^n (x_i- \overline x) $
$\ = (23 – 35) + (45 -35) + (67 -35) + (19 - 35) + (5 – 35) + (51 – 35) = (-12) + 10 + 32 + (-16) + (-30) + 16 = 0$

Die Optimalitätseigenschaft besagt, dass

$\sum_{i=1}^n (x_i-m)^2 $ Min!, wenn $m = \overline x $.

Addiert man also das Quadrat der einzelnen Abweichungen der Beobachtungswerte $\ x_i $ von einem beliebigen Punkt $\ m $, so ist das Ergebnis minimal, wenn das arithmetische Mittel $\ \overline x $ gleich diesem Punkt m ist. Erneut wollen wir es am Alter aus Beispiel 36 deutlich machen:

Nimmt man bspw. $m = 25 $ an, ist die Summe der quadrierten Abweichungen $\sum_{i=}^n (x_i-m)^2 = (23 - 25 )^2+(45 - 25 )^2+...+(52 - 25 )^2 = 3280 $ ,
für $\ m= 40 $ bekommt man wiederum $\ \sum_{i=1}^n (x_i-m)^2= 2830 $,
für $\ m= \overline x = 35 $ ist die Summe der Abweichungsquadrate letztlich $\sum_{i=1}^n (x_i-m)^2 = 2680$, welche unter allen möglichen bzw. gegebenen Ergebnissen minimal ist. Kein anderer Wert für m liefert einen kleineren Wert als die 2680.