ZU DEN KURSEN!

Deskriptive Statistik - Gini-Koeffizient

Kursangebot | Deskriptive Statistik | Gini-Koeffizient

Deskriptive Statistik

Gini-Koeffizient

wiwiweb JETZT WEITER LERNEN!

Weitere Lernvideos sowie zahlreiche Materialien erwarten dich:
Komplettpaket für wiwi-Studenten


1715 Lerntexte mit den besten Erklärungen

399 weitere Lernvideos von unseren erfahrenen Dozenten

3836 Übungen zum Trainieren der Inhalte

2242 informative und einprägsame Abbildungen

Man kann die Konzentration auf der Lorenz-Kurve nicht nur grafisch darstellen, sondern sie auch berechnen. Dafür nutzt man den Gini-Koeffizienten. Füllt man den Raum zwischen der Winkelhalbierenden und der Lorenzkurve so entsteht eine sichtbare Fläche K, die bei wachsender Konzentration auch immer größer wird.

Berechnung des Gini-Koeffizienten

Wir bilden den Quotienten aus der Fläche K und der dreieckigen Fläche der Winkelhalbierenden (oder hier auch als Hauptdiagonale bezeichnet) und der Abszisse. Letztgenannte ist logischerweise $\ {1 \over 2} \cdot 100 \cdot 100 = 5.000$. Der Gini-Koeffizienten G errechnet sich also aus:

$$ G ={\text {Fläche zwischen der Lorenzkurve und der 45°-Linie} \over \text {Fläche unterhalb der 45°-Linie}} $$

Weil sich für die Fläche unterhalb der Hauptdiagonalen $\ {1 \over 2} \cdot 100 \cdot 100 = 5.000$ ergibt, kann man auch sofort rechnen: $\ G ={K \over 5.000} $. 

Zweckmäßigerweise errechnet man K als Differenz aus dem Dreieck unterhalb der Hauptdiagonalen (graue + schraffierte Fläche) und der Summe der Flächen (schraffiert) unterhalb der Lorenzkurve. Die schraffierte Fläche kann man berechnen, indem man die Summe der Dreiecke und Rechtecke bildet, die hier einmal exemplarisch eingezeichnet ist.

Lorenzkurve - Gini-Koeffizienten
Abb.28: Lorenzkurve - Gini-Koeffizienten

Außerdem existieren auch noch einige weitere Formeln zur Bestimmung des Gini-Koeffizienten, welche auch ohne das graphische Verständnis der Fläche unterhalb der Lorenzkurve auskommen:

$$\begin{align} 1. \; \; \; G = & {2 \sum_{i=1}^n i \cdot p_i-(n+1) \over n}
\\ 2. \; \; \; G = & {{2 \sum_{i=1}^n i \cdot x_i - (n+1) \cdot \sum_{i=1}^n x_i} \over {n \cdot \sum_{i=1}^n x_i}}
\\ 3. \; \; \; G = & {{1 \over n^2} \sum_{i=1}^n \sum_{j=1}^n |x_i-x_j| \over {2 \cdot \overline x}}
\\ 4. \; \; \; G = & \sum_{i=1}^n (H_{i-1}+H_i) \cdot c_i-1 \end{align}$$

Besonders die 4. Formel ist für klassierte Daten geeignet, kann aber selbstverständlich auch für nicht klassierte Daten verwendet werden.

Man benennt $\ F(x_j) $ als Anteil auf der Abszisse (also hier: der Spieler) und $\ g(x_j) $ als Anteil auf der Ordinate (hier: des Gehalts).

Folglich ist G zwischen 0 und $\ {n-1 \over n} $ also $\ 0 \leq G \leq {n-1 \over n} $.

Somit gilt für den Fall der völligen Konzentration $\ G={n-1 \over n} $ und $\ G = 0 $ bei Gleichverteilung (keine Konzentration).

Der normierte Gini-Koeffizient

Die fehlende Normierung des Gini-Koeffizienten auf 1 erreicht man durch den normierten Gini-Koeffizienten G*. Er wird berechnet durch:

$\ G^*= {n \over n-1} \cdot G $

Für unser vorheriges Beispiel berechnet man den Gini-Koeffizienten wie folgt:

$\begin{align} G & = {2 \sum_{i=1}^n i \cdot p_i-(n+1) \over n}
\\ & = {{2\cdot (1 \cdot 0,0278 + 2 \cdot 0,0278 +...+ 10 \cdot 0,4167) - (10+1)} \over 10}
\\ & = 0,5611
\end{align}$

oder

$\begin{align} G & = {{2 \sum_{i=1}^n i \cdot x_i - (n+1) \cdot \sum_{i=1}^n x_i} \over {n \cdot \sum_{i=1}^n x_i}}
\\ & = {{2 \cdot (1 \cdot 20.000 + ... + 10 \cdot 300.000 )-(11 \cdot 720.000) } \over {(10 \cdot 720.000)}}
\\ & = 0,5611
\end{align}$

aber auch

$\begin{align} G = &\sum_{i=1}^n (H_{i-1}+H_i) \cdot c_i-1
\\ & = (0 + 0,1) \cdot 0,0278 + (0,1 + 0,2) \cdot 0,0278 + [...] + (0,9 + 1) \cdot 0,4167 -1
\\ & = 3,6 \cdot 0,0278 + 0,0722 + 0,125 + 0,4722 + 0,7917 - 1
\\ & = 0,5611 \end{align}$