ZU DEN KURSEN!

SPSS Statistik-Software - Distanzmaße

Kursangebot | SPSS Statistik-Software | Distanzmaße

SPSS Statistik-Software

Distanzmaße

Die Abstände zwischen den einzelnen Objekten und die Abstände zwischen den Clustern sind berechenbar. Die Abstände zwischen den einzelnen Merkmalen sind definiert als $d(n,m)=d_{nm}$.

Bei ordinalskalierten Merkmalen ergeben sich zahlreiche Probleme, da die Messung von Abständen nicht ohne weiteres möglich ist. Daher muss man sich hierbei auf die ganzzahligen Abstände beschränken, welche berechnet werden können.

Quantitative Merkmale

Zu den wichtigsten Distanzen zählt die Lq-Distanz. Sie ist definiert als
$$d_q(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^q})^{\frac{1}{q}}$$

Eine wichtige Ausprägung ist die sog. euklidische Distanz, welche auch L2-Distanz genannt wird.
$$d_2(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^2})^{\frac{1}{2}}$$

Eng verwandt mit diesen Abständen ist die City-Block-Metrik:
$$d_1(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^1})^{\frac{1}{1}}$$

Umgestellt ergibt das dann:
$$d_q(x_n,x_m)=\sum{\mid x_{ni}-x_{mi}\mid} $$

An folgender Grafik kann man sehr gut erkennen, woher der Begriff „City-Block-Metrik“ kommt.

Distanzen
Distanzen

Sie gibt quasi den Weg an, der zwischen zwei „Blöcken“ liegt. Die euklidische Distanz hingegen berechnet die „Luftlinie“. Daraus wird auch leicht ersichtlich, dass die City-Block Metrik immer größer oder gleich der euklidischen Distanz sein muss.