Die Abstände zwischen den einzelnen Objekten und die Abstände zwischen den Clustern sind berechenbar. Die Abstände zwischen den einzelnen Merkmalen sind definiert als $d(n,m)=d_{nm}$.
Bei ordinalskalierten Merkmalen ergeben sich zahlreiche Probleme, da die Messung von Abständen nicht ohne weiteres möglich ist. Daher muss man sich hierbei auf die ganzzahligen Abstände beschränken, welche berechnet werden können.
Quantitative Merkmale
Zu den wichtigsten Distanzen zählt die Lq-Distanz. Sie ist definiert als
$$d_q(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^q})^{\frac{1}{q}}$$
Eine wichtige Ausprägung ist die sog. euklidische Distanz, welche auch L2-Distanz genannt wird.
$$d_2(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^2})^{\frac{1}{2}}$$
Eng verwandt mit diesen Abständen ist die City-Block-Metrik:
$$d_1(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^1})^{\frac{1}{1}}$$
Umgestellt ergibt das dann:
$$d_q(x_n,x_m)=\sum{\mid x_{ni}-x_{mi}\mid} $$
An folgender Grafik kann man sehr gut erkennen, woher der Begriff „City-Block-Metrik“ kommt.
Sie gibt quasi den Weg an, der zwischen zwei „Blöcken“ liegt. Die euklidische Distanz hingegen berechnet die „Luftlinie“. Daraus wird auch leicht ersichtlich, dass die City-Block Metrik immer größer oder gleich der euklidischen Distanz sein muss.
Weitere Interessante Inhalte zum Thema
-
Durchführung in SPSS
Vielleicht ist für Sie auch das Thema Durchführung in SPSS (Korrelationsanalyse) aus unserem Online-Kurs SPSS Software interessant.
-
Metrische Skalen
Vielleicht ist für Sie auch das Thema Metrische Skalen (Grundbegriffe der deskriptiven Statistik) aus unserem Online-Kurs Deskriptive Statistik interessant.
-
Flow-Shop-Probleme
Vielleicht ist für Sie auch das Thema Flow-Shop-Probleme (Termin- und Kapazitätsplanung) aus unserem Online-Kurs Produktion interessant.