Zu dieser Karteikarte gibt es einen kompletten Satz an Karteikarten. Kostenlos!
103
Wie funktioniert die Bestimmung der Ähnlichkeiten bei metrischen Daten (Clusteranalyse) mittels eines Distanzmaßes?
L-Normen sind verbreitete Distanzmaße
(z.B. Euklidische Distanz (L2-Norm))
– Bildung von Differenzwerten für jede Eigenschaft / Bestimmung der Beziehung zwischen Personen per Distanz (identisch -> Distanz = 0)
– Addition der quadrierten Differenzwerte pro Paar
– Aufsummieren
– Ziehen der Quadratwurzel aus der Summe
– Durch die Quadrierung werden große Differenzwerte stärker berücksichtigt
Rohdatenmatrix wird in Distanzmaßenmatrix überführt.
(z.B. Euklidische Distanz (L2-Norm))
– Bildung von Differenzwerten für jede Eigenschaft / Bestimmung der Beziehung zwischen Personen per Distanz (identisch -> Distanz = 0)
– Addition der quadrierten Differenzwerte pro Paar
– Aufsummieren
– Ziehen der Quadratwurzel aus der Summe
– Durch die Quadrierung werden große Differenzwerte stärker berücksichtigt
Rohdatenmatrix wird in Distanzmaßenmatrix überführt.
Tags: Clusteranalyse, VL08
Quelle:
Quelle: