This flashcard is just one of a free flashcard set. See all flashcards!
103
Wie funktioniert die Bestimmung der Ähnlichkeiten bei metrischen Daten (Clusteranalyse) mittels eines Distanzmaßes?
L-Normen sind verbreitete Distanzmaße
(z.B. Euklidische Distanz (L2-Norm))
– Bildung von Differenzwerten für jede Eigenschaft / Bestimmung der Beziehung zwischen Personen per Distanz (identisch -> Distanz = 0)
– Addition der quadrierten Differenzwerte pro Paar
– Aufsummieren
– Ziehen der Quadratwurzel aus der Summe
– Durch die Quadrierung werden große Differenzwerte stärker berücksichtigt
Rohdatenmatrix wird in Distanzmaßenmatrix überführt.
(z.B. Euklidische Distanz (L2-Norm))
– Bildung von Differenzwerten für jede Eigenschaft / Bestimmung der Beziehung zwischen Personen per Distanz (identisch -> Distanz = 0)
– Addition der quadrierten Differenzwerte pro Paar
– Aufsummieren
– Ziehen der Quadratwurzel aus der Summe
– Durch die Quadrierung werden große Differenzwerte stärker berücksichtigt
Rohdatenmatrix wird in Distanzmaßenmatrix überführt.
Tags: Clusteranalyse, VL08
Source:
Source:
Flashcard info:
Author: P-H-I-L
Main topic: Statistik
Topic: Inferenzstatistik
Published: 13.04.2010