This flashcard is just one of a free flashcard set. See all flashcards!
103
Wie funktioniert die Bestimmung der Ähnlichkeiten bei metrischen Daten (Clusteranalyse) mittels eines Distanzmaßes?
L-Normen sind verbreitete Distanzmaße
(z.B. Euklidische Distanz (L2-Norm))
– Bildung von Differenzwerten für jede Eigenschaft / Bestimmung der Beziehung zwischen Personen per Distanz (identisch -> Distanz = 0)
– Addition der quadrierten Differenzwerte pro Paar
– Aufsummieren
– Ziehen der Quadratwurzel aus der Summe
– Durch die Quadrierung werden große Differenzwerte stärker berücksichtigt
Rohdatenmatrix wird in Distanzmaßenmatrix überführt.
![](https://cobocards.s3.amazonaws.com/card/480_300/5/53120543.jpg)
![](https://cobocards.s3.amazonaws.com/card/480_300/5/53120543_2.jpg)
(z.B. Euklidische Distanz (L2-Norm))
– Bildung von Differenzwerten für jede Eigenschaft / Bestimmung der Beziehung zwischen Personen per Distanz (identisch -> Distanz = 0)
– Addition der quadrierten Differenzwerte pro Paar
– Aufsummieren
– Ziehen der Quadratwurzel aus der Summe
– Durch die Quadrierung werden große Differenzwerte stärker berücksichtigt
Rohdatenmatrix wird in Distanzmaßenmatrix überführt.
![](https://cobocards.s3.amazonaws.com/card/480_300/5/53120543.jpg)
![](https://cobocards.s3.amazonaws.com/card/480_300/5/53120543_2.jpg)
Tags: Clusteranalyse, VL08
Source:
Source:
![](/pool/img/avatar_40_40.gif)
Flashcard info:
Author: P-H-I-L
Main topic: Statistik
Topic: Inferenzstatistik
Published: 13.04.2010