Clusteranalyse online berechnen
Mithilfe der Clusteranalysen kannst du Ähnlichkeitsstrukturen in deinen Daten entdecken. Du willst eine Clusteranalyse berechnen? Dafür sind nur drei Schritte notwendig:
- Kopiere deine Daten mit denen Du eine Clusteranalyse berechnen willst in die Tabelle.
- Wähle mindestens zwei Variablen aus.
- Definiere die Anzahl der Cluster die du berechnen willst.
Der Algorithmus ordnet jeden Datenpunkt dem Cluster zu, dessen Zentrum (oder "Zentroid") ihm am nächsten ist. Die Zentroide werden nach jeder Zuweisung neu berechnet und der Vorgang wird so lange wiederholt, bis sich die Cluster nicht mehr wesentlich verändern. Dies hilft dabei, Muster oder Strukturen in den Daten zu erkennen.
Cluster können mithilfe verschiedener Gruppierungsverfahren berechnet werden. Diese lassen sich unterteilen in
- graphentheoretisch
- hierarchisch
- partitionierend
- optimierend
k-Means Rechner
Mit DATAtab kannst du online die k-Means Clusteranalyse berechnen. Wenn du dies tun möchten, wähle zwei oder mehrere metrische Variablen aus und definieren wie viele Cluster du berechnen möchtest.
Clusteranalyse Rechner
DU möchten herausfinden, welche Struktur in deinen Daten vorhanden ist? Dann klicke auf den Bereich der Clusteranalyse im Statistik Rechner auf und wähle mindestens zwei metrische Variablen aus. Hier findest du mehr Informationen zur Clusteranalyse.
k-Means online
Für die Online-Berechnung von dem k-means Verfahren führt DATAtab folgende Schritte durch:
- Zunächst wird eine Anfangspartition mit k Clustern (vorgegebene Anzahl an Clustern) erzeugt.
- Daraufhin werden, beginnend mit dem ersten Objekt im ersten Cluster, euklidische Distanzen aller Objekte zu allen Clusterschwerpunkten berechnet.
- Wird dabei ein Objekt entdeckt, dessen Distanz zu dem Schwerpunkt des eigenen Clusters größer ist, als die Distanz zum Schwerpunkt (Zentroid) eines anderen Clusters, kommt es zu einer Verschiebung dieses Objektes in das andere Cluster.
- Schließlich werden die Schwerpunkte der beiden veränderten Cluster erneut errechnet, da sich hier die Zusammensetzungen verändert haben.
- Diese Schritte werden so lange wiederholt, bis sich jedes Objekt in einem Cluster wiederfindet, zu dessen Zentroid (Clustermittelpunkt) es die vergleichsweise kleinste Distanz aufweist (optimale Lösung).