Seite 1 von 1

Cluster Analyse - Definiere Cluster Seed Points

BeitragVerfasst: Mo 23. Nov 2015, 14:55
von Alloesch
Hallo liebes Stata Forum,

Ich mache eine zwei-Stufige Cluster Analyse
(für diejenigen die es interessiert warum, vgl: Multivariate Data Analysis, 7th edition, Hair et al; p. 546 ff):
1. Hierarchische Cluster Analyse um die Gruppenanzahl zu definieren
2. Nonhierarchische Cluster Analyse um die endgültigen Cluster zu bestimmen

Bei der Nonhierarchischen Cluster Analyse möchte ich als cluster seeds die "Cluster-Mittelwerte" (cluster centroids) der Hierarchischen Cluster Analyse verwenden.
Ich weiß zwar, dass das über die seed Option funktionieren müsste, verstehe aber nicht, wie ich dort meine cluster centroids eintragen kann.


Hier ein Beispiel:
Angenommen ich möchte Firmen einer bestimmten Branche anhand von zwei Variablen clustern:
- X (Größe, gemessen in total assets) und
- Y (R&D Ausgaben)

Meine Hierarchische Cluster Analyse ergibt 3 Cluster mit folgenden "Cluster-Mittelwerten" (Cluster Centroids):
- Cluster 1: Centroid: X = 10 ; Y = 100
- Cluster 2: Centroid: X = 100 ; Y = 10
- Cluster 3: Centroid: X = 50 ; Y = 50

Das bedeutet doch, dass ich in der Nonhierarchischen Cluster Analyse drei seeds angeben muss (diese seeds entsprechen einem n-Vektor, mit n = Anzahl der Cluster variablen (hier: n=2)). Wie mache ich das?

Ich wäre über jede Hilfe dankbar