Cluster Analyse - Definiere Cluster Seed Points

Faktorenanalyse, Clusteranalyse, Diskriminanzanalyse und weitere multivariate Verfahren mit Stata.

Cluster Analyse - Definiere Cluster Seed Points

Beitragvon Alloesch » Mo 23. Nov 2015, 14:55

Hallo liebes Stata Forum,

Ich mache eine zwei-Stufige Cluster Analyse
(für diejenigen die es interessiert warum, vgl: Multivariate Data Analysis, 7th edition, Hair et al; p. 546 ff):
1. Hierarchische Cluster Analyse um die Gruppenanzahl zu definieren
2. Nonhierarchische Cluster Analyse um die endgültigen Cluster zu bestimmen

Bei der Nonhierarchischen Cluster Analyse möchte ich als cluster seeds die "Cluster-Mittelwerte" (cluster centroids) der Hierarchischen Cluster Analyse verwenden.
Ich weiß zwar, dass das über die seed Option funktionieren müsste, verstehe aber nicht, wie ich dort meine cluster centroids eintragen kann.


Hier ein Beispiel:
Angenommen ich möchte Firmen einer bestimmten Branche anhand von zwei Variablen clustern:
- X (Größe, gemessen in total assets) und
- Y (R&D Ausgaben)

Meine Hierarchische Cluster Analyse ergibt 3 Cluster mit folgenden "Cluster-Mittelwerten" (Cluster Centroids):
- Cluster 1: Centroid: X = 10 ; Y = 100
- Cluster 2: Centroid: X = 100 ; Y = 10
- Cluster 3: Centroid: X = 50 ; Y = 50

Das bedeutet doch, dass ich in der Nonhierarchischen Cluster Analyse drei seeds angeben muss (diese seeds entsprechen einem n-Vektor, mit n = Anzahl der Cluster variablen (hier: n=2)). Wie mache ich das?

Ich wäre über jede Hilfe dankbar
Alloesch
 
Beiträge: 1
Registriert: Mo 23. Nov 2015, 14:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Zurück zu Multivariate Verfahren

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast