Seite 1 von 1

Clusteranalyse kmeans Studie replizieren

BeitragVerfasst: Sa 1. Sep 2018, 20:57
von NicoleBue
Hallo zusammen

Im Rahmen meiner Bachelorarbeit muss ich eine Clusteranalyse durchführen. Ich habe in meiner Umfrage zu Umweltbewusstsein einen Frageblock von Klages (Wertesynthese) in meine Untersuchung aufgenommen (als unabhängige Variable) und musste die 21 Fragen betreffend Werten (4er-Likert-Skala) via Faktoranalyse in drei Faktoren/Dimensionen unterteilen (das hat geklappt) und muss nun mittels einer Clusteranalyse der drei Dimensionen die 109 Teilnehmer den fünf Typen (Konventionalist, Idealist, Hedo-Materialist, Resignierter und Realist) zuordnen. Ich habe die drei Dimensionen vorab z-standardisiert und dann eine kmeans clusteranalyse durchgeführt (k=5). Theoretisch sollte ich damit auf dasselbe Resultat kommen Klages (1992):

Gruppe 1: Konventionalist = Konventionalismus (positiver mean) , Idealismus (negativer mean) , Hedo-Materialismus (negativer mean)
Gruppe 2: Idealist = Konventionalismus (-) , Idealismus (+) , Hedo-Materialismus (-)
Gruppe 3: HedoMat = Konventionalismus (-) , Idealismus (-) , Hedo-Materialismus (+)
Gruppe 4: Realist = überall (+)
Gruppe 5: Resignierter = überall (-)

Mittels Clusteranalyse erhalte ich zwar drei der fünf Gruppen so wie er (Idealist, Realist und Resignierter), jedoch sind die anderen zwei Gruppen nicht zu zu ordnen. Das heisst ich habe zwei Gruppen, die auf zwei Faktoren/Dimensionen einen positiven Wert haben.

Also liess ich mir eine "graph matrix" der clusteranalyse erstellen und stellte fest, dass sich die Gruppen jeweils auf einer "Wolke" befanden und von Auge nicht disjunkt zu unterscheiden sind. (?) --> Daten der einzelnen 21 Fragen sind sehr ähnlich und oft stark links- oder rechtsschief, kann das der Grund sein?

Ich vermute, dass dieses Resultat etwas damit zu tun hat, dass ich nicht wie Klages die Ausgangszentren der Clusterzuteilungen angeben konnte. Ich weiss nicht wie das mit stata funktionieren soll (er verwendete SPSS). Er hat extrem hohe und extrem niedrige Werte (also +2/-2) als Ausgangszentren festgelegt (z.B. Idealist = +2 bei Idealismus, -2 bei Hedo-Materialismus und -2 bei Konventionalismus).

Erstens mal vielen Dank fürs durchlesen :) ich mache dies zum allerersten Mal und stecke seit Stunden fest.

Meine Fragen sind nun:

Wie hat das Klages mit diesen Ausgangszentren gemacht und wie kann man das im Stata pro Clustergruppe so angeben?
Ist kmeans überhaupt dazu geeignet?
Habe ich sonst etwas nicht durchgeführt oder nicht beachtet, das beachtet hätte werden sollen?

Bin froh um jeden Hinweis und vielen lieben Dank!

Nicole

Re: Clusteranalyse kmeans Studie replizieren

BeitragVerfasst: Mo 3. Sep 2018, 08:19
von Staxa
Grundsätzlich ist es bei einer Replikation nicht verkehrt, die Originalautoren zu kontaktieren. Oft können diese dann do-files bereitstellen. Wenn im Original SPSS verwendet wurde hilft das trotzdem, da man sicher den analogen Befehl zu SPSS in Stata finden kann. Auch könnte es sein, dass aufgrund der langen Zeitdauer (immerhin 25 Jahre) inzwischen die einmal theoretisch fundierten Idealgruppen schlichtweg nicht mehr zutreffen, da sich bestimmte Faktoren sicherlich verändert haben. Ansonsten würde ich dir das Helpfile empfehlen.
https://www.stata.com/manuals13/mvclust ... edians.pdf
Dort dann die Option "start". Siehe auch hier:
https://www.stata.com/statalist/archive ... 00798.html