Problem bei Variablenbildung
Verfasst: Mi 4. Jan 2012, 17:55
Hallo
Da mir hier bereits einmal so nett geholfen wurde, wollte ich nochmal um fachlichen Rat bitten.
Ich möchte für ein Projekt die Veränderung in der individuellen Gesundheit beobachten.
Die Gesundheit wird über mehrere Items abgefragt (leider nur im Zweijahresrhytmus), welche anschließend über eine explorative Faktorenanalyse zu zwei Skalen (mentale und körperliche Gesundheit) zusammengefasst werden. Diese Skalen haben einen Range von 0-100 und sind auf einen Mittelwert von 50 sowie eine Standardabweichung von 10 normiert.
Jede Person in meinem Datensatz hat also (für jedes zweite Jahr) einen individuellen Wert für die körperliche (health) und mentale (mental) Gesundheit.
Sagen wir ich möchte die Veränderung in der körperlichen Gesundheit in den Jahren 2000 und 2006 untersuchen, so bilde ich erst zwei Variablen für die Werte der körperlichen Gesundheit in den betreffenden Jahren.
Also so etwas:
health ==> körperliche Gesundheit s.o. (heißt in jedem Jahr gleich, Daten derzeit im langen Format)
gen health00=health if year==2000
gen health06=health if year==2006
Anschließend müsste man nur noch die Differenz der beiden Variablen bilden (gen diffenrence=health06-health00 oder so). Das funktioniert allerdings nicht. Stata generiert nur fehlende Werte. Hat irgendjemand eine Idee, warum so eine einfache Rechenoperation nicht funktioniert? Vielleicht zu einfach?
Kann es was mit dem storage type/format der health-Variablen zu tun haben (double %10.0g)?
Über eine Antwort würde ich mich sehr freuen (und ja, ich weiß, dass das whs. eine sehr primitive Frage war ).
Vielen Dank im Voraus.
Da mir hier bereits einmal so nett geholfen wurde, wollte ich nochmal um fachlichen Rat bitten.
Ich möchte für ein Projekt die Veränderung in der individuellen Gesundheit beobachten.
Die Gesundheit wird über mehrere Items abgefragt (leider nur im Zweijahresrhytmus), welche anschließend über eine explorative Faktorenanalyse zu zwei Skalen (mentale und körperliche Gesundheit) zusammengefasst werden. Diese Skalen haben einen Range von 0-100 und sind auf einen Mittelwert von 50 sowie eine Standardabweichung von 10 normiert.
Jede Person in meinem Datensatz hat also (für jedes zweite Jahr) einen individuellen Wert für die körperliche (health) und mentale (mental) Gesundheit.
Sagen wir ich möchte die Veränderung in der körperlichen Gesundheit in den Jahren 2000 und 2006 untersuchen, so bilde ich erst zwei Variablen für die Werte der körperlichen Gesundheit in den betreffenden Jahren.
Also so etwas:
health ==> körperliche Gesundheit s.o. (heißt in jedem Jahr gleich, Daten derzeit im langen Format)
gen health00=health if year==2000
gen health06=health if year==2006
Anschließend müsste man nur noch die Differenz der beiden Variablen bilden (gen diffenrence=health06-health00 oder so). Das funktioniert allerdings nicht. Stata generiert nur fehlende Werte. Hat irgendjemand eine Idee, warum so eine einfache Rechenoperation nicht funktioniert? Vielleicht zu einfach?
Kann es was mit dem storage type/format der health-Variablen zu tun haben (double %10.0g)?
Über eine Antwort würde ich mich sehr freuen (und ja, ich weiß, dass das whs. eine sehr primitive Frage war ).
Vielen Dank im Voraus.