multiple imputation mit multilevel data set
Verfasst: Di 7. Mär 2023, 17:42
Hallo liebe Stata-user,
Ich arbeite mit einem multilevel data set, in dem Individuen in Ländern geclustered sind. Ich möchte gerne missings imputen für Einkommen und zwei Anxiety-Variabeln. So sieht mein Code bisher aus:
Mein Analyse-Model ist ein mixed effects model mit random slope und zwei cross-level Interaktionen. Daher habe ich die 2 Interaktionsterme vor der Imputation als Faktor aus Income rank und Individualism / Power Distance generiert. Income rank ist auch eine passive Variable, da sie sich aus Einkommen ergibt.
Meine Fragen sind die folgenden:
1. Ich habe country im Imputations-Model als Faktor gekennzeichnet, um die Clusterung zu berücksichtigen. Ist dies ausreichend dafür oder müssen noch weitere Schritte unternommen werden? Muss ich auch die anderen level-2 Variablen anders kennzeichnen?
2. Sollen die passiven Variablen (sa; incrank; Interaktionsterme) in das Imputations-Model aufgenommen werden oder erst danach erstellt werden?
Ich wäre Euch für jede Art von Hinweisen und Hilfe sehr dankbar!
Liebe Grüße
Daniel
Ich arbeite mit einem multilevel data set, in dem Individuen in Ländern geclustered sind. Ich möchte gerne missings imputen für Einkommen und zwei Anxiety-Variabeln. So sieht mein Code bisher aus:
- Code: Alles auswählen
egen incrank = xtile(inc), n(100) by(country)
gen incrank_pdi = incrank * pdi // Interaction term
gen incrank_idv = incrank * idv // Interaction term
mi set mlong
mi register imputed inc stanx1 stanx2
mi register passive incrank incrank_pdi incrank_idv
set seed 46352
mi impute chained (pmm, knn(5)) inc stanx1 stanx2 incrank incrank_pdi incrank_idv = idv i.sex age i.educ i.empstat pdi idv gini_disp gdp i.country, add(5) rseed(46352)
mi passive: gen sa = (stanx1 + stanx2) / 2
mi estimate: mixed sa incrank inc educ age sex empstat pdi idv gdp gini_disp incrank_pdi incrank_idv || country: incrank, mle
Mein Analyse-Model ist ein mixed effects model mit random slope und zwei cross-level Interaktionen. Daher habe ich die 2 Interaktionsterme vor der Imputation als Faktor aus Income rank und Individualism / Power Distance generiert. Income rank ist auch eine passive Variable, da sie sich aus Einkommen ergibt.
Meine Fragen sind die folgenden:
1. Ich habe country im Imputations-Model als Faktor gekennzeichnet, um die Clusterung zu berücksichtigen. Ist dies ausreichend dafür oder müssen noch weitere Schritte unternommen werden? Muss ich auch die anderen level-2 Variablen anders kennzeichnen?
2. Sollen die passiven Variablen (sa; incrank; Interaktionsterme) in das Imputations-Model aufgenommen werden oder erst danach erstellt werden?
Ich wäre Euch für jede Art von Hinweisen und Hilfe sehr dankbar!
Liebe Grüße
Daniel