Ich muss zugeben, ich bin etwas verwirrt. Ich werde morgen nochmal reinschauen, aber ich würde den -merge- Ansatz noch nicht allzuschnell aufgeben. Vielleicht sollte man die pid anstelle der parid behalten, die dann umbenennen und auf parid -merge-n. In etwa
- Code: Alles auswählen
sa using
keep pid
duplicates drop pid
ren pid parid
mer 1:m parid using using
Wenn ich nicht irre, kannst Du diejenigen, die in _merge eine 1 haben löschen. Bei denen, die eine 2 haben, ersetzt Du die parid mit -2. Ich ag mich irren, das ist ohen realitätsnahe Beispieldaten nicht ganz einach.
Ich weiß nicht, wie ich diesen Absatz
Die anderen Ausprägungen sind so belegt, dass Pesonen, die im ersten Jahr der Teilnahme keinen Partner hatten (-2) immer 2 bei _merge habe (und zwar immer, auch wenn im Laufe der Zeit ein Partner dazu kommt) und bei Personen, die im ersten Befragungsjahr einen Partner haben, steht bei _merge 3 (auch hier immer, auch wenn sie den Partner verlieren).
deuten soll. Stimmen denn die anderen Werte in parid auch nicht? Ich habe mich (Dich offenbar nicht) schon mal gefragt, wieso Du
nur die -2 ersetzen willst. Bist Du denn sicher, dass die anderen Ausprägungen stimmen?
Abgesehen davon musst Du unbeding diese Identifizierungsgeschichte mit pid und svyyear in den Griff bekommen. Ich kann auch absolut nicht nachvollziehen, wieso im master dataset diese beiden Variablen die Beobachtungen nicht eindeutig identifizieren sollen, wenn Du zuvor, beim zweimaligen -merge-n auf genau diese Variablen keine Fehlermeldung bekommst. Irgendetwas stimmt da nicht, und Du solltes rausbekommen, was das ist. Das wird sonst spätestens bei den Anlysn beißen.