Seite 1 von 1

Paneldaten

BeitragVerfasst: So 10. Jan 2021, 11:32
von HansPeet
Hallo,
ich benutze aktuell Paneldaten über den Zeitraum von 2007- 2017. Nun möchte ich alle Personen ausschließen die in diesem Zeitraum nur einmal an der Befragung teilgenommen haben. Dafür fehlt mir jedoch der nötige Stata Befehl. Durch die Variable pid kann ich jeder Person eindeutig identifizieren, das wäre mein erster Ansatzpunkt aktuell, dass man damit irgendwie arbeiten kann.

Wäre für mögliche Ideen oder Lösungsvorschläge sehr dankbar!

Re: Paneldaten

BeitragVerfasst: So 10. Jan 2021, 11:40
von Staxa
Für nachfolgende Ausführungen nehme ich an, dass deine Daten im long Format vorliegen, also jedes Jahr in den Daten eine Zeile hat und eine Person somit mehrere Zeilen einnehmen kann. Wir zählen nun durch, wie viele Zeilen jede Person hat:


Code: Alles auswählen
bysort pid: gen counter = _n
bysort pid: egen teilnahmen = max(counter)
list pid counter teilnahmen in 1/70, sepby(pid)   //Kontrolle
keep if teilnahmen > 1

Re: Paneldaten

BeitragVerfasst: So 10. Jan 2021, 11:46
von HansPeet
Hi,
vielen Dank für die schnelle Antwort!
Funktioniert und erscheint mir auch logisch, jedoch verstehe ich die dritte Zeile nicht ganz. Warum 1/70?

Re: Paneldaten

BeitragVerfasst: So 10. Jan 2021, 12:28
von Staxa
Somit zeigt er nur 70 Zeilen an, ansonsten alle, was doch ein bisschen viel sein könnte.