Seite 1 von 1

Eliminieren von Beobachtungen, die nur 1x vorkommen

BeitragVerfasst: Mi 3. Jul 2013, 13:46
von Johanna_K
Hallo Stata-Freunde,

ich habe mich vor kurzem in Stata eingearbeitet und habe ein Problem, welches ich durch intensive Internet-Recherche nicht lösen konnte.

Folgende Beobachtungen:

Id_number Year
1 2003
1 2004
2 2003
3 2003
4 2003
4 2004

Stata soll nun die Id_Number eliminieren, die nur einmal vorkommen sprich 2 und 3, da hierfür keine Werte in 2004 angegeben sind und nur die Paare relevant sind. Ich glaube, dss die Antowrt relativ einfach ist. Ich komme nur einfach nicht dahinter.

Könnt ihr mir dort weiterhelfen?

Vielen herzlichen Dank!

Re: Eliminieren von Beobachtungen, die nur 1x vorkommen

BeitragVerfasst: Mi 3. Jul 2013, 17:24
von daniel
Code: Alles auswählen
bys Id_number : drop if (_N == 1)


Bist Du sicher, dass Du nicht lieber diejenigen bahalten willst, die genau zweimal vorkommen? Oder macht das bei Dir keinen Unterschied?

Re: Eliminieren von Beobachtungen, die nur 1x vorkommen

BeitragVerfasst: Mi 3. Jul 2013, 20:15
von Johanna_K
Hallo Daniel,

vielen Dank für die Antwort!

Ich benötige immer genau die Unternehmen (id_number), wo sowohl für 2003 als auch für 2004 Werte vorhanden sind. Da in meinem Data Editor sowohl 2003er und 2004er Daten enthalten sind inkl. aller id_number, musste ich die Unternehmen rauswerfen, die lediglich Werte für 2003 oder für 2004 enthalten.

Gruß,

Johanna

Re: Eliminieren von Beobachtungen, die nur 1x vorkommen

BeitragVerfasst: Fr 19. Jul 2013, 12:55
von Johanna_K
Hallo zusammen,

ich bin im Rahmen meiner Analyse auf ein weiteres Problem gestossen, welches ich einfach nicht lösen kann.

id_number Year Bilanzsumme

DE2010479225U 2003 392487
DE2010479225U 2004 367211
DE2010499612U 2003 4130
DE2010499612U 2004 3781


Ich würde nun gerne berechnen, wie sich die Bilanzsumme in den zwei Jahren prozentual verändert hat.

Also gen diff_Bilanzsumme_2003_2004= ((Bilanzsumme aus 2004/ Bilanzsumme aus 2003)-1)*100

Hierzu habe ich schon mehrere Sachen ausprobiert, die nicht funktionieren.

Zunächst wollte ich die Variable Bilanzsumme in zwei Variablen aufteilen, für 2003 und für 2004, damit diese dann nebeneinander stehen und nicht mehr untereinander. Ich habe dann den sort year id_number eingegeben und gen Bilanzsumme_2003=Bilanzsumme if year==2003 (selbe Spiel für 2004). Dies geht zwar. Die Jahre stehen allerdings versetzt nebeneinander und damit kann Stata nicht rechnen.

Ich habe auch schon die entsprechenden Daten aus dem Data Editor (Bilanzsumme) kopiert und hinten (Bilanzsumme_2003) eingefügt. Das Problem hierbei ist, dass ich dies für jedes einzelne Sampel neu machen müsste. Es wäre einfacher, wenn es einen Befehl gäbe, den ich ins Do-File packen könnte.

Habt ihr vielleicht eine Idee?

Gruß,

Johanna