Eliminieren von Beobachtungen, die nur 1x vorkommen

Deskriptive Statistiken mit Stata.

Eliminieren von Beobachtungen, die nur 1x vorkommen

Beitragvon Johanna_K » Mi 3. Jul 2013, 13:46

Hallo Stata-Freunde,

ich habe mich vor kurzem in Stata eingearbeitet und habe ein Problem, welches ich durch intensive Internet-Recherche nicht lösen konnte.

Folgende Beobachtungen:

Id_number Year
1 2003
1 2004
2 2003
3 2003
4 2003
4 2004

Stata soll nun die Id_Number eliminieren, die nur einmal vorkommen sprich 2 und 3, da hierfür keine Werte in 2004 angegeben sind und nur die Paare relevant sind. Ich glaube, dss die Antowrt relativ einfach ist. Ich komme nur einfach nicht dahinter.

Könnt ihr mir dort weiterhelfen?

Vielen herzlichen Dank!
Johanna_K
 
Beiträge: 3
Registriert: Mi 3. Jul 2013, 13:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Eliminieren von Beobachtungen, die nur 1x vorkommen

Beitragvon daniel » Mi 3. Jul 2013, 17:24

Code: Alles auswählen
bys Id_number : drop if (_N == 1)


Bist Du sicher, dass Du nicht lieber diejenigen bahalten willst, die genau zweimal vorkommen? Oder macht das bei Dir keinen Unterschied?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Eliminieren von Beobachtungen, die nur 1x vorkommen

Beitragvon Johanna_K » Mi 3. Jul 2013, 20:15

Hallo Daniel,

vielen Dank für die Antwort!

Ich benötige immer genau die Unternehmen (id_number), wo sowohl für 2003 als auch für 2004 Werte vorhanden sind. Da in meinem Data Editor sowohl 2003er und 2004er Daten enthalten sind inkl. aller id_number, musste ich die Unternehmen rauswerfen, die lediglich Werte für 2003 oder für 2004 enthalten.

Gruß,

Johanna
Johanna_K
 
Beiträge: 3
Registriert: Mi 3. Jul 2013, 13:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Eliminieren von Beobachtungen, die nur 1x vorkommen

Beitragvon Johanna_K » Fr 19. Jul 2013, 12:55

Hallo zusammen,

ich bin im Rahmen meiner Analyse auf ein weiteres Problem gestossen, welches ich einfach nicht lösen kann.

id_number Year Bilanzsumme

DE2010479225U 2003 392487
DE2010479225U 2004 367211
DE2010499612U 2003 4130
DE2010499612U 2004 3781


Ich würde nun gerne berechnen, wie sich die Bilanzsumme in den zwei Jahren prozentual verändert hat.

Also gen diff_Bilanzsumme_2003_2004= ((Bilanzsumme aus 2004/ Bilanzsumme aus 2003)-1)*100

Hierzu habe ich schon mehrere Sachen ausprobiert, die nicht funktionieren.

Zunächst wollte ich die Variable Bilanzsumme in zwei Variablen aufteilen, für 2003 und für 2004, damit diese dann nebeneinander stehen und nicht mehr untereinander. Ich habe dann den sort year id_number eingegeben und gen Bilanzsumme_2003=Bilanzsumme if year==2003 (selbe Spiel für 2004). Dies geht zwar. Die Jahre stehen allerdings versetzt nebeneinander und damit kann Stata nicht rechnen.

Ich habe auch schon die entsprechenden Daten aus dem Data Editor (Bilanzsumme) kopiert und hinten (Bilanzsumme_2003) eingefügt. Das Problem hierbei ist, dass ich dies für jedes einzelne Sampel neu machen müsste. Es wäre einfacher, wenn es einen Befehl gäbe, den ich ins Do-File packen könnte.

Habt ihr vielleicht eine Idee?

Gruß,

Johanna
Johanna_K
 
Beiträge: 3
Registriert: Mi 3. Jul 2013, 13:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Deskriptive Statistik

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast