Nur die Zeile mit der höchsten Beobachtung behalten

Allgemeine Fragen rund um Statistik mit Stata.

Nur die Zeile mit der höchsten Beobachtung behalten

Beitragvon hanna101 » Sa 16. Okt 2021, 12:30

Guten Tag,

ich habe einen Datensatz mit ca. 15 Spalten.

Nur zwei Spalten davon muss ich noch optimieren.

Und zwar sind in der spalte dealvalue die Deal Summen für eine Firma pro Jahr summiert (der gvkeyyear zeigt die Firmennummer und das Jahr). Geiches gilt für numberofdealstotal, hier wurden die ingesamten Deals einer Firma summiert.

Jetzt möchte ich allerdings nur die Zeilen mit der höchsten Beobachtung behalten, sodass am Ende für jede Firma pro Jahr nur eine Zeile vorhanden ist.

Mit "collapse" habe ich dies bislang nur immer für eine Spalte hinbekommen, dann aber alle anderen Spalten des Datensatzes gelöscht.

Kann mir jemand dabei helfen? Vielen Dank im Voraus!
Dateianhänge
1.jpg
1.jpg (65.5 KiB) 1427-mal betrachtet
hanna101
 
Beiträge: 2
Registriert: Do 14. Okt 2021, 16:24
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Nur die Zeile mit der höchsten Beobachtung behalten

Beitragvon Staxa » So 17. Okt 2021, 10:43

Wir markieren zunächst für jede Firma den Wert mit dem höchsten Eintrag und behalten am Ende nur diese Einträge.


Code: Alles auswählen
bysort firma: egen maxvalue = max(dealvalue)
keep if dealvalue == maxvalue


*Falls mehrere Einträge identisch sind pro Firma
Code: Alles auswählen
bysort firma: keep if _n == 1
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron