Dummy-Variable mit Paneldaten erstellen

Fragen zu Stata Syntax und Do-Files.

Dummy-Variable mit Paneldaten erstellen

Beitragvon Leylab1997 » Fr 5. Aug 2022, 15:27

Hallo zusammen,

ich habe ein Problem, bei dem ich Hilfe benötige.
Und zwar möchte ich eine Dummy-Variable "Zeit" erstellen, mit den Ausprägungen 0=2019 und 1=2020. Die Dummy-Variable erstelle ich aus zwei verschiedenen Variablen (Welle2019 und Welle2020). In beiden Wellen wurden insgesamt 2.700 Personen befragt. Mein Ziel ist es, dass in meiner Dummy-Variable bei beiden Ausprägungen jeweils die 2.700 Befragten sind. Allerdings arbeite ich mit Paneldaten, daher habe ich in Welle 2019 und 2020 dieselben Befragten. Wenn ich beide Variablen zusammenfüge mit diesem Befehl (siehe unten), habe ich bei 2019 niemanden und bei 2020 die 2.700 Personen, da Stata den Personen nicht zwei verschieden Werte zuordnet.

gen zeit=.
replace zeit = 0 if welle19 == 1
replace zeit = 1 if welle20 == 1


Im Moment sieht meine Dummy-Variable so aus:
0 2019 0
1 2020 2.700


Ich möchte aber, dass sie so aussieht:
0 2019 2.700
1 2020 2.700

Die Befragten sollen also in beiden Jahren wiederzufinden sein.

Ich hoffe, ich konnte mich verständlich ausdrücken und ihr versteht was ich meine.

Vielen Dank schon einmal!
Liebe Grüße,
Leyla
Leylab1997
 
Beiträge: 3
Registriert: Fr 5. Aug 2022, 14:54
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dummy-Variable mit Paneldaten erstellen

Beitragvon Staxa » Fr 5. Aug 2022, 19:27

So ist das schwer zu sagen, da wir deinen Datensatz nicht kennen. Am besten ein Beispiel posten mit Dataex.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dummy-Variable mit Paneldaten erstellen

Beitragvon Leylab1997 » So 7. Aug 2022, 06:29

Vielen Dank für die Antwort!

Meine beiden Variablen, die ich zusammenfügen möchten, haben beide nur eine Ausprägung. D.h. alle Befragten haben bei beiden Variablen einen Wert von 1. Die Variablen "welle19" und "welle20" sehen also wie folgt aus:

+-------------------+
| welle19 welle20 |
|-------------------|
5000. | 1 1 |
5001. | 1 1 |
5002. | 1 1 |
5003. | 1 1 |
5004. | 1 1 |


Beispiel anhand von Befragtem 5000:
In "welle19" hat er den Wert 1, in "welle20" hat er ebenfalls den Wert 1. Wenn ich jetzt eine Dummyvariable mit den Ausprägungen 2019= 0 und 2020 = 1 erstelle, taucht er nur bei Ausprägung 1 auf. Allerdings muss er in beiden sein, da ich diese Zeit-Dummy als Kontrollvariable für eine Regressionsanalyse benötige.

Ist es nun etwas verständlicher?
Leylab1997
 
Beiträge: 3
Registriert: Fr 5. Aug 2022, 14:54
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dummy-Variable mit Paneldaten erstellen

Beitragvon Staxa » Mo 8. Aug 2022, 10:43

Von dem Beispiel lässt sich das nur erahnen, aber offenbar sind deine Daten im Wide Format. Ist das so gewünscht? Ist es am Ende eine Panelregression? Die läuft nur im Long Format.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dummy-Variable mit Paneldaten erstellen

Beitragvon Leylab1997 » Mo 8. Aug 2022, 15:45

Bedeutet das, dass ich alle meine Variablen, die ich in der Regressionsanalyse verwende, reshapen muss? Meine abhängige Variable habe ich bereits in ein long-format transformiert. Allerdings hatte ich gehofft, dass ich die unabhängigen Variablen im wide-format lassen kann.
Ich hatte bereits versucht auch weitere Variablen zu transformieren, allerdings hatte dies nicht funktioniert, da ich immer nur eine Variable im Datensatz reshapen kann. Sonst bekomme ich eine Fehlermeldung.
Ich habe meine AV mit diesem Befehl transformiert:

-reshape long sozialenetze, i(z000001a) j(netzwerk)

Das hat auch funktioniert, jedoch bekomme ich sobald ich weitere Variablen transformieren will diese Fehlermeldung:
. reshape long welle, i(z000001a) j(zeit_1)
(j = 19 20)
variable id does not uniquely identify the observations
Your data are currently wide. You are performing a reshape long. You specified i(z000001a) and j(zeit_1). In the current
wide form, variable z000001a should uniquely identify the observations.

Kann es sein, dass ich die ID Variable nur einmal zur Identifikation verwenden kann? Wenn ja, wie gehe ich dann bei den anderen "reshapes" vor?
Leylab1997
 
Beiträge: 3
Registriert: Fr 5. Aug 2022, 14:54
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dummy-Variable mit Paneldaten erstellen

Beitragvon Staxa » Mi 10. Aug 2022, 08:08

So scheint das mir nicht zu passen, in der Regel werden alle Variablen einer Analyse gleichzeitig in das andere Format gebracht. Auch verstehe ich nicht, warum die j Variable in deinen merges sich dann ändert, das kann eigentlich nicht sein. Du solltest dir dazu die online Verfügbaren Beispiele ansehen oder in der Stata Dokumentation, wie genau eine solche Umwandlung durchgeführt wird. Ohne konkrete Daten können wir das jedenfalls hier nicht nachvollziehen.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Stata Syntax

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron