SOEP Daten Probleme mit fixed effect Modell

Statistische Auswertung von Longitudinal- und Panel-Daten mit Stata.

SOEP Daten Probleme mit fixed effect Modell

Beitragvon Abuser » Do 11. Sep 2014, 13:55

Hallo,

benötige eure Hilfe, da ich gerade an meinem Forschungsprojekt verzweifele.

Grundlagen:

- Soep Daten
- Fragestellung: Beeinflusst der Eintritt in die Arbeitslosigkeit eine Konsummengenänderung bei Rauchern?
- Beobachtungszeitraum 2006-2010 mit 3 Wellen, da Fragen zum Rauchen nur alle 2 Jahre im Soep abgefragt werden.

Aufbau/Verlauf

- zunächst die drei Wellen zusammengemergt
- Missings aus den Variablen gelöscht
- Einschränkung zum Alter festgelegt 18-59 Jahren

Kontrollvariablen

- Alter
- Nettoäuqivalenzeinkommen
- Bildung
- Familienstand
- feste Partnerschaft

Die unabhängige Variable ist der Erwerbsstatus, welche nominal skaliert ist also: 1=arbeitslos 2= nicht arbeitslos.
Die abhängige Variable ist die durchschnittlich gerauchte Anzahl an Zigaretten, welche metrisch skaliert ist.

Zur Beantwortung der Forschungsfrage würde ich gerne ein fixed effekt modell berechnen.
Die Idee dahinter ist, dass ich schauen möchte, inwieweit sich bei der Gruppe von Leuten, die arbeitslos werden (Treatment) die durchschnittlich gerauchte Anzahl verändert.
Als Kontrollgruppe würden dann die Leute fungieren, die über alle Wellen konstant nicht arbeitslos waren.

Zunächst habe ich die Daten als Paneldaten deklariert und dann das Modell berechnet, was aber ganz seltsame Koeffizieten ausspuckt und bei der Betrachtung von R2 ja kaum Erklärungskraft hat.

"xtset persnr welle"

"xtreg zigarettenanzahl erwerbsstatus familienstand festpartner bildung equiv alter, fe"


Fixed-effects (within) regression Number of obs = 3262
Group variable: persnr Number of groups = 1841

R-sq: within = 0.0057 Obs per group: min = 1
between = 0.0351 avg = 1.8
overall = 0.0273 max = 3

F(6,1415) = 1.34
corr(u_i, Xb) = 0.0780 Prob > F = 0.2347

-------------------------------------------------------------------------------
zigarettena~l | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------------+----------------------------------------------------------------
erwerbsstatus | -.9026169 .4447822 -2.03 0.043 -1.77512 -.0301136
familienstand | -.5805319 .4115894 -1.41 0.159 -1.387923 .2268592
festpartner | -.0207675 .3537138 -0.06 0.953 -.7146274 .6730924
bildung | .2701498 .2918989 0.93 0.355 -.3024514 .8427509
equiv | -8.03e-06 .0000294 -0.27 0.785 -.0000657 .0000497
alter | .0490712 .0670106 0.73 0.464 -.0823797 .1805221
_cons | 15.68336 2.615854 6.00 0.000 10.55199 20.81473
--------------+----------------------------------------------------------------
sigma_u | 8.0621918
sigma_e | 4.4302342
rho | .7680737 (fraction of variance due to u_i)
-------------------------------------------------------------------------------
F test that all u_i=0: F(1840, 1415) = 5.35 Prob > F = 0.0000


Bin echt am verzweifeln und bin über jeden Hilfe dankbar.
Wo liegt der Fehler, was habe ich falsch gemacht?
Abuser
 
Beiträge: 1
Registriert: Do 11. Sep 2014, 13:36
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: SOEP Daten Probleme mit fixed effect Modell

Beitragvon daniel » Di 23. Sep 2014, 10:55

Als Kontrollgruppe würden dann die Leute fungieren, die über alle Wellen konstant nicht arbeitslos waren.


Nicht wirklich. Der gag bei fixed effects (within regression) ist gerade, dass jede Person seine eigene Kontrollgruppe darstellt. Dadurch wird es erst möglich (zeitkonstante) unbeobachtete Heterogenität zwischen Personen als konfundierende Faktoren auszuschließen. Das ist die Stärke dieses Ansatzes.

Du solltest in Deinem Modell für die Erhebungswelle kontrollieren (also eine Indkatorvariable für den Zeitlpunkt aufnehmen). So erzeugst Du eine Art "difference-indifferences" Schätzung, die allgemeine Veränderungen über die Zeit auffängt, und die Ergebnisse noch "sicherer" macht.

Zunächst habe ich die Daten als Paneldaten deklariert und dann das Modell berechnet, was aber ganz seltsame Koeffizieten ausspuckt


Was heißt "seltsam"?

und bei der Betrachtung von R2 ja kaum Erklärungskraft hat.


R-Quadrat spielt für Deine Fragestelung m.E. keine Rolle. Dein Ziel ist die Schätzung des kausalen Effekts der Arbeitslosigkeit auf den Zigarettenkomsum - nicht(!) eine möglichst geringe unerklärte Varianz des Zigarettenkonsums.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Longitudianal und Panel-Analyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron