Hilfe bei Modellauswahl für Einkommensfragestellung

Statistische Auswertung von Longitudinal- und Panel-Daten mit Stata.

Hilfe bei Modellauswahl für Einkommensfragestellung

Beitragvon mrsofficer93 » Sa 14. Jun 2014, 21:54

Liebe stata-Forum Community,

zurzeit arbeite ich unimäßig an einem Projekt zum Thema Einkommen. Mein genaues Thema ist die Untersuchung von soziökonomischen Faktoren und deren Einflüsse auf das Einkommen von Migranten.
Geträumt habe ich von einer Schätzung, die ungefähr folgendermaßen aussehen sollte; links, als abhängige Variable habe ich das Einkommen der Migranten, rechts Variablen wie: wahrscheinlich die üblichen Kontrollvariablen (Geschlecht, etc.) aber auch solche wie "Abschluss in Deutschland (Dummy)", "geboren in Deutschland" (Dummy), "Sprachkenntnisse", "höchster Schulabschluss" etc....
Leider fiel mir das selbstständige Erarbeiten über Paneldatensätze bzw. der Umgang mit diesen in Stata recht schwer. Zunächst habe ich mich natürlich an die Theorie versucht, doch da geht es schon los mit der Verwirrung- einerseits habe ich eine Längsschnittfragestellung, also nehme ich das fixed-effects- Modell- aber da sind die Schätzer irgendwie nicht konsistent, wenn ich Dummy-Variablen und zeitinvariante Variablen habe?! (Lustig aber, dass an dieser Stelle nicht erwähnt wird, welches Modell sich in solchen Fällen am besten eignet...)

Lange Rede, kurzer Sinn- ich wäre Euch sehr verbunden, könntet Ihr mir ein bisschen Licht ins Dunkle bringen und mir Tipps auf den Weg geben! Fühle mich zurzeit etwas verloren :oops:

Ich bedanke mich im Voraus!

Viele Grüße

mrsofficer93
mrsofficer93
 
Beiträge: 4
Registriert: Sa 14. Jun 2014, 21:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hilfe bei Modellauswahl für Einkommensfragestellung

Beitragvon daniel » Sa 14. Jun 2014, 23:34

also nehme ich das fixed-effects- Modell- aber da sind die Schätzer irgendwie nicht konsistent, wenn ich Dummy-Variablen und zeitinvariante Variablen habe?!


Wo hast Du denn das gelesen? Ich denke eine Einführung in Paneldaten Analyse ist im Rahmen eines Forums nicht machbar. Daher nur einige Anregungen.

Fixed-Effects (besser: within Schätzer) sind vermutlich die beste Mögliochkeit der Schätzung kausaler Effekte. Wenn Du aber nach den "Einflüssen" sozioökonomischer Faktoren fragst, die innerhalb eines Individuums nicht variieren (z.B. Geburtsland), dann ist dies keine kausale Fragestellung und (daher) mit FE Modellen nicht zu analysieren.

Welche Modellierung sinnvoll ist, hängt u.A. von der exakten Forschungsfrage bzw. der exakten zu prüfenden Hypothese ab.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hilfe bei Modellauswahl für Einkommensfragestellung

Beitragvon mrsofficer93 » So 15. Jun 2014, 07:47

Hallo Daniel,
vielen Dank schon einmal für Deine Antwort.
Also meine exakte Forschungsfrage lautet: Inwiefern beeinflussen sozioökonomische Faktoren das Einkommen von Migranten?
Und dazu habe ich dann halt einige Hypothesen aufgestellt, die ich überprüfen möchte.
Es macht dann wohl Sinn, die Hypothesen so aufzustellen, dass die Schätzungen auch möglich sind, oder?
Also kann ich bei Paneldaten grundsätzlich nicht (konsistent/effizient) schätzen, wenn meine Variablen einfach querbeet irgendwelcher Art sind?!

Gut, es war mir schon klar, dass ich sowieso mehr als einmal schätzen muss. Aber habe ich es richtig verstanden; fixed - effects bzw. within-Schätzer gehen nur, wenn ich Variablen habe, bei denen ich kausale Effekte vermute? Welche könnten das denn sein, Sprachkenntnisse beispielsweise auch?

Danke nochmals....

Viele Grüße

mrsofficer93
mrsofficer93
 
Beiträge: 4
Registriert: Sa 14. Jun 2014, 21:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Hypothesen

Beitragvon mrsofficer93 » So 15. Jun 2014, 11:17

Das sind meine Hypothesen:

(1) Eine höhere Schulausbildung in Deutschland, bedeutet ein höheres Einkommen für den Migranten. --> FE?
(2) Je besser die Deutschkenntnisse sind, desto höher ist das Einkommen des Migranten. --> FE?
(3) Wenn der beobachtete Migrant in Deutschland geboren ist, hat er ein höheres Einkommen, als wenn er nicht in Deutschland geboren wäre. --> Kein FE?
(4) Bei einer abgeschlossenen Berufsausbildung in Deutschland ist das Einkommen höher, als bei einer abgeschlossenen Berufsausbildung die nicht in Deutschland abgeschlossen wurde. --> Kein FE?
(5) Es gibt keine geschlechtsspezifischen Unterschiede bei den Einkommen der Migranten. --> Kein FE?

Am besten wäre es dann, für jede der Hypothesen eine seperate Schätzung durchzuführen, oder? Meinst Du, bzw. Ihr, dass meine Hypothesen im Rahmen eines uniprojekts in Stata überprüfbar sind? Mein Dozent hat am Anfang gesagt, mit dem Thema kann ich "viel" machen... aber bin halt trotzdem noch Stata Anfängerin :cry:
mrsofficer93
 
Beiträge: 4
Registriert: Sa 14. Jun 2014, 21:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hilfe bei Modellauswahl für Einkommensfragestellung

Beitragvon daniel » So 15. Jun 2014, 11:22

Inwiefern beeinflussen sozioökonomische Faktoren das Einkommen von Migranten?


Im Unterschied zu Einheimischen? Ansonsten scheint die Fragestellung bzw. besser: die Formulierung des Zusatzes "von Migranten" auf den ersten Blick wenig sinnvoll.

Es macht dann wohl Sinn, die Hypothesen so aufzustellen, dass die Schätzungen auch möglich sind, oder?


Nein, umgekehrt. Es ist sinnvoll das Schätzverfahren zu wählen, dass die Forschungsfrage beantworten bzw. die Hypothesen prüfen kann.

Also kann ich bei Paneldaten grundsätzlich nicht (konsistent/effizient) schätzen, wenn meine Variablen einfach querbeet irgendwelcher Art sind?!


Nein. Ich kann sowohl konsistent als auch effeizient Schätzen. Je nach Modell benötige ich dafür stärkere oder schwächere Annahmen.

Aber habe ich es richtig verstanden; fixed - effects bzw. within-Schätzer gehen nur, wenn ich Variablen habe, bei denen ich kausale Effekte vermute? Welche könnten das denn sein, Sprachkenntnisse beispielsweise auch?


Technisch geht es weniger um Kausalität, als um die Varianz innerhalb von Individuen. Stell Dir mal die Frage, wie Du einen Efekt (i.e. einen Unterschied) schätzen willst, wenn die Daten keine Varianz zweigen, also Konstant sind. Um den einfluss solcher Faktoren zu schätzen, wäre ein RE (Random-effects, Multilevel, Mixed-effects) Ansatz möglich. Der macht, wie erwähnt, eben stärkere Annahmen als FE, ist im Gegenzug aber effizienter.

Ich würde Dir empfehlen Dir mal lokal einen Ansprechpartner zu suchen, der Dir bei der Einarbeitung in diese Modellierungen helfen kann.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hypothesen

Beitragvon daniel » So 15. Jun 2014, 11:26

Kurz kommentiert (aber bereits oben beantwortet)

(1) Eine höhere Schulausbildung in Deutschland, bedeutet ein höheres Einkommen für den Migranten. --> FE?

Varrieret die Schulbildung über die Zeit? Meist nicht. Daher: kein FE Modell möglich.

(2) Je besser die Deutschkenntnisse sind, desto höher ist das Einkommen des Migranten. --> FE?

Variieren die Sprachkenntnisse über die Zeit? Falls ja, FE möglich.

Am besten wäre es dann, für jede der Hypothesen eine seperate Schätzung durchzuführen, oder?

Nein. Ich würde über einen Hybrid-Ansatz nachdenken, aber das kommt auf Vorkenntnisse, Zeit und Ansprüche an.

Meinst Du, bzw. Ihr, dass meine Hypothesen im Rahmen eines uniprojekts in Stata überprüfbar sind? Mein Dozent hat am Anfang gesagt, mit dem Thema kann ich "viel" machen... aber bin halt trotzdem noch Stata Anfängerin :cry:


Ich meine, Du solltest mit Deinem Dozenten sprechen. Der wird das Projekt doch betreuen? Stata kann sicher mehr Modelle umsetze, als Du benötigen wirst. Die Software kannst Du also aller Voraussicht nach verwenden.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Hilfe bei Modellauswahl für Einkommensfragestellung

Beitragvon mrsofficer93 » So 15. Jun 2014, 11:45

Huhu,
wow, vielen Dank für die ausführliche Antwort! Hier wird einem ja echt super geholfen.
Deine Antworten helfen mir schon echt, weil ich jetzt wenigstens weiß, wo noch Lücken in meinen Überlegungen zur Schätzung sind.
Wäre es denn sehr unprofessionell, wenn ich für jede Hypothese jetzt eine einzelne Schätzung durchführe? Von einem Hybrid-Ansatz habe ich auch noch nichts gehört, und wenn das zuu kompliziert ist (werde mal googlen und nachfragen, aber glaube, anspruchsvollere Schätzungen fänden die super....) würde ich lieber darauf verzichten. Abgabe ist in 23 Tagen, aber der erste Teil des Papers ist fertig, fehlt nur noch Stata :x

Liebe Grüße

mrsofficer93
mrsofficer93
 
Beiträge: 4
Registriert: Sa 14. Jun 2014, 21:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Longitudianal und Panel-Analyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste