Regressionsanalyse

Allgemeine Fragen rund um Statistik mit Stata.

Regressionsanalyse

Beitragvon tusia » Mi 6. Jun 2012, 12:04

Hallo zusammen!

Ich bin ein absoluter Laie in Sachen Stata und brauche eure Hilfe.
Ich führe zurzeit eine Analyse zur Erwerbstätigkeit auf der Basis von Mikrozenzusdaten.
Überprüft werden soll, warum Frauen mit Kinder weniger (seltener) als kinderlose Frauen erwrbstätig sind.
Die Idee ist halt, dass nicht die Tatsache der vorhandenen Kindern den Unterschied auf dem Arbeitsmarkt macht.
Ich möchte die Erwerbstätigkeit der beider Frauengruppen unter folgenden Aspekten prüfen: Familienstand, Bildungstatus, Anzahl der Kinder, Alter des jüngsten Kindes, Nettoeikommen. Den Datensatz habe ich bereits selektiert und einige Fälle gelöscht (wie Männer, Frauen die noch Schüler sind, Frauen mit Behinderung, Erziehungs-beurlaubte Frauen, Frauen unter 18 und über 45)

Ich habe bereits die einzelnen Variablen erstellt, weiß aber nicht mehr weiter, wie ich vorgehen soll. Müssen alle UV dummykodiert werden,
wenn ich eine Lineare Regression durchführen möchte? Welche soll in dem Fall angewendet werden: einfache oder multiple?
Was ist mit Kontrollvariablen? Welche wäre es sinnvoll einzubeziehen?

Wie interpretiert man ein Regressionsmodell?


Wie gesagt, ich bin ein echter Laie! Bitte nicht lachen :oops:
tusia
 
Beiträge: 3
Registriert: Mi 6. Jun 2012, 11:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse

Beitragvon daniel » Mi 6. Jun 2012, 13:17

Die Umsetzung in Stata ist einfach zu machen, aber mehr dazu, wenn andere Fragen geklärt sind.

Die Idee ist halt, dass nicht die Tatsache der vorhandenen Kindern den Unterschied auf dem Arbeitsmarkt macht.


Das ist m.E. eine sehr dünne "theoretische" Grundlage für eine empirische Untersuchung, aber darauf möchte ich nicht näher eingehen.

Ich möchte die Erwerbstätigkeit der beider Frauengruppen unter folgenden Aspekten prüfen: Familienstand, Bildungstatus, Anzahl der Kinder, Alter des jüngsten Kindes, Nettoeikommen.


Hier sind mindestens zwei Variablen problematisch. Das Alter des jüngsten Kindes ist bei kinderlosen Frauen nicht vorhanden, also ein fehlender Wert. Das kannst Du nicht in Dein Analysemodell aufnehmen. Die zweite problematische Variable ist das Nettoeinkommen. Da das Nettoeinkommen der Fareun oder des Haushalts aus der Erwerbstätigkeit resultiert, kann es nicht als Prädikator fungieren. Was möglich und sinnvoll wäre, ist das Nettoeinkommen des Partners zu kontrollieren.

Müssen alle UV dummykodiert werden,
wenn ich eine Lineare Regression durchführen möchte?


Wenn Dein outcome Erwerbstätigkeit ist, dann solltest Du überlegen, ob Du wirklich ein lineares Modell schätzen willst. Wie genau ist denn Dein outcome kodiert?

Allgemein können (quasi) metrische Variablen einfach in ein Regressionsmodell aufgenommen werden. Variablen mit ordinalem, oder nominalem Skalenniveau sollten als Dummy Variablen umgesetzt werden. Zur Interpretation einer Regression, und dem Umgang mit Stata empfehle ich Dir das Buch "Datenanalyse mit Stata".

Kohler, U, Kreuter, F (2008). Datenanalyse mit Stata. 3. Auflage. München: Oldenburg.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse

Beitragvon tusia » Mi 6. Jun 2012, 14:46

Hallo Daniel!

Danke für die schnelle Antwort.

Also, wenn ich Dich gzt verstanden habe, wäre es besser nur die Mütter un ihr Erwerbsverhalten zu untersuchen. Das würde bedeuten, dass ich die kinderlosen Frauen auschließen muss. Dann würden die Kinder-Variablen kein Problem mehr sein, oder?

Zu dem Nettoeinkommen - natürlich hatte ich das NE des Partners gemeint.

Die AV "Erwerbstätigkeit" habe ich dummykodiert: 0=trifft nicht zu, 1= trifft zu. Familienstand habe ich auch dummycodiert: 0= keine Partnerschaft, 1= in Partnerschaft.

Die Variable "Anzahl der Kinder" habe ich in Gruppen geteilt : 1) 1 bis 3 Kinder; 2) 4 bis 7. Die zweite Gruppe ist überraschend klein (nur 66 Fälle). Ich muss wahrscheinlich anders gruppieren.

"Alter des jüngsten Kindes" habe ich auch in Gruppen geteilt: unter 3, 3 bis unter 6, 6 bis unter 10, 10 und älter.

Die Variable Bildungsniveau ist ein wenig problematisch, weil im Mikrozenzus 2002 in zwei getrennt gefasst wird: Allg. Bildung und berufliche Bildung. Ich habe erstmal eine Variable erstellt, die besagt, ob überhaupt ein Abschluss vorhanden ist (egal ob allg. oder berufl.). Es wäre sinnvoll die beiden Bildungvariablen zusammenzufassen. Weiß allerdings noch nicht, wie ich es machen soll.

Das Nettoeinkommen de Partners ist ordinal skaliert. Wie kann ich die in dummy umsetzten?


Gruß
tusia
 
Beiträge: 3
Registriert: Mi 6. Jun 2012, 11:39
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse

Beitragvon daniel » Mi 6. Jun 2012, 15:17

Also, wenn ich Dich gzt verstanden habe, wäre es besser nur die Mütter un ihr Erwerbsverhalten zu untersuchen.


So würde ich es nicht ausdrücken. Die Frage, was genau Du untersuchen möchtest, sollte immer am Anfang Deiner Untersuchung stehen, und sich auf keinen Fall nach den Variablen im Datensatz richten. Du wirst doch wissen, was Dich interessiert?

Bei nominal skaliertem outcome (AV), ist ein lineares Regressionsmodell (was dann einem linearen Wahrscheinlichkeitsmodell, auch: LPM entspricht) umstritten. Die Alternative wäre ein binär logitisches Modell, das aber auch alles andere als unporoblematisch ist. Ich würde wohl beides mal schätzen und scheun, inwiefern sich die Ergebnisse substantiell unterscheiden.

Die Bildungsvariablen kannst Du auch beide ins Modell nehmen. Wieso willst Du die zusammenfassen?

Wenn das Einkommen ordinal skaliert mit k Ausprägungen ist, dann kannst Du daraus k-1 Dummy Variablen erzeugen und ins Modell aufnehmen. Im Prinzip so, wie Du die klassierte Kinderzahl aufnehmen würdest.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: jameslove120 und 3 Gäste