Seite 1 von 1

Regression auf eine binäre Variable

BeitragVerfasst: Fr 14. Feb 2014, 15:32
von Erich
Kann mir bitte Jemand beantworten, ob ich eine Regression des logarithmierten Lohnes
auf die dichotome Variable "männlich" in Stata einfach so durchführen kann ? Gesucht wird der Effekt von männlich.

Wenn ich männlich nicht als Dummyvariable einstelle bekomme ich normal erscheinende Regressionsergebnisse. Aber das Ergebnis
ist doch verwaschen ? Weil die Löhne der Frauen mit eingeflossen sind ?

Ich hatte als zweite Möglichkeit eine Dummyvariable generiert: gen D_männlich= männlich if männlich==1

Wenn ich reg lnw D_männlich in Stata eingebe, dann bekomme ich Kollinearität gemeldet.

Wie würdet Ihr den Effekt von männlich richtig ermitteln ?

Re: Regression auf eine binäre Variable

BeitragVerfasst: Sa 15. Feb 2014, 16:44
von daniel
Aber das Ergebnis ist doch verwaschen ? Weil die Löhne der Frauen mit eingeflossen sind ?


Was stellst Du Dir denn unter dem "Effekt von männlich" vor? Ein Effekt ist ein Unterschied. In diesem Fall der Unterschied zwischen Männern und Frauen. Wie willst Du einen Unterschied zwischen Gruppen schätzen, wenn Du zur Schätzung nur eine Gruppe (nämlich Männer) verwenden willst?

Du solltest in Einführungsbüchern zu Regresionsanalysen nachlesen, bevor Du anfängst Knöpfchen in Stata zu dücken. Anderenfalls ist das Risiko sehr hoch, dass Du Unsinn machst. Deine Grundeinstellung, die sich darin äußert hier nachzufragen, ist dazu schon mal ein sehr hilfreicher Anfang.

Re: Regression auf eine binäre Variable

BeitragVerfasst: Sa 15. Feb 2014, 18:17
von Erich
Hallo,

danke für die Antwort. Vielleicht habe ich das nicht richtig beschrieben.
Mit Effekt ist gemeint, ob "männlich" ( Ausprägungen 0 oder 1 im Datensatz) den logarithmierten Lohn erhöht ?
Es gibt ja diese Regressionsgleichung, oft habe ich sie gesehen: Y= Konstante+ Koeffizient* X + Fehlerterm.
X kann diskret sein, kontinuierlich, dichotom, usw. .
Wenn ich also nur reg lw male eingebe, meldet Stata Kollinearität. Wenn ich vorher dafür eine DV generiert habe.

Gebe ich reg lw male height language skill etc. ein, bekomme ich ein Ergebnis. Ich kann mir nicht herleiten, ob es stimmen
kann. Warum wird denn manchmal eine DV kreiert und manchmal nicht ?

Stata berechnet den Koeffizienten, der die entprechende Steigerung angibt ja für alle Personen. Wie kann man denn da
sagen, dass männlich den Lohn steigert. Es würde ja nicht für die Frauen gültig sein.

Re: Regression auf eine binäre Variable

BeitragVerfasst: Mo 17. Feb 2014, 18:55
von mangel76
Ich glaube die Definition deiner Dummy ist falsch.

gen D_männlich= männlich if männlich==1

Was hat denn männlich für Ausprägungen? Ich gehe mal davon aus, dass männlich nicht schon 0/1-kodiert ist, also etwa 1 für Männer und 2 für Frauen. Und was hat dann D_männlich für einen Wert falls männlich!=1? Dann müsste es missing sein, also verwendest du in deiner Regression nur Beobachtungen mit dem gleichen Wert für deine Dummy, ergo Kollinearität. Versuche mal

Code: Alles auswählen
gen D_männlich=männlich==1


Obiger Code wertet aus, ob die Aussage männlich==1 Falsch oder Richtig ist und setzt D_männlich entsprechend auf 0 oder 1.

Zur Interpretation: Der Koeffizient gibt dir Auskunft über den (relativen bei Logs) Unterschied in der abhängigen Variable (Lohn) zwischen Männern und Frauen gegeben alle anderen erklärenden Variablen, also height und language skill sind gleich. Umgangssprachlich etwa: Wieviel % verdient ein Mann mehr (oder weniger) als eine Frau gleicher Größe und mit gleichen sprachlichen Fähigkeiten.

Re: Regression auf eine binäre Variable

BeitragVerfasst: Mi 19. Feb 2014, 11:31
von Erich
Eine Variable wie gender kann die Ausprägungen 1,2 haben. Die Variable male ist
ist entweder 0 oder 1.

Anscheinend kann man das Generieren von einer Dummyvariable nicht an eine Bedingung knüpfen.

Vielen Dank für den richigen Stata- Befehl und für die Hilfe.