Seite 1 von 1

Dummy-Variablen

BeitragVerfasst: Do 25. Jun 2015, 17:58
von Gottlob
Servus,
ich muss in meiner Bachelor-Arbeit den Einfluss von Weiterbildung auf unbezahlte Überstunden empirisch anhand einer multivariaten linearen Regression überprüfen. Nun hab ich neben den beiden "zentralen" Variablen noch weitere Kontrollvariablen in der Regression aufgenommen. Da aber das Bestimmtheitsmaß mit 0,0204 als ca 2% schwindend gering ist, will ich auf Anraten meiner Betreuerin noch weitere Kontrollvariablen in dem Modell aufnehmen.
Nun zu meiner eigenen Frage-
Eine der Variablen, die ich mit der Regression aufnehmen wollen würde ist die Betriebsgröße.
Diese ist in verschiedenen Intervallen unterteilt (1,2,3,4,5,6,7,8,9,10,11-19,20-49,mehr als 50)
Nun würde ich gerne 3 bzw 2 Dummy-Variablen erstellen mit Betriebsgröße>50 ,Betriebsgröße 10<x<50 und Betriebsgröße<10. Wobei die 3. ja aufgrund Multikollinearität aus der Regression entfernt wird, oder? Wie genau erstelle ich nun die 2 bzw 3 verschiedenen Dummy-Variablen?
Bei Geschlecht ist es ja eindeutig, da ich 1=mann und 0=frau setzen kann, aber hier wären es ja mehr Unterteilungen.
Das selbe würde für meine weitere Dummy-Variable Wirtschaftszweig gelten. Diese ist in 21 Zweige unterteilt, woraufhin ich auch diese jeweils einzeln in der Regression aufnehmen wollen würde.
Ich hoffe mein Problem ist verständlich ausgedrückt und ihr könnt mir helfen
Danke :)

Re: Dummy-Variablen

BeitragVerfasst: Fr 3. Jul 2015, 13:31
von Torben
Hey Gottlob,
Ich schreibe zur Zeit auch an meiner BA.
Die Dummys kannst du ganz normal erstellen, bedeuten würde das dann zB
1= 10<x<50
0= nicht 10<x<50
Im Grunde ändert sich dadurch nichts. Ich habe in meiner BA das selbe mit Befragungswellen 1-8 gemacht, da dies eine flexiblere Aussage ermöglicht und keine Linearität voraussetzt.
Der Effekt wenn x=1 bedeutet ja nichts weiter als "im Vergleich zu" und das ist ja deine Ausgelassene Variable.
Insofern kannst du ohne Probleme 3 Dummys oder mehr einfügen.

Erstellen kannst du das einfach mit einem if-Befehl
zB gen GroßerBetrieb = 0
replace GroßerBetrieb = 1 if Betriebsgröße > 10 & Betriebsgröße < 50
und das eben 3 mal. Es gibt bestimmt auch eine andere Möglichkeit das zu machen, aber so fand ich es immer sehr einleuchtend.

Grüße, Torben

Re: Dummy-Variablen

BeitragVerfasst: Do 9. Jul 2015, 11:59
von Gottlob
Servus Torben,

vielen Dank für die Antwort.
Hast mir sehr geholfen, weil somit der empirische Teil der BA steht :D