Seite 1 von 1

Multiple lineare Regression welcher Befehl

BeitragVerfasst: Fr 18. Mär 2022, 23:42
von AnneliG.
Hallo ihr Lieben,
ich brauche bitte unbedingt Hilfe.
Es geht um folgendes: Ich muss eine Hausarbeit schreiben mit dem Thema: Wie ist der Zusammenhang zwischen Einkommen in Bezug als Geschlecht, Alter, Bildungsabschluss.

Ich möchte eine multiple lineare Regression machen.

Folgendes habe ich bereits kodiert in Stata: (Kopie von meinem DO_FILE)

*Abhängige Variable*
lookfor Nettoeinkommen
tab v347
tab v347, nolab
mvdecode v347, mv(97=.)
mvdecode v347, mv(99=.)
clonevar Nettoeinkommen = v347

recode Nettoeinkommen (0/8 = 1 "0€-999€") (9/14 = 2 "1000€-1999€") (15/22 = 3 "2000€-7500€u.mehr") , gen (NettoeinkommenVereinfacht)

tab NettoeinkommenVereinfacht

*Unabhängige Variablen*
tab1 v221 v217 v230

*Missings umkodieren für Alter und Geschlecht*
mvdecode v221, mv(9=.)
tab v221

mvdecode v230, mv(99=.)
tab v230

*Unabhängige Variablen namtlich umkodieren*
clonevar AlterKategorisiert = v221
clonevar Geschlecht = v217
clonevar AllgSchulabschluss = v230

Welchen Befehl muss ich nehmen für eine korrekte Regression?
1. regress Nettoeinkommen ib1.Geschlecht i.AlterKategorisiert i.AllgSchulabschluss
oder

2. regress Nettoeinkommen ib1.Geschlecht AlterKategorisiert AllgSchulabschluss
oder

3. regress Nettoeinkommen ib1.Geschlecht##AlterKategorisiert##AllgSchulabschluss
?

Ich bedanke mich schon im Voraus von ganzem Herzen für Eure Hilfe.

Re: Multiple lineare Regression welcher Befehl

BeitragVerfasst: Sa 19. Mär 2022, 10:54
von Staxa
Wie richtig erkannt erhalten alle kategorialen Vars IMMER das Prefix i.
Mit ## machst du einen Interaktionseffekt. Das ist aber eine theoretische Frage, ob du das haben willst. Das kann ich dir nicht sagen. Im einfachen Fall ist das hier richtig:

Code: Alles auswählen
regress Nettoeinkommen ib1.Geschlecht i.AlterKategorisiert i.AllgSchulabschluss


PS: statt tab, schau dir mal fre an

Code: Alles auswählen
ssc install fre, replace
fre AllgSchulabschluss


Bei Vars wie Einkommen, die oft sehr schief verteilt sind, kann man auch darüber nachdenken, die Var vorher zu logarithmieren, also etwa

Code: Alles auswählen
gen logincome = log(Nettoeinkommen)
reg logincome...

Re: Multiple lineare Regression welcher Befehl

BeitragVerfasst: Sa 19. Mär 2022, 11:06
von AnneliG.
Hallo,
Vielen vielen Dank für die gute Rückmeldung.
Dann werde ich lieber den einfachsten Code nehmen :D
Danke für den zusätzlichen Tipp :)