Regressionsmodell mit binärer unabhängiger Variable

Allgemeine Fragen rund um Statistik mit Stata.

Regressionsmodell mit binärer unabhängiger Variable

Beitragvon epicbenz » Mo 3. Mai 2021, 14:18

Hallo zusammen,

ich wollte eine Regressionsanalyse durchführen, um den Effekt eines Jahres auf eine metrische abhängige Variable zu überprüfen.
Ich habe das so gemacht, dass ich das Jahr als Dummy-Variable mit einer 1 codiert habe und damit dann doch den durchschnittlichen Effekt des Jahres verglichen mit den anderen Jahren, für die die Dummy-Variable gleich Null ist, bekomme. Dabei habe ich aber eben nur eine bzw. zwei Dummy-Variablen als unabhängige Variablen in meinem Modell, und dadurch gestalten sich die Testungen der Modellannahmen als schwierig.

Ich habe für die Annahme der korrekten Modellspezifizierung den Ramsey-Test (estat ovtest) verwendet, der funktioniert aber nicht, wenn man keine weiteren metrischen unabhängigen Variablen verwendet.

Auch der Test auf Heteroskedastizität (estat hettest) liefert mir keine guten Ergebnisse und macht bei einer Dummy-Variable doch nur begrenzt Sinn, oder?

Bei dem Test auf Autokorrelation (estat dwatson) sieht es plausibler aus, da ich in meinen Daten eine gewisse Autokorrelation erwartet hatte.

Die "wichtigste" Annahme der Normalverteilung der Residuen (qnorm residuals) zeigt eine halbwegs gute Normalverteilung. Da wäre meine Frage, ob man da bei weit über 30 Beobachtungswerten nicht über den Grenzwertsatz eine Normalverteilung annehmen kann?

Muss man bei Dummy-Variablen die Tests anpassen oder andere Verwenden?
epicbenz
 
Beiträge: 3
Registriert: So 14. Mär 2021, 14:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell mit binärer unabhängiger Variable

Beitragvon Staxa » Mi 5. Mai 2021, 08:20

Ich denke eine solche Parametrisierung ist dann sinnvoll, wenn du a.) wenige Zeitpunkte hast, also wenige Jahre und b.) du davon ausgehst, dass es keine linearen oder quadratischen Effekten gibt, also die Jahre sich die Mittelwerte sehr stark unterscheiden. Ich würde hier mit einer Deskription anfangen und mir den reinen Zeitverlauf ansehen. Ist dieser etwa linear ist eine solche Parametrisierung wie du sie hast wohl nicht notwendig. Wie genau sehen deine Befehle aus?
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell mit binärer unabhängiger Variable

Beitragvon epicbenz » Do 6. Mai 2021, 18:49

Also ich habe als Zeitraum 2005-2020 in Monatsdaten vorliegen. Sprich für jedes Land habe ich 192 Beobachtungen bei 8 Ländern in dem Datensatz. Was meinst du genau mit:
Staxa hat geschrieben: Wie genau sehen deine Befehle aus?


Also ich habe sowohl Daten wie das GDP oder die Arbeitslosenquote für jedes Land und jeden Beobachtungszeitpunkt vorliegen. Ich habe mich für die Testverfahren an den BLUE-Annahmen orientiert, aber ich verstehe nicht ganz, wie ich auf z.B. auf Homoskedastizität testen soll, wenn ich nur eine Dummy-Variable verwende. Der Ramsey-Test macht so ja auch keinen Sinn.
epicbenz
 
Beiträge: 3
Registriert: So 14. Mär 2021, 14:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell mit binärer unabhängiger Variable

Beitragvon Staxa » Fr 7. Mai 2021, 08:13

Also mit Befehlen meine ich deinen bisherigen Stata Code.

Und ja, logistische Regressionen haben eine andere bzw. kaum eine Diagnostik. Die üblichen Tests wie man sie von OLS kennt greifen hier nicht.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell mit binärer unabhängiger Variable

Beitragvon epicbenz » Mo 10. Mai 2021, 13:58

Staxa hat geschrieben:Also mit Befehlen meine ich deinen bisherigen Stata Code.

Und ja, logistische Regressionen haben eine andere bzw. kaum eine Diagnostik. Die üblichen Tests wie man sie von OLS kennt greifen hier nicht.



Also bisher sieht mein Code so aus, dass ich erstmal nur die Excel Liste einlese, Variablen umbenenne, die beiden Dummy-Variablen anlege.
Ich habe beispielsweise als abhängige Variable "Die Wachstumsrate des GDP" und als unabhängige Variable ein Jahr als Dummy-Variable. Im Grunde kann ich dann doch aber nur Aussagen darüber treffen, ob das Jahr einen signifikanten Effekt auf die abhängige Variable hat? Oder sollte ich dennoch robuste Standardfehler verwenden (obwohl ich ja nicht wirklich auf Heteroskedastizität testen kann). Und auch eine Normalverteilung der Residuen habe ich damit ja nicht, da kann man doch aber mit dem zentralen Grenzwertsatz (über 100 Beobachtungen) argumentieren.

Edit: Und handelt es sich bei einer logistischen Regression nicht um den Fall, dass die abhängige Variable nominal oder kategorisch ist? Weil bei meinem Fall ist die abhängige Variable ja dennoch metrisch.

Edit2: Und wenn ich z.B. das Jahr 2020 also Dummy-Variable wähle, dann ist die Interpretation doch so richtig oder: Im Jahr 2020 lag die Wachstumsrate des GDPs durchschnittlich um beta1 höher/niedriger als bei der Referenzgruppe, was hier ja alle anderen Jahre im Datensatz sind (die bei der Dummy-Variable mit einer 0 codiert sind).
Zuletzt geändert von epicbenz am Mo 10. Mai 2021, 14:14, insgesamt 1-mal geändert.
epicbenz
 
Beiträge: 3
Registriert: So 14. Mär 2021, 14:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell mit binärer unabhängiger Variable

Beitragvon Staxa » Mo 10. Mai 2021, 14:03

Genau, wenn die Fallzahl OK ist (im Verhältnis zur Zahl der Prädiktoren) sollte es passen. In der Praxis kümmert die Diagnostik meistens niemand (auch in veröffentlichten Papers nicht). Wenn du eine Seminararbeit schreibst kläre mit deinem Dozenten ab, ob und welche Tests berichtet werden sollen.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron