Grundlegende Fragen

Allgemeine Fragen rund um Statistik mit Stata.

Grundlegende Fragen

Beitragvon NeuerUser » Mo 25. Feb 2013, 14:57

Guten Tag liebe Community,

Ich arbeite erst seit Kurzem im Rahmen einer Lehrveranstaltung mit dem Programm "Stata 11.2" (basierend auf Daten des ESS 2010) und habe einige grundlegende Fragen hierzu.

1.: Ich betrachte für meine Analyse neben der abhängigen Variable noch einige Individual-Merkmale (beispielsweise das Alter oder der Bildungsabschluss) sowie Ländermerkmale (beispielsweise BIP, Arbeitslosigkeit). Diese möchte ich auf Zusammenhang prüfen. Soweit ich weiß geschieht dies für meine Individualmerkmale mit dem "regress"-Befehl und für meine Ländermerkmale mit dem "xtmixed"-Befehl. Liege ich mit dieser Trennung (Individualmerkmale = regress || Ländermerkmale = xtmixed) richtig? Daran anknüpfend, Frage 2...
2.: Kann ich den Zusammenhang meiner unabhängigen Variablen mit den Ländervariablen auch über den "regress"-Befehl untersuchen, oder handelt es sich dabei um einen methodischen Fehler?
3.: Wie kann ich die Multilevel-Daten, die ich mithilfe des "xtmixed"-Befehles erhalte, sinnvoll interpretieren? Angenommen, folgender Befehl liegt vor:

"xtmixed imsclbn agea edulvla BIP || cntry:, var mle"

(imsclbn = "Wann sollten Migraten Zugang zu Sozialleistungen erhalten" , agea = Alter , edulvla = Bildungsabschluss , cntry = Country/Länder)
(imsclbn = abhängige Variable ; agea, edulvla = unabhängige (individual-)Variablen ; BIP = Ländervariable)

Wie kann ich diesen interpretieren? Die Bedeutung der einzelnen Werte bzw. die Interpretation einer Regression ist mit bekannt - ich verstehe jedoch nicht den exakten Verwendungsgrund des "xtmixed"-Befehls bzw. worin der Unterschied zwischen "xtmixed" und "regress" in Hinblick auf die Interpretation liegt...

4.: Kann man beim "xtmixed"-Befehl auch mehrere "Level 2 - Variablen" (was nach meinem Verständnis Ländervariablen wie BIP oder Arbeitslosenquote sind) einfügen? Also beispielsweise hinter den oben geschriebenen Beispielbefehl hinter dem "BIP" noch ein "Arbeitslosenquote" schreiben? Oder muss man, wenn man z.B. drei Ländervariablen untersuchen möchte, den "xtmixed"-Befehl drei Mal eingeben?


Ich habe bereits mehrere Stunden versucht, mir diese Frage mithilfe des Internets zu beantworten, jedoch bislang erfolglos, da die auffindbaren Erklärungen zu ungenau bzw. nicht exakt zugeschnitten auf diese Fragen waren.
Vorab vielen Dank für jeden hilfreichen Beitrag !
NeuerUser
 
Beiträge: 2
Registriert: Mo 25. Feb 2013, 14:32
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Grundlegende Fragen

Beitragvon daniel » Mo 25. Feb 2013, 16:31

1.: Ich betrachte für meine Analyse neben der abhängigen Variable noch einige Individual-Merkmale (beispielsweise das Alter oder der Bildungsabschluss) sowie Ländermerkmale (beispielsweise BIP, Arbeitslosigkeit). Diese möchte ich auf Zusammenhang prüfen. Soweit ich weiß geschieht dies für meine Individualmerkmale mit dem "regress"-Befehl und für meine Ländermerkmale mit dem "xtmixed"-Befehl. Liege ich mit dieser Trennung (Individualmerkmale = regress || Ländermerkmale = xtmixed) richtig? Daran anknüpfend, Frage 2...
2.: Kann ich den Zusammenhang meiner unabhängigen Variablen mit den Ländervariablen auch über den "regress"-Befehl untersuchen, oder handelt es sich dabei um einen methodischen Fehler?


Die Standardfehler Deiner linearen Regression sind vermutlich verzerrt, wenn Du mit -regress- arbeitest. Ob Du ein Multi-Level Modell brauchst, hängt unter anderem von der Frage ab, ob Dich die Varianzzerlegung auf den einzelnene Ebenen substantiell interessiert. Ist das nicht der Fall, kannst Du auch die Standradfehler des gepoolten Modells korrigieren, bsp. -vce(cluster cntry)-.

Code: Alles auswählen
xtmixed imsclbn agea edulvla BIP || cntry:, var mle"



Du willst <BIP> vermutlich hinter <cntry> schreiben? Ich schätze, Du möchtest für diese Landesvariable einen Random slope nach Land.

Wie kann ich diesen interpretieren? Die Bedeutung der einzelnen Werte bzw. die Interpretation einer Regression ist mit bekannt - ich verstehe jedoch nicht den exakten Verwendungsgrund des "xtmixed"-Befehls bzw. worin der Unterschied zwischen "xtmixed" und "regress" in Hinblick auf die Interpretation liegt...

Die Interpretation ist die selbe. Mit -xtmixed- bekommst Du eine Schätzung der Varianzen auf den einzelnen Leveln.

Kann man beim "xtmixed"-Befehl auch mehrere "Level 2 - Variablen" (was nach meinem Verständnis Ländervariablen wie BIP oder Arbeitslosenquote sind) einfügen? Also beispielsweise hinter den oben geschriebenen Beispielbefehl hinter dem "BIP" noch ein "Arbeitslosenquote" schreiben? Oder muss man, wenn man z.B. drei Ländervariablen untersuchen möchte, den "xtmixed"-Befehl drei Mal eingeben?

Drei einzelne befehle würden drei unabhängige Modelle schätzen. Das willst Du ziemlich sicher nicht. Du kannst sinnvoller Weise nur soviele Level 2 Variablne zufügen, wie Du Länder hast.

Ich rate Dir Dich zumindest ein wenig in Multi-Level Modellierungen einzulesen, bevor Du wild Befehle tippst, von denen Du, wie Du selbst sagst, nicht wirklich verstehst, was sie tun. Multi-Level modelling ist gerade kürzlich auf dem Stata blog vorgestellt worden (http://blog.stata.com/2013/02/04/multil ... -variance/). Auch das manual (pdf link im help file zu -xtmixed-) sollte einen guten Einstieg bieten.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Grundlegende Fragen

Beitragvon NeuerUser » Mo 25. Feb 2013, 19:21

Vielen Dank für die schnelle Antwort!

Das hat mir bereits sehr geholfen und nahezu alle offenen Fragen beantwortet. Super!

EIne Frage fällt mir nun jedoch noch ein....ich habe oft gelesen, dass in Forschungsberichten im Rahmen einer Multilevel-Analyse erwähnt wurde, dass die erklärte Varianz bei den Individuellen Variablen höher oder niedriger sei als bei den Ländervariablen. "Erklärende Varianz" ist soweit ich weiß Adj.R^2 (R-Square). Bei einer Regression wird das R-Quadrat bzw. Adj.R-Quadrat direkt angezeigt. Doch wie ermittle ich es bei der Multilevel-Analyse (über den "xtmixed"-Befehl), um damit Aussagen treffen zu können wie "Die erklärende Varianz der Ländervarablen ist höher/niedriger als bei den individuellen Variablen" ?
NeuerUser
 
Beiträge: 2
Registriert: Mo 25. Feb 2013, 14:32
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Grundlegende Fragen

Beitragvon daniel » Mo 25. Feb 2013, 22:52

Da R-Quadradt der Anteil erklärter Varianz ist, kann das adjustierte R-Quadrat nicht der Anteil der erklärten Varianz sein.

Bitte lies zu Deiner Frage die empfohlenen Quellen. Die Varianzlerlegung auf die einzelnen Level wird dort beschrieben und wird nicht an R-Quadrat abgelesen. Du bekommst direkte Schätzer der Varianzen auf den einzelnen Leveln. Schau auch mal bei -xtreg- rein.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste