Seite 1 von 1

Kategoriale Variable als UV in Regression

BeitragVerfasst: Do 30. Jan 2020, 11:24
von Maren_Stata
Hallo zusammen,

ich rechne gerade eine multiple lineare Regression, welche den Einfluss verschiedener Variablen auf die Nutzungsbereitschaft ("WTU", 7er-Likert) untersucht (n=150).

Um für den Effekt des Familienstands (kategorial: 4 Ausprägungen) und des Erhebungsortes (kategorial: 11 Ausprägungen) zu kontrollieren, habe ich folgenden Befehl in Stata verwendet:

regress WTU i.Location i.Familystatus (und noch weitere metrische Variablen, die ich hier nicht aufführe)

Im Regressionsoutput fehlt nun jeweils die erste Kategorie der beiden Variablen. D.h. beim Familienstand sehe ich nur 2, 3 und 4; beim Erhebungsort ebenfalls nur 2, 3, 4, etc.

Kann mir jemand sagen, warum das der Fall ist und ob es eine Möglichkeit gibt, auch die erste Kategorie zu berücksichtigen?

Vielen Dank und mit freundlichen Grüßen
M.

Re: Kategoriale Variable als UV in Regression

BeitragVerfasst: Do 30. Jan 2020, 13:10
von Staxa
Die erste Kategorie (d.h. die mit der niedrigsten numerischen Ausprägung) ist in Stata immer die Referenzkategorie. Wie du dich aus der Statistikvorlesung erinnern kannst, muss für Dummies (und es handelt sich ja hier um eine interne Dummykodierung) immer eine Referenz festgelegt werden. Hat nun Beispielsweise Kategorie 2 einen Wert von 5, so weißt du, dass Kategorie 2 im Vergleich zur Referenz 5 Punkte mehr hat. Willst du nicht Effekte, sondern vorhergesagte Werte, kannst du margins oder predict nutzen. Etwa:
Code: Alles auswählen
reg a b c
margins, by(Location)


Für ein besseres Verständnis wirst du dich in der Stata Beschreibung einlesen müssen, ansonsten gibt das Buch in meiner Signatur einen schnellen Überblick.

Re: Kategoriale Variable als UV in Regression

BeitragVerfasst: Do 30. Jan 2020, 18:50
von Maren_Stata
Hallo Staxa,

vielen Dank für Deine Antwort!

Wie du dich aus der Statistikvorlesung erinnern kannst, muss für Dummies (und es handelt sich ja hier um eine interne Dummykodierung) immer eine Referenz festgelegt werden.


Du hast recht, so langsam dämmert es...:)

Ich habe mich nun weiter eingelesen und noch eine Frage zur Interpretation meiner Ergebnisse, wenn ich Location 1 als Referenzkategorie wähle:

Wenn ich untersuchen möchte, ob der Erhebungsort einen Einfluss auf die AV (in diesem Fall "WTU" hat, dann würde ich es wie unten genannt in meinen Regressionsbefehl aufnehmen (regress WTU PN PEOU SNc i.Location).

Wie interpretiere ich dann den folgenden Output?

Location:
1 (base)
2 p = 0.277
3 p = 0.093
4 p = 0.778

In diesem Fall würde ich sagen, dass der Erhebungsort keinen signifikaten Einfluss auf die WTU hat (auf einem 5% Signifikanzniveau).

Wie wäre es zu interpretieren, wenn eine der Locations einen p-Wert <.05 aufzeigen würde?

Vielen Dank und freundliche Grüße
M.

Re: Kategoriale Variable als UV in Regression

BeitragVerfasst: Do 30. Jan 2020, 23:02
von Maren_Stata
Hallo Staxa,

Wie interpretiere ich dann den folgenden Output?


Eine Antwort auf diese Frage habe ich bereits gefunden.

Mir stellt sich nun die Frage, ob es die Möglichkeit gibt, die "Location" als eine Variable in die Regression mit aufzunehmen?

Mit freundlichen Grüßen
M.

Re: Kategoriale Variable als UV in Regression

BeitragVerfasst: Fr 31. Jan 2020, 09:28
von Staxa
Das ist mir unklar, es handelt sich doch bereits um eine Variable? Eben mit 4 Kategorien / Stufen.

Re: Kategoriale Variable als UV in Regression

BeitragVerfasst: So 2. Feb 2020, 15:54
von Maren_Stata
Hallo Staxa,

du hast recht!

Vielen Dank für deine Hilfe in dem obigen Kommentar, ich habe das Vorgehen und verstanden :)

MfG
M.