Seite 1 von 2

Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Mi 30. Jun 2021, 11:49
von evagenau
Hallo, ich brauche dringend Hilfe für eine Regression für eine Datenauswertung in meiner Hausarbeit.

Gemessen werden soll der Einfluss von Kontakthäufigkeit (drei Ausprägungen: Seltener, Gleichbleibend, Häuftiger) auf die Lebenszufriedenheit, die Einsamkeit und die depressiven Sympotome einer Person (alle drei mit unterschiedlichen Skalen gemessen, z.B. mit Werten von 0-30).

Da die erstellten Scatterplots wegen der wenigeren Ausprägungen der unabhängigen Variable (Kontakthäufigkeit) nur in drei Linien verteilt sind, frage ich mich, ob ich die Regression einfach durchführen kann, oder ob ich auf etwas bestimmtes achten muss?

Sonst hätte ich eine ganz normale Regression (reg Var1 Var2 ...) durchgeführt.

Für Tipps und Hilfen wäre ich sehr dankbar.

Liebe Grüße

Eva

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Mi 30. Jun 2021, 12:50
von Staxa
Solange deine AV halbwegs ordentlich verteilt ist sollte das kein Problem darstellen. Also etwa:

Code: Alles auswählen
reg zufriedenheit i.kontakt

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Do 1. Jul 2021, 14:18
von evagenau
Vielen Dank für die schnelle Hilfe, die Variablen sind meistens etwas links- oder rechtsschiefverteilt bei z.b. Lebenszufriedenheitswerten. Aber ich schätze das sollte ja kein Problem darstellen.

Danke!!

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Do 15. Jul 2021, 17:12
von evagenau
Hallo nochmal zu dem, bzw. einem verwandten Thema. Ich habe eine Variable, die die Corona -Infektion beschreibt. Diese ist mit drei Ausprägungen verteilt (Ja, Nein, Weiß nicht). Wenn ich diese jetzt als unabhängige Variable auf den Einfluss auf zb. die Lebenszufriedenheit untersuchen möchte, klappt das nicht einfach so oder?

Man kann ja den Beta-Koeefizienten dann schlecht interpretieren, hab ich recht? Normalerweise heißt es ja, wenn VarX (unabhängig) um eine Einheit steigt, steigt VarY (abhängig um ...). Hier lässt sich das ja nicht so verallgemeinern, da es sich um keine normale Skala handelt.

Für Hilfe wäre ich sehr dankbar! Viele Grüße!!

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Fr 16. Jul 2021, 09:18
von Staxa
Solange deine AV metrisch ist sollte das kein Problem sein. Die Regression ist dann etwa so:


Code: Alles auswählen
reg zufriedenheit i.corona_status


Wichtig ist hier, wie die Corona-Var kodiert ist. Stata setzt dann eine Referenzkategorie, diese hat dann den niedrigsten numerischen Wert. Also z.B. wenn "kein Corona" den Code 0 hat und "Corona" den Wert 1, so wäre kein Corona die Referenz. Angezeigt wird dir dann der Effekt für alle anderen Kategorien. Ist dieser Koeffizient beispielsweise -5 für Corona, so heisst das, dass Leute die Corona haben eine um fünf Punkte geringere Zufriedenheit haben als Leute ohne Corona (also die Referenz). Mehr Infos sind z.B. im Buch in meiner Signatur gelistet.

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Do 29. Jul 2021, 08:28
von evagenau
Vielen Dank erstmal für die Hilfe. Problematisch ist hier für mich vor allem, wie ich mit der Kategorie "Weiß nicht" umgehen kann. Die Ausprägungen der Variable wurden wie folgt angeliefert:

lt | Freq. Percent Cum.
------------+-----------------------------------
1 | 8 0.21 0.21
2 | 3,709 95.22 95.43
8 | 178 4.57 100.00
------------+-----------------------------------
Total | 3,895 100.00

Wobei 1 = Infektion, 2 = Keine Infektion und 8 = Weiß nicht. Ich muss ja wahrscheinlich das Label bei der 8 erstmal zu einer 3 umkodieren, damit die Abstände gleich sind, richtig? Und danach kann die Regression mit der Lebenszufriedenheit erst interpretieren oder?

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Do 29. Jul 2021, 09:54
von Staxa
Nein, in diesem Falle ist das unerheblich. Im Prinzip tut deine Regression nur Mittelwerte nach diesen Kategorien getrennt berechnen. Das kannst du so einfach nachvollziehen:


Code: Alles auswählen
reg zufriedenheit i.corona_status
margins corona_status


Dafür ist es unerheblich, wie die erklärende Variable Status kodiert ist, solange du das Präfix i. benutzt. Da du aber offenbar nur 8 Leute mit einer Infektion hast wird das sowieso sehr unsicher sein, die Fallzahl ist ja extrem niedrig.

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Fr 30. Jul 2021, 09:51
von evagenau
-------------------------------------------------------------------------------
lz_alt | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------------+----------------------------------------------------------------
infektion_alt |
2 | .5728734 .2435663 2.35 0.019 .0953417 1.050405
8 | .4097458 .2487381 1.65 0.100 -.0779256 .8974171
|
_cons | 3.325 .2433006 13.67 0.000 2.847989 3.802011
-------------------------------------------------------------------------------

-------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. t P>|t| [95% Conf. Interval]
--------------+----------------------------------------------------------------
infektion_alt |
1 | 3.325 .2433006 13.67 0.000 2.847989 3.802011
2 | 3.897873 .0113749 342.67 0.000 3.875572 3.920175
8 | 3.734746 .0517251 72.20 0.000 3.633334 3.836157


Okay danke schon mal. Ich hab mal so eine Regression durchgeführt und folgende Ergebnisse bekommen (Ich hoffe man kann es lesen). Um das jetzt mal zu interpretieren, wäre der Einfluss insofern signifikant, dass mit keiner Infektion die Lebenszufriedenheit um 0.5728734 steigt? Oder habe ich das falsch verstanden?

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Fr 30. Jul 2021, 09:57
von Staxa
Ja, also Personen, die keine Infektion haben, haben eine um 0.57 Punkte höhere Lebenszufriedenheit als Personen mit Infektion (die mit Infektionen sind die Referenzkategorie).

Unten siehst du dann jeweils die Mittelwerte pro Gruppe (3.325 / 3.89 / 3.73).

Re: Regression mit mehreren polytomen kategorialen Variablen

BeitragVerfasst: Fr 30. Jul 2021, 10:08
von evagenau
Cool, danke das hat mir sehr geholfen! :) Aber du meintest es wäre eher eine unsichere Regression, weil die Verteilung so ungleich ist?