Hallo,
ich habe eine "Anfänger"-Frage:
Ich rechne in meiner Arbeit eine multivariate lineare Regression (bzw. ist dies angedacht). Meine AV (Einsamkeit) ist eigentlich oridnal skaliert mit einer range von 1-4, in Absprache verwende ich sie quasi-metrisch. Als ich mein Modell auf Verstöße (Heteroskedastizität, Multikollinearität etc.) getestet habe, gab es sowohl mit dem White als auch den Breusch-Pagan Test eindeutige Hinweise auf Heteroskedastizität.
Ich habe mir sowohl die Verteilung der Variable als auch die der Residuen mit einem Histogramm und qnorm r anzeigen und den Schiefekoeffizienten ausgeben lassen - die Variable ist zwar linkssteil verteilt (viele Befragte sind nicht sehr einsam), die Residuen sind allerdings nahezu normalverteilt. Zuvor habe ich mir mit predict r, residuals und sfrancia r (meine Fallzahl liegt bei etwas über 4000) die Residuen schätzen lassen. Bei 5%iger Irrtumswahrscheinlichkeit liege ich mit einem p = 0.00001 weit darunter, was die Normalverteilungsannahme nicht unterstützt - trotz der grafischen nahezu Normalverteilung.
Ich habe bereits einige Studienautor:innen angefragt, die mit meinem Datensatz und der Variable entsprechend linear gearbeitet haben und habe bisher die Rückmeldung erhalten die Regression mit robusten Standardfehlern zu schätzen und nicht auf eine logistische Regression umzusatteln - meine Frage ist nun, da ich keine zitierfähige Quelle finde (Kohler & Kreuter 2017 und Breitenbach 2021 zeigen nur Lösungen für Heteroskedastizität auf aber keine weitere Erläuterung was diese Lösungen an der Koeffizienteninterpretation ggf. verändern):
Inwiefern würde sich eine Interpretation der Regressionskoeffizienten verändern, wenn ich die Variable "so lasse" (untransformiert) aber mit robusten Standardfehlern rechen? Kennt ihr eine zitterfähige Quelle?
Ich freue mich auf einen Austausch!
maller01


