Seite 1 von 1

Marginal effects für Interaction terms

BeitragVerfasst: Mi 14. Jul 2021, 21:26
von Peppemori
Hallo,


ich habe eine probit regression inklusive Interaction Term durchgeführt. Analog einem Paper folgend, das behauptet auch den marginal effect für die interaction terms berechnet zu haben. Allerdrings ohen genau darauf einzugehen, was und wie genau sie zur Berechnung getan haben.

Nun habe ich mich bereits viel in Foren durchgelesen und die Diskussion zwischen es gibt keine marginal effects für Interaction terms verfolgt. Demanch wenn ich die %*Average marginal effect durch das Kommand Margins, dydx(*) berechne , kommt logischerweise kein Ergebnis für den Interaction Term heraus.
Dies hat mich leider nicht wirklich bei dem konkreten Problem weiter gebracht.

Mein model sieht momentan folgend aus

probit y i.x1##c.x2 x3 x4 x5

x1 entweder 0 (Gruppe A) oder 1 (Gruppe B)
x2 continious (Angabe zwischen -50 und 200, IAus Berechnung für einen Glücklickeitsfaktor, höhere Werte = glücklicher)


Da die Interpretation des signifikanten Interaktion terms für mich wichtig ist, habe ich weitergelesen und folgendes gefunden:
margins, dydx(x1) at (x2=1), welchen die Margin von x1 als fixen Level für x2 geben soll.
Wäre dies ein richtiger Ansatz um den marginal effect für den Interaction term zu beschreiben ? Bz. was wäre die richtige Interpretation dieses Wertes ?
Wenn ich zudem für die anderen Variablen Margins, dydx(*) durchlaufen lasse, also auch für x1 und x2 getrennt, iwe interpretiere ich diese dann in Relation zu dem Ergebnis das bei margins, dydx(x1) at (x2=1) raus kommt ?

Gibt es sonst andere /besser Möglichkeiten damit ich die Koeffizienten/ Effekt des Interaction terms sinnvoll und gut interpretieren kann ?


Ich freue mich über jegliche hilfreichen Hinweise.
Liebe Grüße

Re: Marginal effects für Interaction terms

BeitragVerfasst: Do 15. Jul 2021, 08:16
von Staxa
Hier ein einfaches Beispiel: hängt die Wahrscheinlichkeit, Mitglied einer Gewerkschaft zu sein sowohl vom Bildungslevel (Bildungsjahre) als auch dem Wohnort ab (South vs nicht-south)? Interagieren beide Terme, also hat die Bildung je nach Wohnort einen unterschiedlichen Effekt?

Code: Alles auswählen
sysuse nlsw88, clear
probit union c.grade##i.south age
margins, dydx(grade) by(south)


Das hier ist ein gangbarer Weg. Dort siehst du die Effekte von Bildung, je nach Wohnort getrennt. Du siehst, der Effekt von Bildung ist im nicht-south etwas stärker als im south. Ob sich diese beiden nun signifikant voneinander unterscheiden entnimmst du dem Hauptmodell.

Re: Marginal effects für Interaction terms

BeitragVerfasst: Fr 16. Jul 2021, 21:53
von Peppemori
Hallo, lieben Dank für die Antwort !

Wäre die Interpretation dann gegeben man wohnt nicht im Süden, steigt die Wahrscheinlichkeit für Union um 2% pro zusätzliches Schuljahr ? Und analog für South um 0.5% pro zus. Schuljahr ?
Der margin aus margins, dydx(*) für grade beträgt 0.0139 und South -0.125. Demnach ein zusätzliches Schuljahr erhöht Wahrscheinlichkeit Union um 1.39% und im Süden zu leben reduziert die Wahrscheinlichkeit um 12.5%.
Bisher so korrekt?


Lassen sich nun die Zahlen aus margins, dydx(grade) by(south) und margins, dydx(*) inhaltlich zusammen interpretieren in einem Satz ? Im Sinne von aufrechnen der Effekte ?
Mir geht es vorallem um Interpretationsmöglichkeiten.



margins, dydx(*)
Expression : Pr(union), predict()
dy/dx w.r.t. : grade 1.south age

------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grade | .0139156 .0038597 3.61 0.000 .0063507 .0214805
1.south | -.1246051 .0192773 -6.46 0.000 -.162388 -.0868222
age | .0018422 .0032337 0.57 0.569 -.0044958 .0081802
------------------------------------------------------------------------------


. margins, dydx(grade) by(south)

Average marginal effects Number of obs = 1,876
Model VCE : OIM

Expression : Pr(union), predict()
dy/dx w.r.t. : grade
over : south

------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grade |
south |
0 | .0203655 .0057054 3.57 0.000 .009183 .0315479
1 | .0052027 .004783 1.09 0.277 -.0041719 .0145773
------------------------------------------------------------------------------



Liebe Grüße

Re: Marginal effects für Interaction terms

BeitragVerfasst: Sa 17. Jul 2021, 11:28
von Staxa
Fast, also du musst aufpassen, dydx bedeutet immer Änderung in Prozentpunkten bei Logit/Probit Modellen. Also nehmen wir den Wert von South, -0.1246. Das heißt, dass Personen, die im Süden wohnen, eine um 12,46 Prozentpunkte geringere Wahrscheinlichkeit haben, Mitglied einer Gewerkschaft zu sein als Leute, die im Norden wohnen.

Für die anderen Werte bedeutet es: die Wahrscheinlichkeit, Mitglied einer Gewerkschaft zu sein, steigt mit jedem Bildungsjahr um 2,04 Prozentpunkte an, für Personen, die nicht im Süden wohnen. Für solche, die im Süden wohnen steigt die Wahrscheinlichkeit um 0,52 Prozentpunkte an pro Bildungsjahr, sie ist also kleiner. Für mehr Infos zu solchen Modellen und deren Interpretation siehe den Link in meiner Signatur.

Re: Marginal effects für Interaction terms

BeitragVerfasst: Mi 9. Feb 2022, 14:08
von chisquarex
Hallo,

Ich stoße mich momentan an einer ähnlich Frage und schließe mich daher hier an, vielleicht kann mir jemand von euch helfen.

Ich rechne ebenfalls ein logit Modelle, wobei sich mein 'letztes' Modell von dem vorangehenden nur um die Aufnahme von Interaktionstermen unterscheidet. Erst durch die Hinzunahme dieser Interaktionsterme wird eine Variable signifikant [es handelt sich um eine dichotome Variable, die ebenso jeweils ein Teil meiner Interaktionsterme ist], ebenso wie einer dieser Interaktionsterme. Nun ist mir klar, dass man hier bei der Interpretation sehr vorsichtig sein muss, da die Signifikanz des Prädikators (wie beschrieben dichotom) konditional zur Interaktion entsteht - dennoch halte ich dieses Ergebnis für interessant und relevant, weshalb ich es gerne tabellarisch berichten würde. In einem nächsten Schritt schaue ich mir diese Interaktion mit dem margins Befehl genauer und & mit marginsplot erkennt man sehr deutlich subgruppenspezifische Effekte auf das Outcome. Nun Frage ich mich, was für Koeffizienten ich in der Regressionstabelle berichten soll? Wie Peppemori schon beschrieben hat, werden für margins, dydx(*) keine AMEs für Interaktionsterme berichtet ( da es solche technisch gesehen nicht gibt).
Allerdings wird ja in der Literatur für hierarchisch aufgebaute Regressionsmodelle empfohlen, auf AMEs zurückzugreifen, da man logits oder odds ratio nicht zwischen Modellen vergleichen kann. Gibt es da eine andere Lösung, dass ich zB eine Regressionstabelle mit den Koeffizienten meiner Modell & den Signfikanzen berichte mit AMEs berechne, und trotzdem auch für das 'letzte' Modell (das eben nur um Interaktionsterme erweitert ist) auch AMEs einfüge, die sich ggf. manuell errechnen lassen oder ähnliches? Ich habe auch von dem inteff-Befehl gelesen, allerdings scheint das bei mir technisch nicht hinzuhauen (und in die Berichte aus dem statslist-Forum scheinen mWn auch margins deutlich zu bevorzugen). Ich hoffe, meine Unklarheit ist verständlich ausgedrückt & ich freue mich, falls mir wer helfen kann!
Viele Grüße

Re: Marginal effects für Interaction terms

BeitragVerfasst: Mi 9. Feb 2022, 14:17
von Staxa
Letztlich bedeutet eine Interaktion ja nur, dass der Effekt, den X auf Y ausübt, in 2 Gruppen unterschiedlich ist. Da könntest du 2 Tabellen mit AMEs ausgeben, einmal für A und einmal für B, etwa


Code: Alles auswählen
margins, dydx(*) by(groupvar)

Re: Marginal effects für Interaction terms

BeitragVerfasst: Mi 9. Feb 2022, 14:43
von chisquarex
Viele Dank für die Antwort! Das wäre eine Option, mit margins, dydx(*) by(groupvar) habe ich auch gerechnet & basierend darauf profile plots erstellt, um den Konditionalen Effekt darzustellen.
Aber was bedeutet es konkret, dass diese dichotome Gruppenvariable erst in dem Modell mit den Interaktionstermen signfikant wird? Hat das eine spezifische statistische Bedeutung für den Zusammenhang dieser Gruppenvariable auf das Outcome, oder ist das nur rechnerisch über die Interaktionsterme erklärbar & quasi ein "Artefakt"?
Ich würde mich gerne bei den Tabellen mit Koeffizienten knapp halten & einfach eine Tabelle mit den Koeffizienten aller Modelle berichten, aus der ersichtlich hervorgeht, dass meine Gruppenvariable in dem Modell mit den Interaktionstermen signifikant ist - im Prinzip in der Art so, wie es auch klassischerweise in Joournals publiziert wird: https://fintechprofessor.com/creating-a ... -in-stata/

Auf die spezifische Interaktion & den hetereogenen Effekt für die Subgruppen würde ich dann wie beschrieben graphisch genauer eingehen (& die zugehörigen vorhergesagten Wahrscheinlichkeiten mit AMEs ausgeben). Daher nochmal die Frage, ob ich so eine Darstellung ausschließlich mit logits oder odds ratio machen kann (wodurch die Modell zwischeneinander allerdings inhaltlich nicht vergleichbar sind), oder ob ich das irgendwie trotzdem mit AMEs in Koeffizientenform darstellen kann, inklusive der Interaktionsterme? (Wie beschrieben, mit margins,dydx(*) fallen die Interaktionsterme raus & d.h. wird die tabellarische Darstellung meines letzten Modells im Prinzip obsolet, zusätzlich fällt auch bei der beschriebene Gruppenvariable damit die Signifikanz weg, was mich etwas verunsichert).

Re: Marginal effects für Interaction terms

BeitragVerfasst: Do 10. Feb 2022, 08:59
von Staxa
Du solltest dir klar machen, was genau eine Interaktion besagt. Ohne diesen Term hast du nur den Haupteffekt, also den Durchschnittseffekt des Treatments über alle Subgruppen hinweg. Ist der in A positiv, in B negativ, so hast du im Mittel einen Nulleffekt und keine Signifikanz. Mit dem Interaktionseffekt ist der Haupteffekt dann nur der Effekt für Gruppe A (0 kodiert), und dann kann er natürlich plötzlich signifikant werden.
Und zu der anderen Frage: was genau ist dein Hauptziel? Möchtest du verschachtelte Modelle vergleichen? Dann ist eine Darstellung mit AMEs, egal welche, wahrscheinlich besser. OR oder Logits sind aber nicht zwangsläufig falsch, es kann aber sein. Hier würde ich auch schauen, was die Gutachter sagen und das abwägen. Man kann auch im Haupttext die OR berichten und als Robustheitscheck dann die AMEs im Appendix. Möchtest du sowieso vor allem innerhalb eines Modells vergleichen, etwa, wann dein Interaktionsterm signifikant wird, dann kannst du natürlich OR oder Logits benutzen. Und wenn es dir ganz speziell um grafische Abbildungsformen geht würde ich mir in der Literatur Vorlagen suchen, dazu speziell kann ich dir leider keinen Rat geben.