Seite 1 von 1

Unterschiedliche Ergebnisse Regression und Korrelation

BeitragVerfasst: So 20. Nov 2022, 17:01
von Vanessa97
Hallo Zusammen,

im Rahmen einer Seminararbeit argumentieren wir, dass verschiedene Diversitätsfaktoren wie Alter, Geschlecht und Education einen positiven Effekt auf die Anzahl der CVC-Deals (Corporate Venture Capital) der Unternehmen hat. Die Anzahl der CVC-Deals ist dabei eine Count-Variable.Für unsere IVs haben wir Klassen gebildet und mittels des Blau Index jeweils für jede Variable den Grad der Diversität berechnet (Berechnung vergleichbar zu Herfindahl), welches in der Literatur eine gängige Methode ist, um Diversity zu messen.

1. Da eine Count-Variable als DV und Overdispersion vorliegen, haben wir in STATA die Negative Binomiale Regression verwendet. Unser Problem ist nun das folgende:
In der Regression kam raus, dass Alter (p=0.00) und Geschlecht (p= 0.001) einen signifikanten Einfluss auf die Anzahl der CVC Deals haben. Die Education (p=0.65) hat keinen signifikanten Einfluss.
Mithilfe einer Korrelation nach Spearman kam jedoch heraus, dass Alter (p=0.015) und Education (p= 0.003) einen signifikanten Einfluss haben und Geschlecht (p=0.54) nicht. Wie kann das sein, dass in der Korrelation etwas nicht signifikant ist und dann in der Regression schon und auch umgekehrt. Haben wir etwas falsch gemacht? Oder sagt bei Count Variablen die Korrelation überhaupt nicht aus.
Bzw. dürfen wir überhaupt ein korrelationskoeffizient wie Spearman oder Kendall’s Tau bei Count Variablen verwenden?
Wir sind sehr irritiert über die gegensätzlichen Ergebnisse und können uns diese nicht erklären.

2. Zudem haben wir in unserer Count Variable eine hohe Anzahl an Nullen, d.h. die Unternehmen haben in dem Jahr kein CVC Deal abgeschlossen. Müssten wir daraufhin die Zero-Inflated Negativ Binomial Regression oder ein Tobit Regression Model anwenden?

Wir sind dankbar jeden Input und jede Hilfe.
LG Vanessa

Re: Unterschiedliche Ergebnisse Regression und Korrelation

BeitragVerfasst: Mo 21. Nov 2022, 10:10
von Staxa
Zu Frage 1 muss klar sein, dass eine Regression ein multivariates Verfahren ist, die Effekte also immer unter Kontrolle aller anderen Variablen im Modell interpretiert werden. Das ist ein wesentlicher Unterschied zu Korrelationen und kann wesentliche Unterschiede durchaus erklären. Auch Fallzahlen und damit genutze Samples können in Regressionen mitunter erheblich von bivariaten Analysen abweichen.

Zu 2: auf diese Frage gibt es keine eindeutigen Antworten, es sind Ermessensfragen. Hier müsste man sich ganz konkret die Verteilungen ansehen und abwägen bzw. ausprobieren. In der Literatur finden sich ggf. auch Hinweise, ab wann welche Methode zu bevorzugen ist.

Re: Unterschiedliche Ergebnisse Regression und Korrelation

BeitragVerfasst: Mo 21. Nov 2022, 14:49
von Vanessa97
Erst einmal vielen Dank für die schnelle Rückmeldung.

Ich hätte noch eine weitere Frage zum Verständnis. Verstehe ich es richtig, dass Spearman lineare Zusammenhänge sucht und die Negativ-Binomiale Verteilung auf Wahrscheinlichkeitsverteilungen aufbaut. Aus diesem Grund kann es durchaus sein, dass sich die Signifikanzen bei unseren Ergebnissen zwischen Korrelation und Regression unterscheiden?

Besten Dank!

Re: Unterschiedliche Ergebnisse Regression und Korrelation

BeitragVerfasst: Mo 21. Nov 2022, 19:03
von Staxa
Das ist auch ein Grund ja. Hat aber mit den Kontrollvariablen nichts zu tun.