Hallo zusammen,
ich stoße bei meinen Regressionsanalysen mal wieder auf Probleme, die ich mir nicht ganz erklären kann.
Es geht um Preiskonvergenz durch Einführung des Euros. Ich habe Preisinformationen zu 120 Produkten in 8 Ländern in den Jahren 1998, 2001 und 2009.
Ich habe nun als abhängige Variable die logarithmierten Preisdifferenzen vom Mittelwert der 8 Länder. Als unabhängige Variable nehme ich zunächst nur 7 Länderdummies rein.
In weiteren Modellen möchte ich aber auch für VAT, Labor Costs und Income per Capita kontrollieren (pro Land, also aggregiert). Pro zusätzlicher Variable, die ich davon mit reinnehme, fliegt immer ein weiteres Land raus aufgrund von "collinearity". Ich vermute, das hat irgendetwas damit zu tun, dass es Länder-Dummies sind und pro zusätzlich geschätztem Parameter ein Land redundant wird? Ich weiß es aber nicht richtig, woran es liegt und ob ich es vllt. verhindern kann und kann mir nicht ganz einen Reim draus machen.
Ein weiteres Problem ist, dass wenn ich die Standardfehler über die 8 Länder cluster, die Standardfehler komischerweise kleiner werden und alles nun signifikant auf dem 0.1 %-Level wird (ohne cluster ist kaum etwas signifikant) und die Modell-F-Statistik nicht erscheint, da es 0 Frieheitsgerade sind. Habe ein bisschen gegoogelt und gefunden, dass es daran liegen könnte, dass die intraclass-correlations negativ sind. Ich bin mir nun nicht sicher, ob ich die SE clustern sollte, da ich ja nur 8 cluster habe aber andererseits eben aggregierte Variablen mit reinnehme.
Ich freue mich, wenn ihr mir helfen könntet und vielleicht einen Tipp habt, was ich falsch mache oder verändern könnte!
Vielen Dank schon einmal
Pinsi1