korrelationsanalyse

Pearson, Spearman und co., Korrelationsanalysen aller Art mit Stata.

korrelationsanalyse

Beitragvon mimi » Do 12. Jun 2014, 19:08

Hallo,

Kennt jemand den Unterschied zwischen der Korrelationsanalyse vor und nach Regressionsanalyse?

Bei Stata kann man nämlich vor der Regression eine Matrix mit dem Befehl correlate durchführen und nach der Regressionsanalyse die Korrelation mit dem Befehl estat vce, c durchführen. Und dabei kommen unterschiedliche Ergebnisse raus. Woran liegt das? Und welche Form der Korrelationsanalyse wäre besser?
mimi
 
Beiträge: 7
Registriert: Do 12. Jun 2014, 18:55
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon daniel » Do 12. Jun 2014, 23:02

Und dabei kommen unterschiedliche Ergebnisse raus. Woran liegt das?


-correlate- berechnet die Korrelation zwischen Variablen, -estat vce- zeigt die Kovarianzmatrix der geschätzen Koeffizienten. Das sind zwei völlig unterschiedliche Dinge.

Und welche Form der Korrelationsanalyse wäre besser?


Um welche Frage zu beantworten?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon mimi » So 15. Jun 2014, 16:32

Ob es sinnvoll ist, die Variablen überhaupt in einem Modell zu schätzen.

Und danke für die schnelle Antwort!
mimi
 
Beiträge: 7
Registriert: Do 12. Jun 2014, 18:55
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon daniel » So 15. Jun 2014, 21:12

Verstehe ich nicht. Wenn es um Kollinearität geht, empfehle ich Varianzinflationsfaktoren zu berechnen. Siehe: http://www.statistik-forum.de/regressionanalyse-f11/auswertung-regressionsanalyse-t4375.html
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon mimi » Di 17. Jun 2014, 15:10

Sorry, ich hatte einen Denkfehler. Deine Antwort hat mir aber sehr geholfen. Danke!

Aber ich hätte da noch drei weitere Fragen:

1. Kann ich den Befehl correlate <var1> <var2> ... <vari> so erweitern, dass Stata mir auch Signifikanzen mit ausgibt, wie beispielsweise bei dem Befehl pwcorr <var1> <var2>, sig obs star(0.01)?

2. Gibt es einen Richtwert für die mittlere quadratische Abweichung (RMSE)? Also bis zu welchem Wert kann ich sagen, dass die mittlere quadratische Abweichung niedrig ist und ich somit von einem geringen Bias und einer geringen Streuung ausgehe?

3. Gibt es Richtwerte für die F-Statistik des ANOVA-Blocks? Ich weiß nämlich nicht, was mir beispielsweise ein F-Wert von 16,6 sagen soll.
mimi
 
Beiträge: 7
Registriert: Do 12. Jun 2014, 18:55
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon daniel » Di 17. Jun 2014, 16:02

Welche Forschungsfrage(n) willst Du denn beantworten?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon mimi » Mi 18. Jun 2014, 08:36

Ich will untersuchen, ob Variablen wie die Krankenhausdichte, die Anzahl an Ärzten, die PKW-Dichte, das Einkommen etc. einen Einfluss auf die Operationshäufigkeit bei Tumoren beispielsweise haben und wie diese Häufigkeiten regional verteilt sind. Im ersten Schritt wollte ich gerne ein normales OLS-Modell schätzen und im zweiten Schritt muss ich dann noch eine Spatial Regression durchführen, um zu sehen ob es Spillover-Effekte gibt, die dafür verantwortlich sind, dass in einigen Regionen die Operationshäufigkeit höher ist als in anderen.
mimi
 
Beiträge: 7
Registriert: Do 12. Jun 2014, 18:55
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon daniel » Mi 18. Jun 2014, 10:43

Für keine dieser Fragen scheint mir ein Omnibus-Test wie F-Test (R-quadrat) oder RMSE geeignet. Alle Informationen zur Beantwortung dieser Fragen findest Du in den Regressionskoeffizienten und deren Standradfehlern.

Um

1. Kann ich den Befehl correlate <var1> <var2> ... <vari> so erweitern, dass Stata mir auch Signifikanzen mit ausgibt, wie beispielsweise bei dem Befehl pwcorr <var1> <var2>, sig obs star(0.01)?


noch zu beantworten. Du kannst Dir -corsp- (SSC) anschauen. In Stata tippst Du

Code: Alles auswählen
ssc inst corsp


Da werden p-Werte für Korrelationen ausgespuckt. Mir scheint das aber eher überflüssig zu sein, weil ich keine Verbindung zu den Forschungsfragen sehen kann.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon mimi » Mi 18. Jun 2014, 10:47

Dass ich das Hautpaugenmerkt auf die Koeffizienten und die Standardfehler lege ist schon klar, allerdings muss ich ja trotzdem auch die Güte der Schätzung berücksichtigen. Habe ich zumindest so gelernt. Da die Variablen aber sowieso fast alle relativ hoch untereinander korreliert sind, scheint mir die OLS-Schätzung ohnehin überflüssig.
mimi
 
Beiträge: 7
Registriert: Do 12. Jun 2014, 18:55
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: korrelationsanalyse

Beitragvon daniel » Mi 18. Jun 2014, 13:01

allerdings muss ich ja trotzdem auch die Güte der Schätzung berücksichtigen


Frag Dich mal warum Du die Güte berücksichtigen willst/musst. Was sind die Konsequenzen einer "schlechten" Güte? Was die Konsequenzen einer "guten" Güte? Was wwürdest Du in dem einen oder anderen Fall tun?

Ich will Dich nicht quälen, aber um zu verstehen und kritisch zu reflektieren was Du tusts (das ist das Ziel von Wissenschaft) solltest Du fürhzeitig lernen, die Dinge zu hinterfragen, die "man" mach, weil "man" sie so gelernt hat. Das heißt nicht, dass Du nicht R-quadrat berichten sollst, oder den F-Test, oder den RMSE oder sonstige Maße zum Model-Fit. Es heißt nur, dass Du mit Deinem Betreuer (oder Reviewern) klären musst, was genau die sehen wollen (nachvollziehbar begründen, wesshalb Sie das wollen, könne sie wohl nur in seltenen Fällen - aber wenn, kann man daraus vielleicht auch etwas lernen). Was mich angeht, kann und will ich Dir keine Dauenregeln für Omnibusmaße geben, weil ich nicht glaube, dass soetwas sinnvoll ist.

Da die Variablen aber sowieso fast alle relativ hoch untereinander korreliert sind, scheint mir die OLS-Schätzung ohnehin überflüssig.


Hier möchte ich aber entschieden widersprechen. Die Korrelation unter den Variablen ist gerade der Grund eine Regression zu schätzen. Wären die Variablen unkorreliert, wären die Regressionskoeffizienten identisch mit den Korrelationen und eine multivariate Analyse (also ein Analyse des Einflusses eines X unter Konstanthaltung aller weiteren X) wäre in der Tat überflüssig.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron