STATA Gewichtung

Allgemeine Fragen rund um Statistik mit Stata.

STATA Gewichtung

Beitragvon Mary966 » Mo 17. Feb 2020, 21:42

Ich hab ein Problem. Ich arbeite mit dem ALLBUS Datensatz und muss das darin verwendete Ost-West Gewicht für meine Analysen verwenden. Aktuell hab ich das Problem, dass ich nach der Anwendung des Gewichts mehr Fälle als vorher habe. Das kann ja eigentlich nicht richtig sein. Ich weiß gerade aber auch nicht wo mein Fehler liegt. Ich hab mit folgendem befehlt gearbeitet: tab eastwest [weight=round (Gewichtungsvariable *1000)]
Mary966
 
Beiträge: 6
Registriert: Fr 24. Jan 2020, 14:29
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon Staxa » Di 18. Feb 2020, 11:13

Doch, das kann stimmen. In deinem Fall benutzt du tab, der nur ganzzahlige Gewichte akzeptiert. Deshalb nimmst du ja auch die Variable zunächst mit 1000 Mal und rundest. Du interpretierst daher bei deinem Ergebnis am Ende nur die Prozente, nicht die absolute Anzahl. Ansonsten probier doch mal fre

Code: Alles auswählen
ssc install fre
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 254
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon Mary966 » Sa 22. Feb 2020, 22:03

Da bleibt das Problem. Ich hab jedoch festgestellt, dass ich erst nach Anwendung eines Filters auf die erhöhte Fallzahl komme.
Ich schließe in meiner Analyse Männer, Frauen ohne Kinder und alle Jahre bis auf 2008, 2012 und 2016 aus. Vor der Nutzung des Filters komme ich bei der Gewichtung auf eine andere Zahl als nach dessen Anwendung. Ich find dafür aber gerade keine Lösung.
Über Hilfe würde ich mich wirklich freuen und hoffe, dass ich mich halbwegs verständlich ausgedrückt habe.
Mary966
 
Beiträge: 6
Registriert: Fr 24. Jan 2020, 14:29
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon Staxa » Mo 24. Feb 2020, 14:18

Poste doch mal bitte alle Befehle exakt so wie du sie eingibst. Allgemein kann mit einem Filter die Fallzahl nur niedriger werden, da, wie der Name ja sagt, manche Fälle rausgefiltert werden. Hinzugefügt werden dadurch keine.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 254
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon Mary966 » Di 25. Feb 2020, 10:04

Zuerst filter ich nach den Jahren. Dazu nutze ich den Befehl keep if year == 2008 | year == 2012 | year ==2016
Danach filtere ich nach dem Geschlecht: drop if sex == 1 und der Anzahl der Kinder drop if dk04 <1
Zuerst möchte ich dann die Verteilung nach Ost und West ohne Gewichtung betrachten und anschließend mit Gewichtung. Von der Gewichtung hab ich einmal ein Bild angefügt.
Dateianhänge
3D71CF02-51F8-46A8-8044-6C4E52643B5C.jpeg
3D71CF02-51F8-46A8-8044-6C4E52643B5C.jpeg (222.72 KiB) 660-mal betrachtet
Mary966
 
Beiträge: 6
Registriert: Fr 24. Jan 2020, 14:29
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon Staxa » Di 25. Feb 2020, 12:28

Und wo genau liegt nun das Problem? Man sieht sehr gut, dass Personen aus Ostdeutschland im ALLBUS überrepräsentiert sind. Im rohen Datensatz sind 27% aus dem Osten, aber nach der Gewichtung nur noch 14,7%. Personen aus dem Osten werden also nach unten gewichtet, ihre Antworten zählen "weniger". Somit ist das Ergebnis am Ende repräsentativ für die ganze BRD. Die absoluten Zahlen in der gewichteten Analyse kannst du ignorieren.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 254
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon Mary966 » Di 25. Feb 2020, 14:28

Vielen Dank für die schnelle Antwort. Ich muss die Verteilung der Stichprobe beschreiben und da sollen nicht nur die Prozentzahlen angegeben werden. Da ist mir jetzt nicht ganz klar wie ich das machen soll
Mary966
 
Beiträge: 6
Registriert: Fr 24. Jan 2020, 14:29
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon Staxa » Di 25. Feb 2020, 16:00

Ohh, hier liegt das Hase im Pfeffer... du darfst keine frequency weights benutzen, sondern probability weights.
Also ändern in ... pweight = round(...)

Das habe ich vorher übersehen. Die Interpretation ist danach wie gehabt.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 254
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon zitrom » So 6. Sep 2020, 19:09

Hallo zusammen,

ich bin gerade auf diesen Eintrag gestoßen und möchte gerne einige Fragen daran anschließen.
Vorweg: Ich beschäftige mich zum ersten Mal mit der Gewichtung in STATA (Version 16.1) und bin leider etwas ratlos. Aktuell arbeite ich mit den Daten aus der GLES Nachwahlbefragung 2013 (ZA5701). In diesem Datensatz sind mehre Gewichtungsvariablen enthalten. (Quelle: https://search.gesis.org/research_data/ZA5701)

Um die Ergebnisse möglicher Analysen so repräsentativ zu erhalten habe mich für das Gewicht: „Sozial- und regionalstrukturelles Gewicht, gesamt (mit Trans.-/mit OW-Gewicht)“ entschieden. Dabei handelt es sich um eine Kombination mehrerer Gewichte; allerdings nicht mehr um ein reines „Designgewicht“.
Dieser Befehlsbeschreibung (https://www.stata.com/help10.cgi?weight) nach würde ich den Befehl pweight als sample-Gewicht verwenden. Ist das korrekt?

1. Tabellen
Mir ist aufgefallen, dass es nur geringfügige Unterschiede zwischen den Ergebnissen gibt, wenn ich pweight und fweight verwende.

Code: Alles auswählen
tab geschlecht [fweight= round(w_ipfges_1*100)]

svyset [pweight=w_ipfges_1]
svy: tab geschlecht


tab.png
tab.png (178.87 KiB) 150-mal betrachtet


Die Unterschiede könnten auf die Rundung zurückzuführen sein.
Welchen Unterschied macht die Verwendung der Befehle dann?

2. Berechnung von Regressionen

Wenn ich eine Regression berechne gibt es zwar Unterschiede zwischen den verschiedenen Befehlen zur Gewichtung pweight und fweight. Aber ich kann nicht so richtig einschätzen wie gravierend die unterschiedlichen Befehle sich hier auswirken und ob es tatsächlich einen Unterschied macht pweight oder fweight bei einer Regression zu verwenden?

Als Beispiele:

Code: Alles auswählen
logit wahl2013spd ib0.berufsgruppe [pweight= w_ipfges_1]


reg_pweight.png
reg_pweight.png (187.25 KiB) 150-mal betrachtet


Code: Alles auswählen
logit wahl2013spd ib0.berufsgruppe [fweight= round(w_ipfges_1*100)]


reg_fweight.png
reg_fweight.png (184.86 KiB) 150-mal betrachtet


3. Zusammenhangsmaße

Wenn ich nun das Zusammenhangsmaß Cramver‘s V zwischen zwei mit pweight gewichteten Variablen berechnen möchte erhalte ist dies nicht möglich.
Die Befehle:

Code: Alles auswählen
tab berufsgruppe gewerkschaftsmitglied [pweight= round(w_ipfges_1*100)], V
tab berufsgruppe gewerkschaftsmitglied [pweight= w_ipfges_1*100], V


… ergeben nur: pweights not allowed

und:

Code: Alles auswählen
svyset [pweight=w_ipfges_1]
svy: tab berufsgruppe gewerkschaftsmitglied, V


… ergibt: option V not allowed

Einzig der Befehl:

Code: Alles auswählen
tab berufsgruppe gewerkschaftsmitglied [fweight= round(w_ipfges_1*100)], V


…. liefert ein Ergebnis!


Aber es ist ja eigentlich kein Frequenzgewicht. Wie berechne ich dann mit pweight Cramer's V?


Ich hoffe ich konnte meine Fragen und Probleme verständlich erklären und würde mich freuen wenn mir jemand von euch weiterhelfen könnte. Danke!
zitrom
 
Beiträge: 2
Registriert: So 6. Sep 2020, 14:55
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: STATA Gewichtung

Beitragvon Staxa » Mo 7. Sep 2020, 08:38

Nicht alle Analysen funktionieren mit allen Gewichten, wie du ja bereits festgestellt hast. Grundsätzlich empfehle ich immer einen Blick in die Dokumentation bzw. eine Nachfrage bei den Herausgebern der Daten, wie genau die Gewichte zu handhaben sind. Ich kann mir nicht vorstellen, dass fweights für deine Analysen überhaupt nutzbar sind, oder steht eine Datenzeile für mehrere Personen / Fälle? Wenn nein dann musst du immer mit pweights arbeiten, also eine Gewichtung je nach Auswahlwahrscheinlichkeit in der Stichprobe.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 254
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron