Umgang mit fehlenden Werten ("keine Angabe")

Allgemeine Fragen rund um Statistik mit Stata.

Umgang mit fehlenden Werten ("keine Angabe")

Beitragvon Toevre » Mi 24. Mär 2021, 11:01

Hallo Leute,

wie gesagt bin ich Anfänger in der Datenanalyse und konnte leider durch Recherchen keine Lösung finden.

Ich analysieren einen Datensatz des SOEP und bin mit fehlenden Angaben immer so vorgegangen, dass ich sie einfach gelöscht habe.
Jedoch wurde ich dabei nun skeptisch, wobei ich mich folgendes gefragt habe:

Angenommen Frage 1 wurde von einer Grundgesamtheit von 30.000 Menschen vollständig beantwortet, jedoch die etwas sensiblere Frage 2 nur von 25.000, da 500 Personen keine Angabe gewählt haben. Nun möchte ich bei einer ersten deskriptiven Analyse nicht jede Untersuchung detailiert in Tabellen ausgeben sondern einfach im Text erwähnen, dass z.B. 20% A und 80% B gewählt haben, nach vorheriger Angabe des Stichprobenumfangs. Bei jeder Frage, die vollständig beantwortet wurde, kann ich das ja ohne weiteres tun, jedoch würde das Ergebnis verfälscht werden, wenn ich das auch für Fragen mit Enthaltungen tun würde. Andererseits ist es nicht gerade schön im Text zu schreiben: 50% haben A gewählt und 48% B.

Ich hoffe ich konnte mein Problem etwas beschreiben und dass mir jemand weiter helfen kann. Vielen Dank im Voraus!

VG
Toevre
Toevre
 
Beiträge: 9
Registriert: Do 15. Okt 2020, 11:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit fehlenden Werten ("keine Angabe")

Beitragvon Staxa » Mi 24. Mär 2021, 13:35

Das ist ein schwieriges Thema, hier gibt es keine allgemeingültige Regel. Entweder kannst du fehlende Daten imputieren (MICE) oder du machtst listwise deletion. Die Analyse bezieht dann also nur Fälle ein, die komplette Infos auf allen genutzten Variablen haben. Meistens sollte man daher ein analytisches Sample definieren und alle Fälle rauswerfen, die missings haben. Danach nutzt man nur das verbleibende Sample, was in allen Analysen konstant ist.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit fehlenden Werten ("keine Angabe")

Beitragvon Toevre » Mi 24. Mär 2021, 15:11

Dann schaue ich mir doch gleich mal das imputieren an.
Einfach nur herauslöschen oder schlichte weglassen von Variablen kommt kaum in Frage, da ich nur eine kleine Menge an Variablen zur Auswahl habe, die ich für meine Untersuchungen benötige.

Vielen Dank!
Toevre
 
Beiträge: 9
Registriert: Do 15. Okt 2020, 11:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron