Seite 1 von 1

Umgang mit fehlenden Werten ("keine Angabe")

BeitragVerfasst: Mi 24. Mär 2021, 11:01
von Toevre
Hallo Leute,

wie gesagt bin ich Anfänger in der Datenanalyse und konnte leider durch Recherchen keine Lösung finden.

Ich analysieren einen Datensatz des SOEP und bin mit fehlenden Angaben immer so vorgegangen, dass ich sie einfach gelöscht habe.
Jedoch wurde ich dabei nun skeptisch, wobei ich mich folgendes gefragt habe:

Angenommen Frage 1 wurde von einer Grundgesamtheit von 30.000 Menschen vollständig beantwortet, jedoch die etwas sensiblere Frage 2 nur von 25.000, da 500 Personen keine Angabe gewählt haben. Nun möchte ich bei einer ersten deskriptiven Analyse nicht jede Untersuchung detailiert in Tabellen ausgeben sondern einfach im Text erwähnen, dass z.B. 20% A und 80% B gewählt haben, nach vorheriger Angabe des Stichprobenumfangs. Bei jeder Frage, die vollständig beantwortet wurde, kann ich das ja ohne weiteres tun, jedoch würde das Ergebnis verfälscht werden, wenn ich das auch für Fragen mit Enthaltungen tun würde. Andererseits ist es nicht gerade schön im Text zu schreiben: 50% haben A gewählt und 48% B.

Ich hoffe ich konnte mein Problem etwas beschreiben und dass mir jemand weiter helfen kann. Vielen Dank im Voraus!

VG
Toevre

Re: Umgang mit fehlenden Werten ("keine Angabe")

BeitragVerfasst: Mi 24. Mär 2021, 13:35
von Staxa
Das ist ein schwieriges Thema, hier gibt es keine allgemeingültige Regel. Entweder kannst du fehlende Daten imputieren (MICE) oder du machtst listwise deletion. Die Analyse bezieht dann also nur Fälle ein, die komplette Infos auf allen genutzten Variablen haben. Meistens sollte man daher ein analytisches Sample definieren und alle Fälle rauswerfen, die missings haben. Danach nutzt man nur das verbleibende Sample, was in allen Analysen konstant ist.

Re: Umgang mit fehlenden Werten ("keine Angabe")

BeitragVerfasst: Mi 24. Mär 2021, 15:11
von Toevre
Dann schaue ich mir doch gleich mal das imputieren an.
Einfach nur herauslöschen oder schlichte weglassen von Variablen kommt kaum in Frage, da ich nur eine kleine Menge an Variablen zur Auswahl habe, die ich für meine Untersuchungen benötige.

Vielen Dank!