Seite 1 von 1

Abhängige Variable und missings in Paneldaten

BeitragVerfasst: Do 19. Sep 2019, 13:36
von uiolo
Hi Leute,

also ich verwende einen Paneldatensatz für meine Masterarbeit. Dieser besteht aus 7 Wellen und meine abhängige Variable ist die Wahlabsicht für oder gegen eine bestimmte Partei. Diese wurde auch in allen 7 Wellen abgefragt. Da es leider keine Zeitvariable in dem Datensatz gibt, transformiere ich den Datensatz von wide in das long-Format. Meine Frage ist nun, ob ich meine abhängige Variable in einer Variable zusammenfassen soll oder schlussendlich nur die Frage zur Wahlabsicht von der letzten Welle nehme und als abhängige Variable habe?

Sprich so sieht es dann aus: Wahl1 Wahl2 Wahl3 Wahl4 Wahl5 Wahl6 Wahl7-->durch reshapen wird es dann eben eine Variable, also Wahl. Soll ich dann diese eine Variable als abhängige Variable benutzen?


Dann noch eine weitere Frage zu missings. Leider ist es im Datensatz so, dass nicht alle Fragen bzw. Variablen immer abgefragt werden. Sprich z.B. Einstellungen zu Immigration werden nur in Wellen 1, 2, 3, 6 und 7 abgefragt, aber nicht in Welle 4 und 5. Wie handhabe ich es in der Panelregression mit diesen missings? Gibt es da einen Trick?

Re: Abhängige Variable und missings in Paneldaten

BeitragVerfasst: Fr 20. Sep 2019, 13:19
von Staxa
Welches Verfahren du anwendest hängt von deiner Fragestellung ab. Wenn du Längsschnittanalysen durchführst, musst du immer das xt Framework benutzen und das Long Format, hier hast du dann gar keine Wahl.

Sofern missings korrekt in den Daten deklariert sind (Notation .) so werden diese automatisch in allen Analysen korrekt einbezogen bzw. weggelassen. Du würdest dann sehen, dass in manchen Wellen keine Effekte geschätzt werden können.