Seite 1 von 1

Subgruppen innerhalb einer Variable miteinander korrelieren

BeitragVerfasst: Fr 31. Jan 2014, 16:27
von StataMan
Hallo allerseits,

ich habe folgendes Problem, was sich für mich schwerer erweist als zuvor gedacht: ich habe eine Variable mit der persönlichen Stellung in einem Haushalt. Für mich relevant sind 5 Personengruppen: Haushaltsvorstand, Partner heterosexuell vom Haushaltsvorstand, Partner homosexuell vom Haushaltsvorstand, eigenes Kind des Haushaltsvorstands, Kind des Partners des Haushaltsvorstands. Es sind Daten zur Haushaltsnummer enthalten, so dass mit theoretisch auch schon klar ist, wie man die zusammenbringt - über die Haushaltsnummer. Nur ich bekomme das nicht hin. Also nochmal, es beziehen sich die letzten vier Personengruppen auf die Beziehung zum Haushaltsvorstand. Jedenfalls kriege ich es nicht hin, herauszufinden, wie viele Kinder z.B. bei homosexuellen Paaren leben, weil ich die Variable nicht meinen Wünschen getrennt kriege, um dann schöne cross tabs zu machen. Hat jemand eine Idee? Wäre echt toll, wenn einer was weiß. Schönes Wochenende.

Re: Subgruppen innerhalb einer Variable miteinander korrelie

BeitragVerfasst: Fr 31. Jan 2014, 17:52
von daniel
Reproduzierbare Beispiele bitte. Zusätzlich eine viel exaktere Beschriebung der Datenstruktur. Die Frage ist ansonsten nicht zu beantworten.

Re: Subgruppen innerhalb einer Variable miteinander korrelie

BeitragVerfasst: Sa 1. Feb 2014, 14:48
von StataMan
Natürlich, sorry. Also, die Variable ist eine String-Variable und es wird nach der Stellung im Haushalt gefragt. Und ich interessiere mich für die unten angegebenen Personengruppen. Ich kann anhand der Daten (Haushaltsvorstand ("01"), dessen getrenntgeschlechtlicher Partner("02") und dessen gleichgeschlechtlichen Partner ("03") herausfiltern. Ich habe einfach alle anderen Personen im Datensatz gelöscht und mit dem duplicate-Befehl gearbeitet. So war es problemlos möglich, herauszufiltern welche Personen der Haushaltsvorstände nun in gleich- oder getrenntgeschlechtlicher Beziehung leben. Der duplicate-Befehl bezog sich auf die Variable der Haushaltsnummer - wenn also Haushaltsvorstand und jemand von "02" oder "03" die gleiche HH-nr. haben waren sie in einer Partnerschaft. Soweit, so gut. Nun möchte ich aber für dieses Partnerschaftsgruppen untersuchen, ob dort Kinder leben bzw. zu welchem Prozentsatz in bspw. gleichgeschlechtlichen Partnerschaften Kinder vorhanden sind. Die Kinder haben die Ausprägungen "04" und "05" in der selben Variable nach der Stellung im Haushalt. So, und an dieser Stelle kommt jetzt mein Knoten im Kopf. Ich schaffe es nicht, die Variable so zu bearbeiten, dass ich mir ansehen kann, wie viele der Kinder z.B. zu den gleichgeschlechtlichen, und wie viele Kinder zu den getrenntgeschlechtlichen Paaren gehören. Ebenfalls will ich wissen, wie viele Partnerschaften ganz ohne Kinder leben.
Helfen meine Informationen nun weiter?

Grüße

Re: Subgruppen innerhalb einer Variable miteinander korrelie

BeitragVerfasst: Sa 1. Feb 2014, 14:59
von daniel
Nicht sonderlich.

Wie sieht der Datensatz aus? Was wird durch eine Zeile identifiziert? Ein Haushalt? Eine Person? Noch etwas anderes?

Deine Fragestellugn wäre sicher am einfachsten zu beantworten, wenn eine Zeile einem Haushalt entspricht. Du bräuchtest dann eine Variable, die pro Haushalt angibt, um welche Art es sich Handelt (single, homo, hetero) und eine Variable, die die Anzahl der Kinder im Haushalt angibt.

-reshape- und -merge- können hilfreich sein.

Re: Subgruppen innerhalb einer Variable miteinander korrelie

BeitragVerfasst: Sa 1. Feb 2014, 15:31
von StataMan
Es handelt sich um Individualdaten. Jede Zeile ist eine einzelne Person. Danke für Deine Hilfe, ich werde mir die von dir empfohlenen Befehle mal näher anschauen.

Thomas

Re: Subgruppen innerhalb einer Variable miteinander korrelie

BeitragVerfasst: Mi 26. Feb 2014, 19:13
von StataMan
Hallo Leute,

ich muss mich hier nochmal an Euch wenden mit einem alten Problem: ich bekomme die Zuordnung von Kindern zu Haushalten nicht hin mit meinem Stata (SE 12.0). Ich kann das natürlich alles mit excel machen vorübergehend, nur ist das m.E. nicht die Lösung.

Ich habe in den Anhang eine excel-Tabelle gesteckt und einen Beispieldatensatz kreiert. Meine Zielvariable befindet sich in Spalte 5 und ist grau unterlegt. Ich habe dort mein Wunschergebnis eingetragen. So sollte diese Variable aussehen - die Zahlen neben den Werten für Spalte 3, in der angezeigt wird, ob jemand in einer hetero- oder homosexuellen Beziehung lebt. Das ist wichtig, weil ich als abh. Variable später nur die Variable in Spalte 3 benutze. Ich bzw. Stata muss jetzt also die Spalte 2 (Stellung zum Haushaltsvorstand) durchlaufen und sobald dort eine 4 (also Kind) auftaucht, soll eine "1" bei dem Haushaltsvorstand ("1") und beim Partner ("2" oder "3") stehen, also exakt dort, wo auch die 1en und 0en der Variable in Spalte 3 stehen (Partnerschaft homo/hetero). Für meine späteren logistischen Analysen fliegen dann nämlich alle Fälle raus, in denen für die Variable in Spalte 3 (Partnerschaft homo/ hetero) keine Werte stehen. In der angehängten Datei habe ich der Übersichtlichkeit wegen die Haushalte jeweils mit einer orange eingefärbten Zeile abgetrennt.

Ich hoffe, ich habe mich verständlich ausgedrückt und jemand hat Rat. Danke im Voraus.

Tom

Re: Subgruppen innerhalb einer Variable miteinander korrelie

BeitragVerfasst: Do 27. Feb 2014, 11:49
von daniel
Das sieht eigentlich relativ einfach aus. Angenommen <Partnerschaft> wurde korrekt definiert

Code: Alles auswählen
bys <HH-ID> (<Status in Haushalt>) : g byte  kids = sum(<Status in Haushalt> == 4)
bys <HH-ID> (<Status in Haushalt>) : replace  kids = cond(mi(<Partnerschaft>), ., (kids[_N] > 0))

Re: Subgruppen innerhalb einer Variable miteinander korrelie

BeitragVerfasst: Mo 3. Mär 2014, 17:17
von StataMan
dachte ich ja auch erst, aber für mich wars halt schwerer. Herzlichen Dank Daniel, hat super funktioniert.