Seite 1 von 1

Problem bei neuer Variable

BeitragVerfasst: Fr 23. Mai 2014, 16:47
von aeHmmm
Hallo Community,
ich arbeite momentan an einem Datensatz zur Einkommensverteilung und habe ein Problem mir eine geeignete neue Variable zu generieren.
Ich hab einerseits die Variable zur Wirtschaftsgruppe bzw. Beruf und eine weitere Variable zum Abschluss.
Ich möchte fortan den Anteil der Hochschulabschlüsse in den spezifischen Berufs- bzw. Wirtschaftsgruppen in einer neuen Variable darstellen und bin leicht überforder, da ich
mit Stata lediglich die Basics beherrsche.
Ich habe bis dato die Variable für Abschlüsse rekodiert und eine Dummyvariable mit 0 = Kein Hochschulabschluss und 1 = Hochschulabschluss generiert.
Im Folgenden habe ich die Variable "Anzahl an Hochschulabschlüssen" mittels gen X = wzgruppe / Hochschulabschluss erzeugt. Ich möchte jedoch den prozentualen Anteil der in der Branche enthaltenen
HS-Abschlüsse in einer Variable erfassen und müsste demnach diese Anzahl durch die Gesamtzahl der Observationen teilen. Ich komme jedoch nicht auf einen geeigneten Weg.
Vielen Dank im Voraus.
Grüße aeHmmm

Re: Problem bei neuer Variable

BeitragVerfasst: Sa 24. Mai 2014, 14:26
von daniel

Re: Problem bei neuer Variable

BeitragVerfasst: Mi 4. Jun 2014, 19:48
von aeHmmm
Ich kann des mit diesem Beispieldatensatz einfach nicht abbilden. Ich versuche es daher erneut zu erklären:
Nehmen wir an ich habe eine Variable zum Betrieb mit den Ausprägungen 1,2,3,... und einer gewissen frequency. Nehmen wir an in Betrieb 1 sind 5 observations.
Jetzt habe ich durch eine weitere Variable "Ausbildung" für diese 5 Observations einen gewissen Bildungsstand gegeben. Sagen wir 2 Personen waren 9 Jahre auf der Schule und 3 waren 13 Jahre auf einer Schule.
Ich möchte fortan eine neue Variable generieren, die dem Betrieb #1 die durchschnittliche Schulzeit zuweist. Also:
Betrieb #1 | 11.4 Jahre
Betrieb #2 | 9 Jahre
etc. pp.
Diese neue Variable soll im Anschluss in einer Regression verwendet werden. Also Lohn = a + b*DurchschnittlicheAusbildung
Vielleicht könnt ihr mir jetzt helfen.
MfG

Re: Problem bei neuer Variable

BeitragVerfasst: Mi 4. Jun 2014, 20:54
von daniel
-egen- hat eine -mean()- Funktion. Vermutlich ist die mit -by- kombinierbar.

Re: Problem bei neuer Variable

BeitragVerfasst: Mi 16. Jul 2014, 16:26
von aeHmmm
Heyho, ich habs hinbekommen. Ich hätte jedoch eine weitere Frage:
Kann mir zufällig jemand kurz und knapp erklären wie man eine Multi_Level_Analyse durchführt?

Ich denke der Befehl dafür sollte mixed sein (stata13).
Ich habe 3 Ebenen:
Individuell, Betriebe, Region.
Meine abhängige Variable ist das Einkommen (AV)

Wenn ich jetzt verschiedene unabhängige Variablen (UVA) habe die individuelle Faktoren erklären sollen und verschiedene die betriebliche (UVB) erklären wollen, lautet der Befehl dann ungefähr so?

.mixed Einkommen UVA1 UVA2 UVA3 || Betrieb: UVB1 UVB2 UVB3 || Region

Wär schön wenn sich mir jemand erbarmen würde :) Grüssle

Re: Problem bei neuer Variable

BeitragVerfasst: Mi 16. Jul 2014, 20:10
von daniel
Es wäre evtl. günstig für ein komplett neues Thema auch einen neuen Thread zu erstellen, da später niemand, der sich für multi-levl interessiert unter dem Schlagwort "Problem bei neuer Variable" suchen wird.

Wenn ich jetzt verschiedene unabhängige Variablen (UVA) habe die individuelle Faktoren erklären sollen und verschiedene die betriebliche (UVB) erklären wollen, lautet der Befehl dann ungefähr so?

.mixed Einkommen UVA1 UVA2 UVA3 || Betrieb: UVB1 UVB2 UVB3 || Region


Nein. Naja, ungefähr vielleicht schon, aber bei komplexen Modellen sollte man es etwas genauer nehmen, als "ungefähr". Lies mal unter -help mixed- dem pdf link folgend im manual nach und schau Dir die Beispiele an.

Du musst alle Variablen direkt nach der depvar (Einkommen) nennen - völlig unabhängig vom level. Was nach den level Spezifikationen folgt, erlaubt den Effekten dieser Variablen lediglich zwischen den leveln zu variieren (random coefficients).