Problem bei neuer Variable

Allgemeine Fragen rund um Statistik mit Stata.

Problem bei neuer Variable

Beitragvon aeHmmm » Fr 23. Mai 2014, 16:47

Hallo Community,
ich arbeite momentan an einem Datensatz zur Einkommensverteilung und habe ein Problem mir eine geeignete neue Variable zu generieren.
Ich hab einerseits die Variable zur Wirtschaftsgruppe bzw. Beruf und eine weitere Variable zum Abschluss.
Ich möchte fortan den Anteil der Hochschulabschlüsse in den spezifischen Berufs- bzw. Wirtschaftsgruppen in einer neuen Variable darstellen und bin leicht überforder, da ich
mit Stata lediglich die Basics beherrsche.
Ich habe bis dato die Variable für Abschlüsse rekodiert und eine Dummyvariable mit 0 = Kein Hochschulabschluss und 1 = Hochschulabschluss generiert.
Im Folgenden habe ich die Variable "Anzahl an Hochschulabschlüssen" mittels gen X = wzgruppe / Hochschulabschluss erzeugt. Ich möchte jedoch den prozentualen Anteil der in der Branche enthaltenen
HS-Abschlüsse in einer Variable erfassen und müsste demnach diese Anzahl durch die Gesamtzahl der Observationen teilen. Ich komme jedoch nicht auf einen geeigneten Weg.
Vielen Dank im Voraus.
Grüße aeHmmm
aeHmmm
 
Beiträge: 3
Registriert: Fr 23. Mai 2014, 11:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Problem bei neuer Variable

Beitragvon daniel » Sa 24. Mai 2014, 14:26

Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Problem bei neuer Variable

Beitragvon aeHmmm » Mi 4. Jun 2014, 19:48

Ich kann des mit diesem Beispieldatensatz einfach nicht abbilden. Ich versuche es daher erneut zu erklären:
Nehmen wir an ich habe eine Variable zum Betrieb mit den Ausprägungen 1,2,3,... und einer gewissen frequency. Nehmen wir an in Betrieb 1 sind 5 observations.
Jetzt habe ich durch eine weitere Variable "Ausbildung" für diese 5 Observations einen gewissen Bildungsstand gegeben. Sagen wir 2 Personen waren 9 Jahre auf der Schule und 3 waren 13 Jahre auf einer Schule.
Ich möchte fortan eine neue Variable generieren, die dem Betrieb #1 die durchschnittliche Schulzeit zuweist. Also:
Betrieb #1 | 11.4 Jahre
Betrieb #2 | 9 Jahre
etc. pp.
Diese neue Variable soll im Anschluss in einer Regression verwendet werden. Also Lohn = a + b*DurchschnittlicheAusbildung
Vielleicht könnt ihr mir jetzt helfen.
MfG
aeHmmm
 
Beiträge: 3
Registriert: Fr 23. Mai 2014, 11:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Problem bei neuer Variable

Beitragvon daniel » Mi 4. Jun 2014, 20:54

-egen- hat eine -mean()- Funktion. Vermutlich ist die mit -by- kombinierbar.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Problem bei neuer Variable

Beitragvon aeHmmm » Mi 16. Jul 2014, 16:26

Heyho, ich habs hinbekommen. Ich hätte jedoch eine weitere Frage:
Kann mir zufällig jemand kurz und knapp erklären wie man eine Multi_Level_Analyse durchführt?

Ich denke der Befehl dafür sollte mixed sein (stata13).
Ich habe 3 Ebenen:
Individuell, Betriebe, Region.
Meine abhängige Variable ist das Einkommen (AV)

Wenn ich jetzt verschiedene unabhängige Variablen (UVA) habe die individuelle Faktoren erklären sollen und verschiedene die betriebliche (UVB) erklären wollen, lautet der Befehl dann ungefähr so?

.mixed Einkommen UVA1 UVA2 UVA3 || Betrieb: UVB1 UVB2 UVB3 || Region

Wär schön wenn sich mir jemand erbarmen würde :) Grüssle
aeHmmm
 
Beiträge: 3
Registriert: Fr 23. Mai 2014, 11:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Problem bei neuer Variable

Beitragvon daniel » Mi 16. Jul 2014, 20:10

Es wäre evtl. günstig für ein komplett neues Thema auch einen neuen Thread zu erstellen, da später niemand, der sich für multi-levl interessiert unter dem Schlagwort "Problem bei neuer Variable" suchen wird.

Wenn ich jetzt verschiedene unabhängige Variablen (UVA) habe die individuelle Faktoren erklären sollen und verschiedene die betriebliche (UVB) erklären wollen, lautet der Befehl dann ungefähr so?

.mixed Einkommen UVA1 UVA2 UVA3 || Betrieb: UVB1 UVB2 UVB3 || Region


Nein. Naja, ungefähr vielleicht schon, aber bei komplexen Modellen sollte man es etwas genauer nehmen, als "ungefähr". Lies mal unter -help mixed- dem pdf link folgend im manual nach und schau Dir die Beispiele an.

Du musst alle Variablen direkt nach der depvar (Einkommen) nennen - völlig unabhängig vom level. Was nach den level Spezifikationen folgt, erlaubt den Effekten dieser Variablen lediglich zwischen den leveln zu variieren (random coefficients).
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron