Individualdaten in Haushaltsdaten als Variable speichern

Fragen zu Stata Syntax und Do-Files.

Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon Kessler » Mo 2. Jan 2012, 18:48

Hallo zusammen

ich habe einen Datensatz, der zu jeder Person eines Haushalts Informationen enthält.
In meiner Analyse will ich den peer effekt bei der Internetnutzung kontrollieren. Ich hab also von jeder Person die Information, ob sie das Internt nutzt oder nicht.
Nun will ich kontrollieren, ob die Personen des selben Haushalts das Internet auch/nicht nutzen, um den peer-Effekt zu berücksichtigen.
Könnt ihr mir da weiterhelfen?
mfg
Ellen
Kessler
 
Beiträge: 14
Registriert: Mo 2. Jan 2012, 18:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon daniel » Mo 2. Jan 2012, 23:38

Möchtest Du Vorschläge für ein statisitsches Modell, oder Vorschläge wie Du das am besten kontrollierst, oder brauchst tatsächlich die syntax für ein Modell oder um Deine Variable/n zu erstellen?

In jedem Fall wären midestens nähere Informationen zu den Daten sinnvoll, z.B. sind das Quesrschnitt-/oder Paneldaten? Wie sind die Personen, wie die Haushalte identifiziert? Wie ist die Internetnutzung abgebildet?

Wenn Du nach einer syntax suchst, solltest Du etwas detailierter beschreiben, wo Du stehst und wo Du hin möchtest.

Wenn es um "inhaltliche" Fragen geht, solltest Du zusätzlich auch die Forschungsfrage bzw. wenigstens das angedachte Modell skizzieren und auch gerne einen (kurzen) Abstecher in Theorie und Hypothesen machen. Zudem könnte es dann sogar sinnvoll sein, das Thema in einem passenden Bereich im Statistikforum erneut zu eröffen, da hier im Stata-Forum offensichtlich nicht allzuviel los ist.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon Kessler » Fr 6. Jan 2012, 19:34

Danke für die schnelle Antwort und sorry für meine etwas späte. Dachte man wird irgendwie benachrichtigt, wenn jemand auf den eigenen Beitrag antwortet.

Also meine Daten sind prinzipiell als Paneldaten jährlich erhoben. Ich schaue aber nur das Jahr 2000 und 2010 an und will die beiden vergleichen.
Es gibt zu jedem erhobenen Jahr jeweils einen Individual- und einen Haushaltsdatensatz (hier sind mehr allg. Infos erhoben, wie Haushaltseinkommen etc.).
Ich verwende den Individualdatensatz. Da werden jeweils alle Personen eines Haushalts befragt, die über 14 Jahre alt sind. Jede Person bekommt eine persönliche ID und eine, mit der man sie dem Haushalt zuordnen kann.
Ich habe mal ein Bild angehängt, das zeigt den ersten Teil von tab idhous00, also die haushalts-ID im Jahr 2000. Vielleicht ist es jetzt einfacher zu verstehen.
Die ID vom ersten Haushalt ist 41. Und es gibt 5 Befragte in diesem Haushalt, von denen dieselbe Info erhoben wurde.

In meiner Regression will ich ja den peer-Effekt für die Internetnutzung kontrollieren. Also muss ich irgendwie eine Variable kreieren, die Information darüber enthält, ob die Leute im selben Haushalt auch das Internet nutzen. (Die Variable für die Frage nach der Anzahl minuten, die man im Internet verbringt ist p00a26).
Ich hoffe mein Problem ist etwas verständlicher geworden?
Dateianhänge
Stata.png
Stata.png (41.83 KiB) 5436-mal betrachtet
Kessler
 
Beiträge: 14
Registriert: Mo 2. Jan 2012, 18:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon daniel » Sa 7. Jan 2012, 13:25

Dachte man wird irgendwie benachrichtigt, wenn jemand auf den eigenen Beitrag antwortet.

Ich glaube Du kannst das irgendwo im Profil einstellen, wenn Du möchtest. Ich habe das nicht gemacht.

Ich verwende den Individualdatensatz. Da werden jeweils alle Personen eines Haushalts befragt, die über 14 Jahre alt sind. Jede Person bekommt eine persönliche ID und eine, mit der man sie dem Haushalt zuordnen kann.

Klingt nach SOEP.

In meiner Regression will ich ja den peer-Effekt für die Internetnutzung kontrollieren. Also muss ich irgendwie eine Variable kreieren, die Information darüber enthält, ob die Leute im selben Haushalt auch das Internet nutzen. (Die Variable für die Frage nach der Anzahl minuten, die man im Internet verbringt ist p00a26).
Ich hoffe mein Problem ist etwas verständlicher geworden?


Ein wenig deutlicher, auch wenn Du noch immer nicht näher spezifizierst was genau Du Dir unter "den peer-Effekt für die Internetnutzung kontrollieren" vorstellst und ob Dein Datensatz im langen oder weiten Format vorliegt. Ich gehe aufgrund des Variablennames "idhous00" vom weiten Format aus. Eine Möglichkeit den peer-Effekt (Einschub: Unter peers versteht man im Übrigen meist nicht die Familie oder die Haushaltsmitglieder, sondern spezifisch die etwa gleichaltrigen Freunde. Auch theoretisch würde ich eher davon ausgehen, dass die Internetnutzung der Freunde einen größeren Effekt haben sollte, als die Internetnutzung der Mutter oder des Vaters, aber das ist eine andere Diskussion.) abzubilden, wäre einfach die Dauer der Internetnutzung im Haushalt zu berechnen.

Code: Alles auswählen
bys idhous00 : egen dur = total(p00a26)


-egen- ist zwar recht langsam aber einfach. Von dieser Zeit solltest Du nun noch die Zeit jedes einzelnen HH-Mitglieds abziehen

Code: Alles auswählen
replace dur = dur - p00a26


Dann hast Du für jede Person in "dur" die Dauer, die die anderen HH-Mitglieder das Internet nutzen.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon Kessler » Di 10. Jan 2012, 12:51

okay danke.
Der Datensatz ist das Schweizer Haushalts Panel.
Ja mit dem peer-Effekt hast Du recht, danke für den Hinweis. Die Daten geben leider keine Auskunft darüber, wie und ob der Bekannten-/Freundeskreis das Internet nutzt. Mit der Kontrolle, ob im selben Haushalt das Internet von den anderen Mitgliedern genutzt wird, soll das ein wenig simuliert werden. Besser als nichts. Und wenn beispielsweise die Eltern schon einen Computer mit Internet haben, kommt man vermutlich auch viel früher damit in Verbindung, als wenn das nicht der Fall ist.

Die gleiche Information brauche ich dann auch für die Variable "Informationssuche im Internet" und "Nutzung des Internets um Zeitung zu lesen". Also auch hier muss ich kontrollieren, ob die Personen im selben Haushalt das Internet zur Infosuche und zum Zeitung lesen verwenden. Das geht dann genau gleich oder?
*Infosuche (p00a30)
bys idhous00 : egen peer00info = total(p00a30)
replace peer00info = peer00info - p00a30
*Zeitung lesen (p00a32)
bys idhous00 : egen peer00news = total(p00a32)
replace peer00news = peer00news - p00a32

Hier nochmals ein Bild der Variable "dur". Wenn ich die Variable nun als erklärende in mein Regressionsmodell aufnehme und der Koeffizient bspw. 0,3 ist. Kann ich das dann so interpretieren: Wenn andere Mitglieder desselben Haushalts das Internet nutzen, steigt die Wahrscheinlichkeit um 30%-Punkte, dass das Internet genutzt wird?
Dateianhänge
dur.png
dur.png (18.95 KiB) 5423-mal betrachtet
Kessler
 
Beiträge: 14
Registriert: Mo 2. Jan 2012, 18:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon daniel » Di 10. Jan 2012, 14:31

[...] Die Daten geben leider keine Auskunft darüber, wie und ob der Bekannten-/Freundeskreis das Internet nutzt. Mit der Kontrolle, ob im selben Haushalt das Internet von den anderen Mitgliedern genutzt wird, soll das ein wenig simuliert werden. Besser als nichts.

Vermutlich ja. Kommt darauf an, was man modelieren will. Wenn die Verfügbarkeit des Internets nicht gegeben ist, müsste man das vielleicht eher als Restriktion modellieren denn als Kontrollvariable, bzw. "peer"-Effekt, aber solche Fragen sollten m.E. besser im Statisitkforum diskutiert werden.

Wenn ich die Variable nun als erklärende in mein Regressionsmodell aufnehme und der Koeffizient bspw. 0,3 ist. Kann ich das dann so interpretieren: Wenn andere Mitglieder desselben Haushalts das Internet nutzen, steigt die Wahrscheinlichkeit um 30%-Punkte, dass das Internet genutzt wird?

Nein, ganz sicher nicht. Die Variable "dur" ist metrisch und nicht dichotom (wie Du an Deinem angehängten Bild erkennen kannst), was Deine Interpretation implizieren würde. Du erfasst hier nicht ob die anderen Mitglieder des Haushaltes das Internet nutzen, sonden wie lange sie das tun. Der Koeffizient macht also eine Aussage darüber, wie sich Dein outcome (das Du hier im Übrigen noch nicht spezifiziert hast) verändert, wenn die Nutzung des Internets der anderen Mitglieder um 1 Einheit (vermutlich Minute) steigt.

Wie die genau Interpretation ist, kommt darauf an, wie Dein Modell aussieht. Dazu hast Du bisher ebenfalls nichts gesagt.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon Kessler » Mi 11. Jan 2012, 11:36

daniel hat geschrieben:Nein, ganz sicher nicht. Die Variable "dur" ist metrisch und nicht dichotom (wie Du an Deinem angehängten Bild erkennen kannst), was Deine Interpretation implizieren würde. Du erfasst hier nicht ob die anderen Mitglieder des Haushaltes das Internet nutzen, sonden wie lange sie das tun. Der Koeffizient macht also eine Aussage darüber, wie sich Dein outcome (das Du hier im Übrigen noch nicht spezifiziert hast) verändert, wenn die Nutzung des Internets der anderen Mitglieder um 1 Einheit (vermutlich Minute) steigt.


Achso ja klar, da hast du natürlich recht danke. war ich etwas zu voreilig mit meiner Formulierung. Ja die Einheit sind Minuten pro Tag.
Ich werde drei Modelle untersuchen:
einmal als abhängige Variable (AV) die Internetintensität (also wie viele Minuten pro Tag das Internet genutzt wird)
dann als AV die Nutzung des Internets um nach Informationen zu suchen (dichotom)
und im dritten Modell als AV die Nutzung des Internets um Zeitung zu lesen (dichotom).
Als erklärende Variablen verwende ich immer dieselben. u.a. Bildung, Einkommen, ... und eben ob die Familienmitglieder das Internet zu denselben Zwecken nutzen oder nicht . Kannst Du deshalb noch etwas hierzu sagen, ob ich da richtig liege?

Kessler hat geschrieben:Die gleiche Information brauche ich dann auch für die Variable "Informationssuche im Internet" und "Nutzung des Internets um Zeitung zu lesen". Also auch hier muss ich kontrollieren, ob die Personen im selben Haushalt das Internet zur Infosuche und zum Zeitung lesen verwenden. Das geht dann genau gleich oder?
*Infosuche (p00a30)
bys idhous00 : egen peer00info = total(p00a30)
replace peer00info = peer00info - p00a30
*Zeitung lesen (p00a32)
bys idhous00 : egen peer00news = total(p00a32)
replace peer00news = peer00news - p00a32


oder kann man das für dichotome Variablen nicht so einfach machen?
Kessler
 
Beiträge: 14
Registriert: Mo 2. Jan 2012, 18:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon daniel » Mi 11. Jan 2012, 12:56

Das kommt darauf an, wie Du das operationalisieren willst. Wenn Deine Kontrollvariable dichotom sein soll, dann geht es natürlich nicht so. Willst Du die Anzahl der Haushaltsmitglieder, die ebenfalls das Internet nutzen, dann sollte es so passen, vorrausgesetzt Deine Variable ist nicht nur dichotom sondern binär codiert.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon Kessler » Do 12. Jan 2012, 15:00

Also am besten wäre natürlich, dass ich hinterher so interpretieren kann: wenn eine person mehr im haushalt das internet für infozwecke (bzw. zeitunglesen) nutzt, steigt die wahrscheinlichkeit um xx %-Punkte, dass die Person das internet für dieselben Zwecke verwendet.
geht das?
die variablen sind gar nicht dichotom, sorry. es wird nach der Häufigkeit gefragt. also "wie oft verwenden sie das internet zur Infosuche" bzw. "wie oft verwenden sie das internet um Zeitung zu lesen"
Kessler
 
Beiträge: 14
Registriert: Mo 2. Jan 2012, 18:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Individualdaten in Haushaltsdaten als Variable speichern

Beitragvon daniel » Do 12. Jan 2012, 16:21

Also am besten wäre natürlich, dass ich hinterher so interpretieren kann: wenn eine person mehr im haushalt das internet für infozwecke (bzw. zeitunglesen) nutzt, steigt die wahrscheinlichkeit um xx %-Punkte, dass die Person das internet für dieselben Zwecke verwendet.
geht das?

Nicht ohne Weiteres. Das hat aber weniger mit der Variablengenriering zu tun, als mit der Tatsache, dass die Veränderung in den Wahrscheinlichkeiten in nicht-linearen Modellen von den Ausprägungen aller Kovariaten abhängen. Das ist aber eine andere Diskussion und es wird nicht genügen im Rahmen eines Forums die Interpretation logistischer Modelle zu erklären. Dazu bedraf es eigener Literaturrecherche und Lektüre.

Also am besten wäre natürlich, dass ich hinterher so interpretieren kann: wenn eine person mehr im haushalt das internet für infozwecke (bzw. zeitunglesen) nutzt [...] die variablen sind gar nicht dichotom, sorry. es wird nach der Häufigkeit gefragt. also "wie oft verwenden sie das internet zur Infosuche" bzw. "wie oft verwenden sie das internet um Zeitung zu lesen"

Naja, dann kannst Du Dir zuerst für jede Person einen Dummy generieren, der Anzeigt, ob die Person das Inernet für den fraglichen Zweck nutzt (Häufigkeit > 0). Danach kannst Du die Summe bilden, wie bereits gezeigt.

Mir fällt gerade kein Befehl/Funktion ein, der das in einem Schritt macht, aber gegeben der Tatsache, dass die Nutzung Werte im Bereich 0 (keine Nutzung)-unendlich annimmt, könntest Du alternativ die (egen) -count- Funktion verwenden und schrieben

Code: Alles auswählen
bys idhouse00 : egen useinet = count(ln(p00a30))
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Stata Syntax

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste

cron