Seite 1 von 1

Daten restrukturieren: kniffliges Problem

BeitragVerfasst: Di 30. Apr 2013, 09:55
von bromelius
Liebes Forum,

ich sitze derzeit an 3 Excel-Dateien, die ich in ein bestimmtes Format bringen möchte, um sie später zusammen zu fügen.

Die Datei Excel 0 (Beispielaufbau im Bild) werde ich zunächst auf monatliche Daten zusammenfassen. Dafür würde ich das Datum mit

split var1, p(".")

auseinandernehmen und dann mit

collapse (mean) var2, by(monat)

auf monatliche Daten zusammenfassen.

Problem: die Firmennamen und das Jahr verschwinden leider. Wie behalte ich diese und ggf. andere Variable?

Excel 1 enthält in den Zellen nur Informationen zu einer Variable. Die Datenstruktur soll wie Excel 0 sein (also eine Spalte die Firma, dann das Jahr, der Monat und dann die Werte der Variablen), wobei die Quartalswerte für jedes Jahr auf 12 Monate so aufgefüllt werden sollen, dass der Wert aus Q1 in Monat 1, der aus Q2 in Monat 4, Q3 in Monat 7 und Q4 in Monat 10 stehen soll. Hier habe ich leider keine Ahnung wie das geht. Später werden dann die fehlenden Werte interpoliert.

Excel 2 enthält nun in den Spalten pro Firma den Wert einer Variablen. Auch hier soll die Struktur von Excel 0 entstehen. Auch hier habe ich leider keine Idee.

Ich danke im Voraus für die Hilfe.

-Brome

Re: Daten restrukturieren: kniffliges Problem

BeitragVerfasst: Di 30. Apr 2013, 10:55
von daniel
Die Datei Excel 0 (Beispielaufbau im Bild) werde ich zunächst auf monatliche Daten zusammenfassen. Dafür würde ich das Datum mit

split var1, p(".")

auseinandernehmen und dann mit

collapse (mean) var2, by(monat)

auf monatliche Daten zusammenfassen.

Problem: die Firmennamen und das Jahr verschwinden leider. Wie behalte ich diese und ggf. andere Variable?


Naja, "Problem" ist vielleicht das falsche Wort hier. Wenn Du alle Werte pro Monat aggregierst ohne zu berücksichtigen, dass diese Werte von verschiedenen Firmen kommen, sehe ich nicht, in welchem Verhälnis die Firmennamen -- selbst wenn Du sie behalten würdest -- zu den aggregierten Daten stehen sollen? Kannst Du hier ein reproduzierbares Minibeipsiel erstellen? Ich denke hier spontan in Richtung speichern der Ausgangsadaten und ein anfügen (-merge-) der aggregierten Werte.

Zu Excel1: Nachdem Du die erste Zeile gelöscht hast, sieht das nach einem mehr oder weniger einfachen -reshape- aus.

Zu Excel2: vgl. bitte mal die Threads stata-syntax-f18/groszer-datensatz-renditenberechnung-t353.html und stata-syntax-f18/erste-zeile-aus-excel-wird-nicht-als-variablen-ubernommen-t358-10.html in denen nahezu identische Probleme behandelt werden.

Re: Daten restrukturieren: kniffliges Problem

BeitragVerfasst: Di 30. Apr 2013, 11:08
von bromelius
Ok, dann habe ich es falsch ausgedrückt, auch im Syntax: es soll immer pro Firma aggregiert werden, und: die Daten bei Excel 2 sind so, dass pro Quartal ebenfalls für die Variablen immer gleiche Werte vorliegen, demnach also auch wie bei Excel 1 die Quartale auf 12 Monate gestreckt werden müssten und der konstante Quartalswert immer auf den ersten Monat des Quartals gesetzt werden müsste.

Danke für die Link-Tipps, probiere das mal aus.

Re: Daten restrukturieren: kniffliges Problem

BeitragVerfasst: Di 30. Apr 2013, 11:34
von bromelius
Noch eine Frage: kann Stata keine hermite polynomial interpolation, speziell bei mir die cubic?

Re: Daten restrukturieren: kniffliges Problem

BeitragVerfasst: Di 30. Apr 2013, 11:38
von daniel
Ein weitere Link: http://www.ats.ucla.edu/stat/stata/faq/ ... onthly.htm

Zur Frage:

Code: Alles auswählen
findit pchipolate
findit  gausshermite