Datensatz bereinigen problem

Fragen zu Stata Syntax und Do-Files.

Datensatz bereinigen problem

Beitragvon Iranhnsn » So 22. Mai 2022, 15:34

Hallo,
ich kenne mich leider nicht mit Stata aus und habe Probleme bei der Bereinigung/Umsortierung eines Datensatzes.
Mein Datensatz beinhaltet in einer Spalte sowohl numerische Werte und geschriebene Definitionen. Gibt es einen Befehl, womit man praktisch alle Zahlenwerte in eine neue Spalte ziehen kann und diese auch direkt aus der alten Spalte löschen kann, sodass am Ende praktisch 2 getrennte Spalten da sind.
Vielen Dank im Voraus!
liebe grüße
Zuletzt geändert von Iranhnsn am So 12. Jun 2022, 10:26, insgesamt 1-mal geändert.
Iranhnsn
 
Beiträge: 18
Registriert: So 22. Mai 2022, 13:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Datensatz bereinigen problem

Beitragvon Staxa » So 22. Mai 2022, 21:12

Gibt es hier ein bestimmtes Zeichen, z.B. ein Leerzeichen, was immer Zahlen von Text trennt? Hier wäre eine Lösung beschrieben:

https://www.stata.com/support/faqs/data ... -variable/

Hier ist noch ein anderes Beispiel:

https://www.techtips.surveydesign.com.a ... it-command

Ansonsten musst du mal einen Datenauszug posten.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Datensatz bereinigen problem

Beitragvon Iranhnsn » Mo 23. Mai 2022, 12:09

Hallo!
Vielen Dank für die schnelle Antwort.
Ich habe mich leider zu ungenau ausgedrückt. Die Spalte beinhaltet nicht innerhalb einer Zeile numerische Werte und Beschreibungen sondern nur jeder nte Eintrag in Spalte A ist eine Beschreibung so wie auf dem Bild zu sehen ist.
Was kann man da machen?

Vielen dank nochmal!
Iranhnsn
 
Beiträge: 18
Registriert: So 22. Mai 2022, 13:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Datensatz bereinigen problem

Beitragvon Staxa » Mo 23. Mai 2022, 12:36

Also es geht um das WZ08-05? Das muss herausgelöst werden?
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Datensatz bereinigen problem

Beitragvon Iranhnsn » Mo 23. Mai 2022, 12:37

Ja genau, die ganze Beschreibung!
Iranhnsn
 
Beiträge: 18
Registriert: So 22. Mai 2022, 13:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Datensatz bereinigen problem

Beitragvon Staxa » Mo 23. Mai 2022, 12:40

Kannst du ein paar mehr Beispiele posten, also für andere Zeilen? Wenn es komplexe Formate sind wirst du um regular expressions nicht herum kommen.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Datensatz bereinigen problem

Beitragvon Iranhnsn » Mo 23. Mai 2022, 13:29

Es ist praktisch immer so, dass zuerst das label steht, dann alle werte für den Zeitraum von 2007-2020, wobei aber immer nur zu Beginn des Jahres eine Jahreszahl steht und dann wenn alle Zeiträume durch sind, steht das neue Label und es wird wieder der Zeitraum abgebildet
Iranhnsn
 
Beiträge: 18
Registriert: So 22. Mai 2022, 13:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Datensatz bereinigen problem

Beitragvon Iranhnsn » Mo 23. Mai 2022, 13:31

Noch ein Beispiel
Zuletzt geändert von Iranhnsn am So 12. Jun 2022, 10:25, insgesamt 1-mal geändert.
Iranhnsn
 
Beiträge: 18
Registriert: So 22. Mai 2022, 13:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Datensatz bereinigen problem

Beitragvon Staxa » Mo 23. Mai 2022, 14:17

Das sind wieder Screenshots und keine Daten, aber gut...

Ich würde hier die Jahreszahlen forcieren etwa

Code: Alles auswählen
destring A, replace force


Deine Monate würde ich dann manuell kodieren

Code: Alles auswählen
gen month = .
replace month = 1 if B == "January"
replace month = 2 if B == "February"

usw...

Und dann das Datum generieren. Zuerst die Jahreszahlen fortschreiben:
Code: Alles auswählen
replace A = A[_n-1] if missing(A) & !missing(A[_n-1])


Und dann
Code: Alles auswählen
gen date = mdy(month, 1, A)
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 680
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Stata Syntax

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron