STATA-FORUM.DE

Hallo Leute,

ich untersuche derzeit eine Reihe von Daten mit parametrischen Lebensdaueranalysen. Dabei erstelle ich Modelle mit unterschiedlichen Einflussfaktoren und verschiedenen Verteilungsannahmen. Anhand eines Informationskriterium (AIC oder BIC) kann ich das Modell mit der höchsten Modellgüte wählen. Bis hier hin ist soweit alles klar. Im Anschluss möchte ich die Modelle bzw. die Auswahl nochmals validieren (--> Modellgüte vs. Prognosegüte).

Ich habe an ein Verfahren gedacht, bei dem die Daten aufgeteilt werden. Anschließend wird mit einem Datensatz das Modell gebildet und dann mit dem anderen verglichen. Ich weiß aber nicht genau, wie das aussehen könnte bzw. was man dann genau miteinander vergleich.... Habt ihr eine Idee, wie ich dies umsetzen könnte bzw. habt ihr andere Ideen?

Grüß
Olaf

Worauf genau zielt die Frage ab?

Du schätzt Dein Modell mit (zufällig) ausgewählten Fällen, was als pseudo code so aussehen kann:

Code: Alles auswählen: bys id : g sample = runifom() > .5 streg y x if sample

Dann -predictest- Du Werte für die anderen Fälle.

Code: Alles auswählen: predict yhat if !sample

Dann kannst Du bsp. die original y mit den vorhergesagten yhat vergleichen.

Code: Alles auswählen: cor y yhat if !sample

STATA-FORUM.DE

Validierung von Survival-Daten / -Modellen

Validierung von Survival-Daten / -Modellen

Re: Validierung von Survival-Daten / -Modellen