Seite 1 von 1

Validierung von Survival-Daten / -Modellen

BeitragVerfasst: Di 5. Mär 2013, 01:18
von Olaf
Hallo Leute,

ich untersuche derzeit eine Reihe von Daten mit parametrischen Lebensdaueranalysen. Dabei erstelle ich Modelle mit unterschiedlichen Einflussfaktoren und verschiedenen Verteilungsannahmen. Anhand eines Informationskriterium (AIC oder BIC) kann ich das Modell mit der höchsten Modellgüte wählen. Bis hier hin ist soweit alles klar. Im Anschluss möchte ich die Modelle bzw. die Auswahl nochmals validieren (--> Modellgüte vs. Prognosegüte).

Ich habe an ein Verfahren gedacht, bei dem die Daten aufgeteilt werden. Anschließend wird mit einem Datensatz das Modell gebildet und dann mit dem anderen verglichen. Ich weiß aber nicht genau, wie das aussehen könnte bzw. was man dann genau miteinander vergleich.... Habt ihr eine Idee, wie ich dies umsetzen könnte bzw. habt ihr andere Ideen?

Grüß
Olaf

Re: Validierung von Survival-Daten / -Modellen

BeitragVerfasst: Di 5. Mär 2013, 12:55
von daniel
Worauf genau zielt die Frage ab?

Du schätzt Dein Modell mit (zufällig) ausgewählten Fällen, was als pseudo code so aussehen kann:

Code: Alles auswählen
bys id : g sample = runifom() > .5
streg y x if sample


Dann -predictest- Du Werte für die anderen Fälle.

Code: Alles auswählen
predict yhat if !sample


Dann kannst Du bsp. die original y mit den vorhergesagten yhat vergleichen.

Code: Alles auswählen
cor y yhat if !sample