Dtsch Med Wochenschr 2002; 127(Suppl. Statistik): T 14-T 16
DOI: 10.1055/s-2002-32819
Statistik
© Georg Thieme Verlag Stuttgart · New York

Überlebenszeitanalyse: Eigenschaften und Kaplan-Meier Methode

- Artikel Nr. 15 der Statistik-Serie in der DMW -A. Ziegler1 , S. Lange2 , R. Bender3
  • 1Institut für Medizinische Biometrie und Statistik,(Direktor: Prof. Dr. A. Ziegler), Universitätsklinikum Lübeck, Medizinische Universität zu Lübeck
  • 2Abteilung für Medizinische Informatik, Biometrie u. Epidemiologie (Direktor: Prof. Dr. H. J. Trampisch), Ruhr-Universität Bochum
  • 3AG Epidemiologie und Medizinische Statistik, Fakultät für Gesundheitswissenschaften (Leitung: Prof. Dr. M. Blettner), Universität Bielefeld
Further Information

Publication History

Publication Date:
16 July 2002 (online)

Überlebenszeitanalyse

In vielen kontrollierten klinischen Studien wird die Wirksamkeit therapeutischer Maßnahmen anhand der Zeit bis zum Auftreten eines bestimmten Ereignisses beurteilt. Dabei können diese Ereignisse positiv sein, wie z. B. die Entlassung aus einer Klinik oder das Eintreten einer Schwangerschaft bei Paaren mit Kinderwunsch. Sie können neutral sein, wie z. B. das Ende der Stillzeit, oder sie können negativ sein, wie z. B. der Tod oder das Auftreten einer Krankheit [1]. Unabhängig von der Wertung des Ereignisses wird in der Medizin ganz allgemein von Überlebenszeitanalyse (engl.: survival analysis) gesprochen. In der Demographie oder den Sozialwissenschaften werden üblicherweise die Begriffe Sterbetafelanalyse, Verweildaueranalyse, Verlaufsdatenanalyse oder Ereigniszeitanalyse (engl.: life table methods, failure time data analysis, lifetime data analysis) verwendet.

In der Medizin gibt es eine Vielzahl von Anwendungsmöglichkeiten: So wird z. B. in onkologischen Therapiestudien die Überlebenszeit oder die Zeit bis zum Auftreten eines Rezidivs unter zwei verschiedenen Therapien miteinander verglichen. Mitunter soll ebenfalls eine Prognose für die erwartete Überlebenszeit eines Patienten abgegeben werden, z. B. wie lange es im Mittel dauern wird, bis eine Patientin mit Kinderwunsch schwanger wird.

In all den oben beschriebenen Situationen ist das Charakteristische der Überlebenszeitanalyse, dass die Zielvariable nicht zu einem festen Zeitpunkt erhoben werden kann, d. h. dass es zu Beginn einer Studie unbekannt ist, wann das Ereignis eintritt. Darüber hinaus muss am Ende des Beobachtungszeitraums das Ereignis nicht eingetreten sein; dann wird von einer zensierten Beobachtungszeit gesprochen, oder kurz: Einer zensierten Beobachtung. Zensierung kann auch dadurch entstehen, dass der Patient in der Beobachtung verloren geht, also »lost to follow-up« ist. Eine Zensierung ist auch durch das Eintreten eines konkurrierenden Risikos (engl.: competing risk) möglich, wenn z. B. der Patient durch einen fremdverursachten Verkehrsunfall verstirbt und nicht an seinem Tumor, und das interessierende Ereignis der tumorbedingte Tod ist.

Sehr häufig werden im Rahmen von Überlebenszeitstudien Patienten in einem bestimmten Zeitraum, also nicht zu einem bestimmten Zeitpunkt, rekrutiert und über einen anderen bestimmten Zeitraum hinaus mindestens nachbeobachtet. Beträgt die Rekrutierungsphase z. B. zwei Jahre und die Nachbeobachtungsphase drei Jahre, so dauert die Studie insgesamt fünf Jahre. Dabei wird die zuerst rekrutierte Person fünf Jahre nachbeobachtet und die zuletzt rekrutierte Person drei Jahre, falls bei ihr innerhalb des Beobachtungszeitraums das Zielereignis nicht eingetreten sein sollte. Aufgrund der kürzeren Nachbeobachtungszeit hat die zuletzt rekrutierte Person eine geringere Wahrscheinlichkeit, dass bei ihr das Ereignis eintritt. Daher ist eine wesentliche Annahme bei vergleichenden Überlebenszeitstudien, z. B. im Rahmen von epidemiologischen Kohortenstudien, dass die Prognose für die verschiedenen Patienten in der Studie gleich ist, also unabhängig vom Rekrutierungszeitpunkt. Bei randomisierten Studien ist das Problem weniger gravierend, da sich die Nachbeobachtungszeiten zwischen den Gruppen aufgrund der Randomisierung nicht wesentlich unterscheiden werden. Dieselbe Annahme macht man üblicherweise auch für Patienten, die in der Nachbeobachtung verloren gehen.

Bei Verletzung dieser Annahmen kann es leicht zu Fehlschlüssen im Hinblick auf mögliche kausale Zusammenhänge kommen. Beispielsweise könnte eine Überschrift der Boulevard-Presse lauten [3]: »Alarm! 95 % aller Bundsliga-Fußballer werden keine 70 Jahre alt«. Diese Aussage impliziert einen Vergleich mit der (Allgemein-) Bevölkerung, von der wir wissen, dass die Mehrzahl der Menschen älter als 70 Jahre wird. Genau bei diesem (impliziten) Vergleich wird die Unabhängigkeitsannahme von Zensierung und Prognose verletzt: Betrachtet man das Gründungsjahr 1963 der Bundesliga und nimmt man einmal an, dass der älteste Spieler damals 35 Jahre alt war, ist oder wäre der älteste Spieler von damals heute (im Jahr 2002) höchstens 73 Jahre alt. Es bestand somit für keinen Bundesliga-Fußballer die Chance, bis heute z. B. 75 oder 80 Jahre alt geworden zu sein, d. h. die Beobachtungen wurden für alle spätestens bei einem Alter von 73 Jahren zensiert. Damit haben aber gerade die Zensierten eine besonders gute Prognose. Umgekehrt müssen die Nicht-Zensierten eine besonders schlechte Prognose gehabt haben, weil sie schon in jungen Lebensjahren verstorben sind. In der impliziten Vergleichsgruppe der Allgemeinbevölkerung existiert ein solcher Zensierungsmechanismus natürlich nicht, denn hier sind sowohl früh (vor dem Alter von 70 Jahren) Verstorbene als auch noch lebende 100-Jährige vertreten.

Das hier in einem nicht-medizinischen Kontext beschriebene Phänomen wird als »lead-time bias« bezeichnet und ist insbesondere bei der Beurteilung der Effektivität von Screeningmaßnahmen bedeutsam, wenn die Zeit von Diagnosestellung bis zum Tod betrachtet wird. Durch das Screening wird der Diagnosezeitpunkt für asymptomatische Erkrankte nach vorne verschoben, die ohne Screening erst beim Auftreten von Symptomen diagnostiziert würden, beispielsweise im Mittel 6 Monate später. Somit haben beim Vergleich von gescreenten mit nicht gescreenten Erkrankten die gescreenten per se einen »Vorsprung« (engl.: lead) in ihrer Überlebenszeit von eben 6 Monaten. Einen ähnlichen »Vorsprung« hat auch die Allgemeinbevölkerung in dem fiktiven Vergleich mit den Bundesliga-Fußballern (s. o.). Allgemein gilt, dass bei Vergleichen von Überlebenszeiten, wenn unterschiedlich lange Beobachtungszeiten und Zensierungsmuster bestehen, eine Reihe von Annahmen für eine korrekte Schlussfolgerung notwendig sind: a) die Prävalenz der Risikofaktoren bleibt konstant, b) die Charakteristika der Population unter Risiko bleiben konstant und c) die Prognose des Überlebens bleibt über die Zeit konstant. Unglücklicherweise sind diese Annahmen häufig nicht haltbar und generell nicht testbar.

Tab. 1 Überlebenszeit (Wochen) von 28 Männern mit Zungenkrebs und diploidem DNA-Tumorprofil - Daten aus Sickle-Santanello et al. 4. Verstorben Zensiert 1 18 69 8 3 23 104 67 4 26 104 76 5 27 112 104 5 30 129 176 8 42 181 231 12 56 13 62

Literatur

  • 1 Altman D G, Bland J M. Time to event (survival) data.  Br med J. 1998;  317 468-469
  • 2 Kaplan E L, Meier P. Nonparametric estimation from incomplete observations.  J Am Stat Ass. 1958;  53 457-481
  • 3 Krämer W. So lügt man mit Statistik. Frankfurt: Campus 1991
  • 4 Sickle-Santanello B J, Farrar W B, DeCenzo J F. et al . Technical and statistical improvements for flow cytometric DNA analysis of paraffin-embedded tissue.  Cytometry. 1988;  9 594-599
  • 5 Ziegler A, Lange S, Bender R. Der Log-Rang-Test.  Dtsch Med Wochenschr. 2002;  127 (in Vorbereitung)
  • 6 Ziegler A, Lange S, Bender R. Das Cox-Modell.  Dtsch Med Wochenschr. 2002;  127 (in Vorbereitung)

Prof. Dr. rer. nat. Andreas Ziegler

Institut für Medizinische Biometrie und Statistik, Universitätsklinikum Lübeck, Medizinische Universität zu Lübeck

Ratzeburger Allee 160, Haus 4

23538 Lübeck

Email: ziegler@imbs.mu-luebeck.de

    >