Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

Hazard Ratio und Kaplan-Meier Kurve: Survivalanalyse mit unserem Shiny Dashboard!

In vielen Situationen und Anwendungen ist es nicht nur von Interesse, ob ein Ereignis auftritt, sondern auch wann dies der Fall ist. So beurteilt man beispielsweise in der Medizin viele Therapien danach, ob sie die Zeit bis zu einer Komplikation hinauszögern können. Aber auch in der Technik ist die Zeit bis zu einem Ausfall eines Maschinenteils von großem Interesse. Im HR Management ist dagegen die Zeit zwischen Einstellung und Kündigung eines Arbeitsplatzes wichtig. All diesen Situationen ist die zeitliche Komponente gemeinsam sowie die Tatsache, dass oft nicht alle Beobachtungseinheiten ein interessierendes Ereignis aufweisen. Diese Tatsachen werden in der Überlebenszeitanalyse oder Survivalanalyse berücksichtigt. Typische Auswerteverfahren hierfür sind die Kaplan-Meier-Kurve bzw. der Kaplan-Meier Plot zur grafischen Darstellung, die mediane Überlebenszeit sowie die Hazard Rate oder Hazard Ratio. In diesem Artikel stellen wir ihnen ein R Shiny Dashboard vor, mit dem man die Auswertungen online automatisiert durchführen kann.

Unsere Experten unterstützen Sie bei einer individuellen Problemlösung gerne. Wir freuen uns auf Ihre Herausforderung.

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.

Jetzt unverbindlich anfragen

Dieser Artikel beantwortet folgende Fragen zur Hazard Ratio:

  • Welche Besonderheiten hat die Survival Analyse?
  • Was versteht man unter einer Kaplan-Meier-Kurve?
  • Wie berechnet man die mediane Überlebenszeit?
  • Was versteht man unter mittlerer Überlebenszeit?
  • Was versteht man unter Hazard Ratio oder Hazard Rate?
  • Wie kann ich eine Kaplan-Meier Analyse mit dem Shiny Dashboard durchführen?

Herausforderungen der Survivalanalyse

In der Überlebenszeitanalyse oder Survivalanalyse wird die Zeit bis zum Auftreten eines Ereignisses als primäre Zielgröße modelliert. Dabei ist der Begriff Überlebenszeitanalyse missverständlich: Die Zeitspanne zwischen Beobachtungsstart und -ende bezeichnet man allgemein als Überlebenszeit, auch wenn man als Ereignis neben Tod noch andere Arten von zeitabhängigen Ereignissen, wie beispielsweise das Auftreten einer Krankheit, Re-Operation, Therapiestart, Defekt, Ausfall, Reparatur modellieren kann.

Für eine Überlebenszeitanalyse benötigt dabei man immer zwei Informationen: Das Auftreten eines Ereignisses und der Zeit bis zum Auftreten eines Ereignisses.

Das Ereignis

Das Ereignis kann sowohl ein Erfolg (Heilung) als auch ein Misserfolg (Rezidiv, Tod) sein. Am Beobachtungsbeginn hat keine Beobachtungseinheit ein Ereignis. Wenn man im Beobachtungsfenster ein Ereignis beobachtet oder registriert, dann setzt man den Ereignisindikator auf „1“. Das erwartete Ereignis kann nicht immer im vorgegebenen Zeitfenster beobachtet werden. Der Ereignisindikator erhält dann den Wert 0. Solche Beobachtungen nennt man Zensierung.

Die Zeit bis zum Auftreten des Ereignisses

Beobachtungsstart und Beobachtungsende sind fest definiert. Die Zeit gibt man in geeigneten Einheiten (Minuten, Tage, Monate) ab Beobachtungsstart bis zum Auftreten des Ereignisses an. Bei Zensierungen wird die Zeit unter Beobachtung angegeben. Dies kann der maximale Beobachtungszeitraum sein, aber auch kürzere Zeitabschnitte sind denkbar, wenn zum Beispiel Beobachtungen vorzeitig aus der Studie ausscheiden.

Bei Überlebenszeitanalysen berücksichtigt man neben den Daten von Beobachtungen mit Ereignissen auch zensierte Beobachtungen in der Analyse.

Kaplan-Meier-Kurve

Die Kaplan-Meier-Kurve dient dazu, Überlebenszeiten grafisch darzustellen. Auf der x-Achse trägt man hierzu die Beobachtungszeit beginnend mit Zeitpunkt 0 = Beobachtungsstart ab. Die y-Achse stellt die mit dem Kaplan-Meier-Verfahren ermittelte Überlebenswahrscheinlichkeit dar. Zum Beobachtungsbeginn liegt bei keiner Beobachtungseinheit ein Ereignis vor. Bei 100 % der Beobachtungen besteht somit noch die Möglichkeit, ein Ereignis zu beobachten. Jede Stufe stellt ein Ereignis dar. Kaplan-Meier-Kurven kann man einerseits für die gesamte Stichprobe erstellen. Man kann aber auch verschiedene Subgruppen grafisch anhand ihrer Verläufe vergleichen. Dazu trägt man die Überlebenskurven der Subgruppen (Strata) in einem Diagramm ab.

Überlebensraten

Mit Hilfe der Kaplan-Meier Analyse kann man die Überlebensraten bestimmen. Diese Raten geben an, bei welchem Anteil der Beobachtungen bis zu einem bestimmten Zeitpunkt noch kein Ereignis eingetreten ist. In der Medizin sind beispielsweise 1- oder 5-Jahres-Überlebensraten häufige Kenngrößen bei Survivalanalysen.

Medianes Überleben und mittleres Überleben

Unter der Medianen Überlebenszeit versteht man den Zeitpunkt, zu dem die Hälfte der Beobachtungseinheiten ein Ereignis aufweist. Die mediane Überlebenszeit kann nur dann angegeben werden, wenn der Beobachtungszeitraum lang genug ist, so dass der Kaplan-Meier-Schätzer in dieser Zeit unter 50% fällt.

Die Angabe der mittleren Überlebenszeit ist nicht zweckmäßig, da die Berechnung stark vom Zensierungsmuster der Beobachtungen abhängt.

Hazard Ratio oder Hazard Rate

Wenn man zwei Subgruppen hinsichtlich der Zeit bis zu einem Ereignis miteinander vergleicht, dann gibt man die Hazard Ratio als Maßzahl an. Hazard gibt dabei die momentane Ereignisrate für eine Gruppe von Beobachtungseinheiten an. Die Hazard Ratio ist das Verhältnis von zwei Hazards. Die Hazard Ratio oder Hazard Rate gibt somit an, um wie viel die Ereignisrate einer Gruppe höher ist im Vergleich zu der anderen Gruppe. Damit ist die Hazard Rate oder Hazard Ratio ein Maß zum paarweisen Vergleich von Überlebenszeiten zweier Subgruppen. Die Interpretation erfolgt analog zum relativen Risiko oder Odds Ratio im logistischen Modell. Beträgt die Hazard Rate 2,8, so ist das Risiko für ein Ereignis in der betrachteten Gruppe 2,8 mal so hoch wie in der Referenzgruppe bzw. um 180% erhöht gegenüber der Referenzgruppe.

Das Shiny Dashboard

Mit dem R package shiny ist es möglich, interaktive, nutzerfreundliche Web-Apps zu erstellen. Für die Analyse von Überlebenszeitdaten hat Novustat ein Shiny Dashboard erstellt.

Benötigen Sie Berechnungen, die über das Spektrum unseres Shiny Dashboard hinaus gehen? Dann nehmen Sie gerne Kontakt mit uns auf!

Umfang des Shiny Dashboards

Mit Hilfe des Shiny Anwendung kann ein CSV Datensatz eingelesen werden. Anschließend wird basierend auf diesen Daten im ersten Tab eine Kaplan-Meier-Kurve erstellt. Mit Hilfe eines Reglers kann eingestellt werden, zu welchem Zeitpunkt die Überlebensrate berechnet werden soll. Die Zeit, nach der 25, 50 und 75 % der Beobachtungen ein Ereignis haben wird berechnet. Im zweiten Reiter wird die Hazard Rate grafisch in Relation zur Referenzkategorie grafisch dargestellt und mit dem 95 % Konfidenzintervall ausgegeben. Der dritte Reiter zeigt die eingelesenen Daten, die für die Überlebenszeitanalyse verwendet werden.

Einlesen der Daten

In den ersten drei Spalten ist der Zensierungsindikator (Censor), Zeit unter Beobachtung (Time) und die Gruppenvariable (Strata) abgetragen. Optional kann in der ersten Zeile der Variablenname eingetragen werden. Als Separatoren zur Abgrenzung der Spalten kann Semikolon oder Komma verwendet werden. Als Dezimaltrenner ist Komma oder Punkt möglich. Die Anzahl der Zeilen ist nicht limitiert. Soll nur eine Gruppe ausgewertet werden, so ist in der Spalte Strata (3) jeweils eine beliebige Konstante einzutragen.

Steht kein eigener Datensatz zur Auswertung zur Verfügung, wird ein Testdatensatz für die Auswertung verwendet.

Das Shiny Dashboard für Hazard Ratio und Kaplan-Meier in Aktion

Shiny Dashboard für die Berechnung des Hazard Ratio
Shiny App: Kaplan-Meier Kurve

Im Reiter Hazard Ratio befindet sich die grafische Darstellung der Hazard Ratio oder Hazard Rate.

Shiny Dashboard für die Überlebenszeitanalyse und Kaplan-Meier Plot
Shiny App: Der Reiter Hazard Ratio

Der Datensatz mit den drei für die Überlebenszeitanalyse wesentlichen Spalten ist im Reiter Datensatz zu finden.

Shiny Dashboard mit dem Datensatz für den Hazard Ratio
Shiny Dashboard: Der Reiter Datensatz

Zusammenfassung: Shiny App für Hazard Ratio und Kaplan-Meier Plot

Überlebenszeitanalysen stellen in vielen Anwendungsgebieten eine wichtige Modellierung dar, wenn die Zeit bis zum Auftreten eines Ereignisses im Vordergrund steht. Wichtig dabei ist die Berücksichtigung von Zensierungen. Mit Hilfe eines Shiny Dashboards haben wir aufgezeigt, wie man Kaplan-Meier-Kurven automatisiert erstellen kann. Außerdem wird im Rahmen des R Shiny Dashboard die mediane Ereigniszeit angegeben sowie Ereignisraten. Beim Vergleich von zwei Gruppen kann man das Hazard Ratio oder die Hazard Rate berechnen. Auswertungen kann man nur dann sinnvoll interpretieren, wenn man diese individuell auf die Fragestellung und auf die Datenlage abstimmt. Vorgefertigte Auswertemodule wie das Shiny Dashboard können nur zu Demonstrationszwecken dienen. Tatsächlich muss man oft mehr als zwei Gruppen miteinander vergleichen. Statistische Testungen mit Hilfe des log-rank Tests werden benötigt oder der Effekt mehrerer Einflussvariablen soll berücksichtigt werden.