In der Medizin haben analytische Testverfahren eine zentrale und oft sogar lebensrettende Bedeutung. Das Ziel dieser diagnostischen Tests ist es, krankheitsspezifische Marker nachzuweisen, damit man einen Rückschluss auf das Vorhandensein einer bestimmten Krankheit ziehen kann. Allerdings kann auch der beste diagnostische Test keine 100 %ige Treffergenauigkeit aufweisen. Die Genauigkeit eines diagnostischen Tests wird deshalb über zwei Maßzahlen beschrieben: Sensitivität und Spezifität. Für die Beurteilung von Testergebnissen ist allerdings noch eine weitere Größe entscheidend: die Prävalenz Definition einer Krankheit. Anhand eines diagnostischen Tests im Rahmen einer Vorsorgeuntersuchung für Colonkarzinom zeigen wir Ihnen, wie Sensitivität, Spezifität, Prävalenz Definition und 4 Felder Tafel im (medizinischen) Alltag richtig eingesetzt werden. Wenn Sie Fragen rund um das Thema medizinische Statistik haben, stehen Ihnen unsere Experten zur Verfügung. Wir bieten Ihnen ein breites Angebot von der Statistik-Beratung bis hin zur statistischen Auswertungen. Nehmen Sie Kontakt mit uns auf!
Folgende Fragen werden in diesem Artikel beantwortet
- Was versteht man unter den Begriffen Sensitivität, Spezifität und Prävalenz?
- Was ist die Prävalenz Definition und weshalb ist diese Größe so wichtig?
- Wie nutze ich eine 4 Felder Tafel für die medizinische Statistik?
- Wie werden diagnostische Tests richtig interpretiert?
Die Früherkennungsuntersuchung
Markus geht mit einem etwas mulmigen Gefühl zum Arzt. Vor einer Woche hat er dort routinemäßig sein Testbriefchen mit der Stuhlprobe abgegeben. Diese wurde im Rahmen der Früherkennungsuntersuchung für Kolonkarinom (Dickdarmkrebs) im Labor untersucht. Vor zwei Tagen erhielt er schließlich einen Anruf von der Arzthelferin, die ihn zur Befundbesprechung einbestellt hatte. Das ist in den 7 Jahren, in denen er nun schon die Vorsorgeuntersuchung durchführt aber noch nie vorgekommen! Seit dem Telefonat kann Markus deshalb kaum noch schlafen.
Das Arztgespräch
Markus nimmt auf dem Stuhl in Sprechzimmer Platz. Sein Hausarzt erklärt ihm, dass okkultes Blut in der Stuhlprobe nachgewiesen wurde. Aufgrund des Ergebnisses bestehe der Verdacht auf Mastdarmkrebs. Der Arzt möchte daher mit weiteren Untersuchungen wie Darmspiegelung und einer Röntgenuntersuchung mit Kontrastmittel fortfahren.
Völlig verwirrt vereinbart Markus also Termine für die nächsten Untersuchungen und verlässt die Praxis.
Der positive Screeningtest – hat Markus nun Krebs?
Nach etlichen Überlegungen beschließt Markus schließlich, seinen Schulfreund Peter, einen Statistiker – spezialisiert auf medizinische Statistik, anzurufen und um ein Gespräch zu bitten. Darauf treffen sich die beiden am Abend und besprechen die Situation. Peter erklärt Markus die Sachlage schließlich folgendermaßen:
Screeningtest aus Sicht eines Statistikers
Ein optimaler diagnostischer Test erkennt alle Kranken als krank und alle Gesunden als gesund. Aber „nobody is perfect“. Das gilt auch für diagnostische Tests und medizinische Statistik. Generell sind zwei Arten von falschen Ergebnissen möglich:
- Falsch positives Ergebnis: der Test weist Blut in der Stuhlprobe nach, obwohl der Untersuchte kein Kolonkarzinom hat. Das ist dann ein falscher Alarm. Blut im Stuhl auch andere Ursachen haben wie z.B. Hämorriden,…
- Falsch negatives Ergebnis: der Test weist kein Blut nach, obwohl der Untersuchte tatsächlich ein Kolonkarzinom hat. Vielleicht war in der Probeentnahmestelle kein Blut oder das Karzinom hat zu diesem Zeitpunkt nicht geblutet.
Dies kann man auch anhand folgender 4 Felder Tafel darstellen:
Testergebnis positiv – Untersuchte wird als krank angesehen | Testergebnis negativ – Untersuchte wird als gesund angesehen | |
Der Untersuchte ist tatsächlich krank | Richtig positiv (RP) | Falsch negativ (FN) |
Der Untersuchte ist tatsächlich gesund | Falsch positiv (FP) | Richtig negativ (RN) |
Wie treffsicher ist ein diagnostischer Test? Sensitivität und Spezifität eines Tests
Die Güte eines diagnostischen Tests kann man mit zwei Gütekriterien beschreiben: Sensitivität & Spezifität.
- Unter Sensitivität versteht man den Anteil richtig positiver Ergebnisse, wenn der Untersuchte tatsächlich krank ist, also RP /(RP+FN).
- Die Spezifität eines Testverfahrens gibt dahingegen den Anteil der richtig negativen Testergebnissen unter allen gesunden Untersuchten an, also RN/(FP+RN).
Die Spezifität bei Tests in der Früherkennung liegt üblicherweise bei 97 %, die Sensitivität eines diagnostischen Tests ist dagegen oft nicht besser als 50 %.
Eine Sensitivität von 50 % bedeutet allerdings, dass die Hälfte der tatsächlich vorhandenen Kolonkarzinome übersehen wird.
Mit diesen Informationen ergibt sich dann die folgende 4 Felder Tafel:
Testergebnis positiv – Untersuchte wird als krank angesehen | Testergebnis negativ – Untersuchte wird als gesund angesehen | |
Der Untersuchte ist tatsächlich krank | 50 % richtig positiv (RP) | 50 % falsch negativ (FN) |
Der Untersuchte ist tatsächlich gesund | 3 % falsch positiv (FP) | 97 % richtig negativ (RN) |
Prävalenz Definition – oder was außer Sensitivität & Spezifität noch wichtig ist.
Markus Testergebnis ist positiv. Er möchte nun endlich von Peter wissen, ob seine Ängste berechtigt sind. Peter erklärt, dass die Wahrscheinlichkeit, dass Markus tatsächlich an Mastdarmkrebs erkrankt ist, noch von einer weiteren Größe abhängt, dem Anteil der Kranken in der Bevölkerung:
Prävalenz Definition: Häufigkeit einer Krankheit oder eines Symptoms in einer Population zu einem bestimmten Zeitpunkt. Die Prävalenz wird berechnet als Quotient aus der Anzahl der betroffenen Individuen und der Gesamtzahl aller Individuen dieser Population.
Die Schätzungen zur Prävalenz von Krebserkrankungen in Deutschland werden auf der Basis der jährlichen Neuerkrankungsraten (Inzidenz) und Überlebensraten ermittelt.
Laut Zentrum für Krebsregisterdaten des Robert-Koch Instituts betrug die altersspezifische Erkrankungsrate 2013 – 2014 bei Männern in der Altersgruppe 70 – 74 Jahre etwa 300 pro 100000 Einwohner und pro Jahr. Dies entspricht somit einer Prävalenz von 0,3 % pro Jahr.
4 Felder Tafel mit Sensitivität, Spezifität und Prävalenz:
Mit Hilfe dieser Information kann man die 4 Felder Tafel also folgendermaßen füllen:
Anzahl der untersuchten Personen | Testergebnis positiv – Untersuchte wird als krank angesehen | Testergebnis negativ – Untersuchte wird als gesund angesehen | |
Der Untersuchte ist tatsächlich krank | 300 | 50 % richtig positiv 150 | 50 % falsch negativ 150 |
Der Untersuchte ist tatsächlich gesund | 99700 | 3 % falsch positiv 2991 | 97 % richtig negativ 96709 |
SUMME | 100000 | 3141 | 96859 |
Von 100000 Untersuchten haben also 300 tatsächlich ein Kolonkarzinom. Von diesem 300 wird der Test 50 % daher 150 als krank erkennen (richtig positiv), die andere Hälfte wird übersehen (falsch negativ). 97 % der Gesunden, also 97 % von 99700 werden vom Screening korrekterweise als gesund erkannt, das sind 96709 Personen (richtig negativ). Bei 3 % der Gesunden schlägt der Test dagegen falschen Alarm. In unserem Zahlenbeispiel sind davon 2991 Personen betroffen (falsch positiv).
Insgesamt werden also 3141 Personen vom Test als positiv klassifiziert. Markus gehört zu der Gruppe mit positiven Testergebnis. Die Wahrscheinlichkeit, dass Markus nun tatsächlich krank ist, errechnet sich aus dem Anteil der Richtig positiven unter allen Untersuchten mit positiven Ergebnis, also 150/3141 = 0,0478 oder 4,78 %. Trotz des positiven Screeningergebnisses beträgt die Wahrscheinlichkeit, dass Markus tatsächlich krank ist nur 4,78 %. Mit einer Wahrscheinlichkeit von 100 % – 4,78 %=95,22 % hat er kein Kolonkarzinom.
Markus atmet auf – Entwarnung?
„Dann bin ich ja so gut wie gesund?“, erwidert Markus auf Peters Ausführungen. Ein positives Screeningergebnis ist kein Grund zur Panik, allerdings sollte Markus den Rat des Hausarztes befolgen, und weitere Untersuchungen durchführen zu lassen. Wenn zwei oder drei unabhängige voneinander durchgeführte Untersuchungen zum gleichen positiven Befund führen, erhöht sich die Wahrscheinlichkeit tatsächlich erkrankt zu sein, sehr schnell. Peter erklärt: Stell dir vor, alle 3141 Untersuchten mit positiven Befund werden gebeten, nochmals eine Stuhlprobe abzugeben, die dann mit dem Screeningtest (bei gleicher Sensitivität, Spezifität) untersucht wird. Die 4 Felder Tafel ergibt sich dabei als:
Anzahl der untersuchten Personen | Testergebnis positiv – Untersuchte wird als krank angesehen | Testergebnis negativ – Untersuchte wird als gesund angesehen | |
Der Untersuchte ist tatsächlich krank | 150 | 50 % richtig positiv 75 | 50 % falsch negativ 75 |
Der Untersuchte ist tatsächlich gesund | 2991 | 3 % falsch positiv 90 | 97 % richtig negativ 2901 |
SUMME | 3141 | 165 | 2976 |
Nach der 4 Felder Tafel haben also 165 Patienten bei 2 unabhängigen Screenings beide Male ein positives Ergebnis. Davon haben 75 Patienten tatsächlich ein Kolonkarzinom, das entspricht 75/165 = 0,4545 = 45,45 %.
Durch Folgeuntersuchungen, wie sie der Hausarzt angeraten hat, lässt sich die Diagnose also immer genauer abklären.
Prävalenz Definition als zentrale Information
Die Argumentation leuchtet Markus ein. Er ist froh, dass er die Termine für die Darmspiegelung bereits vereinbart hat. Er hat aber noch ein weiteres Anliegen: „Vielen Dank für deine Ausführung. Ich rufe dann gleich meine Tochter Anna an, die soll sich am besten auch gleich testen lassen: Sicher ist sicher!“ Daraufhin bremst Peter den Aktionismus seines Freundes etwas: „Wie alt ist denn deine Tochter?“ „32“.
„Die Prävalenz Definition ist keine statische Größe. Häufig haben z.B. Männer und Frauen unterschiedliche Prävalenzen. Außerdem tritt Kolonkarzinom bei jungen Menschen wesentlich seltener auf, als bei älteren. Die Prävalenz für Kolonkarzinom bei Frauen in der Altersgruppe 30-35 Jahre beträgt nur 10 je 100000, also 0,0001 oder 0,01%. Bei einer so kleinen Prävalenz ist die Wahrscheinlichkeit, bei einem positiven Befund tatsächlich erkrankt zu sein wesentlich niedriger als bei dir.“
Für Annas Situation ergibt sich also folgende 4 Felder Tafel:
Anzahl der untersuchten Personen | Testergebnis positiv
– Untersuchte wird als krank angesehen | Testergebnis negativ
– Untersuchte wird als gesund angesehen | |
Der Untersuchte ist tatsächlich krank | 10 | 50 % richtig positiv
5 | 50 % falsch negativ
5 |
Der Untersuchte ist tatsächlich gesund | 99990 | 3 % falsch positiv
3000 | 97 % richtig negativ
96990 |
SUMME | 100000 | 3005 | 96995 |
Man darf nicht vergessen, dass die Folgeuntersuchungen wie Darmspiegelung und Kontrastmittelradiologie nicht ohne mögliche Nebenwirkungen sind. Hier werden die beiden Situationen noch einmal gegenüber gestellt:
Markus: männlich, 73 Jahre | Anna: weiblich, 32 Jahre | |
Erstuntersuchungen | 100000 | 100000 |
Anzahl mit positiven Ergebnis = Anzahl derer, die nachuntersucht werden | 3141 | 3005 |
Maximale Anzahl durch Nachuntersuchung früh erkannte Krankheitsfälle | 150 | 5 |
Anzahl der Erstuntersuchung pro früh erkannten Fall | 100000/150 =667 | 10000/5 = 20000 |
Anzahl der Nachuntersuchungen pro früh erkannten Fall | 3141/150 = 21 | 3005/5 = 601 |
Zusammenfassung
Die beiden Größen Sensitivität Spezifität sind wichtige Kenngrößen für die Beurteilung diagnostischer Tests. Für die Berechnung der bedingten Erkrankungswahrscheinlichkeiten benötigt man außerdem die Prävalenz Definition. Die Prävalenz Definition bezieht sich dabei immer auf spezielle Populationen. So gibt es geschlechtsspezifische, altersspezifische aber auch gebietsspezifische Prävalenz. Befolgen Sie auf jeden Fall den Ratschlag ihres Arztes bei positiven Befunden. Aus Sicht der Wahrscheinlichkeitsrechnung ist ein positiver Befund möglich, auch wenn man tatsächlich nicht erkrankt ist.
Wenn Sie Fragen oder Probleme zu statistischen Fragestellungen auf dem Gebiet medizinische Statistik haben, stehen Ihnen unsere Experten gerne zur Verfügung. Nehmen Sie Kontakt mit uns auf.
Weiterführende Quellen
Das Beispiel ist in enger Anlehnung an Kapitel 3: Die Lebenslüge der medizinischen Statistik aus Beck-Bornholdt, Dubben: „Der Schein der Weisen – Irrtümer und Fehlurteile im täglichen Denken“ ISBN 3499614502 entstanden.