Sensitivität, Spezifität und Prävalenz: Diagnostische Test

In der Medizin haben analytische Testverfahren eine zentrale und oft sogar lebensrettende Bedeutung. Das Ziel dieser diagnostischen Tests ist es, krankheitsspezifische Marker nachzuweisen, damit man einen Rückschluss auf das Vorhandensein einer bestimmten Krankheit ziehen kann. Allerdings kann auch der beste diagnostische Test keine 100 %ige Treffergenauigkeit aufweisen. Die Genauigkeit eines diagnostischen Tests wird deshalb über zwei Maßzahlen beschrieben: Sensitivität und Spezifität. Für die Beurteilung von Testergebnissen ist allerdings noch eine weitere Größe entscheidend: die Prävalenz Definition einer Krankheit. Anhand eines diagnostischen Tests im Rahmen einer Vorsorgeuntersuchung für Colonkarzinom zeigen wir Ihnen, wie Sensitivität, Spezifität, Prävalenz Definition und 4 Felder Tafel im (medizinischen) Alltag richtig eingesetzt werden. Wenn Sie Fragen rund um das Thema medizinische Statistik haben, stehen Ihnen unsere Experten zur Verfügung. Wir bieten Ihnen ein breites Angebot von der Statistik-Beratung bis hin zur statistischen Auswertungen. Nehmen Sie Kontakt mit uns auf!

Folgende Fragen werden in diesem Artikel beantwortet

Was versteht man unter den Begriffen Sensitivität, Spezifität und Prävalenz?
Was ist die Prävalenz Definition und weshalb ist diese Größe so wichtig?
Wie nutze ich eine 4 Felder Tafel für die medizinische Statistik?
Wie werden diagnostische Tests richtig interpretiert?

Die Früherkennungsuntersuchung

Markus geht mit einem etwas mulmigen Gefühl zum Arzt. Vor einer Woche hat er dort routinemäßig sein Testbriefchen mit der Stuhlprobe abgegeben. Diese wurde im Rahmen der Früherkennungsuntersuchung für Kolonkarinom (Dickdarmkrebs) im Labor untersucht. Vor zwei Tagen erhielt er schließlich einen Anruf von der Arzthelferin, die ihn zur Befundbesprechung einbestellt hatte. Das ist in den 7 Jahren, in denen er nun schon die Vorsorgeuntersuchung durchführt aber noch nie vorgekommen! Seit dem Telefonat kann Markus deshalb kaum noch schlafen.

Das Arztgespräch

Markus nimmt auf dem Stuhl in Sprechzimmer Platz. Sein Hausarzt erklärt ihm, dass okkultes Blut in der Stuhlprobe nachgewiesen wurde. Aufgrund des Ergebnisses bestehe der Verdacht auf Mastdarmkrebs. Der Arzt möchte daher mit weiteren Untersuchungen wie Darmspiegelung und einer Röntgenuntersuchung mit Kontrastmittel fortfahren.

Völlig verwirrt vereinbart Markus also Termine für die nächsten Untersuchungen und verlässt die Praxis.

Der positive Screeningtest – hat Markus nun Krebs?

Nach etlichen Überlegungen beschließt Markus schließlich, seinen Schulfreund Peter, einen Statistiker – spezialisiert auf medizinische Statistik, anzurufen und um ein Gespräch zu bitten. Darauf treffen sich die beiden am Abend und besprechen die Situation. Peter erklärt Markus die Sachlage schließlich folgendermaßen:

Jetzt unverbindlich anfragen

Screeningtest aus Sicht eines Statistikers

Ein optimaler diagnostischer Test erkennt alle Kranken als krank und alle Gesunden als gesund. Aber „nobody is perfect“. Das gilt auch für diagnostische Tests und medizinische Statistik. Generell sind zwei Arten von falschen Ergebnissen möglich:

Falsch positives Ergebnis: der Test weist Blut in der Stuhlprobe nach, obwohl der Untersuchte kein Kolonkarzinom hat. Das ist dann ein falscher Alarm. Blut im Stuhl auch andere Ursachen haben wie z.B. Hämorriden,…
Falsch negatives Ergebnis: der Test weist kein Blut nach, obwohl der Untersuchte tatsächlich ein Kolonkarzinom hat. Vielleicht war in der Probeentnahmestelle kein Blut oder das Karzinom hat zu diesem Zeitpunkt nicht geblutet.

Dies kann man auch anhand folgender 4 Felder Tafel darstellen:

	Testergebnis positiv – Untersuchte wird als krank angesehen	Testergebnis negativ – Untersuchte wird als gesund angesehen
Der Untersuchte ist tatsächlich krank	Richtig positiv (RP)	Falsch negativ (FN)
Der Untersuchte ist tatsächlich gesund	Falsch positiv (FP)	Richtig negativ (RN)

Sensitivität Spezifität spielen in für medizinische Statistik eine große Rolle — Auch bei den besten diagnostischen Tests gibt es falsche Ergebnisse

Wie treffsicher ist ein diagnostischer Test? Sensitivität und Spezifität eines Tests

Die Güte eines diagnostischen Tests kann man mit zwei Gütekriterien beschreiben: Sensitivität & Spezifität.

Unter Sensitivität versteht man den Anteil richtig positiver Ergebnisse, wenn der Untersuchte tatsächlich krank ist, also \(RP /(RP+FN)\).
Die Spezifität eines Testverfahrens gibt dahingegen den Anteil der richtig negativen Testergebnissen unter allen gesunden Untersuchten an, also \(RN/(FP+RN)\).

Die Spezifität bei Tests in der Früherkennung liegt üblicherweise bei 97 %, die Sensitivität eines diagnostischen Tests ist dagegen oft nicht besser als 50 %.

Eine Sensitivität von 50 % bedeutet allerdings, dass die Hälfte der tatsächlich vorhandenen Kolonkarzinome übersehen wird.

Mit diesen Informationen ergibt sich dann die folgende 4 Felder Tafel:

	Testergebnis positiv – Untersuchte wird als krank angesehen	Testergebnis negativ – Untersuchte wird als gesund angesehen
Der Untersuchte ist tatsächlich krank	50 % richtig positiv (RP)	50 % falsch negativ (FN)
Der Untersuchte ist tatsächlich gesund	3 % falsch positiv (FP)	97 % richtig negativ (RN)

Prävalenz Definition – oder was außer Sensitivität & Spezifität noch wichtig ist.

Markus Testergebnis ist positiv. Er möchte nun endlich von Peter wissen, ob seine Ängste berechtigt sind. Peter erklärt, dass die Wahrscheinlichkeit, dass Markus tatsächlich an Mastdarmkrebs erkrankt ist, noch von einer weiteren Größe abhängt, dem Anteil der Kranken in der Bevölkerung:

Prävalenz Definition: Häufigkeit einer Krankheit oder eines Symptoms in einer Population zu einem bestimmten Zeitpunkt. Die Prävalenz wird berechnet als Quotient aus der Anzahl der betroffenen Individuen und der Gesamtzahl aller Individuen dieser Population.

Die Schätzungen zur Prävalenz von Krebserkrankungen in Deutschland werden auf der Basis der jährlichen Neuerkrankungsraten (Inzidenz) und Überlebensraten ermittelt.

Laut Zentrum für Krebsregisterdaten des Robert-Koch Instituts betrug die altersspezifische Erkrankungsrate 2013 – 2014 bei Männern in der Altersgruppe 70 – 74 Jahre etwa 300 pro 100000 Einwohner und pro Jahr. Dies entspricht somit einer Prävalenz von 0,3 % pro Jahr.

4 Felder Tafel mit Sensitivität, Spezifität und Prävalenz:

Mit Hilfe dieser Information kann man die 4 Felder Tafel also folgendermaßen füllen:

	Anzahl der untersuchten Personen	Testergebnis positiv – Untersuchte wird als krank angesehen	Testergebnis negativ – Untersuchte wird als gesund angesehen
Der Untersuchte ist tatsächlich krank	300	50 % richtig positiv 150	50 % falsch negativ 150
Der Untersuchte ist tatsächlich gesund	99700	3 % falsch positiv 2991	97 % richtig negativ 96709
SUMME	100000	3141	96859

Von 100000 Untersuchten haben also 300 tatsächlich ein Kolonkarzinom. Von diesem 300 wird der Test 50 % daher 150 als krank erkennen (richtig positiv), die andere Hälfte wird übersehen (falsch negativ). 97 % der Gesunden, also 97 % von 99700 werden vom Screening korrekterweise als gesund erkannt, das sind 96709 Personen (richtig negativ). Bei 3 % der Gesunden schlägt der Test dagegen falschen Alarm. In unserem Zahlenbeispiel sind davon 2991 Personen betroffen (falsch positiv).

Insgesamt werden also 3141 Personen vom Test als positiv klassifiziert. Markus gehört zu der Gruppe mit positiven Testergebnis. Die Wahrscheinlichkeit, dass Markus nun tatsächlich krank ist, errechnet sich aus dem Anteil der Richtig positiven unter allen Untersuchten mit positiven Ergebnis, also 150/3141 = 0,0478 oder 4,78 %. Trotz des positiven Screeningergebnisses beträgt die Wahrscheinlichkeit, dass Markus tatsächlich krank ist nur 4,78 %. Mit einer Wahrscheinlichkeit von 100 % – 4,78 %=95,22 % hat er kein Kolonkarzinom.

Markus atmet auf – Entwarnung?

„Dann bin ich ja so gut wie gesund?“, erwidert Markus auf Peters Ausführungen. Ein positives Screeningergebnis ist kein Grund zur Panik, allerdings sollte Markus den Rat des Hausarztes befolgen, und weitere Untersuchungen durchführen zu lassen. Wenn zwei oder drei unabhängige voneinander durchgeführte Untersuchungen zum gleichen positiven Befund führen, erhöht sich die Wahrscheinlichkeit tatsächlich erkrankt zu sein, sehr schnell. Peter erklärt: Stell dir vor, alle 3141 Untersuchten mit positiven Befund werden gebeten, nochmals eine Stuhlprobe abzugeben, die dann mit dem Screeningtest (bei gleicher Sensitivität, Spezifität) untersucht wird. Die 4 Felder Tafel ergibt sich dabei als:

	Anzahl der untersuchten Personen	Testergebnis positiv – Untersuchte wird als krank angesehen	Testergebnis negativ – Untersuchte wird als gesund angesehen
Der Untersuchte ist tatsächlich krank	150	50 % richtig positiv 75	50 % falsch negativ 75
Der Untersuchte ist tatsächlich gesund	2991	3 % falsch positiv 90	97 % richtig negativ 2901
SUMME	3141	165	2976

Nach der 4 Felder Tafel haben also 165 Patienten bei 2 unabhängigen Screenings beide Male ein positives Ergebnis. Davon haben 75 Patienten tatsächlich ein Kolonkarzinom, das entspricht 75/165 = 0,4545 = 45,45 %.

Durch Folgeuntersuchungen, wie sie der Hausarzt angeraten hat, lässt sich die Diagnose also immer genauer abklären.

Prävalenz Definition als zentrale Information

Die Argumentation leuchtet Markus ein. Er ist froh, dass er die Termine für die Darmspiegelung bereits vereinbart hat. Er hat aber noch ein weiteres Anliegen: „Vielen Dank für deine Ausführung. Ich rufe dann gleich meine Tochter Anna an, die soll sich am besten auch gleich testen lassen: Sicher ist sicher!“ Daraufhin bremst Peter den Aktionismus seines Freundes etwas: „Wie alt ist denn deine Tochter?“ „32“.

„Die Prävalenz Definition ist keine statische Größe. Häufig haben z.B. Männer und Frauen unterschiedliche Prävalenzen. Außerdem tritt Kolonkarzinom bei jungen Menschen wesentlich seltener auf, als bei älteren. Die Prävalenz für Kolonkarzinom bei Frauen in der Altersgruppe 30-35 Jahre beträgt nur 10 je 100000, also 0,0001 oder 0,01%. Bei einer so kleinen Prävalenz ist die Wahrscheinlichkeit, bei einem positiven Befund tatsächlich erkrankt zu sein wesentlich niedriger als bei dir.“

Für Annas Situation ergibt sich also folgende 4 Felder Tafel:

	Anzahl der untersuchten Personen	Testergebnis positiv – Untersuchte wird als krank angesehen	Testergebnis negativ – Untersuchte wird als gesund angesehen
Der Untersuchte ist tatsächlich krank	10	50 % richtig positiv 5	50 % falsch negativ 5
Der Untersuchte ist tatsächlich gesund	99990	3 % falsch positiv 3000	97 % richtig negativ 96990
SUMME	100000	3005	96995

Man darf nicht vergessen, dass die Folgeuntersuchungen wie Darmspiegelung und Kontrastmittelradiologie nicht ohne mögliche Nebenwirkungen sind. Hier werden die beiden Situationen noch einmal gegenüber gestellt:

	Markus: männlich, 73 Jahre	Anna: weiblich, 32 Jahre
Erstuntersuchungen	100000	100000
Anzahl mit positiven Ergebnis = Anzahl derer, die nachuntersucht werden	3141	3005
Maximale Anzahl durch Nachuntersuchung früh erkannte Krankheitsfälle	150	5
Anzahl der Erstuntersuchung pro früh erkannten Fall	100000/150 =667	10000/5 = 20000
Anzahl der Nachuntersuchungen pro früh erkannten Fall	3141/150 = 21	3005/5 = 601

Zusammenfassung

Die beiden Größen Sensitivität Spezifität sind wichtige Kenngrößen für die Beurteilung diagnostischer Tests. Für die Berechnung der bedingten Erkrankungswahrscheinlichkeiten benötigt man außerdem die Prävalenz Definition. Die Prävalenz Definition bezieht sich dabei immer auf spezielle Populationen. So gibt es geschlechtsspezifische, altersspezifische aber auch gebietsspezifische Prävalenz. Befolgen Sie auf jeden Fall den Ratschlag ihres Arztes bei positiven Befunden. Aus Sicht der Wahrscheinlichkeitsrechnung ist ein positiver Befund möglich, auch wenn man tatsächlich nicht erkrankt ist.

Wenn Sie Fragen oder Probleme zu statistischen Fragestellungen auf dem Gebiet medizinische Statistik haben, stehen Ihnen unsere Experten gerne zur Verfügung. Nehmen Sie Kontakt mit uns auf.

Weiterführende Quellen

Das Beispiel ist in enger Anlehnung an Kapitel 3: Die Lebenslüge der medizinischen Statistik aus Beck-Bornholdt, Dubben: „Der Schein der Weisen – Irrtümer und Fehlurteile im täglichen Denken“ ISBN 3499614502 entstanden.

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Speichert die Einstellungen der Besucher, die in der Cookie Box von Borlabs Cookie ausgewählt wurden.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Google Tag Manager
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google zur Steuerung der erweiterten Script- und Ereignisbehandlung.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren	Google Analytics
Name	Google Analytics
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google für Website-Analysen. Erzeugt statistische Daten darüber, wie der Besucher die Website nutzt.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Monate

Akzeptieren	Vimeo Statistiken
Name	Vimeo Statistiken
Anbieter	Vimeo.com, Inc.
Zweck	Sammelt Daten über Besuche des Benutzers auf der Website, wie zum Beispiel welche Seiten gelesen wurden.
Datenschutzerklärung	https://vimeo.com/privacy
Host(s)	vimeo.com
Cookie Name	vuid
Cookie Laufzeit	2 Jahre

Akzeptieren	Proven Expert
Name	Proven Expert
Anbieter	Expert Systems AG
Zweck	Sammelt Informationen zum Besucherverhalten auf mehreren Webseiten. Diese Informationen wird auf der Webseite verwendet, um die Relevanz der Werbung zu optimieren.
Datenschutzerklärung	https://www.provenexpert.com/en-us/privacy-policy/
Host(s)	provenexpert.com
Cookie Name	PE_SESSION
Cookie Laufzeit	Session

Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

+49 211 99346512

+41 78 89 11111

+43 720 3035410

Sensitivität, Spezifität und Prävalenz: Diagnostische Test in der Medizin