Wie verlässlich sind Corona-Tests?

Print 🖨 PDF 📄 eBook 📱

Der Fall des vor einigen Monaten fälschlicherweise positiv auf Corona getesteten Serge Gnabry vom FC Bayern hat auch einer breiteren Öffentlichkeit deutlich gemacht, dass die (PCR-) Corona-Tests mitnichten so zuverlässig sind, wie das vielfach angenommen und auch von Politikern und Medizinern gerne verbreitet wird. Selbst bei einer formal zunächst hochverlässlich klingenden Testsensitivität und -spezifität von 98% oder 99% sind die resultierenden Testergebnisse alles andere als sicher. Das hat vor allem mathematische Gründe.

Die resultierende Ungenauigkeit ist keine spezifische Schwäche des PCR-Tests an sich, wobei hier in der Anwendung durchaus noch einige zusätzliche Fallstricke warten, die die Testungenauigkeit noch weiter steigern können. Durch die Aussagen von Medizinern und Sprechern von Laboren, die Tests hätten nur eine Fehlerrate von 1%, wird ein falscher Eindruck erweckt. Wie gesagt, das hat wenig mit Medizin oder gar Virologie zu tun. Die Problematik besteht grundsätzlich bei jedem Test gegebener Sensitivität und Spezifität, z.B. auch dann, wenn Schrauben auf Passgenauigkeit überprüft werden.

Nehmen wir ein Beispiel: Testsensitivität 99%, Testspezifität 99%. Das klingt nach fast absoluter Sicherheit. Der Laie meint, damit seien 99% aller positiven Testergebnisse verlässlich und nur 1% falsch. Dem ist leider nicht so. Tatsächlich könnten hier bis zu 50% aller Positiv-Fälle in Wahrheit negativ sein.

Bevor wir dies aufklären, sollen noch die beiden Fachbegriffe kurz erläutert werden.

Sensitivität und Spezifität

Testsensitivität 100% bedeutet Folgendes: Wenn eine Person Virusträger ist, dann zeigt dies der Test mit Sicherheit an. Jeder Infizierte wird demnach als solcher erkannt. Bei einer Testsensitivität von p wird das Virus durch den Test entsprechend mit der Wahrscheinlichkeit p gefunden.

Testspezifität 100% bedeutet Folgendes: Wenn eine Person kein Virusträger ist, dann wird dies vom Test mit Sicherheit erkannt. Jeder Nicht-Infizierte wird demnach eindeutig als gesund identifiziert. Bei einer Testspezifität von q wird die Abwesenheit des Virus vom Test entsprechend mit der Wahrscheinlichkeit q erkannt.

Ein simples Beispiel

Um zu verstehen, wie es trotz der hohen Verlässlichkeit des Testverfahrens zu dieser großen Ungenauigkeit bezüglich der positiven Testergebnisse kommt, betrachten wir ein konkret nachvollziehbares Beispielszenario, in dem die betreffenden Wahrscheinlichkeiten unmittelbar auf der Hand liegen.

Nehmen wir einige Blätter kariertes Papier und schneiden davon 101 quadratische Zettel mit je 5 cm Seitenlänge heraus. Auf jedem der kleinen Papierbögen haben wir nun 10×10 = 100 kleine Quadrate á 5 mm Seitenlänge. Nun nehmen wir die Zettel und färben jeweils genau eines der kleinen Quadrate schwarz ein. Auf dem ersten Zettel das erste Quadrat oben links, auf dem zweiten Zettel das zweite Quadrat in der Reihe, usw., so dass am Ende auf jedem Zettel ein anderes Quadrat eingefärbt ist. Nachdem wir 100 Zettel derart bearbeitet haben, färben wir den letzten (101-ten) Zettel komplett schwarz. Nun überkleben wir die Zettel mit einer abziehbaren intransparenten Folie, die gleichfalls mit einem 5×5 mm Karomuster bedruckt ist.

Abbildung 1: Das Beispielszenario (s. Text)

Wenn wir nun einen der Zettel 1 – 100 zur Hand nehmen, zufällig eines der 100 darauf bedruckten kleinen Quadrate auswählen und es abziehen, befindet sich darunter entweder ein weißes oder ein schwarzes Quadrat. Nachdem jeder der Zettel genau ein schwarzes Quadrat trägt, ist die Wahrscheinlichkeit, auf ein solches Quadrat zu stoßen 1:100. In 99 von 100 Fällen ist das freigelegte Quadrat weiß. Beim 101-ten Zettel sind alle Quadrate schwarz, demzufolge finden wir dort mit 100%-iger Wahrscheinlichkeit ein schwarzes Quadrat.

Die Analogie zum Corona-Testszenario

Worin besteht nun der Querbezug zum Testszenario bei einem Corona-Test? Ganz einfach: Der bestimmte durchgehend schwarz eingefärbte Zettel entspricht einem mit Corona infizierten Probanden. Ihn zu finden ist die Aufgabe des Tests. Der Test ist so konstruiert, dass wir diesen Zettel mit 100%-iger Sicherheit finden. Demzufolge haben wir hier eine Testsensitivität von 100%.

Die übrigen 100 weißen Zettel mit nur einem schwarz eingefärbten Quadrat stehen für die große Mehrheit der nicht infizierten Probanden. Wenn wir einen solchen Zettel nehmen und ein beliebiges Quadrat freilegen, sehen wir dort mit 99%-iger Wahrscheinlichkeit ein weißes Quadrat. In diesem Wert spiegelt sich die Testspezifität wider: Das ist die Wahrscheinlichkeit dafür, dass der entsprechende Zettel nicht gänzlich schwarz ist bzw., dass ein Proband nicht infiziert ist.

Nun stellen wir uns der Aufgabe, unter den 101 Zetteln den komplett schwarz eingefärbten zu finden. Dazu dürfen wir ein beliebiges quadratisches Feld aussuchen, die Zettel nacheinander zur Hand nehmen und das betreffende Feld freilegen. Was passiert?

Die Ungenauigkeit solcher Tests ist kein spezifisches Corona-Problem

Genau einer der 100 weißen Zettel hat an der freigelegten Stelle ein schwarzes Quadrat, die 99 anderen zeigen ein weißes Quadrat. Der eine schwarze Zettel (den wir aber nicht als solchen erkennen) zeigt natürlich ebenfalls ein schwarzes Quadrat. Wir haben also 2 Zettel mit schwarzen Quadraten und können nicht entscheiden, welcher davon der gänzlich schwarze Zettel ist. Die Falsch-Positiv-Rate beträgt somit 50%. Genau die gleiche Situation haben wir bei einem Corona-Test mit einer 100%-igen Testsensitivität und einer 99%-igen Testspezifität unter der Annahme von 1% tatsächlich positiven Probanden.

Nun skalieren wir das beschriebene Szenario auf die Situation mit einer Million weißen und schwarzen Zetteln. Dazu multiplizieren wir einfach mit dem Faktor 10.000. Wir finden sodann 20.000 Zettel mit einem schwarzen Quadrat. Da tatsächlich nur 10.000 Zettel wirklich schwarz sind, haben wir somit weitere 10.000 die fälschlicherweise als schwarz angesehen werden.

Übertragen auf das Testszenario beim Corona-Test mit 100%-iger Testsensitivität und 99%-iger Testspezifität entspricht dies 20.000 positiv Getesteten bei nur 10.000 tatsächlichen Virenträgern und damit einer Falsch-Positiv-Rate von 50%. Die realen Verhältnisse dürften nicht allzu weit davon entfernt liegen.

Konkrete Zahlenwerte

Wenn wir davon ausgehen, dass 2% der Bevölkerung Träger des Coronavirus sind, dann liegt ein solcher Test (mit Testsensitivität = 99% und Testspezifität = 99%) im Hinblick auf die Gesamtbevölkerung in 33% aller Positivfälle falsch. D.h., jeder dritte positiv Getestete ist in Wahrheit nicht infiziert. Und wenn die Testspezifität „nur“ 98% beträgt, was ja immer noch sehr vertrauenswürdig klingt, dann ist sogar nur jeder zweite Positivfall tatsächlich ein Virusträger.

Der Fall Gnabry ist also keineswegs die große Ausnahme. Er zeigt auch, ein singulärer Positivtest ist allenfalls ein Indikator für eine mögliche Infektion und ruft förmlich nach einem Zweittest.

Was bringen Antigen (Schnell-) Tests?

Für sehr gute Antigentests werden eine Testsensitivität von 95% und eine Testspezifität von 97% angegeben. Unter den gleichen Bedingungen wie oben (also die Annahme, tatsächlich seien 2% der Getesteten Virenträger) resultiert ein solcher Antigentest in einer Falsch-Positivrate von 60% (s. Abb. 2). Weniger gute Antigentests mit einer Testsensitivität von 90% und einer Testspezifität von 90% führen gar zu einer Falsch-Positivrate von 85% und sind damit bezüglich der Positivaussage fast wertlos.

In Abb. 2 sind die Zusammenhänge bei Variation der Testspezifität von 90% bis 100% und Prävalenzen von 1% bis 10% grafisch dargestellt.

Abbildung 2: Resultierende Falsch-Positiv-Rate in Abhängigkeit von der Testspezifität für Prävalenzen von 1%, 2%, 5% und 10%. Die Testsensitivität wurde hier zu 100% angenommen. Bei einer niedrigeren Sensitivität verschieben sich die Kurven für die Falsch-Positiv-Rate noch etwas nach oben, allerdings ist dieser Effekt bei Sensitivitäten über 90% relativ klein.

Was die Beispiele ebenfalls enthüllen: Wahllose Tests sind wenig sinnvoll und richten wahrscheinlich mehr Schaden an als sie Nutzen stiften. Tests mit einer Spezifität von 97% und darunter sind allenfalls in Bezug auf Risikogruppen mit einer hohen Prävalenz (höhere Wahrscheinlichkeit, tatsächlich infiziert zu sein, z.B. > 10% bis 30%) von Nutzen, denn nur in diesem Fall sinkt die Wahrscheinlichkeit für ein Falsch-Positives Testergebnis unter 20%.

Immerhin ist die Negativaussage (Proband ist nicht infiziert) in all diesen Beispielen mit hoher Wahrscheinlichkeit (95% bis über 99%) zutreffend. Wer also ein negatives Testergebnis bekommt, der darf darauf vertrauen. Natürlich vorausgesetzt, der Test wurde medizinisch und labortechnisch adäquat durchgeführt.

Faustregel

Man kann sich den prinzipiellen Zusammenhang leicht merken.

Wenn die relative Häufigkeit für das Auftreten eines bestimmten gesuchten Merkmals (also die Prävalenz) in einer vorgegebenen Gesamtheit p Prozent beträgt, dann hat ein Testverfahren, für das gilt Sensitivität = Spezifität = 100 – p Prozent eine Falsch-Positiv-Rate von exakt 50%.

Beispiel 1: Prävalenz 1%, Sensitivität = Spezifität = 99%, Falsch-Positiv-Rate = 50%.

Beispiel 2: Prävalenz 5%, Sensitivität = Spezifität = 95%, Falsch-Positiv-Rate = 50%.

Oft ist die Sensitivität nahe 100%. In diesem Falle kann man die Falsch-Positiv-Rate leicht anhand der folgenden Faustregel abschätzen.

Wenn die relative Häufigkeit für das Auftreten eines bestimmten gesuchten Merkmals (also die Prävalenz) in einer vorgegebenen Gesamtheit p Prozent beträgt, dann hat ein Testverfahren der Genauigkeit 100 – p Prozent (das ist die Testspezifität) eine Falsch-Positiv-Rate von ca. 50%. Für Prävalenzen bis zu 10% ist das eine sehr gute Näherung. Die Sensitivität hat nur einen geringen Einfluss.

Beispiel 3: Prävalenz 2%, Spezifität = 98%, Falsch-Positiv-Rate = 49,5%, Näherungsfehler 0,5%.

Beispiel 4: Prävalenz 10%, Sensitivität = 100%, Spezifität = 90%, Falsch-Positiv-Rate = 47,4%, Näherungsfehler 2,6%.

sumymus blog