CoronaGesellschaft

Über die Grenzen der Statistik

Offensichtlich stoßen Zahlen und Statistiken zur Lage in Corona-Zeiten auf erhebliches Interesse. Aber leider lassen sich gerade die jetzigen Statistiken sehr leicht falsch interpretieren.

Das heißt nun nicht, dass diese Zahlen und Statistiken falsch seien. Aber sie bilden nur einen kleinen Teil der Realität ab, seriöse Hochrechnungen lassen sich kaum erstellen. Trotzdem kann man auch auf dieser Basis durchaus Schlussfolgerungen ziehen. Aber es können eben auch einmal die falschen Schlussfolgerungen sein.

Und weil im Moment sehr viele Menschen die Statistiken sehen, die sonst wenig mit Mathematik und Statistik zu tun haben, möchte ich in diesem Artikel einmal die grundsätzlichen Probleme dieser Statistiken aufzeigen.

Die Datenbasis

Die Datenbasis für jede Statistik zur Corona-Pandemie ist notgedrungen unvollständig. Das gilt für alle Länder der Welt. Und es liegt ganz einfach daran, dass bisher in den allermeisten Ländern fast nur die Personen getestet werden, die schwere Symptome von Covid-19 aufweisen.

Aufgrund der Situation im Gesundheitswesen und der begrenzten Anzahl der möglichen Tests ist das auch durchaus richtig. Aber aus Sicht der Statistik stellt es ein erhebliches Problem dar. Weil nämlich recht viele Menschen (wohl irgendwo zwischen 80 und 90 %) entweder gar keine oder nur sehr geringe Symptome aufweisen und dementsprechend gar nicht erst getestet werden.

Deswegen tauchen diese Personen in keiner offiziellen Statistik auf, obwohl sie durchaus an Covid-19 erkrankt sind. Man bezeichnet diese Gruppe von Personen als Dunkelziffer .Und sie könnte bei der aktuellen Pandemie sehr groß sein. Leider lässt sich diese Dunkelziffer aber nicht errechnen, ein Statistiker kann sie bestenfalls einigermaßen begründet schätzen.

Solange diese Schätzung auch als solche gekennzeichnet wird und der Statistiker erklärt, auf welcher Basis geschätzt wurde, ist das auch kein größeres Problem. Aber leider werden solche Zahlen teilweise auch ohne große Erklärung weitergegeben und dann (im schlimmsten Fall) sogar als Basis für Entscheidungen genutzt.

Feldstudien in eng umgrenzten Gebieten

Ein ähnliches Problem stellt sich bei Feldstudien in kleineren Gebieten. Diese Studien werden gerne „repräsentative“ Studien genannt, selbst wenn sie bei genauerem Hinsehen gar nicht so sehr repräsentativ sind.

Streng genommen wird eine Studie an wenigen Personen erst dann repäsentativ für eine größere Gruppe, wenn die kleinere Gruppe in ihren Eigenschaften exakt der größeren Gruppe entspricht. In der Praxis lässt sich das quasi nie erreichen, also versucht man sich diesem Punkt so weit wie möglich anzunähern.

Aber selbst wenn diese Annäherung gelingt, lassen sich die Ergebnisse dieser Studie nicht notwendigerweise auf jede größere Gruppe hochrechnen.

Wenn also beispielsweise in einer kleinen Gemeinde mit 20.000 Einwohnern eine repräsentative Studie an 500 oder 1.000 Einwohnern durchgeführt wird, dann lassen sich die Ergebnisse dieser Studie mit hoher Wahrscheinlichkeit auf die 20.000 Einwohner dieser Gemeinde hochrechnen. Das Ergebnis dieser Hochrechnung wird dann auch annähernd korrekt ausfallen.

Aber ob sich die Ergebnisse dann auch mit einem korrekten Ergebnis auf die rund 83 Millionen Einwohner von ganz Deutschland hochrechnen lassen, ist sehr fraglich.

Leider wird aber genau das gemacht. So hat beispielsweise eine aktuelle Studie der Uni Bonn zur Corona-Situation in der Gemeinde Gangelt im deutschen Kreis Heinsberg eine Infizierung von 15 % der Bevölkerung in dieser Gemeinde ergeben. Und dieses nicht-verifizierte Ergebnis eines Zwischenberichts wird jetzt munter dazu genutzt, um Ergebnisse für ganz Deutschland und andere Länder hochzurechnen.

Natürlich können Statistiken mit solchen Hochrechnungen durchaus interessante Anhaltspunkte liefern. Aber die Ergebnisse dieser Hochrechnungen sollten klar als Schätzungen ausgewiesen werden, damit sie nicht als reale Zahlen missverstanden werden können. Und das ist leider nicht immer der Fall.

Der Einfluss der Testanzahl

Kein Land der Welt kann genügend Tests durchführen, um alle Menschen mit Symptomen auch nur annähernd testen zu können. Denn die dazu verwendeten PCR-Tests benötigen neben den Testmaschinen und dem nötigen Zeitaufwand (beides steht nicht unbegrenzt zur Verfügung) vor allem auch Materialien (Abstrich-Kits und Reagenzien), die nicht in beliebiger Anzahl beschafft werden können.

Deswegen werden in nahezu allen Ländern fast nur die Personen getestet, die stärkere Symptome aufweisen. Bei diesen durchgeführten Tests liegt die Positiv-Rate (die Anzahl der Personen, bei denen der Test positiv war) um die 10 %. Was bedeutet, dass von hundert getesteten Personen ungefähr 10 positiv auf Covid-19 getestet werden.

Wenn in einem Land also die maximal mögliche Test-Anzahl bei 10.000 Tests pro Tag liegt, dann können in diesem Land durchschnittlich ungefähr 1.000 Personen pro Tag positiv getestet werden. Man bezeichnet diese Zahl als technische Nachweisgrenze.

Wenn nun aber die Zahl der täglichen Neu-Infektionen mit Symptomen oberhalb dieser technischen Nachweisgrenze liegt, dann werden nicht neu Infizierten positiv getestet werden, weil die Anzahl der zur Verfügung stehenden Tests das schlicht nicht zulässt.

In solchen Fällen sieht es dann in der Statistik so aus, als ob die Anzahl der Neu-Infektionen stagnieren würde. Obwohl tatsächlich nur die Testkapazität nicht ausreicht, um alle Neu-Infizierten auch tatsächlich zu testen.

Grundsätzlich ist das auch kein besonderes Problem für die Statistik. Wenn die Nachweisgrenze bekannt ist, lässt sich in der Statistik durchaus anmerken, dass diese Grenze erreicht wurde und die Zahlen ab diesem Punkt nicht mehr die tatsächliche Situation widerspiegeln.

Leider wird aber auch das nicht immer beherzigt. Und das birgt dann das große Risiko, dass aufgrund dieser scheinbar stagnierenden Neu-Infektionen falsche Entscheidungen getroffen werden.

Ein Beispiel hierfür liefert der Vergleich des prozentualen Zuwachses der Neu-Infektionen zwischen Luxemburg und Deutschland.

Da sich Deutschland bereits seit einiger Zeit so ziemlich an der Nachweisgrenze befindet (siehe auch Spiegel vom 10.04.2020) und auch recht früh Eindämmungsmaßnahmen beschlossen hat, verläuft die Steigerung für Deutschland (die grüne Linie) nahezu linear.

Bei Luxemburg (die rosa Linie) verläuft die Steigerung ähnlich linear, weil auch hier an der Nachweisgrenze gearbeitet wird. Sie verläuft etwas steiler, weil die Testkapazität im Verhältnis zur Bevölkerung höher ist als in Deutschland. Aber hier ist besonders auffällig, dass die Kurve zum Schluss hin erheblich abflacht. Das sollte eigentlich auf einen Rückgang der Zuwachsrate hindeuten. Tatsächlich liegt es hauptsächlich daran, dass in Luxemburg in der letzten Woche verhältnismäßig wenige Tests durchgeführt wurden.

Was aber so manchen Statistiker nicht daran gehindert hat, laut und deutlich auf die sinkenden Zahlen und die großen Erfolge bei der Pandemie-Bekämpfung hinzuweisen. Und zwar leider ohne die Einschränkung, dass es dafür auch einen anderen Grund geben könnte.

Die Grafik unten stellt die Testsituation in Luxemburg seit Beginn der Pandemie dar. Sie zeigt deutlich den Rückgang der Testaktivitäten in Luxemburg in den letzten Tagen.

Ein weiteres Problem mit dieser Nachweisgrenze stellt sich dann, wenn die Infektionsverläufe verschiedener Länder miteinander verglichen werden. Denn die Testkapazität der Länder sind kaum vergleichbar. Die Statistik läuft dann Gefahr, tatsächliche Neu-Infektionen mancher Länder mit der Nachweisgrenze anderer Länder zu vergleichen. Was logischerweise dann zu technisch falschen Vergleichen führt.

Daneben ist die Anzahl der Test natürlich auch für die Anzahl der offiziellen Fallanzahl entscheidend. Denn umso weniger Tests durchgeführt werden, desto weniger Infizierte werden natürlich auch gefunden. Aber damit hat natürlich auch die Anzahl der durchgeführten Tests einen erheblichen Einfluss auf die Entwicklung der Pandemie in den verschiedenen Ländern und erschwert den Vergleich zwischen Ländern noch einmal deutlich.

Trotzdem können statistische Vergleiche verschiedener Länder durchaus nützlich sein, um die verschiedenen Entwicklungen zu verdeutlichen. Der Leser der Statistik sollte sich der aus der Testanzahl und der Nachweisgrenze resultierenden Probleme allerdings bewusst sein. Und deswegen muss der Autor der Statistik auf diese Problematik hinweisen.

Die richtige Darstellung der Neu-Infektionen

Wenn man in der Statistik die Zunahme der Neu-Infektionen zwischen verschiedenen Ländern vergleichen möchte, dann benötigt man eine Möglichkeit diese Zahlen auf einen vergleichbaren Maßstab umzurechnen. Für diese Umrechnung bietet sich die Bevölkerungszahl des jeweiligen Landes an, das Resultat sind Werte wie „Neu-Infektionen in % der Bevölkerung“ oder „Neu-Infektionen pro 1.000 Einwohner“. Eine entsprechende Grafik könnte dann beispielsweise so aussehen.

In dieser Grafik sehen gerade Länder wie USA, Großbritannien und Schweden recht gut aus, ein moderater Anstieg der Kurve und relativ geringe Werte. Während es bei Luxemburg, Spanien und Italien eher schlecht aussieht.

Allerdings sollte man bei dieser Grafik beachten, dass die Zahlen direkt von den durchgeführten Tests abhängig sind. Deswegen fällt die Anzahl der Infizierten in Relation zur Bevölkerung in den Ländern stärker aus, die mehr Tests durchführen. Und sowohl die USA als auch Schweden und Großbritannien haben erst sehr spät mit den Tests begonnen und müssen die Testkapazitäten erst noch ausbauen. Dagegen führen gerade Luxemburg und in geringerem Maße auch Spanien und Italien recht viele Tests durch.

Man sieht das recht gut, wenn man die Zahlen umrechnet. Die folgende Grafik zeigt die gleichen Werte, allerdings in Form eines sogenannten gleitenden 7-Tage-Durchschnitts der Verdopplungszeit. Hierzu wird die Steigerungsrate pro Tag erfasst und daraus der Durchschnittswert der jeweils vorhergehenden Woche ermittelt. Dieser Durchschnittswert wird dann in die Anzahl der Tage umgerechnet, die zu einer Verdopplung der Anzahl der Infizierten benötigt wird. Umso höher diese sogenannte „Verdopplungszeit“ ausfällt, desto geringer ist der tägliche Zuwachs an Neu-Infektionen.

Im Gegensatz zur vorherigen Grafik sieht man hier recht gut, dass die USA, Großbritannien und Schweden es bisher nicht geschafft haben, die Zuwachsraten in den Griff zu bekommen. Sie befinden sich in der ersten Phase der Pandemie-Welle und liegen schätzungsweise 10 bis 14 Tagen hinter der Entwicklung in den anderen Ländern.

Auch sehr gut sichtbar ist, dass gerade in Luxemburg die strikten und früh getroffenen Maßnahmen sehr viel Wirkung gezeigt haben. Und wohlgemerkt, die Grafik beruht auf exakt den gleichen Zahlen wie die vorherige Grafik.

Sowohl Luxemburg als auch Italien und Spanien beginnen übrigens gerade mit den ersten Maßnahmen zur Lockerung der Beschränkungen. Der Einfluß dieser Lockerungen wird in den nächsten 14 Tagen in den Statistiken sichtbar werden.

Über den Sinn von Hochrechnungen

Hochrechnungen sind ein beliebtes und durchaus bewährtes Instrument der Statistiker. Wenn die Grundeigenschaften einer Krankheit bekannt sind, lässt sich damit auch die Entwicklung einer Pandemie recht genau vorhersagen.

Da sich Pandemien exponentiell entwickeln, kann für die Berechnung entweder der Reproduktionsfaktor (er gibt an, wie viele andere Personen ein Infizierter typischerweise ansteckt) oder die Verdopplungsrate (in welchem Zeitraum verdoppelt sich die Anzahl der Infizierten) herangezogen werden. Um eine zukünftige Verlangsamung der Ausbreitung zu simulieren, kann man diesen Werten dann noch gewisse Reduktionsfaktoren hinzufügen.

Das Ergebnis könnte dann beispielsweise so aussehen.

Leider bietet diese Grafik aber keinen wirklichen Anhaltspunkt für irgendwelche Entscheidungen. Denn im Gegensatz zu den üblichen Anwendungsbereichen der Statistik gibt es zu der jetzigen Pandemie keine belastbaren Informationen. Wir kennen weder die tatsächliche Ausbreitungsgeschwindigkeit (weil wir die Dunkelziffer nicht kennen), noch den Einfluss irgendwelcher Eindämmungs- oder Lockerungsmaßnahmen.

Sicher lässt sich anhand solcher Grafiken belegen, dass sinkende Zuwachsraten weniger Infizierte und weniger belegte Krankenhausbetten bedeuten. Aber um das zu wissen, ist im Prinzip keine Statistik notwendig. Deswegen helfen solche Hochrechnungen momentan nicht sehr viel weiter.

Natürlich ist auch bei Pandemien grundsätzlich eine mehr oder weniger seriöse Modellierung möglich. Allerdings kaum auf Basis der derzeit vorliegenden Informationen.

Ähnliches gilt übrigens für die leider recht verbreiteten Hochrechnungen auf Basis der Todesfälle.

Hochrechnungen aufgrund der Todesfälle

Zwar ist die tatsächliche Mortalitäts-Rate (die Anzahl der Menschen, die an einer Infektion versterben) bei Covid-19 nicht genau bekannt, Studien gehen aber von ungefähr 1,4 % aus. Was dafür sorgt, dass man auf dieser Basis in der Statistik grundsätzlich auch auf die Anzahl der Infizierten zu einem bestimmten Zeitpunkt schließen könnte.

So eine Statistik könnte dann ungefähr so aussehen.

Die rosa Linie unten stellt die Anzahl der Todesfälle dar, die dunkelblaue Linie darüber die durch Tests bestätigte Anzahl der Infizierten dar. Die hellblaue Linie darüber gibt die Anzahl der Menschen wieder, die bei einer angenommenen Mortalitäts-Rate von 1,4 % hätten infiziert sein müssen.

Das Ganze sieht nett und sehr seriös aus, beinhaltet aber zwei Probleme. Zum einen sind in der Grafik nur reale Werte für den Zeitraum bis zum 14. April enthalten, die restlichen Werte bis zum 14. Juli sind eine reine Hochrechnung auf Basis der Zuwachsrate der letzten 14 Tage vor dem 14. April. Und die Hochrechnung der tatsächlich Infizierten beruht einzig und allein auf der Mortalitäts-Rate von 1,4 %.

Womit in dieser Grafik nur sehr wenig belastbares Datenmaterial ist. Trotzdem können solche Statistiken recht nützlich sein, weil sie eine bestimmte Situation in der Zukunft darstellen können, wenn die zugrunde liegenden Faktoren gleich bleiben. Was allerdings leider auf die derzeitige Situation nicht zutrifft.

Das Fazit

Von Winston Churchill stammt der Ausspruch, dass man nur Statistiken vertrauen sollte, die man selbst gefälscht habe. Damit bin ich als Statistiker natürlich nicht einverstanden.

Aber natürlich weiß jeder Statistiker, dass man Daten so darstellen kann, dass sie so ungefähr das gewünschte Ergebnis liefern. Bei realen Daten sollte das nicht passieren, aber Hochrechnungen lassen sich durch „geschickte“ Wahl der Grundlagen natürlich recht leicht so „aufbereiten“, dass sie das jeweilig gewünschte Ergebnis liefern.

Deswegen sollten Sie als Nutzer von Statistiken immer darauf achten, wo die zugrundeliegenden Daten eigentlich herkommen. Und gerade bei Hochrechnungen auch überprüfen, wie der Autor der Statistik denn nun auf diese Zahlen gekommen ist.

Ganz besonders vorsichtig sollen Sie mit Statistiken sein, bei denen die Datenherkunft nicht klar erläutert wird. Denn ein Statistiker, der die Herkunft seiner Daten nicht erläutern kann, arbeitet entweder recht unwissenschaftlich (und damit wahrscheinlich nicht sehr seriös) oder versucht irgendetwas zu verbergen.

In der momentanen Situation kann die Statistik annähernde Aussagen über die derzeitige Situation liefern. Annähernd deswegen, weil eben nicht alle Fakten zur Situation bekannt sind. Weswegen es sich immer um mehr oder minder zutreffende Schätzungen handeln.

Hochrechnungen zur Situation müssen täglich angepasst werden und können nur wenig verlässliche Informationen liefern. Für die nächsten paar Tage mag eine Hochrechnung noch einigermaßen zutreffen, schon für die nächsten paar Wochen ist sie aufgrund der vielen unbekannten Faktoren kaum seriös möglich.

Statistiken und grafische Aufbereitungen sind heute vielleicht wichtiger denn ja, denn durch sie können Trends aufgezeigt werden. Diese Trends sind gerade jetzt von unschätzbarem Wert. Aber bezüglich der absoluten Werte handelt es sich in fast allen dieser Statistiken um ungefähre Zahlen aufgrund der bestehenden Dunkelziffer der Infizierten. Das entwertet diese Statistiken und Hochrechnungen keineswegs, aber dem Nutzer sollten diese Zusammenhänge klar sein, damit es nicht zu Fehleinschätzungen kommt.

Allerdings können Sie sich damit trösten, dass es unseren Politikern derzeit auch nicht besser geht. Die Wissenschaft kann in der jetzigen Situation jedem nur ungefähre Schätzungen liefern. Deswegen hören Sie in der derzeitigen Situation von Politikern auch kaum absolute Aussagen zu irgendwelchen festen Terminen für Maßnahmen oder Lockerungen. Die Datenlage lässt solche Festlegungen schlicht nicht zu, hier sind die Grenzen der Statistik erreicht.

Wir werden also noch etwas Geduld aufbringen müssen. Denn niemand, sei er nun Politiker oder Wissenschaftler, kennt im Voraus die Ergebnisse einer bestimmten Maßnahme. Die jetzige Situation kennt keine Sicherheiten, sondern nur Wahrscheinlichkeiten, die sich alle zwei bis drei Wochen ändern. Wir werden deswegen alle miteinander den Erfolg der jeweiligen Maßnahme oder Lockerung abwarten müssen, eine andere Möglichkeit gibt es nicht.

Deswegen werden wir für einen gewissen Zeitraum in Drei-Wochen-Abschnitten denken müssen. Denn die zukünftige Entwicklung lässt sich dieses Mal nicht vorab berechnen.

Wie denken Sie darüber? Schreiben Sie es mir in den Kommentaren.

Claus Nehring

Der Autor ist freiberuflicher Autor, Texter und Web-Entwickler mit Sitz in Luxemburg. Er ist diplomierter Informatiker und Statistiker und verfügt über jahrelange Erfahrung in der Visualisierung und Modellierung großer Datenmengen. Er publiziert Artikel zu Themen rund um Gesellschaft, Internet und verschiedene Wissenschaftsgebiete in seinem eigenen Blog und in verschiedenen Foren.

Related Articles

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.


Durch das Abschicken des Kommentars werden die eingegebenen Daten in der Datenbank dieser Website gespeichert. Ausserdem speichern wir aus Sicherheitsgründen Ihre IP-Adresse für einen Zeitraum von 60 Tagen. Weitere Informationen zur Datenverarbeitung finden Sie in der Datenschutz-Erklärung.

Back to top button
Close