Die #Reproduktionszahl #R verstehen und berechnen... und kritisch bleiben!

In den letzten Tagen wird sehr viel über die Reproduktionszahl R diskutiert und das zum Teil sehr heftig. Jens Spahn hat das Sinken von R auf 0.7 als Beleg genommen, dass nun der Corona-Ausbruch wieder beherrschbar ist (https://www.dw.com/de/gesundheitsminister-jens-spahn-h%C3%A4lt-corona-ausbruch-f%C3%BCr-beherrschbar/a-53163527). Die Kanzlerin erklärte am 16.04. öffentlichkeitswirksam, wie wichtig die Reproduktionszahl ist und dass sie unter 1.2 bleiben müsse (https://www.focus.de/gesundheit/news/1-0-oder-1-2-ist-ein-grosser-unterschied-reproduktionszahl-statt-verdoppelung-merkel-praesentiert-wichtige-corona-rechnung_id_11889566.html). Die einhellige politische Meinung war, dass der Erfolg, gemessen in R zeige, wie gut die Maßnahmen in Deutschland funktionieren. Allerdings war R schon vor dem 23.03. unter 1 und daher habe ich Zweifel angemeldet, ob der Lockdown vom 23.03. etwas in Bezug auf R bewegt hat. Andere sind noch weiter gegangen und sagen, der Lockdown hat gar keine Wirkung. Daraufhin wird in den Medien inzwischen sehr heftig gegen diese Position argumentiert. Diverse "Faktenchecker" versuchen nachzuweisen, dass die Argumente gegen die Wirksamkeit des Lockdowns falsch sind (u. a. CORRECTIV: https://correctiv.org/faktencheck/2020/04/24/coronavirus-ist-der-lockdown-unwirksam-die-behauptungen-ueber-die-reproduktionszahl-im-faktencheck).
Ranga Yogeshwar hat ein sehr interessantes Video zu dem Thema gepostet:

Und Christian Drosten hat sich in seinem Podcast vom 24.04. auch dazu geäußert: https://www.ndr.de/nachrichten/info/podcast4684.html.
Leider versteht keiner dieser drei Kritik-Kritiker die Dynamik, die in der Berechnung von R zum Tragen kommt.
Ich halte die Debatte für unglaublich wichtig und bin überzeugt, dass sie in den kommenden Tagen noch an Fahrt aufnehmen wird. Der NDR hat heute einen Bericht veröffentlicht mit der Überschrift: "Corona: Neue Daten stellen Epidemie-Verlauf infrage". Darin wird zwar fälschlicher Weise behauptet, dass "erstmals [!] der tatsächliche Erkrankgungsbeginn" geschätzt würde. Der Autor stellt aber richtiger Weise klar: "Allerdings wird nun auch sichtbar, dass die Zahl der Neuerkrankungen schon zurückging, als am 23. März die Kontaktbeschränkungen verhängt wurden."
Die Debatte um die Wirksamkeit des Lockdowns fängt also vermutlich gerade erst richtig an.

Ich möchte daher im Folgenden die Berechnungsweise von R durch das Robert-Koch-Institut noch einmal verständlich erklären und präsentiere ein Modell, wie man R selbst berechnen kann. Dieses Modell hilft insbesondere, die Verzögerungen von Maßnahmen in Bezug auf R zu verstehen. Nur so lässt sich klären, was von den Argumenten der Kritiker der Wirksamkeit und denen der Kritiker der Kritiker zu halten ist.

R und seine Dynamik

Eigentlich ist es ganz einfach: "Die Reproduktionszahl ist die Anzahl der Personen, die im Durchschnitt von einem Indexfall angesteckt werden." (RKI-Bulletin 16). Das RKI geht davon aus, dass es im Durchschnitt vier Tage dauert, bis jemand infiziert wird. Dies nennt man die Generationszeit. Jetzt fragt man sich, bei wie vielen Leuten ist die Krankheit in einem Zeitfenster von vier Tagen durchschnittlich ausgebrochen. Dann geht man nochmal vier Tage weiter und fragt sich, wie viele Leute im Durchschnitt in diesen vier Tagen erkrankt sind. Diese beide Größen setzt man dann in ein Verhältnis. Sind in den letzten vier Tagen halb so viele Leute erkrankt, wie in den vier Tagen davor, dann ist R = 0.5. Sind es doppelt so viele, dann ist R = 2. Nochmal in den Worten des RKI, weil es wirklich wichtig ist:

"Bei einer konstanten Generationszeit von 4 Tagen, ergibt sich R als Quotient der Anzahl von Neuerkrankungen in zwei aufeinander folgenden Zeitabschnitten von jeweils 4 Tagen. Der so ermittelte R-Wert wird dem letzten dieser 8 Tage zugeordnet, weil erst dann die gesamte Information vorhanden ist. Daher beschreibt dieser R-Wert keinen einzelnen Tag, sondern ein Intervall von 4 Tagen. Das dazu gehörende Infektionsgeschehen liegt jeweils eine Inkubationszeit vor dem Erkrankungsbeginn" (RKI-Bulletin 17).
Alles klar?
Ganz wichtig ist, dass man sich klar macht, was eine "Erkrankung" in diesem Sinne ist: Erkrankt ist man laut RKI von dem Tag an, an dem sich Symptome zeigen. Infiziert ist man aber schon vorher. Die Dauer von der Infizierung bis zur Erkrankung ist die Inkubationszeit und die beträgt laut beträgt laut RKI 5-6 Tage (https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Steckbrief.html#doc13776792bodyText4). Da die Menschen aber noch keine Symptome haben, wenn sie infiziert wurden, trotzdem aber schon andere anstecken können wird es kompliziert. Die Generationszeit beschreibt (auch wieder durchschnittlich) die Zeit von einer Erkrankung bis zur nächsten. Da man davon ausgeht, dass Menschen mit COVID19 schon zwei Tage bevor sie irgendwelche Symptome haben ansteckend sind, ist die Generationszeit nicht gleich der Inkubationszeit, sondern eben zwei Tage kürzer.

Wenn ich mich frage, "Wann sind die Leute angesteckt worden, die heute Symptome entwickelt haben?", dann ist die Antwort: "Vor sechs Tagen!" (Inkubationszeit). Wenn ich aber frage: "Wer hat die Leute angesteckt, die heute neu erkrankt sind?", dann ist die Antwort: "Das sind die, die vor sechs Tagen bereits ansteckend waren, also die, die vor vier Tagen Symptome gezeigt haben." (Generationszeit).
Da es sich um Durchschnittswerte handelt, fragt man: "Wie viele Leute sind durchschnittlich in den letzten vier Tagen erkrankt, also wurden von der letzten Generation der Infizierten angesteckt?" Auch die letzte Generation kennt man nur als Durchschnitt von vier Tagen. Daher die Formulierung von RKI: "Der so ermittelte R-Wert wird dem letzten dieser 8 Tage zugeordnet, weil erst dann die gesamte Information vorhanden ist. Daher beschreibt dieser R-Wert keinen einzelnen Tag, sondern ein Intervall von 4 Tagen."

Das lässt sich ziemlich einfach berechnen: Man muss bloß den Durchschnitt der Neuerkrankungen der jeweils vier letzten Tage berechnen und dann den Wert von heute durch den von vor vier Tagen dividieren.
Im Prinzip...
Leider gibt es zwei Probleme: Der Krankheitsbeginn ist nicht immer bekannt und es gibt ständig Meldeverzug am Wochenende, so dass die Daten verzerrt sind.
Das RKI geht mit diesen zwei Problemen auf eine Weise um, die sich nicht reproduzieren lässt. Sie schätzen erstens die fehlenden Werte des Krankheitsbeginns. Das Verfahren dazu nennt sich Imputation und ich habe es hier schon einmal erklärt: https://politicaldatascience.blogspot.com/2020/04/bleibtzuhause-hat-nicht-zu-einer.html
Das kann niemand mit den öffentlichen Daten nachrechnen, weil nicht vermerkt ist, für welche Fälle das Erkrankungsdatum fehlt. Es gibt ein so genanntes Referenzdatum, das entweder das gemeldete Erkrankungsdatum oder wenn dies fehlt, das Meldedatum enthält. Es gibt aber auch Fälle, wo das Meldedatum und das Erkrankungsdatum tatsächlich identisch sind, so dass sich diese Information einfach nicht rekonstruieren lässt.
Für das zweite Problem verwendet das RKI den so genannten Nowcast, den ich auch schon im verlinkten Post besprochen habe. Der Nowcast schätzt mit statistischen Methoden, wie viele Fälle an einem Tag voraussichtlich erkranken werden und sorgt damit dafür, dass das Meldeverzugsproblem kleiner wird. Da aber der Nowcast auf den zuvor geschätzten Erkrankungsdaten basiert und wie bei der Imputation auch das Modell nicht völlig klar ist, lässt sich auch dieser Wert nicht reproduzieren.

Reverse-Engineering des RKI-R

Können wir ein Modell bauen, dass nur auf den frei verfügbaren Daten basiert und trotzdem ziemlich dasselbe berechnet, wie die R-Werte des RKI? Ja!

Umgang mit fehlenden Krankheitswerten

In den Daten, die das RKI zur Verfügung stellt (http://npgeo-corona-npgeo-de.hub.arcgis.com/datasets/dd4580c810204019a7b8eb3e0b329dd6_0) sind fehlende Erkrankungsdaten einfach durch das Meldedatum ersetzt. Es gibt jetzt drei Möglichkeiten:

Erstens kann man einfach mit diesen Daten arbeiten. Das RKI sagt, dass das Erkrankungsdatum bei 35% der Fälle fehlt. Bei der Mehrheit der Fälle ist es also auch in den Daten richtig. Zudem wissen wir auch nicht, ob die Imputation des RKI vernünftig funktioniert. Die Ersetzung durch das Meldedatum ergibt also durchaus Sinn.

Zweitens können wir die Fälle identifizieren, bei denen Meldedatum und Referenzdatum identisch sind. Alle Fälle mit fehlenden Erkrankungsdaten sind dann in dieser Menge enthalten. Leider macht diese Menge nicht 35% der Fälle aus, sondern 56%. Es gibt also eine ganze Reihe von Fällen, wo das Erkrankungsdatum und das Meldedatum tatsächlich identisch sind. Man kann jetzt (Variante 2a) versuchen, diesen Effekt zu berücksichtigen oder (Variante 2b) einfach alle Werte mit identischem Melde- und Referenzdatum veränderen. Vergleicht man nur die Fälle, wo Melde- und Referenzdatum unterschiedlich sind, dann ergibt sich eine durchschnittliche Differenz von genau einer Woche. Wenn wir eine Imputation machen wollen, dann können wir also entweder einen Teil der Fälle mit identischen Daten (Variante 2a) oder alle (Variante 2b) um eine Woche nach vorne in der Zeit ziehen. D. h., wir nehmen an, dass diese Fälle erst eine Woche nach auftreten der Symptome in der Statistik auftauchen.

Umgang mit Meldeverzug

Das Hauptproblem sind die Schwankungen an den einzelnen Wochentagen, weil die Gesundheitsämter am Wochenende die Fälle nicht melden. Anstelle der Komplizierten Nowcast-Methode lassen sich die Daten aber auf eine ganz gebräuchliche Arte und Weise "detrenden": Anstelle der wirklich gemeldeten Fälle berechnet man immer den Durchschnitt der letzten sieben Tage. Dadurch verschwindet der Trend. Diese Methode ist das Standardverfahren in der Zeitreihenanalyse.

Berechnung von R

Um R zu berechnen, ermittelt man den Mittelwert der Fälle am neu berechneten Erkrangsdatum der letzten vier Tage. Diesen Wert dividiert man durch den Durchschnittswert von vor vier Tagen.

Überprüfung des Modells

Kommen wir mit dieser Berechnung tatsächlich zu Werten, die den R-Werten des RKI entsprechen?

So in etwa:

Der Plot zeigt die Berechnung von R mit starker Imputation (alle Fälle mit identischem Melde- und Reverenzdatum - 7 Tage; olivgrün), mittlerer Imputation (62.5% der Fälle mit identischem Melde- und Reverenzdatum - 7 Tage; blau) und ohne Imputation (golden). Man sieht, dass sich die Ergebnisse nicht sehr unterscheiden. Insgesamt wirkt sich Imputation nicht stark aus, außer bei den aktuellsten Werten. Das kann damit zusammenhängen, dass die aktuellen Werte ja deutlich zurück gehen, wenn jetzt auch noch ein Teil dieser Neuerkrankungen eine Woche vorgezogen wird, dann verzerrt dies offenbar die Statistik. Eine andere Erklärung wäre, dass inzwischen anders getestet wird (zum Beispiel wegen mehr Contact-Tracing), so dass es aktuell überdurchschnittlich viele Fälle gibt, wo Melde- und Erkrankungsdatum tatsächlich identisch sind.

Die rosa Punkte zeigen die offiziellen R-Werte des RKI. Leider stellt das RKI diese Werte nicht als Datensatz zur Verfügung. Um an die Werte zu kommen, habe ich ein Raster in die Graphik im Bulletin gelegt und dann die Werte "per Hand" abgelesen.

Die soliden pinken Punkte sind die Werte, die das RKI seit dem 7.04. im täglichen Lagebericht veröffentlicht. Es fällt auf, dass das RKI für die selben Tage unterschiedliche Werte angibt. Meiner Meinung liegt das daran, dass durch die Nowcast-Schätzung gerade die aktuellen Werte eine große Unsicherheit haben und vermutlich dann, wenn die Fallzahlen sinken eigentlich tendenziell zu hoch sind. Ich vermute daher auch, dass das eigentliche R deutlich unter dem liegt, was das RKI in den Lageberichten publiziert. Eine Zeitreihe wäre hier tatsächlich sehr hilfreich. Auch im Dashboard des RKI sieht man immer sehr schön, dass der Nowcast offenbar nicht besonders genau ist. Wie dieses Phänomen genau zu erklären ist, kann allerdings nur das RKI aufdecken. Man sieht allerdings auf jeden Fall, dass R eben keine exakte Größe, sondern ein Schätzwert ist.

Davon abgesehen sind meine Kurven und die Werte des RKI sehr nahe beieinander. Das muss ja auch so sein, da irgendwann jeder Fall in der Statistik erscheint, oder eben nie auftaucht. Durch das Detrending und das Zeitfenster von vier Tagen ist das Modell relativ robust gegen statistische Ausreißer.

Der Wert, der dem RKI-R am meisten gleicht, ist die Berechnung ohne Imputation. Übrigens verwendet das RKI diesen Wert auch selber in seinem Dashboard...

Es gibt auch ein geeignetes Maß, um mein Modell mit RKI-Werten aus der Graphik zu vergleichen: Den Mean Absolute Error (MAE). Dafür berechnen wir einfach den Durchschnitt der absoluten Abweichungen. Der MAE liegt bei 0.1, das heißt, im Durchschnitt weicht mein Modell um 0.1 von den Werten des RKI ab. Da sich mein Modell ohne Probleme reproduzieren lässt, anders als das des RKI, und es theoretisch weniger Unsicherheiten enthält, halte ich es für legitim, dieses Modell nun tatsächlich für die Berechnung von R zu nehmen.

Verdeutlichung der Dynamiken

Angenommen, ab dem 23.03. hätte sich niemand mehr infiziert. Wann wäre R dann auf Null gesunken?

Wir können uns die Frage erst theoretisch vorlegen und dann im Modell ausprobieren. Wenn sich ab dem 23.03. niemand mehr ansteckt, dann gibt es trotzdem noch sechs Tage weiter neue Fälle. Nämlich die, die sich vorher angesteckt haben. Erst nach der Inkubationszeit ist dann die Zahl der Neuerkrankungen gleich Null. Unser Modell - und der Nowcast der RKI auch - führt aber zu einer ungewöhnlichen Veränderung: Das Modell schaut ja immer in die Vergangenheit zurück, um die Durchschnittswerte zu berechnen. Durch das 4-Tages-Fenster werden wir die Veränderung daher nicht erst ab dem 30.03 sehen, sondern sie beginnt in dem Modell schon am 27.03!

Als zweites Beispiel stellen wir uns vor, die Zahl der Neuerkrankungen hätte sich ab dem 23.03. jeden Tag doppelt so hoch, wie eigentlich in den Daten angegeben. Logisch gesehen ist es klar, dass dadurch R ansteigen muss. Allerdings nur, bis das ganze Modell auf dem neuen Level rechnet. Dann verschwindet dieser Effekt ganz. Durch das Zeitfenster ist wieder mit vier Tagen zu rechnen, bis sich irgendetwas verändert. Die Verdopplung der Fallzahlen wirkt sich auch auf den wöchentlichen Trend aus. Daher dauert es dann vierzehn Tage, bis der Effekt wieder verschwunden ist.

Die folgende Graphik zeigt genau die beiden Beispiele mit simulierten Daten im Modell:

Wir können diese Erkenntnisse nun nutzen, um die Entwicklung von R und mögliche Wirkungen auf diese Größe genauer zu analysieren.

Analyse der Reproduktionszahl

Da wir jetzt ein Modell haben, um R zu berechnen können wir uns auch was den Beobachtungszeitraum anbelangt vom RKI unabhängig machen und gleich mit einem gängigen Missverständnis aufräumen.

In der Besprechung der RKI-Grafik heißt es immer, R sei zunächst gestiegen. Das macht aber überhaupt gar keinen Sinn, da R eigentlich von Anfang an bei der Basisreproduktionszahl (also zwischen 2.5 und 3) hätte liegen müssen. Der folgende Plot zeigt R über den gesamten Beobachtungszeitraum:

Ich denke, die starken Schwankungen am Anfang haben mit zwei Effekten zu tun: Erstens ist R als Relation natürlich total unstabil, solange die Zahl der Neuerkrankungen an manchen Tagen noch Null ist. Zweitens unterstellt die Berechnung von R, dass sich Menschen nur bei Menschen anstecken, die zuvor auch in der Statistik geführt wurden. Das ist aber nicht der Fall, wenn sich Menschen im Ausland infiziert haben. Trotzdem erzählt dieses Bild eine andere Story als: "R ist gestiegen, bis dann die Maßnahmen vom 9.03. gegriffen haben".

Springen wir zurück in die Zeit ab März.

Der folgende Plot zeigt die R-Werte und die drei entscheidenden Daten, die auch das RKI in seiner Grafik hat: 9.03. = Absage von Großveranstaltungen, 16.03. = Bund-Länder-Vereinbarung, 23.03. = Lockdown.

Die blauen Linien zeigen zusätzlich den frühesten Termin, wann Maßnahmen sich überhaupt auf R auswirken können, basierend auf den oben ausgeführten Beispielen nämlich frühestens vier Tage nach der Maßnahme.

Vier Tage nach dem 9.03. sinkt die Kurve bereits seit mehreren Tagen. Es ist nicht zu erkennen, dass sich die Steigung verändert.

Ähnlich sieht es nach dem 16.03. aus: Hier scheint es eher, dass die Kurve ab dem 20.03. sogar abflacht, also weniger schnell sinkt.

Nach dem 23.03. (also ab dem 27.03.) ist gar keine Veränderung zu sehen, erst fünf Tage später sinkt die Kurve (und das auch nur bei meinen und den alten Zahlen des RKI, nicht in den neuen).

Es gibt also keinerlei Hinweise, dass die Maßnahmen der entsprechenden Stichtage einen senkenden Effekt auf R gehabt haben.

Es gibt aber eine ganze Reihe von Möglichkeiten, wieso:

Erstens können die Daten falsch sein.

Zweitens kann das Modell verkehrt sein.

Drittens lässt sich argumentieren, dass die Bevölkerung die Maßnahmen schon antizipiert hatte. Das könnte den Turningpoint am 10.03. erklären, hilft aber für die anderen Punkte nichts (mehr dazu weiter unten).

Viertens kann man argumentieren, dass die R-Kurve ohne die Maßnahmen gestiegen wäre.

Zu den ersten beiden Argumenten lässt sich nur folgendes sagen: Wenn die Daten fehlerhaft sind oder das Modell nicht funktioniert (und wenn mein Modell nicht funktioniert, dann das des RKI auch nicht), dann sollten politische Entscheidungen überhaupt nicht vom R-Wert abhängig gemacht werden. Sowohl Spahn als auch Merkel haben aber anders argumentiert.

Die anderen Punkte möchte ich im Kontext der Kritik-Kritiker besprechen.

Anmerkungen zu Ranga Yogeshwar

Das Hauptargument von Yogeshwar ist, dass die Menschen ihr Verhalten schon vor dem 23.03. verändert haben. Er belegt das mit Mobilitätsdaten, die zeigen, dass die Menschen schon Anfang März viel weniger unterwegs war. Außerdem weist er darauf hin, dass es eine ganze Reihe von Maßnahmen vor dem 23.03. gab und zwar schon seit dem 25.02. (Bericht über den ersten Patienten in NRW). Ich halte die These, dass dieses kulminierte Verhalten die Ausbreitung abgedämpft hat, für sehr plausibel. Damit wäre dann auch gesagt, dass die Einschränkung von Kontakten nicht per se wirkungslos ist. Das kann ja auch gar nicht anders sein. Das Virus beamt sich ja nicht durch das Land, sondern kann nur übertragen werden, wenn Menschen sich begegnen.

Dann sagt Yogeshwar aber: "Das Kontaktverbot nutzt uns auch heute, denn es sorgt ja auch dafür, dass das ganze nicht eine kurze Episode war, sondern das wir uns an die Regeln halten." Er führt weiter aus, dass ohne den Lockdown die Menschen müde und nachlässig würden und ansonsten ja auch die Arbeitgeber verlangen könnten, dass die Menschen wieder arbeiten.

Das Argument finde ich nicht einleuchtend. Wenn sich die Menschen in ihrem Verhalten auch ohne Verbot vorher vernünftig gezeigt haben, warum sollten sie es dann nach dem 23.03. nicht auch tun? Ich persönlich glaube, dass Menschen ihr Verhalten dann am wirksamsten ändern, wenn sie selber die Gründe dafür verstehen und teilen und nicht, weil etwas verboten ist. Auf der anderen Seite hat das Verbot zum Beispiel in Bayern zu vielen Anzeigen geführt, es bedeutet einen sozialen Schaden, den wir noch gar nicht absehen können und alles nur, um einen Zustand zu erhalten, den wir ohne dieses Verbot erreicht haben.

Der Hinweis auf das Machtverhältnis, dass ohne Lockdown die Arbeitgeber ja die Menschen einfach wieder in die Arbeit einbestellen könnten, finde ich geradezu perfide. Anstatt alle Menschen unter Hausarrest zu setzen, könnte man ja auch einfach den Arbeitgebern gesetzliche Vorgaben machen und dafür sorgen, dass die Gesundheit der Menschen nicht durch die Abhängigkeit von ihrem Arbeitsplatz gefährdet wird.

Anmerkungen zu CORRECTIV

CORRECTIV sagt in ihrem Faktencheck, die R-Kurve sei "Anfang März auf über 3 angestiegen und flachte dann ab". Das ist nicht ganz richtig, sondern stimmt nur, wenn man den begrenzten Zeitraum betrachtet, den das RKI geplottet hat. Wie beschrieben und auf dem Plot zu sehen stieg und sank die Kurve vorher schon und pendelte ziemlich umher.

Weiter heißt es: "Schon vor dem 23. März sei das öffentliche Leben zurückgefahren worden, erklärt das RKI auf eine Anfrage von CORRECTIV per E-Mail. Deswegen sei der R-Wert bereits vor dem bundesweiten Kontaktverbot abgesunken. Diese Maßnahmen sind in der RKI-Grafik abgebildet."

Das Problem ist, dass auch die anderen in der Graphik abgebildeten Maßnahmen ohne weitere Annahmen nicht als Ursache für eine Absenkung von R in Frage kommen. Man müsste schon - wie Yogeshwar die komplette Vorgeschichte betrachten. Die in der Graphik abgebildeten Maßnahmen belegen nicht, was CORRECTIV behauptet. Auch der Verweis, dass das RKI behauptet, dass Kontaktverbot hätte geholfen R unter 1 zu halten, hilft nichts, weil diese Behauptung ja gerade in Frage gestellt wird. Man muss sich schon fragen, was Faktenchecker eigentlich checken, wenn sie bloß die in Frage gestellte Position wiedergeben.

Auch ansonsten zitieren CORRECTIV einfach nur das Bulletin des RKI (und das sogar in einer aktualisierten Fassung, die am 16.04. gar nicht vorlag und mit der das RKI selbst schon versucht, der Kritik den Wind aus den Segeln zu nehmen). In der alten Version fragt sich das RKI zum Beispiel noch, warum trotz des Lockdowns R nicht stärker gesunken ist.

Die zwei inhaltlichen Argumente sind, dass es zu Ausbrüchen in Pflegeheimen und Krankenhäusern gekommen sei und das die gestiegenen Testkapazitäten die Statistik verzerren würden.

Der erste Punkt verdient einen eigenen Blogpost. Immerhin wird hier zu Protokoll gegeben, dass man die Wirksamkeit der Maßnahmen bitte nicht daran messen soll, ob sie Ältere schützen. Der Punkt mit den Testkapazitäten ist schnell geklärt. Die Anzahl der Tests hat sich laut RKI von KW 11 (9.03.) auf KW 12 (16.03) mehr als verdoppelt, dann noch einmal leicht erhöht und stagniert seit dem bzw. ist leicht rückläufig. Ab dem 16.03, spätestens ab Mittwoch den 18.03. muss man also mit einer Erhöhung der Fallzahlen rechen. Fallzahlen sind aber nicht der Erkrankungsbeginn, der errechnet wird und im Durchschnitt 7 Tage vor dem Meldedatum liegt. Also muss man eigentlich ab dem 13.03. (9.03. plus vier Tage, bis das Modell die Veränderung aufgreift) rechnen. Nach dem 23.03. würde diese R wegen dieser Verzerrung daher nicht steigen, sondern wieder auf das "eigentliche" Maß sinken, wie in dem Beispiel oben gezeigt. Würde der Lockdown (nicht etwas was schon vorher war) eine Senkung von R bewirken, dann müsste R nach dem 23.03. um so stärker sinken.

Man muss leider sagen, dass CORRECTIV wirklich nicht mehr leistet, als die Position des RKI wiederzugeben. Eine kritische Überprüfung findet überhaupt nicht statt. Leider mit sehr heftigen Konsequenzen, denn was CORRECTIV negativ bewertet wird von Facebook und Twitter als Fakenews behandelt, in der Reichweite gedrosselt und so dem öffentlichen Diskurs entzogen.

Anmerkungen zu Drosten

Christian Drosten greift in seinem Podcast vom 24.04. das Argument mit der Anzahl der Tests auch auf, hat da aber eine völlig andere Idee als das RKI. Zunächst gibt er die Testzahlen des RKI vollständig wieder, was schon einmal zu einer Versachlichung der Debatte beiträgt. Ich gebe sein Statement zu den Tests in gänze wieder, weil es sonst leicht etwas verfälscht, wenn man aus dem gesprochenem Wort etwas raus nimmt:

"Dann hatten wir Anfang März einen sprunghaften Anstieg der Diagnostikkapazität um einen erheblichen Faktor. Ich habe mir die Daten rausgeschrieben. Es wurden 87.000 Tests gemacht in der Woche, die am 2. März anfängt. In der Woche, die am 9. März anfängt – also nur eine Woche später – waren es 127.000. In der Woche danach, am 16.03., waren es 348.000. Das ist ein extremer Zuwachs. Wir müssen uns überlegen, was in die Ermittlung dieser R, dieser Reproduktionsstatistik eingeht. Das sind die gemeldeten Fälle, die auf der PCR und der Verfügbarkeit der PCR basieren. Das heißt, wir hatten zwei Effekte, die gleichzeitig auftraten: Der Zuwachs an Möglichkeiten, das überhaupt zu erkennen, und auch der reale Zuwachs. Da sind zwei Dinge gleichzeitig gewachsen. Die PCR war aber ab Mitte März auf einem Status quo. Also dieser Zustand war dann erreicht, da kam auch nicht mehr viel dazu. Und wenn man in solchen Statistiken solche zwei Effekte gleichzeitig hat, dann fällt der eine weg, dann sieht es manchmal so aus, als wäre die Grundtätigkeit wieder nach unten verändert."

Das Argument von Drosten ist also, dass in der zweiten Märzhälfte R zu niedrig war. Dieser Schein, dass die "Grundtätigkeit" sich nach unten verändert, wird dann aber wieder aufgehoben im weiteren Verlauf. Also nach dem 23.03. sieht es so aus, als würde R steigen, in Wirklichkeit pendelt es sich aber auf seinen "richtigen" Wert ein, weil es vorher nicht hätte sinken dürfen. Bzw. im konkreten Fall bleibt R wo es ist, weil der Lockdown ja wirkt. So verstehe ich das Argument von Drosten. Und er führt es auch genauso aus:

"Ich kann nur sagen, ich habe den starken Verdacht, dass das mit reinspielt. Also dass Anfang März gleichzeitig die Fälle stiegen und die Diagnostik stieg und dann aber nur noch die Fälle da waren und auch erste Verhaltensänderungen in der Bevölkerung stattfanden und die PCR-Diagnostik nicht mehr weiter anwuchs. Ich bin mir fast sicher, ich habe ein starkes Gefühl, dass das auch eine Verzerrung der Statistik zusätzlich bewirkt hat. Im dem Sinn, dass wir scheinbar einen frühen starken Anstieg hatten. Die Statistik erwartete dann, dass das auf gleichem Niveau blieb. Aber in Wirklichkeit kam nicht mehr so viel dazu, wie die Statistik erwartete, wie das Modell erwartete. Das sieht dann so aus, als ob die R-Zahl wieder absinkt."

Es ist Drosten hoch anzurechnen, dass er deutlich macht, dass dies nur ein Gefühl ist, dass er das nicht berechnet hat und selber auch nicht berechnen kann (er will eine andere Gruppe fragen, das zu tun). Würde in der öffentlichen Berichterstattung auf diese kommunizierte Unsicherheit stärker eingegangen, anstatt immer die eine richtige Antwort zu erwarten und in einer Situation voller Unsicherheiten alles zu überhöhen, um Sicherheit doch zu erlangen, dann wäre der Diskurs wesentlich offener, Experten wie Drosten könnten sich freier äußern und es gäbe mehr Meinungen und eventuell auch Handlungsoptionen.

In dem konkreten Fall bin ich mir sehr sicher, dass Drosten einfach völlig falsch liegt. Wenn die Fallzahlen erhöht werden, dann kann R nur temporär ansteigen und dann wieder auf den eigentlich Wert abfallen. Ein Sinken unter den eigentlichen Wert ist m. M. nach mathematisch ausgeschlossen. Dieser Effekt würde eintreten, wenn sich Fallzahlen künstlich halbieren (also plötzlich viel weniger getestet wird). Das Beispiel von oben hat ja genau die angesprochene Erhöhung simuliert. Die Verdopplung der Fallzahlen führt zu einer Erhöhung nach vier Tagen, die sich nach 11 Tagen wieder sinkt und sich nach 14 Tagen normalisiert hat. Da Drosten (übrigens als erster, der mir auffällt) sich die Mühe gemacht hat, sich die Teststatistik des RKI anzuschauen weiß er, dass die These eines Steigens der Fälle nach dem 23.03. nicht haltbar ist. Seine Theorie, R sei vorher einfach zu stark abgesunken (also verfälscht) ist kreativ, aber lässt sich nicht belegen oder anhand des R-Modells berechnen.

Fazit

Wer das feststellen möchte wird sehen, dass ich mich intensiv mit den Argumenten auseinandersetze, warum der Lockdown doch etwas gebracht hat. Ich kann allerdings nach wie vor nur konstatieren, dass mich diese Argumente nicht überzeugen. Derzeit wird eine Politik verfolgt, für deren Wirksamkeit es keine Evidenz gibt. Es gibt auch keine Beweise, dass sie nicht wirkt und insofern kann ich es durchaus verstehen, dass man das erstmal so macht. Viele vernünftige Menschen warnen davor, dass sehr schnell eine Situation entstehen könnte, die sich nicht mehr kontrollieren lässt. Insofern ist es sicher nicht verkehrt, vorsichtig zu sein. Nur ist es inzwischen so, dass genug Daten vorliegen, dass man eine Effektivität der Maßnahmen belegen können müsste oder zumindest sagen können müsste, was noch fehlt dafür. Das geschieht aber nicht. Stattdessen werden in meinen Augen nach wie vor unbegründete Ängste und falsche Sicherheiten verbreitet. Ich würde mir wirklich wünschen, wir alle würden eine Debatte führen, die der Komplexität der Situation angemessen ist und nicht versucht, diese so zu reduzieren, dass nur noch Alternativlosigkeit bleibt. Dafür steht gerade zu viel auf dem Spiel.

Codes und Daten

Die Codes und die verwendeten Dateien gibt es auf github, allerdings nicht so schön kommentiert.

https://github.com/SimonHegelich/CoronaTime/blob/master/RKI-R-Sim.R

Political Data Science

Dieses Blog durchsuchen