Im folgenden Beitrag geht es darum, die Daten zur Impfeffektivität des RKI zu rekonstruieren. Das ist leider notwendig, da das RKI an diversen Stellen zwar die Ergebnisse seiner Berechnungen veröffentlicht, nicht aber die Daten, die zu Grunde liegen. Richtige Transparenz fehlt daher.
Um es Interessierten zu ermöglichen, sich ein eigenes Bild zu verschaffen und eigene Berechnungen anzustellen, habe ich die folgenden Auswertungen in R programmiert und stelle die Skripte auf meinem Github-Repository bereit.
Im ersten Teil dieses Blogbeitrags habe ich auf einige theoretische Schwächen in der Ermittlung der Impfeffektivität hingewiesen. Dieser zweite Teil dient zunächst dazu, die Berechnung des RKI transparent zu machen. In wie weit sich die besprochenen Argumente tatsächlich auswirken würden, kann mit Hilfe der hier rekonstruierten Daten untersucht werden. Dies wird dann der dritte Teil des Beitrags.
Um die Berechnungen des RKI zur Impfeffektivität nachvollziehen zu können, braucht man Daten zum Anteil der Geimpften unter den Erkrankten und zur Impfquote zu einem gegebenen Zeitpunkt. Beides wird vom RKI so nicht bereit gestellt.
Was ist der Anteil der geimpften Erkrankten?
Das RKI stellt die Impfdurchbrüche nur als aggregierte Daten über vier Wochen bereit. Das ist Problematisch, weil erstens die angegebene Impfeffektivität im RKI-Wochenbericht wöchentlich berechnet wird, mit diesen Zahlen also nicht überprüft werden kann. Zweitens ist die Aggregation immer vier Wochen hinter der eigentlichen Entwicklung. Drittens sind Timelags ein möglicher Grund für eine stark verzerrte Berechnung.
Die 4-Wochen-Daten aus den Wochenberichten habe ich zu einer aktualisierten Tabelle zusammengetragen.
Das RKI stellt aber für die Endpunkte “Symptomatische Erkrankung” und “Hospitalisierung” die wöchentliche Inzidenz unterschieden nach geimpft/ungeimpft zur Verfügung. Aus diesen Werten lassen sich die Anzahl der Impfdurchbrüche für diese beiden Endpunkte rekonstruieren.
Die Abbildungen zeigen die Inzidenzen für verschiedene Altersgruppen.
Die Inzidenzen werden berechnet mit:
Inzidenz = Anzahl geimpfter (ungeimpfter) Fälle / (Anzahl geimpfter (ungeimfter) Personen / 100000)
Auflösung der Formel nach “Anzahl Fälle” ergibt:
Anzahl geimpfter Fälle = Inzidenz * Anzahl geimpfter Personen / 100000
Was ist die Anzahl der Geimpften/Ungeimpften?
Wir brauchen also nur die Anzahl der geimpften (ungeimpften) Personen. Dafür verweist das RKI auf folgenden Link des Statistischen Bundesamts:
https://www.destatis.de/DE/Themen/Gesellschaft-Umwelt/Bevoelkerung/Bevoelkerungsstand/Tabellen/bevoelkerung-nichtdeutsch-laender.html
Dort sind die Daten, die benötigt werden, aber nicht abrufbar. Es geht um die Bevölkerung Stand 31.12.2020. Diese Daten finden sich unter: https://www-genesis.destatis.de/
Die entsprechende Tabelle wurde im Github-Repository gespeichert.
Aus den Daten lässt sich die Anzahl der 12-17-Jährigen, der 18-59-Jährigen und der Über-60-Jährigen berechnen. Die Abbildung zeigt die Verteilung auf die Altersgruppen.
Für die Berechnung der Geimpften und Ungeimpften braucht man die Impfquote für die entsprechende Altersklasse. Da auch der Effekt von Timelags analysiert werden soll, brauchen wir historische Daten. Das RKI stellt diese seit 18.09.2021 in einem Archiv zur Verfügung. Allerdings muss man dafür für jeden Tag eine eigene Datei öffnen und die entsprechende Werte zusammentragen. Wie auch zu allen hier präsentierten Grafiken findet sich der entsprechende Code dafür auf Github.
Die Abbildung zeigt die Quoten für Vollständig Geimpfte über den Zeitverlauf.
Mit diesen Daten lässt sich nun die Impfeffektivität mit der Farrington Formel berechnen. Auf die Schwierigkeiten bei dieser Methode habe ich im ersten Teil der Analyse deutlich hingewiesen. Die Formel lautet: