Aktualisierung ab 15.11.2020

Im Zentrum der Diskussion um die Verbreitung des Coronavirus stand von Anfang an das exponentielle Wachstum der Übertragung des Krankheitserregers.

Bei allen aktuellen Berechnungen gilt immer noch, dass es uns an verläßlichen Daten bzgl. der Dunkelziffer der Infizierten fehlt. Leider konnte auch die Heinsberg-Studie nicht die Erwartungen diesbezüglich erfüllen (s.u.). Insofern beziehen sich alle Zahlen stets auf die Anzahl der getesteten Infizierten. Hier wäre dringend geboten, in Kooperation mit einem Meinungsforschungsinstitut jede Woche repräsentative Stichproben (n = 1500-2000) mit Erhebung der Werte (Infiziert, bereits gesundet, nicht-infiziert) durch Tests (ggfls. Antikörpertests) zu ermitteln und diese von Woche zu Woche miteinander zu vergleichen. Wenn man rund 2000 Personen repräsentativ erhebt, dann weiß man, wie die Infiziertenrate in Deutschland wirklich sich darstellt auf der Basis eines Konfidenzintervalls mit 95%iger statistischer Sicherheit.


SIR-Modell

Zu Beginn der Diskussionen wurde man in den Medien stets mit einer Abbildung von zwei Graphen konfrontiert, die verdeutlichen, bei welcher Anzahl von Infizierten unser Gesundheitssystem kollabiert bzw. dies nicht tut.

(Quelle: dpg-physik.de)

Dies bildete die Grundlage für die aktuellen Maßnahmen der Kontaktbeschränkungen.

Das zugrunde liegende mathematische Modell nennt sich SIR-Modell:

Die S-Kurve bezieht sich auf den Anteil der Personen, die infiziert werden können, die I-Kurve stellt den Anteil der infizierten Personen dar und die R-Kurve den Anteil derjenigen, die die Infektion hinter sich haben und immun sind. Das SIR-Modell ist das Standardmodell zur Modellierung von Epidemien. Eine gute Erklärung dieses Modells findet man unter https://www.bing.com/videos/search?q=SIR+Modell+corona&&view=detail&mid=6FE2EA47B9A28BF0F6956FE2EA47B9A28BF0F695&&FORM=VRDGAR&ru=%2Fvideos%2Fsearch%3Fq%3DSIR%2BModell%2Bcorona%26FORM%3DHDRSC3

Die entscheidende Kurve ist die I-Kurve, deren Hochpunkt sollte durch die einschränkenden Maßnahmen niedriger werden und die Verteilung sollte sich zeitlich mehr nach rechts verschieben (siehe die Abbildung oben). Dieses Ziel wurde durch die Kontaktbeschränkungen erreicht.

Die R-Kurve ist eine Exponentialfunktion mit logistischem (begrenzten) Wachstum, eine tagesaktuelle Modellierung dieser R-Kurve finden sie unter https://covid.firrm.de/ (dort findet man im Zähler des Funktionsterms die obere Schranke S, also die entsprechend der Modellierung dann zu erwartende Endzahl an Personen, die eine Infektion hinter sich haben, unter der Voraussetzung, dass die jetzige Infektionsrate sich auf diesem Niveau weiterentwickelt).

Mathematisch handelt es sich um ein System von einfachen Differentialgleichungen (siehe Abbildung), die man numerisch, also mit einem Algorithmus, lösen kann. Die Variablen ß und y bezeichnen die Übergangsraten:

ß = Infektionsrate, pro Tag, in Abhängigkeit von der durchschnittlichen Kontaktrate und der Wachstumsrate der Neuinfektionen. Mathematisch ist die Modellierung der Kontaktrate, also der durchschnittlichen Anzahl von Kontakten der Personen einer Population, sehr schwierig. In schwacher Näherung kann man den Quotient 2/Verdopplungszahl als Infektionrate (pro Tag) verwenden. Diese Näherungsformel wird aber umso schlechter, je weiter die Pandemie fortschreitet. Als Bezugspunkt bzgl. der Verdopplungszahl als Infektionsrate (pro Tag) sollte dann die Anzahl der Neuinfektionen nicht durch die Gesamtzahl der Infizierten (Ig) dividiert werden, sondern eher durch die Anzahl der aktuell Infizierten (Ia).

y = Genesungsrate, also bei Corona im Mittel: y =1/12 (pro Tag).

Reproduktionszahl R(t), Infektionsrate und Verdopplungszahl

In der Diskussion um die Kennzahlen für die Frage nach dem Rückgang der Infektionen und der Interpretation der Datenlage spielt die sogenannte Reproduktionszahl R(t), also die durchschnittliche Anzahl der Personen, die eine infizierte Person während der Zeit, in der die Person infektiös ist, wieder ansteckt, eine (je nach politischer Lage) bedeutende Rolle.

Bei dem Coronavirus geht man von einer Basisreproduktionszahl R(0) von 2-3 aus. Das RKI formuliert als Zielgröße, dass diese Zahl unter 1 liegen soll (dann spricht man nicht mehr von einer Epidemie!).

Berechnet wird die Zahl R(t) als Quotient von Infektionsrate/ Genesungsrate (ß/y)

Einen tagesaktuellen Überblick über den Stand der Reproduktionszahl R(t) auf der Basis der Daten des RKI finden sie unter

https://stochastik-tu-ilmenau.github.io/COVID-19/germany

Zu beachten ist, dass in der Übersicht ein Zeitverzug von rund 7(-10) Tagen (die Berechnung bezieht sich auf das tatsächliche Infektionsdatum, das die Wissenschaftler der TU Ilmenau auf rund 7 Tage vorher datieren aufgrund der Inkubationszeit (ca 5 Tage) und der Zeit bis zur Durchführung des Tests und der Meldung an die Behörden). Die letzten Datenpunkte sind noch nicht gesichert.

Um eine realitätsnähere Approximation des Näherungswertes für R zu erhalten, müsste man das geometrische Mittel der Werte für R(t) von Di-Fr innerhalb einer Woche berechnen, um die Wochenendeffekte zu eliminieren. Dies würde auch die Schätzfunktion verbessern und den Aussagewert von R erhöhen.

Die Infektionszahlen auf der Basis des RKI-dashboards, 0:00 Uhr :

Die Tabelle wird aufgrund der sog. 2.-Welle nun, im November 2020, neu aufgenommen. Zentral ist dabei nicht die Entwicklung der absoluten Anzahl der Infizierten (Ig), sondern die Entwicklung der Wachstumsrate bei den aktuell Infizierten (IA) im 7-Tage-Vergleich (So-So). Durch die Wochenendeffekte macht es Sinn, die Wachstumsrate im Vergleich der Vorwoche (Mo-So) zu vergleichen.

Datum
Anzahl der Infizierten gesamt (Ig) 

Zuwachs im Vgl. zum Vortag

(Iz)

Todesfälle (T)


Zuwachs der TodesfälleGenesene (geschätzt, G)Zuwachs GeneseneAktuell Infizierte IA (IA = IG-T-G)Wachstums/
Zerfallsrate
Aktuell Infizierte in einer Woche (Mo-So)
13.11.20
(Fr)
751.09523.54212.200218481.70013.900257.200/
14.11.20 (Sa)773.55622.46112.378178493.20011.500268.000/
15.11.20
(So)
790.50316.94712.485107502.3009.200275.7001. Bezugswert
16.11.20 (Mo)801.32710.82412.54762515.20012.800273.580/
17.11.20
(Di)
815.74614.41912.814267530.20015.000272.732/
18.11.20
(Mi)
833.30717.56113.119305546.50016.400273.588/
19.11.20
(Do)
855.91622.60913.370251562.70016.200279.746/
20.11.20 (Fr)879.56423.64813.630260579.10016.400286.734/
21.11.20
(Sa)
902.52822.96413.884254593.10014.000295.544/
22.11.20 (So)918.26915.74114.022138603.80010.700300.357+8,9%
23.11.20
(Mo)
929.13310.86414.11290618.80015.000296.221
24.11.20
(Di)
942.68713.55414.361249636.70017.900291.626
25.11.20
(Mi)
961.32018.63314.771410656.40019.800290.149
26.11.20
(Do)
983.58822.26815.160389676.10019.600292.328
27.11.(Fr)1.006.39422.80615.586426696.10020.000294.708
28.11.
(Sa)
1.028.08921.69515.965379711.00014.900301.394
29.11.
(So)
1.042.70014.61116.123158722.30011.300304.277+1,3 %
30.11.
(Mo)
1.053.86911.16916.248125739.10016.800298.521
01.12.
(Di)













































Wie berechnet das RKI die Reproduktionszahl R(t) (vgl. https://www.rki.de/DE/Content/Infekt/EpidBull/Archiv/2020/17/Art_02.html)?

Um die oben genannte zeitliche Verschiebung aus den aktuellen Daten herauszurechnen, betreibt das RKI ein sogenanntes Nowcasting, wie der Begriff schon sagt, eine Vorhersage der aktuellen Zahlen auf Grundlage der mit einem Zeitverzug von im Median 7 Tagen gemeldeten Daten. D.h., der vom RKI veröffentlichte Wert R(t) baut nicht auf den berichteten Werten für einen Tag auf:

Nowcasting

Die täglich neu gemeldeten Corona-Fallzahlen entsprechen nicht der tatsächlichen Zahl der neuen Fälle an diesem Tag. Aufgrund von Verzögerungen bei der Meldung können die Zahl der neu gemeldeten Fälle und die tatsächliche Zahl der neuen Fälle erheblich voneinander abweichen. Zur Beurteilung der aktuellen Lage, für die Bewertung der Wirksamkeit von Maßnahmen und zur Prognose ist aber die tatsächliche Anzahl an Neuerkrankungen besser geeignet.

Daher werden aus den aktuellen Meldedaten die tatsächlichen neuen Fallzahlen geschätzt. Dies ist möglich, da man bei den gemeldeten Fällen auch den Beginn der Symptome mit erhebt. Diese Information wird genutzt, um die Verteilung der Verzögerung der Meldung (Zeitraum zwischen Krankheitsbeginn und Meldung beim RKI) zu schätzen. Daraus kann man dann die Anzahl der tatsächlichen Fälle bis zu zwei Tage vor dem Meldedatum schätzen. Es handelt sich dabei nicht um eine Vorhersage (forecast) sondern um eine Schätzung zum aktuellen Zeitpunkt (nowcast).

Weiter kann man aus den Daten die in der Öffentlichkeit viel diskutierte zeitabhängige Reproduktionszahl R(t) schätzen. Diese Zahl ist definiert als die durchschnittliche Anzahl von Personen, die von einer Person mit Krankheitsbeginn zum Zeitpunkt t angesteckt wurden. Sie kann basierend auf den aktuellen Zahlen nur mit einer Verzögerung von 7-10 Tagen geschätzt werden.

Die zeitabhängige Bestimmung der durchschnittlichen Anzahl der Personen, die von einem Infizierten angesteckt werden, erfolgt unter folgenden Annahmen:

  • Zwischen Ansteckung und Beginn der Symptome vergehen im Durchschnitt fünf Tage;
  • Ein Infizierter kann im Durchschnitt bereits zwei Tage bevor er Symptome entwickelt, andere anstecken;
  • Zwischen der Infektion einer Person und der Infektion anderer durch diese Person vergehen im Schnitt vier Tage. Diese Zeitspanne wird als Generation in den Modellen bezeichnet;

Auf dieser Grundlage erfolgt die Berechnung von R(t) als einfache Division zweier aufeinanderfolgender Generationen (ohne Nowcasting):

R(t) = Anzahl der Neuinfektionen INz (z.B. Tage 5 bis 8) / Anzahl der Neuinfektionen INn (z.B. Tage 1 bis 4)

Durch Nowcasting wird der Zähler dieses Bruches, also die Anzahl der Neuinfektionen in den letzten 4 Tagen vor dem Meldedatum, größer, so dass die offizielle Reproduktionsrate des RKI stets größer ist, als der Wert des o.g. Bruches ohne Nowcasting. Allerdings liegt der Bruchwert i.a. innerhalb des Konfidenzintervalls.

Mittlerweile hat sich auch am RKI die Erkenntnis durchgesetzt, dass diese Methode der R-Schätzung sehr anfällig ist bzgl. statistischer Ausreißer an einem einzelnen Tag, wie etwa am Wochenende.

Daher veröffentlicht nun das RKI seit 14.05. neben dem R-Wert, der auf der 4-Tagesberechnung beruht, ein Wochen-R-Wert, der sich auf eine ganze Woche bezieht und damit nicht mehr so anfällig ist gegenüber einzelnen Schwankungen. Er bezieht sich dann auf das Infektionsgeschehen vor rund 14 Tagen.

Eine Beispielrechnung mit einer tabellarischen Übersicht der R-Schätzungen des RKI´s finden sie auf https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Projekte_RKI/Nowcasting.html

Aus mathematischer Sicht erscheint die Infektionsrate im Verbund mit der Genesungsrate eine aussagekräftigere Kennzahl für den Infektionsverlauf zu sein. Hieraus ergibt sich u.a. die Anzahl der aktuell Infizierten (mit Ausnahme der Dunkelziffer), die man dann in Relation zur Intensivbettenkapazität (s.u.) stellen sollte.

Reproduktionszahl und Herdenimmunität

Wie groß muss nun die Immunität in der Bevölkerung sein, um die Reproduktionszahl ohne weitere Maßnahmen unter R = 1 zu halten? Nimmt man R(0) = 3 an, dann bedeutet das ja, dass jeder Infizierte zu Beginn der Epidemie im Schnitt drei andere angesteckt hat. Soll R nun dauerhaft unter 1 bleiben, müssten also zwei von drei Personen aus der Menge der Suszeptiblen (Anfälligen) wegfallen. Etwa 66 Prozent der Bevölkerung müssen demnach immun werden, wenn man R ohne Maßnahmen unter 1 halten will.


Auslastung der Intensivbetten in Deutschland

Bedeutsamer als die Kennzahlen von Reproduktionszahl und Verdopplungszahl ist die Frage nach der Auslastung der Intensivbetten. Einen tagesaktuelle Übersicht über die Auslastung der Intensivbetten in Deutschland finden sie unter

https://interaktiv.morgenpost.de/corona-deutschland-intensiv-betten-monitor-krankenhaus-auslastung/

Aktuell (19.11.20) befinden sich 3.601 Covid-19-Patienten auf den Intensivstationen, das sind 13% aller aktuell verfügbaren Betten.

Sterberate und Dunkelziffer

Alle Zahlen, die zur Zeit vorliegen, haben nur eine beschränkte Aussagekraft, wenn man nicht genau weiß, wie hoch die Dunkelziffer der Infizierten ist, die keine Symptome haben und daher nicht getestet werden. Hierzu benötigt man eine repräsentative Stichprobe, um ein Konfidenzintervall für die unbekannte Dunkelziffer zu bestimmen. Aktuelle Schätzungen gehen von einer Dunkelziffer mit dem Faktor 6-7 aus.

Heinsberg-Studie

Die sog. Heinsberg-Studie unter Leitung des Virologen Prof. Dr. Streeck behauptet, dass die Sterberate (Anteil der Todesfälle in Bezug auf die Zahl der Infizierten) in Deutschland bei 0,37 % liegt.

Der Leistungskurs MSS 12 von Herrn Loch hat nach eingehender Analyse der mathematischen Methoden, die den Ergebnissen der Studie zugrunde liegen (https://www.ukbonn.de/C12582D3002FD21D/vwLookupDownloads/Streeck_et_al_Infection_fatality_rate_of_SARS_CoV_2_infection2.pdf/%24FILE/Streeck_et_al_Infection_fatality_rate_of_SARS_CoV_2_infection2.pdf), grundlegende Bedenken bzgl. der angegebenen Sterberate. Diese Rate wurde auf der Basis zweier Schätzungen berechnet, die Konfidenzintervalle darstellen. HIer ergibt sich durch die doppelte Unschärfe der Intervalle, dass die Rate von 0,37 % statistisch genauso wahrscheinlich ist wie eine Rate zwischen 0,1 und 0,9 %! Mit der Sterberate wurde dann allerdings die Dunkelziffer geschätzt (1,8 Millionen Infizierte)! Schätzt man mit den angegebenen Randwerten von 0,1 % und 0,9% die Anzahl der Infizierten, so kommt man auf sehr große Unterschiede (0,6-5 Millionen Infizierte!).

Bereits einen Tag nach der Veröffentlichung der Studie bestätigen Berechnungen von mathematischen Instituten die Überlegungen des Leistungskurses (https://www.faz.net/aktuell/wissen/corona-die-statistik-schwaechen-der-heinsberg-studie-16758326.html)! Also: Mathematik kann sehr lebensrelevant sein!!

(Rudolf Loch, 19.11.2020)







[PLEASE FIX!] Please choose your cookie preferences: