Für die Abschätzung der sozioökonomischen Folgen der SARS-CoV-2-Pandemie mangelt es an belastbaren Daten, die den zeitlichen Verlauf der COVID-19-Infektionen in Deutschland unter Berücksichtigung des Dunkelzifferfaktors abbilden. Auf Basis von drei unterschiedlich aufgebauten Modellrechnungen schätzen wir die monatlichen SARS-CoV-2-Infektionszahlen in Deutschland für die ersten 5 Jahre der Pandemie (2020–2024) ab. Es ergeben sich insgesamt zwischen 160 und 197 Mio. Infektionen, d. h. wesentlich mehr als die vom RKI gemeldeten 39 Mio. Infektionen. Im Jahr 2024 liegt der Dunkelzifferfaktor bzgl. der offiziellen RKI-Daten bei über 80.
Die Online-Version dieses Beitrags (https://doi.org/10.1007/s10049-025-01520-9) enthält einen Anhang, in dem die drei Modellansätze, die die tatsächlichen SARS-CoV-2-Infektionszahlen in Deutschland abschätzen, eingehend beschrieben werden. Weiterhin werden deren Daten mit den öffentlich zugänglichen Daten verglichen.
Diese Originalie ist Teil des Leitthemas.
×
QR-Code scannen & Beitrag online lesen
Hinweis des Verlags
Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.
Einleitung
Seit dem ersten Auftreten des SARS-CoV-2-Virus in China in 2019 infizierten sich weltweit Milliarden von Menschen einfach oder mehrfach durch unterschiedliche Varianten des sich weiter entwickelnden Virus. Aerosolgetriggerte Übertragungen von Mensch zu Mensch, mit über 40 % asymptomatischen SARS-CoV-2-Infizierten, tragen wesentlich zur unkontrollierten Verbreitung und dem pandemischen Geschehen bei [1]. Zur Abschätzung der Prävalenz und Inzidenz von SARS-CoV-2-Infizierten und an COVID erkrankten Menschen wurde zunächst auf symptom- oder anlassbezogene Testungen mit unterschiedlichen Falldefinitionen fokussiert (RKI-Falldefinitionen). Mit zunehmender Immunität der Bevölkerung wurde die Teststrategie und auch die Meldepflicht gemäß Infektionsschutzgesetz so verändert, dass aktuell keine validen Fallzahlen zu SARS-CoV‑2 veröffentlicht werden können. Ein sogenanntes Abwassermonitoring auf SARS-CoV‑2 zur epidemiologischen Lagebewertung (AMELAG) wurde zwar in ausgewählten Kläranlagen in Deutschland durch das Robert Koch-Institut (RKI) etabliert und aktuell wissenschaftlich evaluiert [2]. Genaue bundesweite Infektionszahlen wie z. B. die Inzidenz symptomatischer und/oder hospitalisierter COVID-Patienten und damit das Belastungsrisiko für das Gesundheitssystem und die Gesellschaft bleiben aber unbekannt (AMELAG Wochenbericht). Die unterschiedliche Pathogenität mutierter Virusvarianten zeigt zudem, dass es deutliche Diskrepanzen zwischen der Prävalenz von Infizierten und der Prävalenz hospitalisierter Patienten gibt, was die zeitnahe Abschätzung der Infektionsfolgen erschwert. Das ARE-Praxis-Sentinel Projekt des RKI ermöglicht eine syndromische Surveillance akuter respiratorischer Erkrankungen (ARE) in Arztpraxen und Krankenhäusern und informiert über die aktuelle Krankheitsschwere und -häufigkeit sowie den saisonalen Verlauf von akuten Atemwegserkrankungen (Stichprobe von 700 Arztpraxen (SEED/ARE) und 70 Krankenhäusern (ICOSARI)).
In Form von Wochenberichten und Dashboard-Darstellungen veröffentlicht das RKI regelmäßig Zahlen der o. g. Surveillance-Methoden, die im Wesentlichen in den Meldepflichten des Infektionsschutzgesetzes verankert sind [3]. Problematisch in diesem Kontext ist, dass für diese Zahlen zur Abschätzung der Inzidenz und Prävalenz zeitweise ein erheblicher Dunkelzifferfaktor (DZF) von über 80 angenommen werden muss [4]. Neben den akuten Symptomen weisen immer mehr wissenschaftliche Arbeiten darauf hin, dass SARS-CoV-2-Infektionen und COVID bleibende Gesundheitsprobleme verursachen [5, 9]. Für die Betroffenen besonders einschneidend sind dabei Long-COVID [6] und ME/CFS [7]. Long-COVID wird bei ca. 8–11 % abhängig von der Virusvariante der COVID-Patienten bei Erstinfektion diagnostiziert [8, 9] sowie bei ca. 1 % bei jeder erneuten Reinfektion [8]. Danach kann man mit einer ca. 20 %igen Genesungsrate alle 12 Monate rechnen [10]. Aus den Long-COVID-Patienten entwickeln ca. 11 % ME/CFS [11], mit einer jährlichen Genesungsrate von ca. 7,5 % [12]. Diese Zusammenhänge führen dazu, dass sich beim Auftreten von Infektionswellen mit Millionen Infizierten (bisher 7 Wellen) die Long-COVID-Patienten und ME/CFS-Patienten schneller anhäufen, als sie wieder gesund werden – mit entsprechender ständiger Belastung für Gesundheitssystem und Gesellschaft.
Anzeige
Der Verlauf der Pandemie in Deutschland
In Deutschland tauchte das SARS-CoV-2-Virus im Januar 2020 das erste Mal auf. Die darauffolgende Zeit war geprägt von der Entwicklung und Herstellung von Test- und Schutzmaßnahmen. Eine flächendeckende valide Surveillance war zu Beginn der Pandemie nicht existent und die Belastung des Gesundheitssystems nicht objektiv messbar. Orientierungspunkte für gesundheitspolitische Steuerungsmaßnahmen, um die Bevölkerung zu schützen und das Gesundheitssystem vor einem Kollaps zu bewahren, waren zum Teil sehr umstritten. In den Jahren 2020 und 2021 wurde durch verschiedene Maßnahmen die Inzidenz an SARS-CoV-2-Neuinfektionen niedrig gehalten. Nach der Impfkampagne im Jahr 2021 konnten Anfang 2022 die systemischen Schutzmaßnahmen weiter reduziert werden. Zeitgleich setzte sich ab Januar 2022 die erste Omikron-Variante durch, die durch wesentlich höhere Ansteckungsraten, aber auch ein Absinken der Hospitalisierungsraten im Vergleich zu den vorhergehenden Varianten gekennzeichnet war. („Omikron ist ansteckender, macht aber weniger krank“; [13]). In der Folge kam es zu einer stufenweisen Reduktion der zum Teil länderspezifisch behördlich empfohlenen Schutzmaßnahmen und einer Reduktion der direkten SARS-CoV-2-Testungen. Damit ergaben sich direkte Einflüsse auf die an das RKI gemeldeten Infektionszahlen, die rein rechnerisch zu einem kontinuierlichen Absinken und Unterschätzen der Inzidenzen führten. Die mittlerweile neu implementierten o. g. Surveillance-Methoden wiesen demgegenüber auf deutliche Diskrepanzen hin, sodass nach aktuellem Stand aus den offiziellen Zahlen nicht präzise auf Inzidenz/Prävalenz oder die Belastung des Gesundheitssystems geschlussfolgert werden kann.
Nach den in dieser Arbeit gezeigten Modellberechnungen gab es bisher sieben Wellen mit über 5 Mio. Infektionen pro Monat, jeweils ausgelöst durch neue, immunflüchtige Varianten und/oder durch das zwischenzeitliche Absinken der Bevölkerungsimmunität aus vorhergehenden Infektionen. Saisonale Effekte, wie sie bei Influenza bekannt sind, scheinen dagegen nur eine untergeordnete Rolle zu spielen. Abb. 1 zeigt den Verlauf der Pandemie anhand der monatlichen Fallzahlen gemäß den Daten des RKI und den Verlauf aus den drei Modellen. Deutlich ist zu sehen, dass ab 2022 die offiziellen Zahlen des RKI (blau) sehr stark von den dargestellten Modellen abweichen.
Abb. 1
Verlauf der Pandemie in Deutschland. (Offizielle monatliche Fallzahlen des RKI und monatliche Fallzahlen der Modelle Paessler, Verbeek, Hechler)
×
In der vorliegenden Arbeit werden drei Modellansätze vorgestellt, die die tatsächlichen SARS-CoV-2-Infektionszahlen in Deutschland abschätzen. Die Ergebnisse werden mit anderen öffentlich zugänglichen Quellen, die zumeist auf der Basis des § 13 Infektionsschutzgesetz erhoben werden, verglichen. Im Supplement werden diese Vergleiche im Detail dargestellt und jeder Modellautor beschreibt seinen Ansatz ausführlicher.
Methoden
Ziel der dargestellten Modelle ist es, realitätsnah eine Inzidenzabschätzung über den zeitlichen Verlauf, möglichst in Echtzeit, zu kalkulieren und damit über die potenzielle Infektionsgefahr für die Bevölkerung zu informieren.
Anzeige
Modell Paessler
Das Modell von Dirk Paessler verwendet als Ausgangszahlen die täglichen Meldungen über Hospitalisierungen wegen COVID von bis zu 25 zentralen Notaufnahmen (ZNA) an die DGINA Notaufnahme-Ampel und schließt daraus über angenommene Hospitalisierungsraten zurück auf die Infektionszahlen. Seit Dezember 2020 erfassen ausgewählte ZNA aus ganz Deutschland tagesaktuell verschiedene Parameter des Vortags, unter anderem die Anzahl der COVID-Patienten, die über die ZNA stationär aufgenommen wurden („COVID-Hospitalisierungen“). Aus dieser Zahl und der Bevölkerungsabdeckung der beteiligten ZNA wird die Anzahl der Hospitalisierungen für ganz Deutschland hochgerechnet.
Die Vorteile dieser Zahlenbasis sind, dass ZNA als erste Anlaufstelle für schwere Erkrankungen und insbesondere für akute oder schwere Infektionserkrankungen fast in Echtzeit Veränderungen im Infektionsgeschehen in der Bevölkerung abbilden und die Symptominterpretation, der Testnachweis auf SARS-CoV‑2 und die Diagnosestellung COVID durch professionelles Gesundheitspersonal erfolgt. Aufgrund der Patientenvorstellung 7/24/365 können auch potenzielle Meldeverzögerungen z. B. durch Feiertagseffekte nahezu ausgeschlossen werden. Seit Implementierung der DGINA Notaufnahme-Ampel im Dezember 2020 werden die Daten unverändert erfasst und analysiert. Die DGINA Notaufnahme-Ampel stellt bisher das einzige konstante Erfassungssystem für SARS-CoV‑2 auf der Basis von tagesaktuell hospitalisierten Patienten in Echtzeit für Deutschland dar. Longitudinalstudien oder Längsschnittuntersuchungen sind hierdurch in einzigartiger Weise möglich. Fast alle anderen publizierten Zahlenreihen in Bezug auf SARS-CoV‑2 in Deutschland unterlagen in den 5 Jahren seit Beginn der Pandemie Regeländerungen bei der Erstellung und/oder Erfassung/Weitermeldung der Zahlen.
Die Berechnung der Inzidenz besteht aus nur einem Schritt, nämlich der Division der täglich gemeldeten COVID-Hospitalisierungen durch eine angenommene Hospitalisierungsrate, was dann die Gesamtinzidenz ergibt. Herleitung/Abgleich und der Verlauf dieser Hospitalisierungsrate werden im Anhang gezeigt.
Modell Verbeek
Das Modell von Rutger Verbeek nutzt neben den vom RKI gemeldeten Fallzahlen die Daten des DIVI Intensivregisters (Belegung der Intensivstationen [ITS]), die AMELAG-Daten (Abwasser-Viruslast-Analysen) sowie die über ein Jahr lang von einer repräsentativen Kohorte mittels wöchentlicher verdachtsunabhängiger Tests ermittelten Infektionszahlen des Projekts SentiSurv-RLP. Auf Basis dieser Zahlen wird ein aktueller Dunkelzifferfaktor (DZF) bestimmt, mit dem aus den offiziellen Zahlen auf die tatsächlichen Infektionszahlen geschlossen wird.
Ab 2022 wurde der DZF auf Basis der Daten aus den Intensivstationen unter Annahme einer bei den Omikron-Varianten konstanten ITS-Quote bestimmt, wobei für Juni 2022 DZF = 2,5 geschätzt wurde; dieser Wert wurde ab Anfang 2023 durch die über SentiSurv direkt ermittelte Inzidenz validiert.
Durch Vergleich mit den über ein Jahr mittels SentiSurv direkt bestimmten Inzidenzen ist es möglich, die ab Juni 2022 verfügbaren AMELAG-Daten zu kalibrieren, sodass man ab Juni 2022 über die wöchentlichen Abwasserdaten eine Schätzung der realen Inzidenz erhält – auch nachdem ab Mitte 2023 die ITS-Daten unzuverlässiger wurden. Genau wird die Vorgehensweise im Anhang beschrieben.
Modell Hechler
Anders als bei den beiden anderen Ansätzen geht das Modell von Martin Hechler numerisch/synthetisch an die Modellierung des pandemischen Verlaufs heran und versucht, über die Anpassung verschiedener Modellparameter den jeweils sich aktuell ergebenden Verlauf der offiziellen Zahlen des RKI (Neuinfektionen, Hospitalisierungen, Intensivbelegung und auch Variantenanteile aus Sequenzierungen) nachzustellen. Auf dieser Basis kann das Modell dann auch eine Modellvorhersage für die folgenden Wochen erstellen.
Grundelement der Modellierung ist der Reproduktionsfaktor R, der von Tag zu Tag die Zahl der Neuinfektionen aus der Zahl der zu dem Zeitpunkt Infektiösen bestimmt. In die Schätzung von R gehen Viruseigenschaften ein, aber auch Bedingungen, die die Virusübertragung (Kontaktreduzierung oder Wetter) und die Infizierbarkeit (Immunisierung durch Impfung und zurückliegende Infektionen) beeinflussen. Der Ansteckungsprozess wird für jede Virusvariante getrennt modelliert, unter Berücksichtigung der Kreuzimmunisierung durch vorherige Varianten, mit zeitabhängigem Immunverlust. Zur Anpassung der Fallmeldungen wird der Dunkelzifferfaktor geschätzt, die Intensivbelegung wird dunkelzifferfrei angenommen, allerdings mit variantenabhängiger Pathogenität.
Anzeige
Ergebnisse
Die Grafik in Abb. 2 zeigt den Verlauf der kumulierten Infektionszahlen für 2020–2024 im Vergleich der drei Modellergebnisse und der Zahlen vom RKI.
Abb. 2
Kumulierte Verläufe der Infektionszahlen (in Deutschland) der Modelle für 2020–2024 im Vergleich zu den Fallzahlen des RKI
×
Im Gegensatz zu den vom RKI publizierten Fallzahlen, die seit November 2022 auf einem Niveau zu verharren scheinen, zeigen die drei Modelle ähnliche kumulierte Fallzahlen. Saisonal betrachtet folgen in den Modellen die Infektionswellen nicht dem bekannten saisonalen Muster der Influenza/RSV-Wellen, was auf Unterschiede in der Entstehungsdynamik hindeuten kann. Die Diskrepanz zwischen den RKI-Fallzahlen und den Modellen wird in Abb. 3 veranschaulicht. Hier zeigen alle drei Modelle den Jahres-Fallzahl-Höchstwert für das Jahr 2022 sowie eine zunehmende Abweichung von den RKI-Fallzahlen zu allen drei Modellen seit 2020.
Abb. 3
Jährliche Infektionszahlen und Gesamtzahl für Deutschland in den drei Modellen im Vergleich zu den Fallzahlmeldungen des RKI
×
Alle drei Modelle rechnen in 2024 mit einem DZF von 80 bis 120. Übertragen auf die Fallzahlen des RKI bedeutet dies, dass in 2024 die Fallzahlen des RKI weniger als 1 % des tatsächlichen Geschehens wiedergeben.
Es wurde eine Korrelationsanalyse der Modelldaten mit allen im Anhang verwendeten öffentlichen Datenreihen erstellt (Pearson-Korrelationskoeffizient r). Dabei wurde nur die Zeit ab Juli 2022 betrachtet (d. h. nach dem massiven Anstieg der Dunkelzifferfaktoren), also der Zeitraum, für den keine gute Fallzahldatenbasis vom RKI zur Verfügung steht.
Anzeige
Eine Korrelation zwischen Zahlenreihen begründet nicht zwangsläufig einen Kausalzusammenhang, jedoch sehen die Autoren eine starke Bestätigung der Modellergebnisse darin, dass es Korrelationen (r > 0,8) zu Datenreihen gibt, die auf komplett unterschiedlichen Quellen basieren, die aber ihrerseits alle eng an das Pandemiegeschehen gekoppelt sind.
Abb. 4 zeigt, dass die drei Modelle von Verbeek, Paessler und Hechler eine starke Korrelation zu den AMELAG-Abwassermeldungen (Viruslast) aufweisen (r = 0,83–0,98), die wahrscheinlich zur Einschätzung des Zeitverlaufs die beste langfristig verfügbare quantitative Zahlenreihe darstellen. Die hohe Datenqualität der Abwassermeldungen wurde in einer Studie gezeigt, die Fallzahlendaten (SentiSurv-RLP) mit den regional dazugehörigen Kläranlagendaten verglichen hat [14]. Wobei hier angenommen wird, dass sich die Menge der ausgeschiedenen Viruspartikel bei Infektionen mit unterschiedlichen Varianten nicht verändert hat.
Abb. 4
Matrix der Pearson-Korrelationskoeffizienten r zwischen den verfügbaren Zeitreihen
×
Die Hospitalisierungsdaten von RKI und DGINA sowie die Erstaufnahmen der Notaufnahmen sowie das Modell Loenenbach weisen einen Korrelationsfaktor von r = 0,77–0,78 auf, liegen damit gleichauf. Im Modell Loenenbach [4] berechnen Mitarbeiter des RKI den Dunkelzifferfaktor für Deutschland für 2020 bis Ende 2023 auf Basis einer Inzidenzberechnung, die auf dem RKI-Projekt GrippeWeb basiert.
Die etwas niedrigere Korrelation der Patientenzahlen zu den Abwasserdaten erklärt sich wahrscheinlich durch das ständige Absinken der Hospitalisierungsrate (durch wachsende Grundimmunität) sowie durch Veränderungen im Testregime über die Zeit.
Anzeige
Die Sterbezahlen und die Fallzahlen des RKI sowie die Krankenstandsdaten der BKK sind deutlich abgeschlagen und scheinen damit wenig geeignet, den Verlauf der Pandemie zu beobachten.
Im Supplement werden die Infektionszahlen der drei Modelle ausführlich mit den öffentlich zugänglichen Daten verglichen.
Diskussion
Es wurden drei verschiedene Zahlenreihen für die Abschätzung der monatlichen tatsächlichen SARS-CoV-2-Infektionszahlen vorgestellt, die mit hoher Plausibilität den tatsächlichen Verlauf der Infektionen in Deutschland wiedergeben sollten.
Für die 5 Jahre von 2020 bis 2024 berechnen die Modelle zwischen 160 und 197 Mio. Infektionen für Deutschland (Mittelwert 184 Mio. plus/minus 15 %), d. h., im Schnitt wäre jeder Bürger mindestens 2‑mal infiziert worden. Der Dunkelzifferfaktor bezogen auf die offiziellen Fallzahlen des RKI lag zuletzt um den Wert 100, d. h., nicht einmal 1 % der stattfindenden Infektionen würden sich aktuell in den offiziellen Zahlen wiederfinden.
Wir folgern, dass sich Deutschland im Blindflug befindet, was die bevölkerungsweite Überwachung von SARS-CoV‑2 angeht. Belastbare, öffentlich verfügbare, zeitnahe Daten liegen nicht vor. Die vorgestellten Zahlenreihen lassen vermuten, dass entgegen der öffentlichen Wahrnehmung die Pandemie nicht zu Ende ist, es kommt weiterhin zu Infektionswellen mit Millionen von Infektionen. Nach unserer modellbasierten Einschätzung wurde im fünften Jahr 2024 fast ein Viertel der Bevölkerung infiziert und dadurch dem Risiko für Long-COVID, postakutes Infektionssyndrom (PAIS) oder ME/CFS ausgesetzt.
Sowohl für gesundheitspolitische Entscheidungen als auch für jeden einzelnen Bürger erscheint eine fundierte Datenlage über den aktuellen Fortgang von Infektionskrankheiten wie SARS-CoV‑2, Influenza, RSV usw. wünschenswert. Dies könnte durch Fortführung des AMELAG-Abwasserprojekts sowie durch die Schaffung einer Panel-basierten Pandemie-Surveillance (analog zu SentiSurv-RLP für das ganze Land) erreicht werden, ausgedehnt auch auf andere Infektionskrankheiten wie Influenza, RSV oder Vogelgrippe. Derartige Daten mit guter Qualität würden Abschätzungen wie die hier vorgestellten Zahlen überflüssig machen.
Dies sollte ergänzt werden durch eine tagesaktuelle Surveillance mithilfe von Proxy-Werten, wie Hospitalisierungen und Intensivpatienten, um Veränderungen in der Krankheitslast schnell erkennen zu können. Eine kostengünstige Option wäre die Fortführung und Erweiterung der DGINA Notaufnahme-Ampel, die bisher rein ehrenamtlich betrieben wird, mithilfe staatlicher Finanzierung.
Einschränkungen
Die Datenlage zu den tatsächlichen Infektionszahlen in Deutschland ist insbesondere ab 2022 problematisch, alle verwendeten Zahlenreihen haben ihre eigenen Einschränkungen, die sich z. T. über die 5 Jahre stark verändert haben. Dies betrifft folglich auch unsere Modellergebnisse. Am Ende zeigen aber die Vergleiche der auf völlig unterschiedlichen Wegen erstellten Modelldatenreihen mit den öffentlich verfügbaren Daten, dass unsere Modellergebnisse eine valide Abschätzung der Größenordnung geben sollten.
Einhaltung ethischer Richtlinien
Interessenkonflikt
D. Paessler, M. Hechler, R. Verbeek, S. Neefischer und H. Dormann geben an, dass kein Interessenkonflikt besteht.
Für diesen Beitrag wurden von den Autor/-innen keine Studien an Menschen oder Tieren durchgeführt. Für die aufgeführten Studien gelten die jeweils dort angegebenen ethischen Richtlinien.
Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen. Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.
Hinweis des Verlags
Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.
Springer Pflege Klinik – unser Angebot für die Pflegefachpersonen Ihrer Klinik
Mit dem Angebot Springer Pflege Klinik erhält Ihre Einrichtung Zugang zu allen Zeitschrifteninhalten und Zugriff auf über 50 zertifizierte Fortbildungsmodule.