TU Berlin & Senozon GmbH

Geodaten als Impfmittel gegen die Corona-Pandemie?

Anonymisierte Bewegungsdaten aus dem Mobilfunksektor sollen die Erkenntnis bringen, wie und wo sich das Corona-Infektionsgeschehen abspielt. 

Per Mobilfunkdaten kann das Mobilitätsverhalten rekonstruiert werden. Die daraus abgeleiteten Prognosemodelle liefern wertvolle Erkenntnisse für den Pandemieverlauf. Foto: Circlephoto / Shutterstock.com

Wo und wann stecken sich Menschen mit dem Corona-Virus an und wie viele erkranken an Covid-19? Mit wie vielen Personen hatten Infizierte bereits während der Inkubationszeit Kontakt? Diese Fragen erregen auch nach über einem Jahr noch immer die Gemüter – und bis dato gab es auch nur wenig wissenschaftlich fundierte Antworten darauf. Ändern will das die Technische Universität Berlin, die unter der Leitung von Professor Kai Nagel ein Simulationsmodell für das Infektionsgeschehen erstellt hat. Dabei basiert das Modell auf einem agentenbasierten Mobilitätsmodell, das seinerseits anonymisierte und aggregierte Bewegungsdaten aus dem Mobilfunk nutzt. Auf diese Weise ist es den Berlinern einerseits gelungen, eine Simulation zu entwickeln, die das Infektionsgeschehen in den vergangenen sechs Monaten meist sehr präzise vorhersagen konnte. Andererseits wurde Kai Nagel aufgrund dieses Erfolgs zu einem jener acht Menschen, die im Zuge des im Januar von Bundeskanzlerin Angela Merkel ins Leben gerufenen Corona-Expertengremiums als engste Berater der Politik fungieren.

Details zum Simulationsmodell
• Kontakte im eigenen Haushalt: 0,5
• Private Besuche: 0,6
• Arbeitskontakte: 0,2 (bei Mehrpersonenbüros und ohne Maske)
• Schulen: 0,2 (vollständig geöffnet)

Doch wie genau funktioniert das Simulationsmodell aus Berlin? Zentrale Bausteine sind eine aus Geodaten erstellte synthetische Bevölkerung und Bewegungsdaten, die im Bereich des Mobilfunks „gewonnen“ werden. Die Datenmodellierung wurde von der Firma Senozon Deutschland GmbH entwickelt, an deren Gründung Nagel beteiligt war. Das Spin-Off der ETH Zürich und der TU Berlin nutzt aggregierte und anonymisierte Daten der Mobilfunkbetreiber und modelliert diese mithilfe von MATSim (kurz für „Multi-Agent Transport Simulation“), einem aus dem Bereich der Verkehrssimulation bekannten OpenSource-Werkzeug. Auf diese Weise werden typische Bewegungsmuster der Mobilfunknutzer identifiziert und aus diesen das Gesamtverhalten der Bevölkerung berechnet.

Kai Nagel, Mobilitätsforscher von der TU Berlin, berät die Bundesregierung zum Thema Maßnahmen gegen die Pandemie. Quelle: TU Berlin

Das Verfahren stützt sich auf eine sogenannte agentenbasierte Modellierung, wie sie in der Verkehrssystemanalyse weit verbreitet ist. „Sie hat ihre Stärken insbesondere darin, das Verhalten kleinteiliger Akteure mit verschiedenen Handlungsoptionen abzubilden und dadurch ein Makro-Phänomen abzubilden“, beschreibt Thomas Haupt, CEO von Senozon. Typische Anwendungsgebiete sind Verkehrssimulationen zur Analyse und Prognose von Verkehrsmengen und der Qualität des Verkehrsablaufs.

Die Mobilitätsdaten für das Corona-Simulationsmodell werden mit einem speziellen Verfahren von Senozon aus dem Betrieb des Mobilfunknetzes gewonnen. Das Verfahren macht sich zu Nutze, dass die Mobilfunkgeräte einen Event erzeugen, z.B. sobald das Smartphone jeweils die eingeloggte Funkzelle der Mobilinfrastruktur wechselt. „Diese Event-Daten fallen massenhaft im Mobilfunkbereich ab und werden seitens des Mobilfunkanbieters anonymisert und aggregiert. Unser Mobility Pattern Recognition Verfahren (MPR) und die Agentensimulation erstellen dann daraus in Verbindung mit weiteren Mobilitäts- und ebenfalls anonymen Geodaten ein flächendeckendes, anonymisiertes Bewegungsmuster der Bevölkerung eines ganzen Landes“, berichtet Haupt. Senozon erzeugt auf dieser Grundlage dann „hochqualitative Mobilitätsmuster“, die für das Infektionsmodell der TU Berlin die Basis bilden. „Das Modell ist ein analytisches und erklärendes“, erklärt Haupt. „Es ordnet alle Beobachtungswerte in einen Modellierungs- und Simulationsrahmen aus Wegeketten der Bevölkerung ein und berechnet dann alle Ortsveränderungen und Aktivitäten in Zeit und Raum für eine repräsentative Wohnbevölkerung.“ Aus den Mobilitätsdaten und den Infektionsberichten lässt sich so eine Statistik für die Zusammenhänge von Mobilität und Infektionsgeschehen erstellen. „Für die Untersuchung von individuellem Verhalten hingegen ist die Methodik nicht zu gebrauchen.“

Statistische Darstellung der Mobilität außerhalb einer Zone von 15 Kilometern entfernt vom Wohnort. Die Daten werden jeweils im Verhältnis einer Woche aus vorpandemischen Zeiten angegeben. Quelle: Senozon GmbH

Datenschutz und Bewegungsmodell – geht das?

Aus Datenschutzsicht ist es wichtig, dass einzelne Bewegungsdaten nicht nur aggregiert und anonymisiert, sondern unter Verwendung von Zusatzdaten modelliert werden. Senozon verwendet dazu zum Beispiel statistische Bevölkerungs-, Verkehrs- oder soziodemografische Daten sowie die Verkehrsnetze und Fahrpläne. Daraus wird dann erkenntlich, wie viele Personen Privatbesuche, Büroaufenthalte oder Fahrten im Öffentlichen Nahverkehr (ÖPNV) durchführen.

Dabei kann Senozon auf über zehn Jahre Erfahrung mit der Modellierung von Verkehr und auf fünf Jahre Erfahrung im Umgang mit Mobilfunkdaten zurückgreifen. Anfangs hatte das Unternehmen noch eine Partnerschaft mit der Deutschen Telekom. Seitdem die Telekom ihren Geschäftszweig der Mobilitätsdaten jedoch im März 2020 eingestellt hatte, kooperiert Senozon mit der Telefónica Deutschland AG. Das Unternehmen mit Sitz in München stellt Senozon in diesem Zusammenhang einerseits die anonymisierten und aggregierten Bewegungsdaten zur Verfügung, andererseits unterstützen deren Fachleute die Entwicklung neuer datenschutzkonformer Analysen. „Der gesellschaftliche Nutzen dieser Daten steht für uns außer Frage“, erklärt Haupt. Dies gelte mit Sicherheit auch nach der Pandemie.

Erkenntnisse 

Aufzeichnung eines anonymen Bewegungsmusters auf Basis der Mobilfunkdaten. Anhand der Muster lässt sich ersehen, ob dies beispielsweise zur beruflichen oder zur privaten Mobilität gezählt werden kann oder ob eine Auto- bzw. eine ÖPNV-Nutzung vorlag. Quelle: Senozon GmbH

Das Simulationsmodell kann das Infektionsgeschehen praktisch ausschließlich durch Übertragungen in Innenräumen erklären. Also in den Bereichen eigener Haushalt, private Besuche, Arbeit und Schule– insbesondere dann, wenn es hier zu länger andauernden und ungeschützten Kontakten kommt. Anhand der Bewegungsdaten lässt sich jedoch lediglich schätzen, ob und wie solche Kontakte im Durchschnitt zunehmen.

Prognose für die Entwicklung des Inzidenzwertes für verschiedene Öffnungsstrategien. Langfristig wirkt sich die Impfquote massiv aus, so dass ab Herbst mit einer Rückkehr in einen annähernd vorpandemischen Zustand gerechnet werden kann. Quelle: TU Berlin

Auch kann das Modell den in der Simulation erkennbaren Bewegungen und Aufenthaltsorten bestimmte Ansteckungswerte (R-Werte) zuordnen. Je nachdem, ob öffentliche Verkehrsmittel genutzt, sich im Büro aufgehalten und sich privat an Orten versammelt wird, entsteht aus diesem geschätzten Durchschnittsverhalten der Bürger ein summierter R-Wert, der räumlich zuordbar ist. „Unsere Kollegen an der TU Berlin können damit sehr gut herausfinden, in welchen Räumen zu welchem Zeitpunkt welche R-Werte entstehen“, berichtet Senozon-CEO Haupt. Die heterogene Verteilung der Inzidenzwerte werde so besser erklärbar.

Alte Prognosen

Anfang Februar hatte Kai Nagel mit seinem Team zwar noch prognostiziert, dass man Anfang März bundesweit mit Inzidenzwerten von unter 35 und folglich mit einer Entspannung der Lage rechnen könne. Doch dann mussten Nagel & Co. den R-Wert der neuen Corona-Mutante B 1.1.1.7 in das Modell mit einbeziehen. Das hatte zur Folge, dass der R-Wert sich laut Modellierung um 35 bis 70 Prozent erhöht.

Im März gingen die Forscher noch davon aus, dass die dritte Welle der Corona-Pandemie im Ergebnis zu deutlich höheren Inzidenzen führen als die zweite Welle und die Ansteckungszahlen gleichzeitig weit langsamer sinken als noch im Mai 2020. Selbst das fortschreitende Impfprogramm und das wärmere Wetter alleine (also ohne zusätzliche Maßnahmen wie Schulschließungen) würden nicht dafür sorgen, dass die Inzidenz bis Mitte Juli unter einen Wert von 200 sinken kann (siehe hier). Dabei geben die Simulationen der TU Berlin die tatsächlichen Ansteckungswerte an. Die aktuellen Zahlen basieren auf den tatsächlich getesteten Zahlen, in den Simulationen ist also die sogenannte „Dunkelziffer“ der nicht entdeckten Ansteckungen enthalten.

Drei Jahres-Prognose der TU Berlin. Vorausgesetzt, durch jährliche Impfauffrischung wird die Quote von 80 Prozent geimpften Bundesbürger aufrecht gehalten, werden sich die COVID19-Fallzahlen ähnlich wie jene von Influenza (2017-2019) verhalten. Quelle: TU Berlin

Aus diesen Erkenntnissen lassen sich umfassende Erkenntnisse für die politischen Maßnahmen für die Corona-Bekämpfung ableiten. „Unsere Berechnungen ergeben, dass es effektiver ist, alle Bereiche zu beteiligen, als in einem einzelnen Bereich weitere Schutzmaßnahmen hinzuzufügen“, beschreibt Nagel und plädiert damit für eine Politik der kleinen Lockerungsschritte.

Dazu hat die TU im MODUS-COVID-Bericht vom 30. April vier Stufen an Öffnungsmaßnahmen entwickelt und einzelne Prognosen dafür erstellt, wie sich die jeweiligen Öffnungsschritte auswirken. Klar ist, dass Öffnungen für Aktivitäten im Außenbereich sich kaum auswirken, sprich problemlos möglich sind. Gleiches gilt für Innenraumaktivitäten mit begrenzter Personendichte, wie sie etwa im Bereich Kultur oder auch im Einzelhandel einfach umzusetzen wären. Dazu gehört allerdings eine umfassende Teststrategie für die Bereiche Bildung, Arbeit und Freizeit. Sie hat auch einen erheblichen Einfluss auf die sinkenden Fallzahlen. (sg)

www.senozon.de