Aktuelle Forschungsprojekte zielen auf eine bessere Simulation und Prognose des Wetters. Dabei wird die Idee des Digitalen Zwillings verfolgt, mit dem Paradigma sogenannter Datenwürfel.
Wetterinformation ist so viel mehr als die Frage, ob man einen Regenschirm auf den Spaziergang mitnehmen sollte. Neben den persönlichen Wetterinteressen sind Wetterdaten unverzichtbar für verschiedenste Bereiche – etwa Landwirtschaft, Katastrophenschutz, Luft- und Schifffahrt, Versicherungen, Schutz kritischer Infrastrukturen, Planung erneuerbarer Energie, um nur wenige zu nennen. Die Grundversorgung an Wetterinformation, die der Deutsche Wetterdienst (DWD) bereitstellt, wird vielfältig genutzt, veredelt und als spezialisiertes Produkt wieder angeboten. Insofern wandern solche Daten bereits vielfältig zwischen den Servern und Softwarepaketen hin und her.
„Und trotzdem sind Wetterdaten nicht in dem Umfang integriert, wie man sich das wünschen könnte. Was fehlt, ist insbesondere eine nahtlose Integration in die Geoinformationssysteme, welche zur geo-basierten Entscheidungsfindung gebräuchlich sind“, sagt Professor Peter Baumann von der Jacobs Universität Bremen, der gleichzeitig Gründer des Unternehmens rasdaman GmbH ist.
Das beginnt mit Datenformaten wie GRIB2, die in der GIS-Welt nicht üblich sind, und endet noch lange nicht damit, dass für die Wettersimulation ein rotierter Globus verwendet wird, bei dem der Äquator quer durch Deutschland läuft: Der Pol etwa wurde auf 39,25 Nord und 162,00 West verlegt. Meteorologisch macht das Sinn, denn die projizierte Vorhersage liefert am Äquator die beste Auflösung, und dies ist natürlich das Interesse des hiesigen, staatlichen Wetterdatenanbieters. „Allerdings, so einfach die affine Transformation mathematisch ist – gängige GIS-Software unterstützt nicht die automatische Umprojektion in die üblichen Koordinatensysteme“, so Baumann.
Projekt DeepRain
Das kürzlich abgeschlossene BMBF-Projekt DeepRain, geleitet vom Forschungszentrum Jülich, hat hier einen Beitrag zur Brückenbildung geleistet. Der Projektpartner Jacobs University hat aus seinem Budget die französische Firma Spatialys beauftragt, das weitverbreitete Reprojektions-Werkzeug PROJ so zu erweitern, dass die Erd-Rotation innerhalb der Wetterdaten-Modellierung verstanden wird. Inzwischen ist diese Funktionalität offizieller Bestandteil von PROJ. „Somit wurde ein Hindernis auf dem Weg zur GIS-Integration von Wetterdaten beseitigt“, so Baumann.
Ein weiteres Problem liegt in der Strukturierung der Daten. Die Atmosphäre ist ein dreidimensionaler Raum von zeitvarianten Phänomenen – also von einem physischen Gebilde mit vier-dimensionalen, raum-zeitlichen Dimensionen.
Für Baumann liegt das Paradigma für den Umgang mit solchen Herausforderungen in der Modellierung via Datenwürfeln. Kommen in der Simulationsumgebung eines notwendigen Supercomputers die Wetterdaten bereits auf einem raum-zeitlichen Gitter an, lassen sich daraus ganz natürlich 4D raum-zeitliche Gitterdaten gewinnen. Solche Datenwürfel können, so Baumann, beliebig-dimensional sein, beispielsweise 1D-Zeitreihen, 2D-Karten, 3D x/y/t Satellitenbild-Zeitreihen oder x/y/z geophysikalische Daten, unsere 4D x/y/z/t atmosphärischen Daten, aber auch mehr. Im DeepRain-Projekt, wo die rasdaman Datenwürfel-Engine zum Einsatz kam, wurden bis zu 7D-Datenwürfel verwendet.
Datenwürfel haben den Charme, dass „sich Dienste darauf erheblich natürlicher, einfacher und auch mächtiger gestalten lassen, als das bei dem klassischen Paradigma ‚große Menge kryptischer Einzeldateien‘ möglich ist“, so Baumann. Daher gelten sie auch allgemein als Königsweg zu analysefertigen Daten (Analysis-Ready Data, ARD). Auch weil die Kombination unterschiedlicher Datenwürfel plötzlich einfacher wird: alle technischen Details bleiben verborgen, und viele der intern erforderlichen Schritte bleiben intern und damit vor dem Anwender verborgen. Auch entsprechende Standards existieren dafür, insbesondere OGC WCPS. Kurz, „Datenfusion wird einfacher“, so der Professor.
Damit komme auch die neue Möglichkeit ins Spiel, Digitale Zwillinge bezogen auf Wetterdaten einfacher zu bauen. Diese Idee sei verführerisch einleuchtend und lässt sich kurz durch sogenanntes „Duck Typing” erklären: wenn etwas läuft wie eine Ente, schwimmt wie eine Ente, quakt wie eine Ente, dann beschließen wir: es ist eine Ente. Auch wenn sie digital ist. „Das hat den Vorteil, dass wir an der digitalen Ente studieren können, wie sich die physische Ente verhält“, beschreibt Baumann den Forschungsansatz.
Ein Wetter-Zwilling ist natürlich anspruchsvoll. Wenn also diverseste Datenwürfel, wie etwa Wetterparameter wie Temperatur und Luftfeuchte, Satellitendaten wie sie die Sentinel-Familie liefert, In-situ Daten der Ämter (am besten gemäß Standards, vor allem INSPIRE-konform) etc. analysefertig und fusionierbar verfügbar sind, dann lassen sich langsam immer mehr Fragen an den Zwilling stellen.
Aktuelle Förderationen
In der Datenwürfel-Föderation EarthServer sind derzeit über 150 Petabyte an solchen Geo-Datenwürfeln bereitgestellt. Im Projekt Cube4EnvSec werden derzeit DWD-Wettervorhersagen gesammelt und zu 4D-Datenwürfeln aufgebaut. Alles mit dem Ziel der Integration in EarthServer, wo bereits Sentinel-Daten, CLMS und weitere Landnutzungsinformationen vorliegen. Beide nutzen die rasdaman-Engine als Datenmanagement- und Analyse-Plattform. „Auf dieser können Werkzeuge für Analyse, Fusion und Visualisierung einfach und skalierbar arbeiten“, so Baumann.
Schließlich verweist der Experte auch auf KI-Methoden wie neuronale Netze, die sich vorteilhaft an Datenwürfel koppeln lassen, was die entstehenden Modelle flexibler, mächtiger und performanter machen könne. Dieser Aspekt wird im BMWi-Projekt AI-Cube von Jacobs University und TU Berlin bearbeitet.
Gleichzeitig macht der Informatiker auch auf die Grenzen von Digitalen Zwillingen aufmerksam. Selbstverständlich seien diese, wie alles in dieser Welt, mit einer gewissen Unsicherheit behaftet. Je nach Fragestellung können diese unterschiedlich ausfallen, sogar bei ein und demselben Zwilling. Leicht kann dies zu falschen Schlussfolgerungen führen, und daher sollte ein solcher Zwilling immer auch Informationen über die zu erwartenden Fehler ausgeben können. „Daraus ergibt sich eine weitere, heute noch offene Forschungsfrage: wie kann ein Client, zum Beispiel Mensch oder KI-Modell, seine eigenen Genauigkeitsanforderungen bestimmen und dem Server mitteilen? Und wie kann der Server solche Anforderungen flexibel bedienen und garantieren?“, formuliert Baumann.
Der Weg zum Digitalen Wetter-Zwilling stelle damit sowohl neue Fragen als auch alte Fragen in neuer Schärfe. Datenwürfel, vor allem in Kombination mit KI, bilden ein mächtiges Instrument auf dem Weg zu einem Zwilling, den man verläßlich befragen kann. (sg)