Das Deutsche Zentrum für Luft- und Raumfahrt (DLR) und das Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften haben ‚terrabyte’ in Betrieb genommen – eine wissenschaftliche Plattformen zur Analyse von Erdbeobachtungsdaten. Sie ermöglicht es Forschenden erstmals, globale Datensätze von Erdbeobachtungssatelliten in höchster Auflösung effizient auszuwerten. ‚terrabyte’ ist sicher und unabhängig von kommerziellen Betreibern. Die Inbetriebnahme der Großrechenanlage fand am 14. Juni 2023 am LRZ in Garching bei München mit Gästen aus Politik und Wissenschaft statt.
‚terrabyte’ stellt aktuelle und über fünf Jahrzehnte gesammelte historische Erdbeobachtungsdaten sowie intelligente Big-Data-Analyseverfahren über Cloud-Dienste zur Verfügung. Diese umfassen neben umfangreichen Daten der nationalen Missionen TerraSAR-X/TanDEM-X sowie des US-amerikanischen Landsat-Systems auch alle Produkte der Sentinel-Satelliten des europäischen Erdbeobachtungssystems Copernicus. Zusätzlich können Nutzende Informationen aus sozialen Netzwerken in ihre Auswertung integrieren.
‚terrabyte’ hat eine Bruttokapazität von etwa 50 Petabyte Online-Speicher. Das System ist in die bestehende Infrastruktur des LRZ in Garching integriert und mit dem Deutschen Satellitendatenarchiv des DLR in Oberpfaffenhofen verbunden. Dort werden alle Daten sicher und langfristig archiviert und können bei Bedarf auf ‚terrabyte’ nachgeladen werden. Eine Netzanbindung mit einer Datenrate von 100 Gigabit pro Sekunde gewährt die schnelle Übertragung der Archivdaten auf das Produktionssystem ‚terrabyte’. Für die Verarbeitung und Analyse der Daten ist die ‚terrabyte’-Plattform mit neuester KI-Hardware ausgestattet und liefert 1,3 Petaflop/s Rechenpower – das sind 1,3 Billiarden Gleitkommaberechnungen pro Sekunde.
Damit die Forschungsgemeinschaft die Datenschätze auch nutzen kann, bietet ‚terrabyte’ eine Reihe von softwarebasierten Diensten an. Ein großer Teil der Daten wird vorverarbeitet und gleich in Anwendungen übernommen (Analysis Ready Data; ARD). Softwaretools und andere Systeme erleichtern es den Wissenschaftlerinnen und Wissenschaftlern, auch eigene Algorithmen zu implementieren und in der ‚terrabyte’-Umgebung zu nutzen. Das Earth Observation Center (EOC), weitere Institute des DLR und deren Partnerorganisationen entwickeln dazu Algorithmen, die künstliche Intelligenz und maschinelles Lernen beinhalten. So lassen sich vielfältige globale geowissenschaftliche Analysen durchführen, die aufgrund der Datenmengen und limitierter Rechnerleistung bisher nur auf kommerziellen Plattformen möglich war.
Welches Potenzial in der Big-Data-Analyse von Erdbeobachtungsdaten steckt, zeigen globale Produkte wie der World Settlement Footprint des DLR. Dieser Datensatz, der die Entwicklung der besiedelten Flächen unseres Planeten zeigt, ist mittlerweile ein Standard, der von den Vereinten Nationen, der Weltbank und vielen anderen genutzt wird. Erzeugt wurde die Karte aus vielen Petabyte Daten der Copernicus- und Landsat-Missionen sowie dem globalen digitalen Höhenmodell, das aus den Daten der TanDEM-X-Mission erzeugt wurde. Ein weiteres Beispiel sind KI-basierte globale Analysen von Off-Shore-Windkraftanlagen, die sich im Bau oder im Betrieb befinden.
„Mit ‚terrabyte’ ist ein großer Schritt für die zukünftige Geoinformationsforschung gelungen. Big Data, neueste KI-basierte Verarbeitungsmethoden und High Performance Computing sind auf einzigartige Weise vereint“, sagt Prof. Dr.-Ing. Anke Kaysser-Pyzalla, Vorstandsvorsitzende des DLR.
Prof. Stefan Dech, Direktor des Deutschen Fernerkundungsdatenzentrums am DLR ergänzt: „Mit dem Leibniz-Rechenzentrum haben wir den idealen Kooperationspartner für dieses herausfordernde Projekt gefunden. Mit ‚terrabyte’ haben wir eine autonome und sichere Plattform mit umfassend globalen Datenbeständen aus der Erdbeobachtung, die wir zusammen mit unseren Partnern erschließen können. Gleichzeitig bildet ‚terrabyte’ eine technologische Brücke zwischen den Standorten Oberpfaffenhofen und Garching.“
Der Leiter des LRZ Prof. Dieter Kranzlmüller betont: „‚terrabyte’ ist die Antwort auf die diversen Anforderungen an effiziente Datenhaltung, Data Science, KI und Cloud-Services bis hin zum Hoch- und Höchstleistungsrechnen. Mit unserem langjährigen Know-how in diesen Bereichen verbinden wir die Technologien zu einem für die Erdbeobachtung maßgeschneiderten Dienst.“