Das data analytics institute (dai) entwickelt mit dem Geo Data Space Germany einen neuen Ansatz für einen Datenraum, der Recherche, Bereitstellung und Nutzung von Geodaten neu definiert und offen macht für jegliche anderen, domainspezifischen Datenräume.
Manch einer mag die Initiativen der Europäischen Union im Bereich Digitalisierung als Papiertiger verunglimpfen. Nicht jeder ist beispielsweise mit der europäischen GDI INSPIRE, mehr als 15 Jahren nach ihrem Startschuss, zufrieden. Und auch in Sachen Datenräume, die in der europäischen Datenstrategie aus dem Februar 2020 auf den Weg gebracht wurden, gibt es nicht nur Erfolgsgeschichten, ein Beispiel ist das groß angelegte CATENA-X aus der Automobilindustrie. Das heißt aber nicht, dass Konzepte für Datenräume abgeschrieben werden sollten. Die Idee ist, Recherche, Harmonisierung, Zugriff und die gemeinsame Nutzung von Daten zu erleichtern und dafür rechtlich gesicherte und transparente Rahmenbedingungen zu schaffen. Die EU beschreibt dies als „vertrauenswürdige Daten-Governance-Mechanismen über faire, transparente, verhältnismäßige und diskriminierungsfreie Zugangsregeln“ und damit als Grundpfeiler der europäischen, digitalen Souveränität. Im Zeitalter von KI verspricht dies, den Mehrwert von Daten exponentiell zu steigern, quer über alle Branchen wie Gesundheit, Energie, Verkehr, Landwirtschaft, Tourismus, Forschung, Infrastruktur, Kultur usw. Was bisher nur fehlte, war ein Datenraum in der Geoinformationswirtschaft und damit einer der wichtigsten Säule von Datenräumen, nämlich deren geografische Dimension. Diese Lücke schließt nun die data analytics institute (dai) AG aus Bonn im Rahmen des neuen Geo Data Space Germany. In Partnerschaft mit dem Fraunhofer ISST entsteht damit ein neuer Ansatz für Handel, Nutzung und Inwertsetzung von Geodaten mit langfristiger Ausstrahlung für den Markt. „Wir stellen aktuell die Weichen für eine sichere, effektive und barrierefreie Inwertsetzung von Daten, die für die nächsten Jahrzehnte höchst relevant ist“, sagt dai-Vorstand und Mitgründer Michael Herter.

Derzeit entstehen viele fachspezifische Datenräume, etwa zu Mobilität, Energie oder Gesundheit. Der Datenraum für Geobasisdaten kann für alle die notwendigen geografischen Daten liefern.
Quelle: Montage: Ilinois; Cetacons / stock.adobe.com
Vision: Mit Mehrwerten auf Knopfdruck zur Deutschlandeffizienz
Datenräume adressieren ein zentrales Problem der heutigen IT-Welt, indem sie den sicheren, souveränen Austausch von Daten zwischen Organisationen ermöglichen. In einem Datenraum verbleiben die Daten in den Quellsystemen des Eigentümers, Dritte greifen über Konnektoren darauf zu. Dabei herrschen kontrollierte Bedingungen aus rechtlicher, organisatorischer und logistischer Sicht. „Daneben steigen aber auch Effizienz und Transparenz der Datenbereitstellung auf ein bisher nicht dagewesenes Niveau“, sagt Herter. Der Geo Data Space Germany stellt somit Informationen zur Verfügung, die auch maschinenlesbar sind und als Trainingsdaten für KI oder für andere KI-basierte Analysen genutzt werden können.
Im Geo Data Space Germany sind bisher 3D-Gebäudedaten, Adress- und Straßendaten, Verwaltungsgrenzen sowie Flurstücks- und Katasterinformationen enthalten. Diese bislang fragmentierten Datenbestände werden in einem einheitlichen Datenmodell zusammengeführt und als sogenannter GeoTWIN, dem von dai entwickelten Datenmodell, bereitgestellt.
Eine der Basistechnologien bei dem Ansatz ist die Geokodierung, also die Zuweisung von Geokoordinaten zu Adressdaten und umgekehrt. Das dai nutzt dafür seinen Open Geocoder, der als freie Software zur Verfügung steht. Er beinhaltet alle rund 23 Millionen amtlichen Adressen mit allen verfügbaren Merkmalen und Raumstrukturen im Rahmen des GeoTWIN-Datenmodells, auf dessen Basis die Daten aggregiert werden. Dazu gehören bauliche, infrastrukturelle, soziodemographische Daten und vieles mehr.
In dieses Modell hat das dai beispielsweise auch die Daten des Zensus 2022 integriert. Diese liegen ursprünglich in einem räumlichen Gitterraster (etwa 100 Meter oder größer) vor, mit Hilfe des Geocoders wurden diese Daten auf Ebene von Haus- und Adressdaten disaggregiert. „Das ist ein gutes Beispiel für die Leistungsfähigkeit eines Datenraums, da hier Daten unterschiedlicher Herkunft und Struktur miteinander verknüpft werden können und je nach Fragestellung der geforderten Analyse ad hoc zusammengebracht werden“, beschreibt Herter.
Vertrauen durch Rechtssicherheit
Dabei gibt es auch ein transparentes Geschäftsmodell des Geo Data Space Germany und damit eine Grundbedingung für die langfristig gesicherte Existenz. Zu den kostenpflichtigen Dienstleistungen des dai zählen auch technische Aspekte wie die systematische Zusammenführung oder die Harmonisierung sämtlicher verfügbarer Public- und Open-Geodaten. Ebenso gehören dazu Anonymisierung und Generalisierung von Daten – Prozesse, die hier nur stark automatisiert und integriert sind.
Eine zentrale Innovation des Datenraums ist die erstmalige technische Implementierung des TRUST-Siegels direkt in einem Datenraum-Connector, das dai entwickelt hat. TRUST steht für Transparency, Reliability, Uncertainty, Spacetime und Traceability und stellt einen strukturierten Bewertungsrahmen zur Sicherstellung von Transparenz, Verlässlichkeit und methodischer Integrität dar.
Transparency beinhaltet die vollständige Offenlegung von Datenquellen, Modellen, Transformationen und Lizenzbedingungen. Reliability stammt direkt aus einer wissenschaftlichen Methodik, was besagt, dass Ergebnisse unter gleichen Bedingungen wiederholbar und reproduzierbar sein müssen. Uncertainty, also Unsicherheit, ist aus Sicht der Statistik der Kern von TRUST, die kein Mangel darstellt, sondern ein fundamentales Strukturmerkmal jeder Messung und jedes Modells. Dazu gehören Beobachtungsfehler, Stichprobenvariabilität, Modellannahmen, Interpolationen oder Prognosen, die im Schätzmodell berücksichtigt werden. Spacetime beschreibt die räumliche und zeitliche Dimensionalität der Daten. Traceability verlangt eine lückenlose Dokumentation aller Verarbeitungsschritte als Voraussetzung, um sie revisionssicher zu nutzen.
Rolle des Datentreuhänders
TRUST, das im Projekt InGeoDTM entwickelt wurde, hat das Ziel, Vertrauen, das bei den immer wechselnden Beziehungen der unterschiedlichen Akteure institutionell nicht festgelegt ist, technisch zu sichern. Die von dai entwickelten Konnektoren des Datenraums wurden dazu um eine TRUST-Enforcement- und TRUST-Evidence-Schicht erweitert, wodurch bei jeder Datenbereitstellung nicht nur der Datensatz selbst, sondern zusätzlich eine maschinenlesbare Güteaussage ausgegeben wurde. Man spricht daher auch vom dai als Datentreuhänder für den Geo Data Space Germany.
Das dai vertritt dabei unter anderem alle 16 Bundesländer, die für Erhebung und Fortführung der amtlichen Geodaten zuständig sind. Es vermittelt zwischen Datengebenden und Datennutzenden und stellt sicher, dass Daten unter klaren Regeln, transparent und souverän genutzt werden können, was vor dem Hintergrund der immer noch unterschiedlichen lizenzrechtlichen Regeln der Bundesländer wichtig ist. Das dai berät und vermittelt auch in organisatorischen Angelegenheiten. Themen sind Verfügbarkeit, Lizenzbedingungen und Kosten der Daten.
Datenräume für Domänen erweitert
Die Umsetzung erfolgt in enger Zusammenarbeit mit dem Fraunhofer ISST, das bereits im Vorprojekt zentrale Konzepte zur Datentreuhand und Datenraum-Governance erarbeitet hat. Es baut auf den Erfahrungen und Grundlagen des Projekts InGeoDTM auf, indem erstmals ein bundesweit harmonisierter, souveräner Geodatenraum geschaffen wurde. Hintergrund ist die Initiative InGeo-X, die dem Verein Zentrum für graphische Datenverarbeitung (ZGDV) in Darmstadt zugeordnet ist. Konzeptionell steht dahinter das Leuchtturmprojekt Gaia-X, das bereits viele Ableger in Bereichen wie Industrie, Verkehr oder Energie hervorgebracht hat. Diese Projekte besitzen zwar inzwischen meist geringe Vitalität, „das liegt vor allem daran, dass die Geschäftsmodelle dafür nicht ausgereift waren und es an Unternehmen fehlte, welche die Idee der Datenräume auch monetarisieren konnten“, so Herter.
Das dai ermöglicht es für domainspezifische Datenräume (etwa für Energie, Mobilität oder Stadtentwicklung), die geografische Dimension der Daten mit abzubilden. Ein solcher domainspezifischer Datenraum in der Energiewirtschaft kann beispielsweise Erzeugungs-, Netz-, Verbrauchs- und Wetterdaten mit Adress-, Haus- oder soziodemografischen Daten anreichern, um so Aufgaben wie etwa die kommunale Wärmeplanung besser lösen zu können. Die Daten werden dann je nach Anwendung ad hoc aus den jeweiligen Datenräumen automatisiert geholt und sind demnach immer aktuell. In Zukunft will das dai auch anderen Betreibern von Datenräumen helfen, ihre Inhalte für solche Datenraum-Konzepte zur Verfügung zu stellen, also dataspaceready zu werden.

Im Geo-Datenraum German Data Space ist ein Digitaler Zwilling als 3D-Datenmodell vorhanden, der sogenannte GeoTWIN. Quelle: DAI
