Die neuen Spatial-Galaxien
|Datenbanksysteme entwickeln immer mehr Leistungsfähigkeit für die Verarbeitung raumbezogener Daten. Die vier maßgeblichen Anbieter unterscheiden sich stark.
Datenbanken und Geoinformationslösungen: Zwei Welten treffen aufeinander. So erscheint es zunächst bei näherer Betrachtung der Historie. Beide IT-Systemebenen entwickelten sich nämlich weitestgehend getrennt voneinander. Geoinformationssysteme (GIS) setzten in ihrer Frühzeit (1980er Jahre) zunächst auf proprietären Datenbanken auf, um die in den Systemen enthaltenen Geo- und Fachdaten zu speichern. Erst im Laufe der Zeit etablierten sich Standard-Datenbanken unterhalb von GIS, wobei die relationalen Datenbanken das Rennen machten. Das heißt, Geodaten waren in Tabellenstrukturen in den Datenbanken vorhanden. Die jeweiligen Datenmodellierungen und Strukturen oberhalb dieser Ebene wurden dennoch mit Argwohn von den GIS-Anbietern kontrolliert. Trotz offenkundiger Bedürfnisse des Marktes nach Interoperabilität waren die Datenmodelle und -formate seit jeher das Mittel, um gewonnene Hoheitsgebiete zu verteidigen. Je versteckter und komplizierter die Barrieren eingeflochten waren, desto wirkungsvoller waren sie.
Diese Bastion schwankt mehr und mehr. Zunehmend wird auf Standards bei Programmierung und Modellierung geachtet, so dass die Grenzen von Anwendungs- und Speicherlogik fließender werden. In gleichem Zuge sind die Datenbanksysteme Richtung „Spatial“ getrimmt worden. Spatial steht im englischen für Raumbezug und meint Daten, die sowohl innerhalb eines globalen Koordinatenreferenzsystems als auch innerhalb eines lokalen Bezugsystems existieren können. Das direkte Speichern von Vektor- und Rasterdaten in der Datenbank ist Common Sense und auch Modellierungen können immer besser (aus Sicht der GIS-Welt) auf Datenbankebene umgesetzt werden. Zum Teil besitzen Datenbanksysteme heute sogar ein Entwicklungsumfeld, um Anwendungen zu erstellen.
Die Datenbankhersteller gehören zu den Schwergewichten der IT-Branche. Zu nennen sind in erster Linie Oracle mit der gleichnamigen Datenbankanwendung, SAP (HANA Spatial) und Microsoft (SQL Server). Diese Firmen haben in den vergangen Jahren stark in Spatial-Technologien investiert und bauen gleichzeitig ihr Partnernetzwerk zielgerichtet aus. Hinzu kommt das Open Source Datenbanksystem PostgreSQL, das mit PostGIS seit dem Jahr 2000 bereits eine Erweiterung für die Verarbeitung von Geodaten bietet und seitdem für große Marktdynamik sorgt. Im Gegensatz zu dem bekannten GIS-Markt verfolgen diese Anbieter damit keinen Applikations-zentrierten, sondern einen Plattform-zentrierten Ansatz. Die Datenbank dient bei solchen Ansätzen als Entwicklungsplattform für Anwendungen. So ist seit wenigen Jahren realisierbar, was sich die GIS-Welt zu Beginn nicht hat vorstellen können, nämlich vollständige GIS-Anwendungen ohne ein marktetabliertes GIS implementieren zu können.
Unter Schlagworten wie dem DB-embedded GIS, das diesen konzeptionellen Ansatz auch umschreibt, finden sich bereits eine Reihe von interessanten Anwendungen. Allen voran ist der Infrastrukturatlas der Bundesnetzagentur zu nennen, der Geodaten über in Deutschland vorhandene Breitband-Infrastrukturen zeigt. Bei diesem aktiven und stetig wachsenden Projekt, das die Ingelheimer Firma GDV realisierte, stammt die gesamte GIS-Logik aus der Datenbank. Der WebGIS-Client basiert dabei komplett auf Application Express (APEX), also einer Umgebung zur Programmentwicklung von Oracle. Zudem sorgen die Spatial-Datenbanken dafür, dass Geodaten auch in Geschäftsprozessen genutzt werden, bei denen zuvor kein GIS installiert war. Dabei haben die einzelnen Datenbanklösungen gänzlich verschiedene Historien und unterscheiden sich in Leistungsfähigkeit und beim Preis.
Vorreiter Oracle
Oracle ist bei der Unterstützung von Geodaten weltweit in einer führenden Position. Schon seit 1998 können in der Oracle-Datenbank raumbezogene Daten gespeichert werden. Seitdem ist die Funktionsvielfalt gewachsen. Koordinatentransformation beispielsweise gehört seit 2001 zum Angebot, 3D-Geodaten ab 2008 und html-maps können seit 2013 generiert werden. Die Strategie von Oracle ist es, Geodatenmanagement und die Analyse sowohl klassisch lizenzgebunden (On Premise) als auch über Cloud Services zu ermöglichen. Drei Datenbanktypen werden unterstützt, die Oracle Datenbank, die Oracle NoSQL Datenbank als auch das Hadoop Distributed File System (HDFS), wobei die letzten beiden ihre Ursprünge im Umfeld der Big-Data-Technologien haben. Die beiden wesentlichen Produkte sind Oracle Spatial und Graph (respektive Oracle Big Data Spatial und Graph).
Als eine der Trendtechnologien im Big Data Umfeld gilt derzeit Hadoop. Das Open Source Framework mit dem gelben Elefanten als Logo ermöglicht die Datenauswertung innerhalb verteilter, parallel verlaufender Rechenprozesse. Oracle sieht die wichtigste Fähigkeit von Hadoop darin, schnelle und komplexe Datenanalysen durchzuführen. Dies gilt sowohl für einfache Datenaufbereitung als auch für komplexe analytische Anwendungen. Damit können Daten aus verschiedenen Quellen vereinheitlicht und konsolidiert werden, beispielsweise, wenn Twitter- Feeds thematisch und geographisch ausgewertet werden sollen. Dabei werden auch sogenannte „implizite“ Geodaten in Tweets ausgewertet, also beispielsweise Ortsbeschreibungen in Textform („am Brandenburger Tor“). Oracle sieht mit dieser Technologie aber auch das Potenzial, bestehende Anforderung wie beispielsweise die Analyse von Routen oder die Risikobewertung bei Versicherungen mit Big Data Technologien umzusetzen. Vorteile sieht das Unternehmen in der Performance, der Skalierbarkeit und der flexiblen Weiterverwertung der Daten auch bei den Zwischenschritten der Verarbeitung.
SAP bringt Spatial bis in den Fußball
SAP ist erst später in den Spatial-Bereich eingestiegen. Anlass war mit SAP HANA die In-Memory Datenbank, die seit 2010 auf dem Markt ist. Im Gegensatz zu Oracle, bei der In-Memory als spezielle Anwendungsschicht innerhalb von Oracle Spatial existiert, setzt SAP durchgängig auf dieses Konzept, bei dem gewissermaßen alle Daten im Arbeitsspeicher vorgehalten werden und somit analytische und transaktionale Aufgaben parallel und sehr schnell durchgeführt werden können. Vor rund vier Jahren begann das Unternehmen, eine Spatial Engine für HANA zu entwickeln. Hintergrund ist das Ziel, die Performance von datenintensiven Anwendungen und Abfragen auf Basis der Datenbanksprache Structured Query Language (SQL) massiv zu steigern. Von Beginn an pflegte SAP eine enge Kooperation mit dem GIS-Anbieter Esri.
SAP erwartet, dass HANA Spatial bis zum Ende des Jahres der Status einer Geodatabase von Esri zuerkannt wird. Das heißt, es unterstützt alle notwendingen Funktionen und Datenmodellierungen, die es aus GIS-Sicht benötigt. Nach Angaben von SAP mussten beide Unternehmen eine Reihe von Anpassungen durchführen, um diesen Status zu erreichen. Eine solche Integration soll vor allem Geschwindigkeitsvorteile bringen. „Wir haben Anwendungsbeispiele mit Geodaten, wo die Abfragen, die zuvor mehrere Stunden benötigten, nun in Sekunden zur Verfügung stehen“, sagt Hinnerk Gildhoff, Spatial-Spezialist bei SAP. Da allgemeine Geschäfts- und Geodaten innerhalb der gleichen Datenbankumgebung vorliegen, könnten neue Anwendungsszenarien sehr schnell entwickelt werden, beispielsweise wenn CRM- und Standortdaten in einem Zuge ausgewertet würden. SAP ist zudem seit diesem Jahr offiziell von der OGC als Standard anerkannt. Konkret ist HANA gemäß dem Simple Feature Access (Version 1.2.1.) spezifiziert, was gewissermaßen ein allgemeines Siegel für die Geotauglichkeit des Systems darstellt. Damit wird auch klar, dass SAP offen gegenüber allen möglichen Partnerschaften ist. „Voraussetzung sollte sein, dass ein Anbieter einen konkreten Use Case hat, bei dem ein Kunde eine Integration der Systeme anstrebt“, verrät Gildhoff. Ebenso gibt es für Vertreter der Open-Source- Philosophie offene Zugänge zu der Entwicklungsumgebung von SAP HANA.
Neben den klassischen GIS-Märkten berichtet SAP vor allem auch großes Interesse von Kunden an der Geodaten-Verarbeitung, die bisher bei der Integration von Geodaten in Geschäftsprozesse weniger erfahren sind. „Dies lässt sich vor allem in den Themengebieten Internet of Things, Industrie 4.0 oder bei Sports und Entertainment feststellen“, so Gildhoff.
SAP bildet dabei sozusagen die Brücke für neue Marktzugänge. Ein aktuelles Beispiel ist auch der Fußball. So sind der deutsche Fußballbund und der Verein TSG 1899 Hoffenheim Partner von SAP. Sie nutzen HANA Spatial für Innovationen in der Echtzeit- Analyse des Sportgeschehens unmittelbar zur Trainingssteuerung. Dazu hat jeder Fußballer zwei Sensoren in die Schienbeinschoner integriert (der Torwart zusätzlich in den Handschuhen), die neben Videoanalysen zusätzlich Positions- und Bewegungsdaten übermitteln. Diese werden von SAP HANA raumbezogen ausgewertet und innerhalb von Sekunden auf mobilen Tablets für die Trainer bereitgestellt. Somit stehen Raumanalysen zur Verfügung, um beispielsweise das fußballerische Fachthema „Deckungsschatten“ genauer zu betrachten. „Wir wissen, dass dies insbesondere vor dem Länderspiel gegen die defensivstarke italienische Mannschaft ein großes Thema für den DFB war“, beschreibt Gildhoff.
Derzeit dürfen solche Analysen jedoch lediglich im Training eingesetzt werden, der DFB erlaubt den Einsatz der Technik im Ligabetrieb noch nicht. In den USA wird die SAP-Technologie aber schon bei schnellen Mannschaftssportarten wie dem Basketball oder dem Eishockey genutzt, um räumlich gestützte Key-Performance-Indikatoren der Spiele in Echtzeit zu generieren.
Anders ist es zum Beispiel bei Logistikanwendungen, bei denen Geo-Positionsdaten und Fahrzeugdaten zu Ladegewicht, Temperatur oder geschätzter Ankunftszeit verarbeitet werden. Für solche Anwendungen hat SAP kürzlich die Anwendung SAP Vehicle Insight auf den Markt gebracht, die auf der SAP HANA Cloud Plattform basiert. Damit lassen sich, so der Hersteller, Sensordaten in Echtzeit sammeln, speichern, zuordnen und analysieren – und diese Geodaten danach sowohl mit externen als auch mit Kundendaten integrieren und konsolidieren.
Kostengünstig und weit verbreitet
Auch Microsoft ist erst relativ spät in den Spatial-Markt eingetreten. Die Version SQL-Server 2008 konnte erstmals raumbezogene Daten vorhalten. Heute gilt der SQL-Server in Sachen Geodatenfunktionen als ernstzunehmender Konkurrent, wenn auch einige Funktionen wie etwa im Bereich des Rasterdatenmanagements noch nicht umfassend implementiert sind. Besonders attraktiv: Mit SQL Server Express gibt es eine Version, die ab Juni kostenfrei zur Verfügung steht und ebenso räumliche Datentypen unterstützt. Für Import- und Exportfunktionen der Daten zu den gebräuchlichsten GIS-Industriestandards ist genauso gesorgt, wie für erweiterte räumliche Bibliotheken zur datenbankseitigen Verarbeitung der räumlichen Daten. Vor allem der Preis macht den SQL-Server interessant für manch neues Projekt.
Open Source Alternative
Bei PostGIS herrscht eine gänzlich andere Logik, schließlich hat das Datenbanksystem einen offenen Quellcode (Open Source). PostGIS erweitert die Datenbank um die Möglichkeit der Datenhaltung räumlicher (Vektor-) Daten. Eine Fülle von räumlichen Funktionen zur Datenabfrage und Prozessierung auf SQL-Basis stehen ebenfalls zur Verfügung. PostGIS existiert seit dem Jahr 2000 und ist demnach als Spatial-Datenbank auch schon sehr lange im Markt. Dementsprechend hoch sind die Marktdurchdringung und der technologische Reifegrad. Außerdem nutzen manche Applikationshersteller das System für die Speicherung der Daten. Seit 2001 wird PostGIS von Refractions Research entwickelt. Es basiert auf der OGC-„Simple Features Specification for SQL“. Seit März 2007 gibt es PostGIS auch in einer Version zum Einsatz unter Windows-Betriebssystemen. Wenn auch der Unternehmensgründer und maßgebliche PostGIS-Entwickler Paul Ramsey Anfang 2016 den Ausstieg aus dem Unternehmen bekannt gegeben hat, so erwartet man doch eine ungebrochen hohe Entwicklungsdynamik bei Post- GIS. Überdies empfehlen auch viele Anbieter klassischer GIS-Systeme die Open-Source-Lösung.
GIS-Nische ist klein
Der globale GIS-Markt beläuft sich laut aktuellen Studien von Frost & Sullivan auf knapp acht Milliarden US-Dollar weltweit. Zieht man bei solchen Studien den Bereich der datennahen Dienstleistungen, also vor allem Datenerfassung und Prozessierung einmal ab, bleibt ein reines GIS-Segment, dessen Volumen für die großen IT-Anbieter dieser Welt eine Nische darstellt und dementsprechend wenig interessant ist. Entscheidend ist, dass Spatial- Daten ein wichtiges Element bei neuen Trends wie IoT, Smart Mobility oder Big Data Analysen sind und somit in den Datenbanklösungen hinterlegt sein müssen. Hier herrscht der sogenannte Plattform-Krieg, bei dem die großen mit harten Bandagen kämpfen.
Dass der klassische Geo-Markt bei den IT-Größen wenig Beachtung fand, mag in diesen Umständen seine Ursache haben. Dennoch ist die sich entwickelnde Situation gleichermaßen Chance und neuer Wettbewerb für die GIS-Anbieter, schließlich wird es immer interessanter, GIS-Projekte ohne GIS zu realisieren. Grundsätzlich ist aber auch mit Synergien bei der Technologieentwicklung zu rechnen. Man darf also gespannt sein, wann etwa erste Big- (neuerdings auch Fast-) Data-Technologien im GIS-Bereich Anwendung finden. (sg)