SmartRegio

Technologie

Die Technologie bei SmartRegio fußt auf einem dreistufigen Architekturmodell, das auch den Anwendungen der drei Entwicklungspartner Disy, USU Software und YellowMap zugrunde liegt. Es trennt zwischen der Datenintegration und Datenhaltungsebene, der Auswertungs- und Analyseebene sowie der Visualisierungsebene. Da alle drei Partner den Fokus in ihren Softwareprodukten auf einen anderen Bereich legen, ergeben sich so optimale Synergien. Alle drei Ebenen werden durch offene Schnittstellen entkoppelt und jede Ebene erhält eine eigene API. Auf diese Weise können Drittanbieter auf allen Ebenen eigene Beiträge liefern und es entstehen Marktplätze für Daten, für Analysedienste und für spezielle Visualisierungswerkzeuge. Die Architektur ist im folgenden Schaubild dargestellt.

Architektur von SmartRegio

Architektur von SmartRegio

Auf allen drei Ebenen entstehen individuelle Herausforderungen. Darüber hinaus gibt es Anforderungen, die ebenenübergreifend berücksichtigt werden müssen.

Datenintegrations- und Datenhaltungsebene

Auf dieser Ebene geht es primär um Vereinheitlichung und Auszeichnung von Daten sowie eine Form der Datenhaltung, die ihre performante Verarbeitung ermöglicht. Die Notwendigkeit der Vereinheitlichung ergibt sich daraus, dass sehr heterogene Datenquellen vorliegen. Diese sind teilweise strukturiert, teilweise halb- oder unstrukturiert (insbesondere Social Media). Der Orts- und Zeitbezug ist unterschiedlich fein aufgelöst. So bezieht er sich bei Open Data und Open Government Data oftmals auf Flächen und Intervalle, während Social Media, OSM, VGI und auch Teile der Daten des Anwendungspartners Stadtwerke Kaiserslautern räumlich und zeitlich punktbezogen sind. Dazwischen sind alle Facetten möglich. Die Auszeichnung ergibt sich ebenfalls aus der Vielfalt der Quellen. Metainformationen sind notwendig, um Daten und die Bedingungen für ihre Nutzung näher zu beschreiben. So können bestimmte Quellen, Bestände und sogar einzelne Daten lizenz- oder datenschutzrechtlichen Beschränkungen oder Vertraulichkeit unterliegen. Auch können sie kostenpflichtig sein, wobei viele verschiedene Preismodelle denkbar sind. Die Auszeichnung schafft die notwendige Voraussetzung dafür, dass Bedingungen und Einschränkungen über die gesamte Verarbeitungskette berücksichtigt werden. Hinsichtlich der Verarbeitung und Datenhaltung kommt an dieser Stelle der von USU Software entwickelte und bereitgestellte Big Data Stack zum Einsatz, der auf Lösungen wie Apache Hadoop und Apache Spark beruht. Er ermöglicht das verteilte Speichern von Daten und Auswertung auf vielen unabhängigen Rechnerknoten. Wichtig ist hier die Verwaltung von Massen an zeitbezogenen Geodaten, denn es existieren zwar viele und sehr ausgereifte Big Data-Verarbeitungsansätze und auch für die Verarbeitung von Geodaten existieren viele Lösungen, aber die Schnittmenge ist bislang unzureichend erforscht.

Datenauswertungsebene

Die Datenauswertung soll über spezielle gekapselte Services abgewickelt werden. Für den Zugriff auf die Datenhaltung, Sicherstellung der korrekten Abrechnung und Wahrung der Rechte sind Plattformdienste zu entwickeln. Alle weiteren Dienste führen auf den Daten Operationen, wie die Berechnung von Kennzahlen, Korrelationen und ähnlichem, durch. Dienste sollen dabei potentiell in der Lage sein, sowohl direkt auf Ursprungsdaten, wie auch auf vorberechneten Ergebnissen zu operieren. Der Verarbeitungsprozess wird dabei über eine Scriptsprache gesteuert. Diese Serviceebene ist das Kernarbeitsgebiet der Firma Disy, die hierfür ihre Technologie einbringt und auf die speziellen Anforderungen in SmartRegio weiterentwickelt. Auch auf der Dienstebene liegt eine besondere Herausforderung darin, flexible und hochskalierbare Methoden zu entwickeln, denn das Ergebnis soll weitgehend live berechnet werden. Weiterhin ergeben sich Herausforderungen aus dem Datenschutzrecht und dem Schutz von vertraulicher Information. Dadurch, dass Daten unterschiedliche Quellen in Beziehung gesetzt werden, kann eine Zuordenbarkeit zu einzelnen Objekten oder Personen entstehen. Zudem kann es auch für Dienste Beschränkungen, Nutzungsbedingungen und verschiedene Preismodelle geben, die im Rahmen eines Gesamtworkflows berücksichtigt werden müssen.

Visualisierungsebene

Die Visualisierung von Ergebnissen gegenüber den Anwendern stellt ebenfalls eine Herausforderung dar, denn erstens sind sie keine homogene Gruppe von Experten, wie dies üblicherweise bei herkömmlichen GIS-Anwendungen der Fall ist. Zweitens sollen die Anwender in der Lage sein, sehr flexible Fragestellungen in variablen, räumlichen und zeitlichen Bereichen zu untersuchen. Damit scheidet auch eine vollständige Vorbereitung der Ansichten aus. Drittens soll es möglich sein, die Ergebnisse in alternative Darstellungsformen zu bringen. Auch ist über die Anwender bisher wenig bekannt. Um die Komplexität für den Anwender zu reduzieren und auch den Zugriff auf die zugrundeliegende Datenintegrations- und Auswertungsebene zu ermöglichen, soll neben der eigentlichen Anzeigeoberfläche ein Cockpit entwickelt werden, mit welchem komplexe Workflows über alle drei Ebenen konfiguriert werden können. Sie verwendet dazu eine grafische Oberfläche, die an Tools zur Geschäftsprozessmodellierung angelehnt ist. Die eigentliche Anzeige und Interaktion soll in einem Baukasten umgesetzt werden, der das flexible Ein- und Ausblenden von Anzeigemodulen ermöglicht. Die Gestaltung der einzelnen Module soll in einem nutzerzentrierten Entwicklungsprozess umgesetzt werden, der im Forschungsprojekt KompUEterchen4KMU methodisch entwickelt und verfeinert wurde.