OSHDB Version 1.0 Ist Eingetroffen

Beitragsbild: Ohsome-Dashboard-Interface für Heidelberg, Deutschland.

Mit den Worten von Konfuzius: „Der Mann, der einen Berg versetzt, beginnt damit, kleine Steine wegzutragen.“ Mit der Veröffentlichung der OSHDB (OpenStreetMap History Database) Version 1.0 blicken wir auf die Versionen 0.5, 0.6, 0.7 und all die anderen kleinen Verbesserungen unserer historischen OpenStreetMap-Datenbank als die kleinen Steine zurück, die es uns ermöglichen, den Berg zu versetzen.

Der Berg selbst wurde bereits 2010 von unserem wissenschaftlichen Geschäftsführer Prof. Dr. Alexander Zipf identifiziert. Laut Benjamin Herfort, dem heutigen Produkteigner des Ohsome- und Big Data-Teams bei HeiGIT, standen Forscher damals vor großen Hürden, wenn sie OSM-Daten im Zeitverlauf untersuchen wollten. Während es relativ einfach war, die aktuellen Entwicklungen in OSM zu analysieren, erwies sich die Schaffung eines Rahmens für die Untersuchung der Datenentwicklung als kompliziert. „Jeder Forscher musste seinen eigenen Aufbau und seine eigene Art der Auswertung von OSM-Daten finden. Genau das wollten wir ändern.“

Unter der Leitung von Prof. Zipf richtete das Team einen Server ein, auf dem Forscher historische OSM-Daten untersuchen konnten, ohne sich um andere Einrichtungen und Prozesse als die ihrer Studie kümmern zu müssen. Mit der Veröffentlichung von OSHDB mussten die Nutzer historischer OSM-Daten keine Informatiker oder Datenbankingenieure mehr sein oder sich mit dem Betrieb eines Clusters auskennen. OSHDB übernahm diese Aufgabe für sie durch eine intuitive API.

Seitdem wurden nur kleine und sinnvolle Änderungen an OSHDB vorgenommen, wobei der Schwerpunkt auf der Erstellung einer ordnungsgemäßen Software durch verbesserte interne Dokumentation und Tests lag. Anstatt verrückte Funktionen hinzuzufügen, haben sich die Veröffentlichungen auf eine gut funktionierende Software konzentriert, die eine zugängliche Analyse ermöglicht. Jetzt, nach fünf Jahren der Entwicklung und des Testens, veröffentlicht das Team die OSHDB Version 1.0.

Diese Version ermöglicht es den Nutzern weiterhin, die Datenmenge und die Beiträge zu OSM im Zeitverlauf zu visualisieren und zu erforschen, beginnend mit den Anfängen von OSM selbst. Die historischen OSM-Daten sind nicht nur an sich interessant, da sie von Ländergrenzen bis hin zu Gebäuden und Abbiegeverboten reichen, sondern sie erleichtern auch die Untersuchung der Datenqualität, regionale Qualitätsvergleiche und ermöglichen die Berechnung von aggregierten Datenstatistiken.

Einer der wichtigsten Aspekte der Datenbank ist ihre Nutzerfreundlichkeit. Mit zwei Klicks auf dem Dashboard von ohsome kann jeder Forscher, Journalist oder Bürgerwissenschaftler die Entwicklung der OSM-Daten im Zeitverlauf für jede beliebige Region einsehen. Diese zeitliche Veränderung kann uns Aufschluss über die Datenqualität geben, da wir die Sättigung bewerten und die Aktualität überprüfen können. Im Fall von Heidelberg beispielsweise hat sich die Anzahl der Gebäude seit 2012 nicht mehr signifikant erhöht, so dass wir sagen können, dass Heidelberg gesättigt ist und die Daten in diesem Gebiet wahrscheinlich von hoher Qualität sind. Um solche Schlussfolgerungen zu ziehen, möchten wir auch die Aktualität prüfen, indem wir untersuchen, wann Einheiten geändert oder hinzugefügt wurden. Weitere Informationen zu dieser Anwendung finden Sie in unserem Blogbeitrag zu diesem Thema.

 

Grafiken: Sättigungsindikatoren für Heidelberg, Deutschland im Zeitverlauf mit OSHDB.

Mit unserer einfachen, intuitiv zu bedienenden API, die eine breite Palette von Analyseabfragen ermöglicht, können Nutzer mit einem verlustfreien Datensatz arbeiten, der auch zuvor gelöschte Objekte sowie fehlerhafte und zum Teil unvollständige Datensätze enthält. Die Daten können als Schnappschüsse zu bestimmten Zeitpunkten oder als vollständige Historie der Region, des Tages oder des Entitäten-Typs angezeigt werden, um endlose Anwendungsfälle zu ermöglichen und alle Benutzeranforderungen zu erfüllen.

Die vollständige Liste der Änderungen ist auf Github verfügbar, wobei die meisten Verbesserungen in den „langweiligen Teilen“ zu finden sind, die Nutzern erst aufgrund des reibungsloseren Analyseprozess auffallen werden. Wir möchten jedoch eine Änderung hervorheben, die sich für viele Forscher als nützlich erweisen wird: Mit den neuen OSHDB-Filtern können Praktiker Entitäten nach der Form der Geometrie filtern. Diese Funktion peilt eine häufige Diskussion in der OSM-Gemeinschaft an: den Umgang mit unvollständig kartierten Objekten.

Wenn Anfänger Objekte zu OSM hinzufügen, können sie beim Hinzufügen neuer Gebäude kleinere Fehler machen, indem sie Kanten zeichnen und rechteckige Gebäude nicht richtig ausrichten. Diese kleinen Fehler können zu Überlegungen über die Datenqualität beitragen, eine der Hauptanwendungen von OSHDB. Mit der Version 1.0 können Nutzer nun rechteckigen oder nicht perfekt rechteckigen Objekten herausfiltern und so verzerrte Formen in OSM identifizieren. Filtermethoden wie diese erlauben es Forschern, die Qualität ihrer OSM-Daten für eine Region im Zeitverlauf zu beschreiben.

Diese Filtermethode und die vielen Änderungen hinter den Kulissen in dieser Version und im Laufe der Entwicklung von OSHDB tragen zu einer zugänglichen Datenbank bei, die es Forschern ermöglicht, Daten auf eine Art und Weise zu interpretieren, die im Jahr 2010, als OSHDB nur eine Vision in den Köpfen unserer Teammitglieder war, nicht möglich war. Mit der Veröffentlichung der Version 1.0 sind wir stolz darauf, ein einfaches Werkzeug für die wichtige Aufgabe der Datenqualitätsanalyse anbieten zu können. Wir freuen uns darauf, in den kommenden Monaten und Jahren noch viele weitere kleine Steine wegzutragen.

In den nächsten Tagen werden wir eine Reihe von Inhalten anbieten, um diese Veröffentlichung zu feiern und zu erweitern – darunter Demos, Funktionen, Anwendungsfälle und Einblicke in den Entwicklungsprozess. Bleiben Sie über unsere Blogs und Social-Media-Kanäle mit uns auf dem Laufenden!

Literaturverweise:

Tags: data qualityoshdbOSM

Comments are closed.