Das Projekt untersucht, wie OpenStreetMap-Daten Satellitenbilder bei der Nachverfolgung von Veränderungen der Landbedeckung in Deutschland ergänzen können. In einem kleinen Testgebiet vergleichen wir Datensätze über eine längere Zeitspanne hinweg, um besser zu verstehen, ob und wie Änderungen in OSM eingetragen werden und wie diese Erkenntnisse die automatisierte Überwachung dieser Änderungen unterstützen könnte.
Das Bundesamt für Kartographie und Geodäsie (BKG) arbeitet zusammen mit HeiGIT an der Optimierung der Erkennung von Landschaftsveränderungen in Deutschland. Das Projekt untersucht die Integration von frei zur Verfügung stehenden Satellitendaten mit auf Crowdsourcing-basierten OpenStreetMap-Daten (OSM-Daten). Ziel ist es, eine kontinuierliche, groß-angelegte Überwachung der Landbedeckung zu unterstützen.
Wichtig für diese Kooperation ist vor allem auch LaVerDi (Landschaftsveränderungsdienst), einer Web-Anwendung, die 2020 veröffentlicht worden ist. LaVerDi stellt jährliche Updates der Landschaftsveränderungen zur Verfügung, die auf Copernicus-Sentinel-2-Daten basieren. Die Dienstleistung ist öffentlich verfügbar und darauf ausgelegt, sowohl institutionelle Anfragen als auch allgemeine Anfragen von Anwender*innen, die sich für Langzeitdynamiken der Landschaftentwicklung interessieren, zu bedienen.
In der ersten Phase des Projekts liegt der Fokus auf der Evaluation des Mehrwerts von OSM als zusätzliche Datenquelle. Speziell geht es um die folgenden zwei Leitfragen:
- Kann OSM-basiertes Crowdsourcing die Genauigkeit und Relevanz in der Erkennung von Landschaftsveränderungen in LaVerDi verbessern?
- Ist die Erstellung eines nationalen, von Crowdsourcing unterstützen und qualitätsgeprüften Landbedeckungs-Datensets denkbar, das öfter aktualisiert wird als gegenwärtig zur Verfügung stehende Varianten, die ausschließlich auf Satellitendaten basieren?
Um diesen Fragen auf den Grund zu gehen, hatten wir uns ursprünglich ein Testgebiet im Norden Deutschlands herausgesucht, in dem in einem 5 km x 5 km Bereich in einer zweijährigen Zeitspanne von Juni 2022 bis Juni 2024 besonders viele OSM Features hinzugefügt oder verändert worden sind. Im Zuge der Analyse ist uns jedoch durch Vergleiche der Veränderungen in OSM zu den Veränderungen vor Ort mit Hilfe von Satellitenbildern aufgefallen, dass viele landwirtschaftliche Nutzflächen im Norden erst kürzlich hinzugefügt worden sind, obwohl diese schon seit langem bestehen. Aus diesem Grund haben wir uns dann dafür entschieden, den Fokus der Analyse stattdessen auf den Raum Heidelberg zu lenken.

Ursprünglich hatten wir die Hypothese gestellt, dass Veränderungen der Landnutzung größtenteils als Folge von Umwaldlungen landwirtschaftlicher Nutzflächen und Wäldern in städtischen Raum erfolgen würden. Basierend auf dieser Annahme haben wir zunächst damit begonnen, mit Hilfe von Multi-Band-Satellitenbildern den NDVI (Normalized Difference Vegetation Index) und den NDBI (Normalized Difference Built-up Index) zu berechnen.
Mit der Google Earth Engine haben wir dann Zeitreihen der NDVI- und NDBI-Indizes über die letzten 20 Jahre im Untersuchungsgebiet erstellt. In den letzten 5-6 Jahren weisen diese Indizes einen Anstieg der Vegetation und eine Abnahme des städtischen Raums auf – also genau das Gegenteil von dem, was wir erwartet hätten. Da es sich allerdings um ein kleines, räumlich begrenztes Untersuchungsgebiet handelt, wollten wir an dieser Stelle keine voreiligen Schlüsse ziehen.
Aus diesem Grund haben wir als nächstes nach Möglichkeiten gesucht, wie wir die Veränderungen in OSM mit der Realität (Satellitenbildern) vergleichen können. Umgesetzt haben wir das Ganze indem wir ein Landnutzungsraster basierend auf den OSM-Features und dem WorldCover Klassifikationsschema, welches 11 Landbedeckungsklassen definiert, erstellt haben. Hierdurch konnten wir die auf OSM basierten Rasterdaten direkt mit den auf Sentinel-1 und Sentinel-2 Satellitenbildern basierten WorldCover-Datensätzen der ESA von 2020 und 2021 vergleichen.
Der Vergleich hat uns geholfen, herauszufinden, wie gut OSM die tatsächliche Landnutzung wiederspiegelt und wo Unterschiede oder Verzerrungen entstehen. Die Ergebnisse zeigen, dass auf OSM-Daten basierte Raster in der Regel mit aktuellen Veränderungen im Untersuchungsgebiet übereinstimmen. Folglich ist es wahrscheinlich, dass OSM-Daten echte Landnutzungsdynamiken auf eine signifikante Art und Weise abbilden.
Es bleibt allerdings anzumerken, dass hochauflösende Satelittenbilder – unter anderem Planet RGB-Daten – aufzeigen, dass viele dieser “neuen” Veränderungen in OSM (wie beispielsweise landwirtschaftliche Nutzflächen) bereits eine Weile existiert haben, bevor sie in OSM kartiert worden sind. Dies ist wenig überraschend, da sich OSM-Daten oft auf ähnliche Weise entwickeln: Die Kartierung von Features erfolgt durch Freiwillige, wodurch Veränderungen oft erst Monate oder sogar Jahre nachdem sie tatsächlich passiert sind in OSM abgebildet werden.


Um die Einschränkungen von WorldCover zu umgehen (die Daten stehen nur für 2020 und 2021 zur Verfügung), mussten wir kreativ werden. Da unser Ziel war, Satellitenbildern und OSM-Daten auf einer hochaufgelösten zeitlichen Skala zu vergleichen, haben wir stattdessen Dynamic World verwendet. Dieses bietet häufigere Aktualisierungen und ein ähnliches Klassifikationssystem mit neun Landbedeckungsklassen. Wir haben den Prozess entsprechend angepasst, um mit dem Dynamic World Schema übereinzustimmen und anschließend einen weiteren Vergleich durchgeführt.

Um die Datenverarbeitung effizienter zu gestalten, haben wir OSM-Daten aus den Paraquet-Datensätzen genutzt. Dies führte zu einer signifikanten Verbesserung der Geschwindigkeit und Leistung, insbesondere bei der Verarbeitung groß angelegter zeitlicher Vergleiche. Im nächsten Schritt haben wir die Datensätze mithilfe von Fehlermatrizen verglichen. Dabei haben wir bewusst einen Versatz von einem Jahr eingebaut, welcher auf unseren bisherigen Beobachtungen basiert, dass reale Veränderungen oft etwa ein Jahr benötigen, bis sie von der OSM-Community erfasst und kartiert werden.

Unser übergeordnetes Ziel ist es, zu identifizieren und zu definieren was eine “Veränderung” bei OSM überhaupt ist. Um dies zu erreichen, analysieren wir, inwiefern OSM-Daten mit externen Beobachtungen übereinstimmen und zu welchem Grad Unstimmigkeiten vorhanden sind. Um Veränderungsdynamiken zu untersuchen, vergleichen wir sowohl OSM-Datensätze, die ein Jahr auseinander liegen, als auch auf Satellitenbildern basierte Landbedeckungsdaten (von Dynamic World) im gleichen Zeitraum. Dies ermöglicht es uns, zeitliche Trends in beiden Datensätzen unabhängig voneinander zu bewerten.

Mit diesem Verständnis wollen wir ein Modell für maschinelles Lernen trainieren, das die Muster von echten Veränderungen in OSM erkennen kann. Ein solches Modell könnte zukünftig bei der Erkennung von entstehenden bedeutsamen Veränderungen helfen und entsprechende Benachrichtigungen oder Überprüfungen in nahezu Echtzeit ermöglichen.
Hier gibt es weitere Informationen zum LaVerDi-Projekt: LaVerDi