Analyse der Vollständigkeit von OSM-Gebäudedaten mittels neuer Daten

Jeden Tag kartieren tausende Menschen in OSM, wodurch die Anzahl der fehlenden Gebäudedaten in urbanen Zentren kontinuierlich zurückgeht. OSM ist eine weit verbreitete Ressource für Projekte, die die Besonderheiten urbaner Zentren weltweit erforschen. Gute Datenqualität sowie eine gleichmäßige Kartierung sind daher wichtige Bestandteile der Plattform. Nicht ausgewiesene, räumliche Unterschiede führen zu Verzerrungen, die Forschende zu falschen Schlussfolgerungen verleiten. Das Verständnis, wie die OSM-Datenqualität innerhalb und zwischen verschiedenen Regionen der Welt variiert, war daher 2022-2023 ein erklärtes Ziel der Forschung von Benjaming Herfort. Um die OSM-Datenqualität zu ermitteln, hat er ein Modell entwickelt, das Random Forest Regression nutzt, um mit Hilfe von diversen Prädiktoren, wie dem nachts sichtbaren Licht und dem Index der menschlichen Entwicklung, Gebiete mit Gebäuden zu ermitteln. Weitere Informationen dazu finden Sie hier. Diese Forschung ist jetzt mit aktuelleren Daten und mehr urbanen Zentren wiederholt worden.

Ergebnisse der ersten Forschung

Die Forschung von Benjamin Herfort hat ergeben, dass die Vollständigkeit von Gebäudedaten weltweit etwa 21 % je urbanes Zentrum entspricht. Das bedeutet, dass durchschnittlich nur 21 % der Gebäude pro Stadt kartiert sind. In Europa, Zentralasien und Nord-Amerika ist die Vollständigkeit relativ hoch. Hier werden Werte von mehr als 50 % pro städtischem Raum erreicht. In Regionen wie Latein Amerika, der Karibik, Ostasien, Südasien, dem Pazifik, dem Nahen Osten und Nordafrika werden hingegen wesentlich niedrigere Vollständigkeitswerte von lediglich 7 – 17 % erreicht. Interessanterweise ist die Kartierungsaktivität in Afrika südlich der Sahara wesentlich höher als in Nordafrika.

Urbane Zentren mit einem sehr hohen SHDI (Index menschlicher Entwicklung) haben erwartungsgemäß vergleichsmäßig höhere Vollständigkeitsquoten. Urbane Zentren mit einem niedrigen SHDI hatten jedoch ebenfalls hohe Vollständigkeitsquoten (teilweise sogar höher als urbane Zentren mit einem mittleren bis hohen SHDI). Dieses Phänomen lässt sich wahrscheinlich dadurch erklären, dass die humanitäre Kartierungsaktivität in diesen Regionen höher ist. Weiterhin korrelieren auch größere urbane Zentren mit höheren Vollständigkeitsquoten.

Zwischen 2008 und 2014 waren Kartierungen vor allem auf Städte fokussiert, die sich in der Nähe von bereits gut kartieren Städten befinden. Dies hat zu einer Art Clusterbildung kartierter Regionen geführt. Seitdem ist die Clusterbildung wesentlich zurückgegangen, wenngleich sie immer noch vorhanden ist.

Was hat sich verändert?

Wir verwenden weiterhin denselben methodischen Ansatz und die Daten urbaner Zentren der JRC-Datenbank. Zusätzlich haben wir dieselben Indikatoren wie in der ersten Analyse auf der Ebene von Gitterzellen verwendet, wobei wir dieses Mal auf die neuesten verfügbaren oder aktualisierten Versionen zurückgegriffen haben. Hierzu zählen Indikatoren wie die Bevölkerungsverteilung, der SHDI, nächtliche Beleuchtung, der Baumbestand, bebautes Gebiet, Vegetation und städtische Straßennetzwerke. Eine Verbesserung, die wir vorgenommen haben, ist dass wir zusätzlich Daten von Microsoft zu Straßenlängen als Referenz verwendet haben, in Fällen, wo die OSM-Datenlage spärlich war.

Zusätzlich haben wir unsere ohsome API genutzt, um OSM-Referenzen zu den Gebäudedaten und Straßenlängen zu erhalten und aktuelle Zeitstempel von Januar und Mai 2024 miteinbezogen.

Haben die Änderungen zu Verbesserungen geführt? Auf der Gitterzellenebene durchaus. Hier war die Vollständigkeitsvorhersage genauer. Auf der Ebene von urbanen Zentren jedoch, war die Vorhersage etwas weniger präzise. Nichtsdestotrotz sind diese Unterschiede nicht schwerwiegend und beide Modelle führen zu denselben Ergebnissen. Weitere Details können Sie auf GitHub einsehen.

Zwischen 2023 und 2024 sind die Vollständigkeitsquoten in den meisten Regionen der Welt entweder stagniert oder nur langsam gewachsen, wobei auch dieses Wachstum langsamer erfolgt ist als in vergangenen Jahren. Insbesondere in Regionen mit hohen Vollständigkeitsquoten ist die Wachstumsrate vergleichbar mit dem Ende einer exponentiellen Kurve bei kontinuierlicher Kartierung. Städte mit einem niedrigen SHDI-Wert, die wahrscheinlich im Zuge einer humanitären Kartierungsaktion kartiert worden sind, zeigen konstantere Vollständigkeitswerte auf, was weitere, vereinzelte Kartierungsaktionen hinweist. Von Januar 2023 bis Mai 2024 ist die durchschnittliche Vollständigkeit je urbanem Zentrum um 2.8 % gestiegen. Die Regionen, mit den größten Anstiegen, liegen in Nord Amerika, dem Nahen Osten, in Nord Afrika und in Regionen Afrikas südlich der Sahara. Hier ist die Vollständigkeit zwischen 5 % und 6.1 % gestiegen (Fig. 1 a). Regionen mit einem niedrigen oder sehr hohen SHDI-Wert verzeichnen einen Anstieg der Vollständigkeit von 3.5 % und 3.7 % im gleichen Zeitraum. Im Vergleich hierzu, weisen Regionen mit einem mittleren oder hohen SHDI-Wert nur einen Anstieg der Vollständigkeit von jeweils 2.0 % und 2.9 % auf (Fig. 1 b).

Fig.1: Vollständigkeit von Gebäudedaten 2008-2024, gruppiert nach Weltbankregion (links, a) und nach SHDI (rechts, b)

Schaut man auf einzelne Städte, ist Lagos in Nigeria hervorzuheben, wo, verglichen mit anderen urbanen Zentren mit Gebieten von über 150 km², der größte Anstieg der Vollständigkeitswerte zu verzeichnen ist. Nigeria sticht auch allgemein hervor, da sich in der Kategorie Städte mit Gebieten von über 150 km² fünf der Top 20 Städte mit dem größten Anstieg der Vollständigkeitswerte in Nigeria befinden. 13 dieser Städte befinden sich im Nahen Osten, Nord-Afrika oder in Afrika südlich der Sahara. Mit einem Anstieg von 37,9 % ist Montreal in Kanada eine der wenigen Städte mit einem sehr hohen SHDI und einem Gebiet von mehr als 1000 km², die einen großen Anstieg der Vollständigkeitswerte verzeichnet. Die Vollständigkeitswerte in anderen großen Städten Kanadas, wie beispielsweise Toronto, Québec und Ottawa, waren entweder bereits bei über 90 % oder haben sich nicht verändert und weisen weiterhin Vollständigkeitswerte um die 50 % auf.

Mit den Daten arbeiten

Wenn Sie die Daten dieses Projektes für Ihre eigene Forschung nutzen möchten, können Sie hier auf ein Geopacket mit allen Daten zugreifen. Wir haben die aktualisieren Daten ebenfalls auf der Ebene von Gitterzellen in ohsomeHeX hochgeladen. ohsomeHeX ermöglicht es Ihnen, in die einzelnen Gitterzellen reinzuzoomen und dort die aktuellen Vollständigkeitswerte der Gebäudedaten. Weiterhin können Sie dort verfolgen, wie sich die Werte seit Januar 2008 verändert haben. Das folgende Video zeigt Ihnen die verschiedenen möglichen Visualisierungsoptionen:

Um über zukünftige Entwicklungen und Veröffentlichungen dieses Projektes, unser Bestreben, Geoinformationstechnologie voranzutreiben, und unseren anderen Projekten in den Bereichen Mobilität, humanitärer Hilfe und der räumlichen Datenanalyse informiert zu bleiben, können Sie uns auf unseren Social-Media-Kanälen folgen und unseren Blog lesen.

Comments are closed.