Bachelorarbeit: Nutzung von OSM für Standortanalysen von Wohnimmobilienprojekten – eine extrinsische Analyse der Datenqualität

In seiner Bachelorarbeit, betreut von apl. Prof. Dr. Sven Lautenbach am HeiGIT, untersuchte Lars Reckhaus die Eignung von OpenStreetMap (OSM) für Standortanalysen im Kontext von Wohnimmobilienprojekten. Typischerweise erfordern solche Analysen die Nutzung einer Vielzahl von Datenquellen und werden vorwiegend händisch durchgeführt. Aus diesem Grund sind sie in der Regel sehr zeitaufwändig. Die Verwendung von OSM als primäre oder einzige Datenquelle hat das Potenzial, diesen Aufwand erheblich zu reduzieren. Damit OSM jedoch nützlich ist, muss die Qualität der Daten ausreichend hoch sein. Daher wurde die anwendungsspezifische Qualität von OSM-Daten extrinsisch erforscht. Der Schwerpunkt der Arbeit lag auf der Nutzung von OSM für die sogenannte „POI-Recherche“, die die Verfügbarkeit relevanter Infrastrukturen (bzw. Points of Interest = POI) in der Umgebung der Immobilie untersucht.

 

Untersuchungsdesign

Die Datenqualität wurde anhand eines extrinsischen Ansatzes analysiert, das heißt OSM wurde mit einem Referenzdatensatz von vermutlich höherer Qualität verglichen. Da kein geeigneter hochwertiger Datensatz verfügbar war, wurde der Referenzdatensatz durch die Erhebung eigener Daten erstellt.

Das praktische Vorgehen gliederte sich in drei Schritte (s. Abb. 1):

  1. In einem ersten Schritt wurden mittels einer Umfrage die elf wichtigsten Infrastrukturen für das Wohnumfeld identifiziert.
  2. Anschließend wurde ein Referenzdatensatz dieser Infrastrukturen erstellt, indem ihr Vorkommen in 24 Untersuchungsgebieten in zwei deutschen Regionen kartiert wurde.
  3. Schließlich konnten die OSM-Daten durch einen Vergleich mit dem Referenzdatensatz auf die beiden Datenqualitätsparameter Vollständigkeit und Korrektheit überprüft werden.
        Abb. 1: Praktisches Vorgehen

 

Umfrage

In der Umfrage wurden die Teilnehmenden (Privatpersonen sowie Mitarbeitende von Immobilienunternehmen) gebeten, aus einer Liste möglicher Infrastrukturen all jene auszuwählen, die sie für das Wohnumfeld als wichtig erachten. Das Ergebnis (s. Tab. 1) zeigt die elf am häufigsten genannten Infrastrukturen, die in die Analyse einbezogen wurden.

Tab. 1: Top 11 Infrastrukturen

 

Untersuchungsgebiete

Um auf ein mögliches Stadt-Land-Gefälle in der Datenqualität zu prüfen, wurden die Untersuchungsgebiete so gewählt, dass sie unterschiedliche Arten von Siedlungsstrukturen repräsentieren. Insgesamt wurden vier Kategorien unterschieden, definiert nach Einwohnerzahl und weiteren Kriterien: Die städtischen Strukturen (1) „Stadt“ und der Sonderfall (2) „Innenstadt“ und die eher ländlichen Strukturen (3) „Kleinstadt“ und (4) „Dorf“. Zur weiteren Überprüfung auf regionale Unterschiede wurden die Gebiete auf zwei Regionen in Deutschland verteilt (s. Abb. 2 & Abb. 3).

Abb. 2: Untersuchungsgebiete in der Metropolregion Rhein-Neckar

Abb. 3: Untersuchungsgebiete im Münsterland

Datenanalyse

Um die Qualitätsparameter berechnen zu können, war es notwendig, die aus der Kartierung und OSM gewonnenen Objekte in drei Klassen einzuteilen (s. Abb. 4):

  1. True positives (TP) sind OSM-Objekte, die auch in der Realität existieren.
  2. False positives (FP) sind OSM-Objekte, die es in der Realität nicht gibt.
  3. False negatives (FN) sind Objekte der realen Welt, die nicht in OSM enthalten sind.

Abb. 4: Beispiel für die Objektklassifizierung im Untersuchungsgebiet Heidelberg-Weststadt (“HD-WS”)

Mithilfe dieser Klassifizierung konnten die Qualitätsparameter unter Verwendung der in Tab. 2 dargestellten Formeln bestimmt werden. Zusätzlich zu den beiden oben genannten Qualitätsparametern wurde ein dritter Parameter (der Critical Success Index = CSI) berechnet, der sowohl die fehlenden (FN) als auch die falschen (FP) Objekte mit einbezieht. Damit ist der CSI ein deutlich strengerer Wert als die beiden anderen und zeigt die Gesamtgenauigkeit an.

Tab. 2: Formulas of the quality parameters

Ergebnisse

OSM zeigt für die ausgewählten Untersuchungsgebiete und Infrastrukturen Vollständigkeits- und Korrektheitswerte von jeweils ca. 80%, was zu einer Gesamtgenauigkeit von ca. 66% führt (s. Abb. 5).

Abb. 5: Qualitätsparameter für den gesamten Datensatz

Werden die Qualitätsparameter nach den beiden Regionen aufgeschlüsselt, zeigt sich, dass die Unterschiede zwischen ihnen wenig Signifikanz aufweisen (s. Abb. 6).

Abb. 6: Qualitätsparameter aufgeschlüsselt nach Region

Die Aufschlüsselung der Parameter nach Siedlungsstruktur zeigt ein Stadt-Land-Gefälle in dem Sinne, dass ländliche Strukturen (Kleinstädte und Dörfer) eine etwas höhere Vollständigkeit und eine deutlich höhere Korrektheit aufweisen (s. Abb. 7).

Abb. 7: Qualitätsparameter aufgeschlüsselt nach Siedlungsstruktur

Eine Analyse der Parameter für die verschiedenen Infrastrukturtypen zeigt, dass vor allem drei Typen (Hausärzt*innen, Grünanlagen und Grundschulen) eine niedrigere Qualität aufweisen, während die anderen Typen von höherer Qualität sind (s. Abb. 8).

Abb. 8: Qualitätsparameter aufgeschlüsselt nach Infrastrukturtyp

Konklusion

Basierend auf den Ergebnissen bietet OSM eine solide Grundlage für die untersuchte Art der Standortanalyse. Je nach Anforderungen an die Datenqualität kann es jedoch notwendig sein, die Daten zu überprüfen und zu ergänzen, um ein bestimmtes Qualitätsniveau (> 90%) zu gewährleisten.

Größere Qualitätsunterschiede konnten nur zwischen den Infrastrukturen (thematische Heterogenität), nicht aber zwischen den räumlichen Einheiten festgestellt werden. Auch wenn ein Stadt-Land-Gefälle erkennbar war, wiesen alle Siedlungsstrukturen ein ordentliches Qualitätsniveau auf, während der Unterschied zwischen den beiden untersuchten Regionen minimal war.

Lars hat mit den Tools QField, QGIS und PostGIS einen anderen Weg zur Datenanalyse eingeschlagen als das HeiGIT mit seinem OSM Analysetool ohsome. Dennoch zeigt seine Arbeit, dass beide, extrinsische und intrinsische Analysen die Möglichkeit bieten in realen Nutzungsbeispielen angewandt zu werden. Sehen Sie sich seine technische Dokumentation an und testen das ohsome dashboard des HeiGIT.

Die Arbeit zitieren:

  • Reckhaus, L. (2023): RealOSM: Eignung von OpenStreetMap für POI-basierte Standortanalysen im Rahmen von Wohnimmobilienprojekten – Eine extrinsische Analyse der Datenqualität. Ruprecht-Karls-Universität Heidelberg. (Unpublished bachelor’s thesis).
Comments are closed.