GeoAI4Water 2: Mit Deep Learning kritische Infrastrukturen erkennnen und auf den Katastrophenfall vorbereiten.

Februar 14, 2024
Geoinformation für humanitäre Hilfe

Kontext

Bei Naturkatastrophen und anderen katastrophalen Ereignissen ist es von entscheidender Bedeutung, dass benötigte Ressourcen schnell ermittelt und verteilt werden. Selbst eine kurze Verzögerung bei der Evakuierung von Bewohner*innen oder der Beschaffung von Wasser kann die Hilfsmaßnahmen erheblich behindern und ein effektives Katastrophenmanagement verhindern. Die Teams von HeiGIT und GIScience haben aktiv an der Entwicklung von Instrumenten zur Unterstützung der Katastrophenvorbereitung und -bewältigung gearbeitet, von der Zusammenarbeit mit Partner*innen zum Aufbau widerstandsfähigker Gemeinden bis zur Aktivierung unseres Disaster Portals nach verheerenden Erdbeben. Eines unserer laufenden Projekte, GeoAI4Water 2, das derzeit von der KSB Group privat finanziert wird, ist ein Schlüsselinstrument in unserem Bestreben, Regierungen und Einsatzkräfte besser auf solche Ereignisse vorzubereiten.

Ziel von GeoAI4Water 2 es, Kläranlagen (Wastewater treatment Plants- WTPs) als kritische Wasserinfrastrukturen mit Hilfe von hochauflösenden Satellitenbildern zu erkennen – ein unschätzbar wichtiger Schritt in der Ermittelung von Menge und Position von Ressourcen. Die manuelle Auswertung und Kennzeichnung jedes einzelnen Bildes für solche Infrastrukturen würde sich als äußerst kostspielig und zeitaufwändig erweisen, was viele abschreckt, die nicht über die finanziellen oder personellen Möglichkeiten verfügen, diese wichtige Aufgabe zu unterstützen. Daher setzt das Projekt Deep-Learning-Algorithmen ein, um diese kritische Infrastruktur in Entwicklungsländern zu erkennen.

Die Schließung von Datenlücken in verschiedenen globalen Regionen erfordert eine robuste Strategie, mit der man präzise Untersuchungsergebnisse aus Erdbeobachtungsdaten erzielen kann. Eine große Herausforderung ergibt sich aus der beträchtlichen Heterogenität von Satellitenbildern und den unterschiedlichen Merkmalen bestimmter Bodenobjekte, wie z. B. WTPs. HeiGIT hat sich zum Ziel gesetzt, umfangreiche WTP-Datensätze zu erstellen, deren Anwendungsbereiche von der Kartierung kritischer Wasserinfrastrukturen bis hin zu Stadtplanung und Klimaschutzmaßnahmen reichen. Um dies zu erreichen, ist die Entwicklung einer zuverlässigen Deep-Learning-Pipeline erforderlich, die sich auch in schwierigen ländlichen und städtischen Kontexten global skalieren lässt. Das Projekt GeoAI4Water 2 hat sich dieser Herausforderung gestellt und seine wichtigsten Ergebnisse im zugehörigen Paper vorgestellt.

Unser Ansatz

Um diese Herausforderungen zu bewältigen, entwickelte HeiGIT ein innovatives Multiscale-Multifeature-Hybridmodell, das in verschiedenen globalen Regionen hochwertige Ergebnisse lieferte. Die vorgeschlagene Methodik beinhaltet die Hybridisierung eines DL-Workflows durch die Feinabstimmung des bildbasierten Representation-Learnings bei verschiedenen räumlichen Auflösungen und aus unterschiedlichen Datenperspektiven (ganz oder teilweise). Das Modell nutzt die Fähigkeiten von Deep-Learning-basierten Objekterkennungsmodellen, insbesondere Yolov6, RTMDET, EfficientDET und Domain Adaptation, um WTP-Standorte weltweit präzise und effizient zu identifizieren. Der Schwerpunkt liegt auf Leistungsverbesserungen, einschließlich der Verringerung von False Positives (FPs) und der Erreichung einer breiten Abdeckung. Die Strategien für diese Verbesserungen umfassen effektive Datenverarbeitungsmethoden, Modellabstimmung und -anpassung. Zusätzlich optimieren wir die Eigenschaften der Trainingsdaten unter Verwendung von VGI-Daten (Volunteered Geographic Information).

Bei Multifeature- und Multiskalenmodellen werden mehrere DL-Modelle mit ausgewählten räumlichen Auflösungen und Bildgrößen trainiert, so dass verschiedene Einstellmöglichkeiten für die Erfassung unterschiedlicher Details auf den Satellitenbildern zur Verfügung stehen. Die gewählten Parameter sind eine Funktion der räumlichen Dimensionen des betreffenden Erfassungsobjekts. Ein Überblick über die vorgeschlagene hybride Methodik ist in der nachstehenden Abbildung dargestellt.

Zu den wichtigsten Ergebnissen zählen:

In unserem hybriden Ansatz haben wir optimierte Basismodelle ausgewählt, die eine deutlich bessere Leistung als einzelne Modelle aufweisen. Bei der Umsetzung in der Praxis stellen wir in der Regel fest, dass die FP ein Vielfaches (3- bis 10-fach) der tatsächlichen Erkennungen betragen. In unserem Fall haben wir jedoch einen verbesserten Ansatz verwendet, der die FPs effektiv auf einen Bruchteil der tatsächlichen Erkennungen senken konnte.
YOLOv6 hat die Erkennung und Klassifizierung im Vergleich zu den Modellen RTMDET und EfficientDET um 10 Prozentpunkte bzw. 6 Prozentpunkte signifikant verbessert.
Ein bereinigter Datensatz steigerte die Leistung bei der Klassifizierung um 6 Prozentpunkte und bei der Erkennung um 4 Prozentpunkte. Eine zu starke Bereinigung des Datensatzes beeinträchtigte jedoch die Generalisierungsfähigkeit des Modells und beeinflusste die Datengröße.
Das Training auf ganzen WTPs führte zu einer bemerkenswerten Leistungssteigerung: 9,5 Prozentpunkte mehr bei der Erkennung und 4 Prozentpunkte mehr bei der Klassifizierung im Vergleich zu Modellen, die auf einzelnen Merkmalen trainiert wurden.
Im Paper haben wir die Wirksamkeit des vorgeschlagenen Ansatzes für drei verschiedene globale Regionen nachgewiesen: Deutschland, Frankreich und Malaysia. Eines der wichtigsten Ergebnisse sind die neuen Erkenntnisse des Modells. Sie beziehen sich auf Kläranlagen, die weder in OSM noch in einer der anderen Datenbanken auftauchten, die wir zur Definition unserer Basisdaten verwendet haben. Diese Erkenntnisse bringen also neue Einsichten und
Wissen über die untersuchten Gebiete und schaffen einen Mehrwert. Die Studie gibt neue Einblicke in die WTP-Verteilung im Vergleich zu bestehenden Datenbanken wie OpenStreetMap (OSM).

Angesichts der Produktionsqualität dieser Ergebnisse haben wir automatisierte Arbeitsabläufe für eine groß angelegte globale Umsetzung entwickelt. Für den US-Bundesstaat Vermont lieferte GeoAI4Water mehrere neue Erkenntnisse (100 % bis 300 % mehr Daten als OSM, je nach Art des WTP).

Die Anzahl der für eine Region gescannten Bilder erhöht sich in der Regel auf Hunderttausende oder sogar Millionen, wenn hochauflösende Satellitenbilder in kleinere Bilder aufgeteilt werden, die für das Training von Deep-Learning-Modellen verwendet werden. In unserem Fall haben wir jedoch eine Geosmart-Filtering-Technik entwickelt, um die Suche auf einige wenige wahrscheinliche Bilder einzugrenzen (siehe unten):

Während der Entwicklung dieses Projekts wurden neue HeiGIT-Tools wie das Multiskalen-Tool ohsome2label entwickelt, um die automatische Kennzeichnung mehrerer Skalen und Merkmale für verschiedene Datensätze zu unterstützen. Außerdem wurden Werkzeuge wie AIR-MAPPER entwickelt, um die Modellinferenz in Echtzeit zu visualisieren, und zwar für jeden Teil der Erde. Jedes DL-Modell (ONNX-Format, Input 256 X 256 wird derzeit unterstützt) auf Satellitenbildern kann hier weltweit ausgewertet werden.

Der Vorteil:

Die genaue Identifizierung wichtiger Infrastrukturen, wie z. B. WTPs, ist von entscheidender Bedeutung für die Stadtplanung, den Klimaschutz und vieles mehr, insbesondere in Entwicklungsregionen, in denen alternative Datenquellen begrenzt sein können. Die Erkennung von WTPs anhand von Erdbeobachtungsdaten stellt eine große Herausforderung dar, da die Daten sehr vielfältig sind und das Aussehen, die Form, die Größe und die Beschaffenheit dieser Anlagen variieren. Frühere KI-basierte Studien haben bestätigt, dass es schwierig ist, ein robustes globales Modell zu entwickeln, das eine umfassende Erkennung von echten Positiven (TPs) bei gleichzeitiger Minimierung von Falsch-Positiven (FPs) gewährleistet.

Dr. Randhawa, Lead Machine Learning for Good am HeiGIT, plant einen breiteren Einsatz der Daten weltweit, mit besonderem Schwerpunkt auf dem globalen Süden in Asien und Afrika, wo der Bedarf an Ressourcenkartierung deutlich höher ist. Zu den Prioritäten werden wahrscheinlich Länder gehören, die von Katastrophen wie Dürren bedroht sind, um die Strategien zur Eindämmung des Klimawandels zu verbessern, und ein weiteres Ziel ist die Anwendung der Technologie auf andere Bereiche wie den Energiesektor. In der OpenStreetMap-Community könnte das Projekt weitere Auswirkungen auf die Landnutzung und zusätzliche Funktionen zur Bereicherung der OSM-Daten haben.

The study has paved way for many interesting applications that go beyond detection of WTPs. The team is currently working on deriving new information/attributes for plant capacity estimation. Moreover, this study lays the foundation for further work on GeoAI-based models with in-built spatial knowledge or models that learn local features and patterns to improve local precision.

Die Studie hat den Weg für viele interessante Anwendungen geebnet, die über die Ermittlung von WTPs hinausgehen. Das Team arbeitet derzeit an der Ableitung neuer Informationen/Attribute für die Schätzung der Anlagenkapazität. Darüber hinaus legt diese Studie den Grundstein für weitere Arbeiten an GeoAI-basierten Modellen mit eingebautem Raumwissen oder Modellen, die lokale Merkmale und Muster lernen, um die lokale Genauigkeit zu verbessern.

Um über künftige Entwicklungen und Veröffentlichungen im Zusammenhang mit diesem Projekt sowie über andere Bemühungen zur Förderung der Geodaten-Technologie in den Bereichen Mobilität, humanitäre Hilfe und Datenanalyse auf dem Laufenden zu bleiben, folgen Sie unseren Social-Media-Kanälen und bleiben Sie in unserem Blog auf dem Laufenden.

Danksagungen:

We are grateful for the financial support and valuable cooperation provided by the KSB Group throughout the project. Led by Dr. Sukanya Randhawa, our Machine Learning Lead for Good, the project includes the development of remote sensing-based filtering by Dr. Yulia Grinblat, exploration of domain adaptation techniques by PhD student Yuze Li for varied geo-regions. The creation of AIR-Mapper and Multiscale ohsome2label within HeiGIT involved valuable contributions from Dr. Michael Auer, Raphael Troilo, and Mohammed Rizwan Khan. Research students Daniel Abanto and Omer Olchik have helped with final verification and evaluation of results across different regions. Building on HeiGIT and GIScience’s history of applying cutting-edge machine learning to address real-world concerns, such as preventing the spread of vector-borne disease, assessing data quality, and plotting route changes to avoid heat stress, GeoAI4Water 2 exemplifies another innovative application of novel methodologies. The project holds promising potential for diverse geospatial applications and expansions that we are excited to continue working on it in the future.

Wir sind dankbar für die finanzielle Unterstützung und die wertvolle Zusammenarbeit mit der KSB Group während des gesamten Projekts. Unter der Leitung von Dr. Sukanya Randhawa, HeiGITs Lead Machine Learning for Good„, umfasst das Projekt die Entwicklung von Filtern auf der Grundlage von Fernerkundung durch Dr. Yulia Grinblat und die Erforschung von Techniken zur Anpassung von Gebieten durch die Doktorandin Yuze Li für verschiedene Georegionen. An der Entwicklung von AIR-Mapper und Multiscale ohsome2label innerhalb von HeiGIT waren Dr. Michael Auer, Raphael Troilo und Mohammed Rizwan Khan beteiligt. Die Forschungsstudierenden Daniel Abanto und Omer Olchik haben bei der abschließenden Überprüfung und Bewertung der Ergebnisse in verschiedenen Regionen geholfen. Als weiteres Beispiel für die innovative Anwendung neuer Methoden ist GeoAI4Water 2 nun Teil einer Historie von Anwendungen modernster Machine-learning-Technologie durch HeiGIT und GIScience zur Lösung realer Probleme, wie z. B. die Verhinderung der Ausbreitung vektorübertragener Krankheiten, die Bewertung von Datenqualität und die Planung von Routenänderungen zur Vermeidung von Hitzestress. Das Projekt birgt vielversprechendes Potenzial für verschiedene raumbezogene Anwendungen und Erweiterungen, so dass wir uns freuen, in Zukunft weiter daran arbeiten zu können.

Quellen:

Sukanya Randhawa, Guntaj Randhawa, Olena Sivak, Johannes Zech, Maria Martin, Alexander Zipf, and Yuze Li. 2023. Multiscale Multifeature Vision Learning for Scalable and Efficient Wastewater Treatment Plant Detection using Hi-Res Satellite Imagery and OSM. In Proceedings of the 1st ACM SIGSPATIAL International Workshop on Advances in Urban-AI (UrbanAI ’23). Association for Computing Machinery, New York, NY, USA, 10–21. https://doi.org/10.1145/3615900.3628772