DOES HIGH-RESOLUTION DOWNSCALING IMPROVE THE ACCURACY OF GLOBAL FLOOD MODEL INUNDATION ESTIMATES? AN ANALYSIS ACROSS BIOMESVERBESSERT HOCHAUFLÖSENDES DOWNSCALING DIE GENAUIGKEIT VON ÜBERSCHWEMMUNGSSCHÄTZUNGEN GLOBALER HOCHWASSERMODELLE? EINE ANALYSE ÜBER BIOME

Degree M.Sc. Ecology, Evolution, and Conservation Abschluss M.Sc. Ökologie, Evolution und Naturschutz Grade 1.6 Note 1.6 University Universität Potsdam Universität Universität Potsdam Supervisor Dr. Jacob Schewe (PIK) Betreuer Dr. Jacob Schewe (PIK) Second Prof. Dr. Oliver Korup (UP) Zweitgutachter Prof. Dr. Oliver Korup (UP) Submitted March 2025 Eingereicht März 2025
Want to talk?Lust zu reden?
Berlin, Germany · Open to relocationBerlin, Deutschland · Offen für Umzug

TL;DR: I built an end-to-end Python + GIS pipeline to test whether making global flood models higher-resolution actually makes them more accurate. Short answer: yes, but with trade-offs that depend on the ecosystem.

Kurzfassung: Ich habe eine durchgängige Python- + GIS-Pipeline gebaut, um zu testen, ob höhere Auflösung globale Hochwassermodelle tatsächlich genauer macht. Kurze Antwort: ja, aber mit Kompromissen, die vom Ökosystem abhängen.

18
Flood events analyzedAnalysierte Hochwasserereignisse
6
Floodplains across 3 continentsÜberschwemmungsgebiete auf 3 Kontinenten
4
Biomes comparedVerglichene Biome
3
Performance metricsLeistungskennzahlen

The ProblemDas Problem

Flood hazards are intensifying globally under changing climatic conditions. Between 1970 and 2019, weather, climate, and water-related hazards caused over 2 million deaths and US$3.6 trillion in economic losses. Floods alone account for 44% of all recorded disaster events worldwide.

Hochwassergefahren intensivieren sich weltweit unter sich ändernden klimatischen Bedingungen. Zwischen 1970 und 2019 verursachten wetter-, klima- und wasserbedingte Gefahren über 2 Millionen Todesfälle und wirtschaftliche Verluste von 3,6 Billionen US-Dollar. Allein Überschwemmungen machen 44% aller erfassten Katastrophenereignisse weltweit aus.

Global Flood Models (GFMs) can simulate flood behavior anywhere on Earth without local calibration -- making them essential for risk assessment in data-scarce regions. But their coarse spatial resolution limits practical usability for decision-making: flood extents get smeared across large pixels, overestimating inundation and missing local detail.

Globale Hochwassermodelle (GFMs) können Hochwasserverhalten überall auf der Erde simulieren, ohne lokale Kalibrierung, was sie unverzichtbar für die Risikobewertung in datenarmen Regionen macht. Aber ihre grobe räumliche Auflösung begrenzt die praktische Nutzbarkeit für Entscheidungsfindung: Überschwemmungsausmaße werden über große Pixel verschmiert, was die Überflutung überschätzt und lokale Details verfehlt.

Diagnostic downscaling promises to fix this by redistributing simulated flood volumes onto a finer grid based on digital elevation models. But does it actually significantly improve accuracy beyond simple statistical methods? And does it work equally well across different ecosystems? This thesis answers both questions.

Diagnostisches Downscaling verspricht, dies zu beheben, indem simulierte Hochwasservolumina auf ein feineres Gitter basierend auf digitalen Höhenmodellen umverteilt werden. Aber verbessert es die Genauigkeit tatsächlich signifikant über einfache statistische Methoden hinaus? Und funktioniert es gleichermaßen gut über verschiedene Ökosysteme? Diese Arbeit beantwortet beide Fragen.

Step 1
SIMULATESIMULIEREN
CaMa-Flood model driven by WaterGAP2 hydrology and GSWP3-W5E5 climate forcing. Output at 0.1° (~10 km).CaMa-Flood Modell angetrieben durch WaterGAP2 Hydrologie und GSWP3-W5E5 Klimaantrieb. Ausgabe bei 0,1° (~10 km).
Step 2
DOWNSCALEDOWNSCALING
Diagnostic downscaling to 1 arcmin (~2 km) and 15 arcsec (~500 m) using high-resolution elevation data.Diagnostisches Downscaling auf 1 Bogenminute (~2 km) und 15 Bogensekunden (~500 m) unter Nutzung hochauflösender Höhendaten.
Step 3
VALIDATEVALIDIEREN
Compare against satellite-derived flood maps from the Global Flood Database (250 m native resolution).Vergleich gegen satellitenbasierte Überschwemmungskarten aus der Global Flood Database (250 m native Auflösung).
Step 4
EVALUATEAUSWERTEN
Score using Critical Success Index (CSI), Bias, and Hit Rate. Stratify by biome to test ecological effects.Bewertung mittels Critical Success Index (CSI), Bias und Hit Rate. Stratifizierung nach Biom zur Prüfung ökologischer Effekte.

Key FindingsZentrale Ergebnisse

01
Downscaling improves accuracy for every event
Diagnostic downscaling consistently improved accuracy and reduced overestimation -- across all 18 flood events. The trade-off: while finer resolutions reduce false positives, they also decrease true positives.
Downscaling verbessert die Genauigkeit für jedes Ereignis
Diagnostisches Downscaling verbesserte durchgehend die Genauigkeit und reduzierte die Überschätzung über alle 18 Hochwasserereignisse. Der Kompromiss: Während feinere Auflösungen falsch-positive Ergebnisse reduzieren, verringern sie auch richtig-positive.
02
Validation procedures matter
Diagnostic downscaling consistently outperformed naive resampling. However, statistical resampling to a finer grid (without additional physical information) also improved scores. This was because resampling grid data from high to low resolution using statistical methods is not a lossless process -- it distorts the comparison baseline itself. This must be accounted for in validation studies.
Validierungsverfahren sind entscheidend
Diagnostisches Downscaling übertraf durchgehend einfaches Resampling. Allerdings verbesserte auch statistisches Resampling auf ein feineres Gitter (ohne zusätzliche physikalische Information) die Ergebnisse. Dies lag daran, dass Resampling von Gitterdaten von hoher zu niedriger Auflösung mittels statistischer Methoden kein verlustfreier Prozess ist. Es verzerrt die Vergleichsgrundlage selbst. Dies muss in Validierungsstudien berücksichtigt werden.
03
Performance differs across biomes
Tropical rainforests showed the highest absolute accuracy and the largest gains from downscaling. Deserts and tropical savannas performed worse. Flooded grasslands fell in between. Local ecological conditions -- vegetation, soil, topography -- modulate how well the model captures flood behavior.
Leistung unterscheidet sich über Biome
Tropische Regenwälder zeigten die höchste absolute Genauigkeit und die größten Zugewinne durch Downscaling. Wüsten und tropische Savannen schnitten schlechter ab. Überschwemmte Grasländer lagen dazwischen. Lokale ökologische Bedingungen, Vegetation, Boden, Topografie, modulieren, wie gut das Modell Hochwasserverhalten erfasst.

Why It MattersWarum es wichtig ist

High-resolution diagnostic downscaling is a promising, low-cost avenue for reducing uncertainties in global flood modeling. For large-scale flood risk assessments, planning, and research, finer resolutions already offer statistically significant advantages.

Hochauflösendes diagnostisches Downscaling ist ein vielversprechender, kostengünstiger Ansatz zur Reduzierung von Unsicherheiten in der globalen Hochwassermodellierung. Für großräumige Hochwasser-Risikobewertungen, Planung und Forschung bieten feinere Auflösungen bereits statistisch signifikante Vorteile.

But there's a practical tension: in flood risk management, a false negative (telling people they're safe when they're not) can be catastrophic. Downscaling reduces overestimation -- but at the cost of missing some actual flood extent. Whether this trade-off is acceptable depends on the application: aggregate research benefits from precision, while local safety planning may still need conservative estimates.

Aber es gibt eine praktische Spannung: Im Hochwasser-Risikomanagement kann ein falsch-negativer Befund (Menschen zu sagen, sie seien sicher, wenn sie es nicht sind) katastrophal sein. Downscaling reduziert Überschätzung, aber auf Kosten des Verfehlens tatsächlicher Überschwemmungsflächen. Ob dieser Kompromiss akzeptabel ist, hängt von der Anwendung ab: Aggregierte Forschung profitiert von Präzision, während lokale Sicherheitsplanung möglicherweise weiterhin konservative Schätzungen benötigt.

The biome-level findings suggest that one-size-fits-all validation is insufficient. Ecological context shapes model performance, and future work should account for this when deploying GFMs across diverse regions.

Die Biom-Ergebnisse deuten darauf hin, dass eine Einheitsvalidierung unzureichend ist. Ökologischer Kontext formt die Modellleistung, und zukünftige Arbeiten sollten dies beim Einsatz von GFMs über verschiedene Regionen berücksichtigen.