Description: Modellierung & Prognose – so funktioniert das Verfahren Das eigentliche Prognosemodell nutzt ein Verfahren namens XGBoost . Dabei handelt es sich um ein modernes Machine-Learning-Verfahren, das auf sogenannten Entscheidungsbäumen basiert. Es hat sich als besonders leistungsfähig erwiesen, wenn es darum geht, komplexe Zusammenhänge aus vielen unterschiedlichen Datenquellen zu erkennen. Für jeden relevanten Luftschadstoff – NO₂ , PM₁₀ und PM₂,₅ – wird ein eigenes Modell trainiert. Dadurch kann jedes Modell gezielt auf die spezifischen Einflussfaktoren und typischen Schwankungen eines Schadstoffs eingehen. Um auf dem aktuellen Stand zu bleiben, erfolgt das Training der Modelle monatlich . So kann das Modell Veränderungen im Verkehrsverhalten, im Wetter oder in anderen Umweltfaktoren berücksichtigen und bleibt anpassungsfähig. Die Prognose selbst erfolgt zunächst auf einem feinmaschigen Raster mit einer Auflösung von 50 m × 50 m . Das heißt: Für jeden Punkt in diesem Raster wird ein eigener Luftschadstoffwert vorhergesagt. Diese feine Auflösung ist entscheidend, um auch kleinteilige Unterschiede in der Luftqualität innerhalb der Stadt sichtbar zu machen. Das Modell verwendet eine Vielzahl an Einflussgrößen (Features), darunter: Zeitliche Informationen: Jahr, Wochentag, Tageszeit und auch spezielle Zeiten wie Schulferien oder Feiertage. Meteorologische Daten: Dazu gehören Temperatur, Windrichtung und -geschwindigkeit, Niederschlagsmengen und andere Wettergrößen. Räumliche Faktoren: Bebauungsdichte, Grünflächenanteil, Straßenstruktur – all das beeinflusst, wie sich Schadstoffe verteilen. Verkehrsdaten: Die prognostizierte Anzahl an Fahrzeugen in jeder Rasterzelle fließt ebenso ein wie deren Geschwindigkeit. Vergangene Messwerte: Durch sogenannte „Lags“ – also zeitlich verzögerte Werte – kann das Modell kurzfristige Trends erkennen und darauf reagieren. Da der Verkehr einer der größten Einflussfaktoren auf die Luftqualität ist, wird zusätzlich ein eigenes Verkehrsmodell betrieben. Auch dieses basiert auf XGBoost und hat die Aufgabe, Fahrzeugmengen und Geschwindigkeiten im Stadtgebiet vorherzusagen. Diese Informationen fließen dann als Input in das Luftschadstoffmodell ein. Wichtig ist dabei: Dieses Verkehrsmodell wird quartalsweise neu berechnet , weil aktuelle Verkehrsdaten qualitätsgesichert erst mit Verzögerung verfügbar sind. Wetterdaten werden in diesem Teilmodell bewusst nicht verwendet – sie sind für die kurzfristige Verkehrsentwicklung kaum relevant. Damit sichergestellt ist, dass die Vorhersagen des Modells auch in der Praxis zuverlässig sind, wird die Modellgüte mit verschiedenen statistischen Methoden überprüft: Der MAE (mittlere absolute Fehler) gibt an, wie stark die Vorhersagen im Schnitt von den tatsächlichen Messwerten abweichen. Der RMSE (Wurzel des mittleren quadratischen Fehlers) berücksichtigt besonders starke Ausreißer und zeigt, ob es punktuell zu großen Fehlern kommt. Der R²-Wert (erklärte Varianz) zeigt, wie gut das Modell die tatsächlichen Schwankungen in den Daten erklären kann. Wichtig dabei: Die Bewertung erfolgt “Out-of-Sample” , also nicht anhand der Daten, mit denen das Modell trainiert wurde, sondern auf neuen, bisher unbekannten Daten. Das sorgt für eine realistische Einschätzung der Prognosequalität im Alltag. Das Berliner Modell zur Vorhersage von Luftschadstoffen ist ein gutes Beispiel dafür, wie moderne Datenanalyse und Machine Learning sinnvoll für die Stadtplanung eingesetzt werden können. Es kombiniert aktuelle Messdaten, Wetter- und Verkehrsprognosen mit detaillierten Stadtinformationen und liefert damit räumlich hochaufgelöste, wissenschaftlich fundierte Aussagen zur Luftqualität – auf dem gesamten Stadtgebiet und in Echtzeit. Die regelmäßige Aktualisierung, die Einbindung zahlreicher Einflussfaktoren und die Möglichkeit, gezielt den Effekt einzelner Maßnahmen zu analysieren, machen das System zu einem leistungsfähigen Werkzeug für Umweltanalysen und eine datenbasierte Politikgestaltung.
Text( Editorial, )
Origins: /Land/Berlin/Umweltatlas
Tags: Berlin ? Luftbelastung ? Betriebsdaten ? Ökologische Bestandsaufnahme ? Stadtplanung ? Wetterdaten ? Künstliche Intelligenz ? Luftqualität ? Messdaten ? Prognosemodell ? Statistische Analyse ? Stadt ? Luftschadstoff ? Modellierung ? Verkehrsmodell ? Bebauungsdichte ? Ökologischer Faktor ? Urbaner Raum ? Schadstoff ? Verkehr ? Verkehrsentwicklung ?
Region: Berlin, Stadt
Bounding boxes: 13.088333218019013° .. 13.76046928413404° x 52.33824183585961° .. 52.675378816534945°
License: other-open
Language: Deutsch
Issued: 2025-09-04
Time ranges: 2025-09-04 - 2025-09-04
Modellierung & Prognose
https://www.berlin.de/weniger-dicke-luft/_assets/projekte-und-massnahmen/luftschadstoffprognose/luftschadstoffprognose-in-berlin.pdf (PDF)Accessed 1 times.