Prediction of Air Pollution based on Machine Learning Methods: A Case Study for Başakşehir, İstanbul


Creative Commons License

ÜNALDI S., YALÇIN N.

Mühendislik bilimleri ve araştırmaları dergisi (Online), vol.4, no.1, pp.35-44, 2022 (Peer-Reviewed Journal) identifier

Abstract

Regular measurement and monitoring of pollutant parameters, prediction of air pollution, and early assessment of its effects on human health are very important to provide a healthier living environment for the city’s residents, and to minimize exposure to air pollution. This study aims to predict air pollution by using machine learning methods. The daily average concentrations of various air pollutants, as well as wind direction, wind speed and air pressure values measured between 2016 and 2021 in Başakşehir are used. PM10, CO, SO2, NO2, and O3 concentrations are predicted using Multiple Linear Regression, Support Vector Machine, K Nearest Neighbor, Decision Tree, Random Forest, and Multi-layer Perceptron Neural Network methods. The obtained results are compared in terms of some performance metrics. The Random Forest method has the minimum error values in the prediction of PM10, CO, SO2, and O3 concentrations, and Multiple Linear Regression shows the better prediction performance for NO2 concentration.
Şehir sakinleri için daha sağlıklı bir yaşam ortamının sağlaması ve onların hava kirliliğine maruziyetinin en aza indirilmesi oldukça önemlidir. Bunun için yapılabilecek çalışmalar arasında kirletici parametrelerine ilişkin ölçümlerin düzenli olarak yapılması ve izlenmesi, hava kirliliğinin tahmin edilmesi ve insan sağlığı üzerindeki etkilerinin erken değerlendirilmesi yer almaktadır. Bu çalışmada, makine öğrenmesi yöntemleri kullanılarak hava kirliliği tahmini gerçekleştirilmiştir. İstanbul ili Başakşehir ilçesinde 2016-2021 yılları arasında ölçülen çeşitli hava kirleticilerine ilişkin günlük ortalama konsantrasyonları ile rüzgar yönü, rüzgar hızı ve hava basıncı değerleri kullanılmıştır. PM10, CO, SO2, O2 ve O3 kirleticilerin konsantrasyonları, Çoklu Doğrusal Regresyon, Destek Vektör Makinaları, K En Yakın Komşu, Karar Ağaçları, Rastgele Orman ve Çok Katmanlı Algılayıcı Sinir Ağı yöntemleri ile tahmin edilmiştir. Elde edilen sonuçlar karşılaştırıldığında PM10, CO, SO2 ve O3 konsantrasyonları tahmininde Rastgele Orman yöntemi, NO2 tahmininde ise Çoklu Doğrusal Regresyon, en iyi sonuçları sunmuştur.