چکیده:
با توجه به مضرات آلودگی هوا بر سلامت انسانها و محیط، کاهش و حل این معضل براساس شناخت دقیق آلایندهها و عوامل تاثیرگذار بر آن و مشخص نمودن پهنههای آلوده ضروری به نظر میرسد؛ بنابراین استفاده از مدلهای ریاضی در قالب یادگیری ماشینی رویکردی بهینه و مقرون به صرفه برای مدلسازی آلودگی هواست. این تحقیق به لحاظ هدف کاربردی بوده و روش بررسی آن توصیفی-تحلیلی است. نوآوری تحقیق حاضر ارائه یک رویکرد ترکیبی جدید جهت تعیین معیارهای موثر در پیشبینی میزان آلودگی هوا میباشد. لذا هدف از تحقیق حاضر ارزیابی و مقایسه قابلیت دو مدل یادگیری ماشین، یعنی ماشین بردار پشتیبان (SVM) و جنگل تصادفی (RF) در ترکیب با الگوریتم ژنتیک (GA) جهت پیشبینی میزان آلودگی هوا در شهرستان تهران است. دادههای مورداستفاده در این تحقیق شامل ذرات معلق و آلایندههای گازی شهر تهران مرتبط با سال 1399 میباشد که از شرکت کنترل ترافیک شهر تهران اخذ گردیده است. به منظور تجزیهوتحلیل دادهها از نرمافزارهای Matlab و ArcMap استفاده شد. مقدار ضریب تشخیص (R2) حاصل از روش ترکیبی RF-GA برابر 997/0 به دست آمد که نشاندهنده سازگاری بالای این مدل با دادههای این تحقیق است. همچنین مقدار ریشه میانگین خطای مربعات (RMSE) برابر 153/0 به دست آمد که نشاندهنده دقت بالای این مدل میباشد. بر اساس اطلاعات گرفته شده از شرکت کنترل ترافیک شهر تهران، نتایج حاصل از روش RF بیانگر مناسب بودن انتخاب مدل مذکور جهت برآورد میزان آلودگی هوای شهر تهران بوده است.
Considering the harms of air pollution on human health and the environment, it seems necessary to reduce and solve this problem based on accurate knowledge of pollutants and criteria affecting it and identifying polluted areas. Therefore, using mathematical models in the form of machine learning is an optimal and cost-efficient approach to air pollution modeling. This research is applied in terms of purpose and its method is descriptive-analytical. The novelty of this research is presenting a new combination approach to determine the effective criteria for predicting the amount of air pollution. Therefore, the purpose of this study was to evaluate and compare the capabilities of two machine learning models, namely Support Vector Machine (SVM) and Random Forest (RF) in combination with Genetic Algorithm (GA) to predict air pollution in Tehran. The data used in this research include particulate matter and gaseous pollutants in Tehran in 2020, which was obtained from Tehran Traffic Control Company. MATLAB and ArcMap software were used to analyze the data. The value of coefficient of determination (R2) obtained from the combined RF-GA method was 0.997, which indicates the high compatibility of this model with the data of this study. Moreover, the Root Mean Square Error (RMSE) value from the combined RF-GA method was 0.153, which indicates high accuracy of this model. Based on the data obtained from Tehran Traffic Control Company, the results of the RF method indicate the appropriateness of selecting the model to estimate the amount of air pollution in Tehran.