曹通 白艷萍



摘 要:為了探索特殊情況下太原市空氣質量預測和評價方法,采用基于灰色關聯度法的模糊綜合評價方法對太原市疫情防控前后的空氣質量進行評價,對相關聯的污染物濃度變化進行分析,并以太原市AQI監測數據為基礎,結合長短期記憶循環神經網絡(LSTM)以及隨機梯度下降算法(Adam)建立了太原市空氣質量預測模型(即Adam-LSTM模型),并與LSTM模型的預測結果進行了比較。結果顯示,在啟動一級應急響應加強防控后,太原市的整體空氣質量得到改善,個別污染物由于氣象及春節等因素未降低,LSTM模型和Adam-LSTM模型預測結果的均方根誤差和訓練速度分別為0.203 s和12.15 s,0.183 s和10.35 s。提出的Adam優化算法能夠有效提高LSTM神經網絡的訓練精度和收斂速度,同時具有較小的預測誤差,可為環保部門制定提升空氣質量相關決策提供數據支持和方法借鑒。
關鍵詞:應用數學;灰色關聯;模糊綜合評價;Adam;LSTM;空氣質量預測
中圖分類號:O29;TP39;X823?? 文獻標識碼:A
DOI: 10.7535/hbgykj.2021yx02013
Air quality analysis and prediction before and after the prevention
and control of COVID-19 in Taiyuan
CAO Tong1,2, BAI Yanping1,2
(1.School of Science, North University of China, Taiyuan, Shanxi 030051, China;
2.Modern Optimization Algorithm Laboratory, North University of China,Taiyuan, Shanxi 030051, China )
Abstract:
In order to explore the prediction and evaluation methods of air quality under special circumstances in Taiyuan, the air quality trend before and after the prevention and control of COVID-19 in Taiyuan was evaluated and the changes of related pollutant concentrations were analyzed by using the fuzzy comprehensive evaluation method based on grey correlation method. On the basis of the AQI monitoring data of Taiyuan, Long Short-Term Memory (LSTM) loop neural network and the stochastic gradient descent algorithm(Adam), the Taiyuan air quality prediction model (Adam-LSTM model) was established, and the prediction results were compared with that of LSTM model. The results show that the air quality of Taiyuan is improved after the start of the first level emergency response, and some pollutants are not reduced due to meteorological and Spring Festival factors.The root mean square error and training speed of LSTM and Adam-LSTM model are 0.203 s and 12.15 s, 0.183 s and 10.35 s, respectively. It shows that the proposed Adam optimization algorithm can effectively improve the training accuracy and convergence speed of LSTM model. With relatively small prediction errors, it can provide data support and prediction methods for environmental protection departments to make related air quality decisions.
Keywords:
applied mathematics; grey correlation; fuzzy comprehensive evaluation method; Adam; LSTM; air quality prediction
鐘南山院士曾于2016年在醫學權威雜志《柳葉刀》上刊發了一篇文章,重點闡述了空氣污
染對呼吸道疾病的嚴重影響[1]。尤其每到冬季,北方很多城市污染加重,霧霾天氣高頻出現,不僅威脅著人們的身體健康,而且也給人們日常出行活動帶來了極大的困擾。為了更好地對空氣污染進行監控和治理,科學有效地對空氣質量進行分析預測具有重要意義。2020年初,新冠疫情爆發,山西省啟動重大突發公共衛生事件一級響應,太原市采取企業停工、機動車停駛等一系列舉措,人們發現2020年2月份太原市的空氣質量明顯好于以往。因此,可將這次疫情防控時期作為進一步探究影響城市空氣質量變化主要因素的良好時間段。
近年來,國內外都越來越重視對空氣質量的研究,不斷開展對空氣質量的分析評價及預測。伊元榮等[2]提出用灰色聚類法對烏魯木齊市(簡稱烏市,下同)空氣質量狀況進行了研究,結果表明烏市大氣質量狀況變化總體較穩定并向清潔程度發展,但建立的白化函數易使評價結果出現偏差。普映娟等[3]用指數評價法對保山市的空氣質量進行了評價,評價結果和實際環境情況比較吻合,但指數評價法只適用于短期評價。潘本鋒等[4]用層次分析賦權法對城市的空氣質量進行了排名,反映了不同城市間的空氣質量狀況差異,但用絕對值計算標度,得到的結果誤差較大。在空氣質量預測方面,牟敬鋒等[5]建立ARIMA模型對深圳市空氣質量指數進行了預測,取得良好的預測效果,但是隨著天數增多,預測精度將大大下降。唐之享[6]通過運用BP神經網絡學習空氣污染物數值的統計規律實現對空氣質量的預測,但是BP易出現過擬合及局部最小化問題。鄭洋洋等[7]利用SARIMA-SVR組合預測模型得到的空氣質量預測結果精度較高,穩定性較好。張冬雯等[8]針對空氣質量研究中預測精度低的問題,提出了基于LSTM的神經網絡模型對DELHI市和HOUSTON市的空氣質量進行了預測,有效提高了預測精度。
為了解決上述研究中所存在的問題,本文提出用基于灰色關聯度法的模糊綜合評價法和基于Adam優化的LSTM時間序列預測模型對太原市空氣質量變化趨勢進行評價及預測,為太原市大氣污染評價與治理提供參考。
1 模糊灰色關聯綜合評價法
1.1 評價方法分析
模糊綜合評價法[9]與較為常用的空氣質量評價方法相比,能較好地滿足大氣中各種污染因子的隨機性和模糊性,得到的評價結果更為清晰。但是,在評價過程中得到的權重過于片面,會導致評價的結果偏差過大。而灰色關聯度法[10]是一種科學高效的方法,它采取對現有實際數據合理的處理,達到對系統發展趨勢的科學描述,繼而明確權重值,可以解決結果偏差過大的問題。因此,本文對太原市空氣質量的評價采用基于灰色關聯度法的模糊綜合評價法,通過將灰色關聯度思想和專家評判法相融合以增加確定評價指標權重的客觀準確性,從而作出更為精準的評價。
1.2 評價步驟
1.2.1 確定因子集
設空氣質量評價有n個評價因子,確定因子集U=u1,u2,…,ui,…,un,其中ui(i=1,…,6)表示PM2.5,PM10,SO2,NO2,CO和O3這六個關鍵性的評價因子。
1.2.2 確定評語集
確定評語集V=v1,v2,…,vk,…,vj,在這里空氣質量評價的結果分別表現為優、良、輕度、中度、重度和嚴重。
1.2.3 確定隸屬函數
根據《環境空氣質量標準》(GB 3095—2012),確立隸屬度矩陣Ut=uijtM×N,uij代表了第i種因子對于第j級空氣質量的隸屬度。
1.2.4 灰色關聯度法求解因素權重
確定完評判矩陣R和因子權向量W后,得到最后的空氣質量綜合評價結果矩陣為
B=At·Ut=AtUt=
B1t,B2t,…,BNt。(1)
2 LSTM遞歸神經網絡
LSTM[11]是以RNN[12]為基石,采用“門”結構解決序列數據問題的改進后循環神經網絡,每個數據段與前一段有一定的相關性。由于前一時刻的信息神經元將與當前的信息神經元相連,利用LSTM內部的門可以解決對數據的長期依賴。因此,LSTM擁有很強的記憶能力,可以更為高效地處理時間序列的預測及分類。而空氣質量數據是通過指定時間點定時監測到的時間序列數據,未來的空氣質量數據和其歷史數據有著較強的關聯性,因此,LSTM適用于對空氣質量進行預測[13]。
在LSTM中,每個神經元包含3個門:輸入門、遺忘門和輸出門。輸入門是確定在神經元狀態下要記住哪些新的信息內容。遺忘門是確定要從單元狀態中忘記哪些數據信息。輸出門是確定在神經元狀態下要輸出哪些信息。具體如圖1所示。
核心算法公式如下:
ft=σWfht-1,xt+bf,(2)
St=11+e-t,(3)
Ct=ft·Ct+it·C~t,(4)
it=σWi·ht-1,xt+bi,(5)
C~t=tanhWC·ht-1,xt+bC,(6)
Ot=σW0·ht-1,xt+b0,(7)
ht=Ot·tanhCt。(8)
3 Adam算法
自適應矩估計算法[14](adaptive moment estimation,Adam)是AdaGrad 和RESProp算法的結合,它作為一個搜索系統最優化目標的算法,加入了二次方梯度改良,不僅對原始平方梯度的指數減弱平均值加以保存,還維系了原始梯度的指數減弱平均值,能夠對各參數的自適應學習率進行計算,較適合優化LSTM模型,同時適用于像空氣質量這樣的較大數據集,可以利用類似權值的參數降低LSTM對空氣質量的預測誤差,進而提高LSTM預測模型的精度。
Adam更新參數方法如下。
隨機挑選x(1),x(2),…,x(i),…,x(m)m個樣本,x(i)對應y(i),計算fθ對θ的梯度:
gt←1mSymbolQC@θt-1∑iLftx(i);θt-1,y(i)。(9)
計算一階矩及梯度二階距:
mt←β1·mt-1+1-β1·gt,(10)
vt←β2·r+1-β2·g2t。(11)
修正一階矩mt,二階矩vt:
m^t←mt1-βt1,
v^t←v^
t1-βt2。(12)
最后可得參數更新公式:
Δθt← -ηmt^v^t+δ,θt←θt-1+Δθt。(13)
4 實驗與分析
4.1 空氣質量評價結果與分析
4.1.1 數據來源及預處理
本次空氣質量評價的數據來源于中華人民共和國環保部數據中心實時發布的有關太原市空氣質量數據,取樣時間為2019-12-25至2020-01-24日疫情防控前的時間段以及2020-01-25至2020-02-24一級應急響應防控期間,數據共計62組。依照最新發布的《環境空氣質量標準》(GB 3095—2012),本文的空氣質量評價采用細顆粒物(PM2.5)、可吸入顆粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)和一氧化碳(CO)這6項與AQI密切相關的指標,評價等級劃分為優、良、輕度污染、中度污染、重度污染、嚴重污染6個等級,空氣質量指數級別分布如表1所示。
本次空氣質量評價的各個指標值都不在一個維度上,因此利用MATLAB中的mapminmax函數對原始數據進行歸一化處理。通過多次的仿真實驗,發現歸一化區間設置為[0,1]時,空氣質量的評價效果最好。
4.1.2 評價結果分析
按照本文所述評價模型對2019-12-25到2020-01-24太原市實施強管控措施前以及2020-1-25至2020-02-24太原市實施強管控措施期間的空氣質量進行評價,可得影響空氣質量的各污染因子影響程度,如圖2所示。
從圖2可以看出,在2020-01-25到2020-02-24,太原市實施強管控措施后,SO2的污染程度明顯降低,PM2.5和PM10的污染程度略顯降低,NO2和CO的污染程度基本和之前持平。對這一時期的空氣質量進行評價,結果如圖3所示。
從圖3的空氣質量評價結果可以看出,在太原市一級應急響應前,太原市的空氣質量主要處于三級到六級的等級標準,而在一級應急響應的1個月,太原市的空氣質量指數級別(以下簡稱空氣質量等級,下同)明顯下降,主要處于一級到三級的等級標準。通過對圖2和圖3的綜合分析,可以看出,在太原市一級應急響應疫情防控加強期間,人們居家隔離,減少機動車輛出行,以及春節期間各工廠停工,對空氣質量的好轉起到一定成效。但是受季節、氣象等因素(包括春節期間煙花爆竹的燃燒[15]以及供暖燃煤等)的影響,其他污染物的影響并未下降。總的來說,大面積的居家隔離和出行、生產行為的減少對太原市空氣質量的改善起到了積極作用,當然上述的分析仍需要更多的證據加以佐證。
4.2 基于Adam-LSTM的空氣質量預測模型
4.2.1 數據來源及分析
本次預測數據同樣來源于中華人民共和國環保部數據中心實時發布的太原市空氣質量數據,取樣時間為2016-01-01至2020-02-29,數據共計1 522組。AQI的歷史序列值具備著特性明顯的周期性,同時季節變化極其鮮明。此外它的歷史序列值存在著線性和非線性分量[16]。對于通常的預測模型而言,它們對AQI數值的預測效果沒那么明顯。對此,本文使用Adam優化后的LSTM時間序列模型對空氣質量的等級進行預測,為進一步精確預測AQI的走向提供了切實有效的參考依據。
4.2.2 模型的實現過程
基于Adam-LSTM空氣質量預測模型的建模過程如下。
1)獲取AQI序列,依據預測要求,對AQI序列劃分窗口。經歸一化處理將數據標準化,并建立LSTM預測模型。
2)利用Adam算法訓練LSTM,預測下一個窗口的值,輸出值與真實值間的誤差會反向影響參數值,伴隨著每次輸入,誤差會以一定的速度下降,直至達到期望值。通過Adam算法在此階段進行優化,提高模型的收斂速度。
3)預測窗口向后滑動推進,通過每次迭代降低歷史序列中的隨機波動影響,以達到更精確的預測。
模型實現過程的流程圖如圖4所示。
4.2.3 預測結果及分析
鑒于超過6天的AQI數據對第7天的AQI數據影響較小,因此模型利用前6天AQI數據對第
7天的AQI數據進行預測,向后滑動推進進行優
化預測。本文首先用LSTM進行預測,再將其與Adam-LSTM預測結果進行對比。經過迭代訓練后,得到2種預測模型的Error-Cost散點圖,如圖5所示。
從圖5中可知,2種模型在迭代過程中,隨著迭代次數增加,均方誤差都不斷降低,且在結束10次迭代后,均方誤差都達到最低。可以看出Adam-
LSTM模型的預測性能要優于LSTM模型,說明Adam算法優化后的LSTM模型具有更高的預測精度。
表2列出了2種模型的預測誤差指標,即均方根誤差(RMSE)可以用來判斷模型的預測精度,由表2可得Adam-LSTM模型的RMSE值為0.183,低于LSTM模型的RMSE值0.203,也說明了Adam優化后的LSTM在預測精度上有了明顯的提升,可以作為一種有效的預測方法。
將2種預測模型的預測結果和真實值進行對比,如圖6和圖7所示,
從圖6和圖7中可以看出,Adam優化后的LSTM模型對原始數據的擬合度比LSTM模型好,預測效果也更好。
根據圖7預測結果可得,后者預測的太原市的空氣質量等級幾乎接近于實際值,且真實等級和預測等級基本符合同一波動,預測精度較好,具有較高的精準度。但是該預測模型對于空氣質量等級的預測依舊存在一定的誤差,這需要更進一步的研究探索。另外通過污染等級預測模型的曲線走勢不難看出,在2016年-2020年,AQI的變化呈現出先降后增的趨勢,在時間線上正好對應了每一年的年初與年末,這一關鍵信息對于太原市空氣污染的整體防控和治理也提供了事實理論參照。
5 結 語
本文針對太原市疫情防控期前后的空氣質量的評價問題,構建了基于灰色關聯度法的模糊綜合評價模型,并在空氣質量評價的基礎上,針對空氣質量等級的預測問題,分別構建了LSTM模型和Adam-LSTM時間序列預測模型。
1)根據基于灰色關聯度法的模糊綜合評價模型所得的評價結果不僅可以反映空氣質量中污染濃度較高的污染物因子,而且也能反映其他濃度較小的污染物的變化情況。該模型的結果對太原市空氣質量的評價是遵循事實依據的,結果顯示疫情期間太原市采取嚴控措施后,空氣污染水平顯著降低。
2)根據LSTM和Adam-LSTM時間序列預測模型預測的結果,可知2種模型都能夠有效地捕捉大氣污染的長期時間機制,可以從AQI歷史數據中提取有用的內在特征,預測效果符合預期,可以為太原市居民們的出行提供健康指導。與LSTM模型相比,Adam優化后的LSTM時間序列預測模型通過類似權值的參數降低了LSTM模型的預測誤差,預測精度更高。
本研究成果可為太原市長期的空氣污染防治攻堅行動提供決策支持。
但研究也存在不足之處,本文所選取的樣本數據,僅限于疫情防控前后的時間段,若再選取歷年未發生新冠肺炎的春節期間數據進行評價對比,則會更有說服力,并可更好地幫助人們掌握影響城市空氣質量的因素。在對空氣質量等級的預測中,缺乏對污染物擴散、氣象環境、氣候背景等諸多因素與太原市AQI指數關系的探討,只是通過AQI值對空氣質量等級進行了預測。在以后的研究中,將開展各類影響因素對空氣質量的影響預測研究,提高對空氣質量預測的精度。
參考文獻/References:
[1] GUAN Weijie, ZHENG Xueyan, CHUNG Kianfan, et al. Impact of air pollution on the burden of chronic respiratory diseases in China: Time for urgent action[J]. The Lancet, 2016, 388(10054):1939-1951.
[2] 伊元榮,海米提·依米提,艾尼瓦爾·買買提,等.基于灰色聚類法的烏魯木齊市空氣質量狀況研究[J].水土保持研究,2007,14(6):139-141.
YI Yuanrong, YIMITI Haimiti, MAIMAITI Ainiwaner, et al. The atmospheric quality status research based on gray clustering method in Urumqi[J].Research of Soil and Water Conservation, 2007, 14(6):139-141.
[3] 普映娟,王琳邦.環境空氣質量綜合指數評價方法探討[J].環境科學導刊,2010,29(2):93-94.
PU Yingjuan, WANG Linbang. Discussion on comprehensive index assessment method of environmental air quality[J].Environmental Science Survey,2010,29(2):93-94.
[4] 潘本鋒,杜麗,李莉娜.層次分析賦權法在城市空氣質量排名中的應用[J].中國環境監測,2015,31(2):44-47.
PAN Benfeng, DU Li, LI Lina. The study on applications of determining weight vector based on ahp for ranking ambient air quality of city[J].Environmental Monitoring in China, 2015, 31(2): 44-47.
[5] 牟敬鋒,趙星,樊靜潔,等.基于ARIMA模型的深圳市空氣質量指數時間序列預測研究[J].環境衛生學雜志,2017,7(2):102-107.
MOU Jingfeng, ZHAO Xing, FAN Jingjie, et al. Time series prediction of AQI in Shenzhen based on ARIMA model[J].Journal of Environmental Hygiene,2017,7(2):102-107.
[6] 唐之享.基于BP神經網絡的空氣質量預測研究與實現[D].西安:西安電子科技大學,2018.
TANG Zhixiang. Research on and Implementation of Air Quality Prediction based on BP Neural Network[D].Xi′an: Xidian University, 2018.
[7] 鄭洋洋,白艷萍,續婷.基于SARIMA-SVR組合模型的空氣質量指數預測[J].河北工業科技,2019,36(6):436-441.
ZHENG Yangyang, BAI Yanping, XU Ting. Air quality index prediction based on SARIMA-SVR combined model[J]. Hebei Journal of Industrial Science and Technology, 2019,36(6):436-441.
[8] 張冬雯,趙琪,許云峰,等.基于長短期記憶神經網絡模型的空氣質量預測[J].河北科技大學學報,2020,41(1):67-75.
ZHANG Dongwen, ZHAO Qi, XU Yunfeng, et al.Air quality prediction based on neural network model of long short-term memory[J]. Journal of Hebei University of Science and Technology,2020,41(1):67-75.
[9] 羅運成.基于模糊綜合評價模型的城市空氣質量評價研究[J].環境影響評價,2018,40(5):79-83.
LUO Yuncheng. Research on urban air quality evaluation based on fuzzy comprehensive assessment method[J].Environmental Impact Assessment,2018,40(5):79-83.
[10]吳先明,蔡海濱,鄧鵬.基于灰色關聯度的改進TOPSIS模型在水質評價中的應用[J].三峽大學學報(自然科學版),2018,40(2):24-28.
WU Xianming, CAI Haibin, DENG Peng. Application of improved TOPSIS model based on grey correlation grade to water quality evaluation[J]. Journal of China Three Gorges University(Natural Sciences),2018,40(2):24-28.
[11]WAN Huaiyu, GUO Shengnan, YIN Kang, et al. CTS-LSTM: LSTM-based neural networks for correlatedtime series prediction[J]. Knowledge-Based Systems, 2020.DOI: 10.1016/j.knosys.2019.105239.
[12]楊麗,吳雨茜,王俊麗,等.循環神經網絡研究綜述[J].計算機應用,2018,38(sup2):1-6.
YANG Li, WU Yuxi, WANG Junli, et al.Research on recurrent neural network[J].Journal of Computer Applications,2018,38(sup2):1-6.
[13]張春露,白艷萍.基于TensorFlow的LSTM模型在太原空氣質量AQI指數預測中的應用[J].重慶理工大學學報(自然科學),2018,32(8):137-141.
ZHANG Chunlu, BAI Yanping. Application of LSTM prediction model based on Tensor Flow in Taiyuan air quality AQI index[J].Journal of Chongqing University of Technology (Natural Science),2018,32(8):137-141.
[14]張晉晶.基于隨機梯度下降的神經網絡權重優化算法[D].重慶:西南大學,2018.
ZHANG Jinjing. Optimization Algorithms of Neural Networks Weights Based on Stochastic Gradient Descent[D].Chongqing: Southwest University,2018.
[15]曹馨元,何月欣,陳衛衛,等.煙花爆竹禁燃對春節期間東北地區空氣質量影響評估[J].中國環境監測,2018,34(4):77-84.
CAO Xinyuan, HE Yuexin, CHEN Weiwei, et al. Effects of fireworks forbidden on air quality during the Spring Festival in Northeast China[J].Environmental Monitoring in China,2018,34(4):77-84.
[16]李博群,賈政權,劉利平.基于模糊時間序列的空氣質量指數預測[J].華北理工大學學報(自然科學版),2018,40(3):78-86.
LI Boqun, JIA Zhengquan, LIU Liping. Air quality index forecast based on fuzzy time series models[J].Journal of North China University of Science and Technology (Natural Science Edition),2018,40(3):78-86.
收稿日期:2020-06-22;修回日期:2020-12-01;責任編輯:王海云
基金項目:國家自然科學基金(61774137);山西省自然科學基金(201701D22111439, 201701D221121);山西省回國留學人員科研項目(2016-088)
第一作者簡介:曹 通(1995—),男,山西臨汾人,碩士研究生,主要從事現代優化算法理論及應用方面的研究。
通訊作者:白艷萍教授。E-mail: baiyp666@163.com
曹通,白艷萍.太原市COVID-19防控前后空氣質量分析及預測[J].河北工業科技,2021,38(2):156-162.
CAO Tong,BAI Yanping.Air quality analysis and prediction before and after the prevention and control of COVID-19 in Taiyuan[J].
Hebei Journal of Industrial Science and Technology,2021,38(2):156-162.