北京市育英學校 呂霽洲
大氣是指地球外圍的空氣,是人類賴以生存的自然環境組成部分之一。隨著地球總人口數的急劇增加,工業的不斷發展,由此帶來了大量的污染氣體、甚至有害氣體的排放,使得人類生存的環境不容樂觀,大氣污染問題日趨嚴重,甚至造成氣候變化、冰川溶解、海洋循環惡化等全球性問題。因此,加強大氣質量的監測和預報非常必要,目前,世界各國對大氣質量的監測內容主要包括大氣中SO2、NO2、O3、CO以及懸浮顆粒物等的濃度。
調查文獻可知[1],上個世紀70年代,美國率先采用污染標準指數(PSI)作為空氣質量評價的標準,于2011年起,這一標準逐步修改為空氣質量指數(AQI)。我國則在1997年第一次提出空氣污染指數(API),直至2012年修改為空氣質量指數(AQI)。中美兩國AQI標準所采用的污染物項目相同,但其取值時間稍有差異。目前來看,中國的顆粒物濃度限值存在一定的問題。AQI的計算公式較為復雜,美國采用的NowCast計算方法具有很好的計算效率,在此方面我國仍有一定差距。空氣質量的好壞不僅影響人們的身心健康狀況,還對人們的衣食住行帶來極大的影響。因此,對空氣質量的預測具有非常重要的意義。
本文首先收集了北京市某地區大量的空氣指數及污染物含量等數據,采用簡化的AQI計算模型,通過數值計算軟件Matlab的編程和求解,得到了簡化的AQI計算值,并與實際值進行了對比分析;其次,本文基于BP神經網絡模型,采用若干數據對其進行了訓練,利用訓練后的神經網絡模型對空氣質量指數進行了預測,并對預測結果進行了誤差分析。本文最后還對所有工作進行了總結。
根據我國實行的空氣質量評價標準,空氣質量的好壞可分為六個等級,分級的標準由空氣質量指數(AQI)確定。AQI的取值范圍為0到500,該指數越大,對應的空氣質量等級越高,空氣污染的程度越嚴重;反之則空氣的污染程度越低,空氣質量越好。根據我國目前施行的國家標準,AQI的計算值主要由細顆粒物(PM2.5)、可吸入顆粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)、一氧化碳(CO)等各項污染物的實測濃度值決定。根據上述每一項的分級濃度限值參照表(GB3095-2012),由下述公式可計算出每一項污染物對應的的空氣質量分指數(IAQIP):
式中,IAQIP是指污染物項目P的空氣質量分指數,CP為污染物項目P的質量濃度值,BPHi是相應地區的空氣質量分指數及對應的污染物項目濃度指數表中與CP相近的污染物濃度限值的高位值,BPLo是相應地區的空氣質量分指數及對應的污染物項目濃度指數表中與CP相近的污染物濃度限值的低位值,IAQIHi是相應地區的空氣質量分指數及對應的污染物項目濃度指數表中與BPHi對應的空氣質量分指數,IAQILo是相應地區的空氣質量分指數及對應的污染物項目濃度指數表中與BPLo對應的空氣質量分指數。[1]
在計算得到每一項污染物對應的的空氣質量分指數(IAQIP)后,最終的空氣質量指數(AQI)取作各項分指數中的最大值,即:
式中,n代表分指數的個數??偠灾?,AQI就是各項污染物的空氣質量分指數(IAQI)中的最大值。
本文為了方便起見,這里對標準模型進行了如下簡化,分指數的個數取為n=6,共包含S02、NO2、O3、CO以及PM2.5、PM10六項濃度指標,且考察的污染物項目均為24h平均值。
本文的全部數據來自于北京市奧體中心監測點自2018年1月1日至3月31日(共90天)的所有監測的污染物每小時濃度,共包含了實時的AQI,PM2.5,PM10,SO2,NO2,O3,CO等數據,該數據抓取自北京市環境保護檢測中心網站[2]。
考慮到簡化的AQI計算模型,這里首先將每一項每天24個小時的濃度進行平均,然后根據上述公式進行計算。采用matlab軟件對相關數據進行處理和分析,繪制數值計算結果與真實結果的對比圖。通過已知AQI的計算公式,采用六項空氣中的主要污染物:PM2.5,PM10,SO2,NO2,O3,CO平均數值計算得到的AQI值,最終與抓取的數據中真實AQI的值(計算所需的污染物不止這六項)對比。最終的對比圖大致如下圖1所示,其中橙色是真實值,藍色是通過軟件數值計算得到的,兩者基本一致,驗證了數值計算模型的準確性。
圖1 簡化模型數值計算得到的AQI值(藍色)與真實AQI值(橙色)的比較
需要說明的是,本文所建立的求解模型中,由于只考慮了該六項污染物的24h平均濃度,較標準的AQI計算模型做了進一步的簡化,該簡化過程提高了計算效率,并再此基礎上具有極高的準確性。
下面將采用BP神經網絡模型代替上述公式求解過程,BP算法的基本思想是,不需要提前確定輸入值和輸出值之間的嚴格的數學方程,而是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡是目前應用最廣泛的神經網絡。BP神經網絡中信號的正向傳播和誤差的反向傳播是閉環反復進行的,其迭代次數將由允許誤差所決定。[3][4]
BP神經網絡的基本結構包括輸入層、隱含層和輸出層。為了預測空氣質量指數AQI的值,輸入量將由PM2.5,PM10,SO2,NO2,O3,CO這六項組成,這里只選取一層隱含層,包含四個隱層神經元,故組成6X4X1的三層BP網絡模型,如圖2所示。
圖2 空氣質量預測的BP神經網絡結構
該BP神經網絡模型采用S型正切函數作為激勵函數,傳遞函數的表達式為:
反傳誤差函數的表達式為:
其中ti為期望輸出,Qi為網絡的計算輸出。通過讀取第1-55天的空氣污染物參數(輸入)和AQI值(輸出),采用上述BP神經網絡算法,通過Matlab編程,由第56-60天空氣污染物參數預測該五天相對應的AQI值,并與真實值進行比較,如下圖為預測值和真實值的相對誤差。
圖3 基于BP神經網絡的空氣質量預測值與真實值的誤差
值得一提的是,由于訓練的原始數據偏少,導致訓練后的神經網絡模型預測誤差偏大,當原始數據足夠多時,采用BP神經網絡模型預測空氣質量指數將會有更高的準確性,從長遠來看,其計算效率將會提高很多。
綜上所述,本文建立了簡化的AQI值計算模型,并通過數值計算軟件Matlab處理了數據,進而進行了求解,并將求解的結果與實際值比較,結果表明,簡化以后的模型在減小計算量的基礎上仍具有較好的準確性;同時,本文采用了另外一種方法,即BP神經網絡算法,在經過若干數據訓練后,取代了上述的AQI值計算模型,并且對空氣質量指數進行了預測,驗證了采用神經網絡算法求解該問題的可行性。本文工作仍存在一些不足之處,如在進行BP神經網絡訓練時輸入的數據量較小,導致神經網絡的訓練不足以提供更高的精確度,需要進一步優化。
[1]高慶先,劉俊蓉,李文濤,等.中美空氣質量指數(AQI)對比研究及啟示[J].環境科學,2015,36(4):1141-1147.
[2]http://www.bjmemc.com.cn/.
[3]陳哲,劉建坤,李冰潔.基于BP神經網絡的空氣質量評價及預測[J].現代經濟信息,2014(24):387-388.
[4]李萍,曾令可,稅安澤,等.基于MATLAB的BP神經網絡預測系統的設計[J].計算機應用與軟件,2008,25(4):149-150.