張春紅
(湖南科技職業學院,長沙 410004)
為完善我國的空氣質量監測系統,實時有效監控各地區的空氣質量情況,中國工業與應用數學學會發起并倡導運用數學模型為空氣質量數據的真實性提供理論依據,并協調國家監測控制站點與化工醫藥礦業冶金等企業的溝通銜接工作,可提供相關研究需要的實時數據,鼓勵各高校數學工作者開展相關應用理論研究。本研究分析并驗證了邊遠地區和特殊企業使用微型空氣質量檢測儀得到數據的準確性,分析異常數據產生的原因并提供解決方案,合理校準相關數據的異常差異,為企業環保生產提供有效參考依據,為優化社會生活環境提供實力支撐。
對某地區自建點空氣質量檢測數據進行預處理,與同一時間國控點數據進行比較,利用R軟件對“兩塵四氣”數據進行描述性統計,分析數據的集中趨勢和離散趨勢。對預處理數據進行極差法的無量綱處理并利用Matlab軟件計算關聯度系數,得到“兩塵四氣”濃度與各氣象參數的關聯度。為分析國控點數據與自控點氣象參數的關系,利用Matlab軟件建立BP神經網絡模型進行探討。針對變量間復雜的非線性關系建立BP神經網絡模型,選取部分數據進行網絡訓練得到擬合優度和預測精度較高的模型,利用模型中的預測值對自建點的數據進行校準。
3.1.1 監測點“兩塵四氣”濃度數據的描述性統計
Step1:數據的預處理。根據自建點檢測的數據,利用Python語言對每小時段的數據進行平均化,與國控點數據一一對應。刪除存在缺失的數據,最終得到4 200個觀測時間點上的數據。
Step2:利用R軟件對預處理好的數據進行描述性統計和變量的密度曲線估計。
Step3:結果分析。國控點和自建點觀測到不同因素濃度數據在集中趨勢和離散趨勢的差異。從極差的數據來看,兩個監測點的數據基本一致。從密度曲線來看,兩個觀測點存在明顯差異,國控點數據分布較為平、扁,更趨近正態分布,自建點數據偏尖峰分布,兩者存在較大差異。
3.1.2 國控點與自建點監測數據差異的動態變化分析
通過對預處理后的數據進行描述性統計分析和密度曲線分析,可初步了解來自兩個監測點不同變量在集中趨勢和離散趨勢上存在差異,利用R軟件進一步分析數據,探索國控點和自建點“兩塵四氣”濃度動態變化趨勢及其差異情況。
對預處理后的數據進行探索性分析可知,國控點和自建點“兩塵四氣”濃度數據存在一定差異,利用關聯度分析法分析天氣參數(風速、降雨量、壓強、溫度、濕度)與“兩塵四氣”濃度影響因素之間的強弱主次關系。
3.2.1 灰色關聯度分析方法模型的建立
選取自建點監測數據中六項影響因素的濃度及五類氣象參數作為研究對象,找出氣象參數與濃度影響因素之間的關系,建立灰色關聯度分析法模型:
(1)定義空氣影響因素每小時平均濃度數列為參考數列,氣象參數數列為比較數列,則參考數列為x0(k),比較數列為xi(k)。
(2)因氣象參數數列中各變量量綱不一樣,為不影響分析結果,進行無量綱化。在進行灰色關聯度分析之前對各指標因素進行量化,轉化為定量因素,便于建立預測模型。

3.2.2 灰色關聯度分析方法模型的求解
Step1:在預處理數據中,使用極差法對自建點包含的“兩塵四氣”和氣象參數數據進行無量綱化處理。
Step2:令模型中的分辨率參數ρ=0.5,使用Matlab軟件得到空氣影響因素及PM10與各個氣象要素的關聯系數。
Step3:通過關聯系數最終得到“兩塵四氣”與氣象參數關聯度,關聯度分析得出:風速與CO、NO2、SO2濃度有一定的相關性,影響較大,風速過高會使CO、NO2、SO2濃度升高,造成監測數據的誤差。PM10、SO2、NO2濃度與溫度有一定的相關性,溫度升高,則對應變量增加。CO、NO2和SO2濃度與天氣參數的關系最為密切,表明天氣因素干擾會對觀測數據造成較大誤差。
3.3.1 建立BP神經網絡模型
“兩塵四氣”濃度與氣象參數間復雜的非線性關系,可以運用BP神經網絡模型來擬合,利用國控點數據對自建點“兩塵四氣”濃度數據進行校準。BP神經網絡過程圖如圖1所示。

圖1 BP神經網絡過程圖
根據BP神經網絡原理,對于輸出層,有:hk=f(netk),k=1,2,…,6
對于隱層,有:yj=f(netj),j=1,2,…,m

神經網絡算法步驟:
Step1:初始化。對權值矩陣W和V賦隨機數,將樣本模式計數器p和訓練次數計數器q置為1,誤差E置0,學習率η設為0~1內的小數,網絡訓練后達到的精度Emin設為一個正的小數。
Step2:輸入訓練樣本,計算各層輸出。用當前樣本對向量數組X和D賦值,并計算Y和H各分量。
Step3:計算網絡輸出誤差。共有12對訓練樣本,網絡對于第i個樣本具有誤差。
Step4:計算各層誤差信號。
Step5:調整各層權值。權值調整量為:
Step6:檢查是否對所有樣本完成一次輪訓。若p<4,計數器p、q加1,返回Step2,否則進行下一步。
Step7:檢查網絡總誤差是否達到精度要求。若ERME 3.3.2 結果分析和對自建點數據的校對 使用Matlab軟件分析自建點氣象參數和國控點“兩塵四氣”濃度的預處理數據。神經網絡模擬的指標與監測值誤差很小,訓練后得到“兩塵四氣”濃度的預測值。部分預測點數據如表1所示。 表1 “兩塵四氣”濃度部分預測值 以上關于PM2.5等五個特征因子的模擬實驗,說明模型預測的值誤差偏小,波動較為穩定,達到了理想的預測效果,可以利用國控點的預測值對自建點數據進行校準。 重復模擬次數,發現特征因子中溫度和濕度的影響因子最大。實驗結果顯示,所采用的模型預測空氣污染指數準確性較高。外在因素中溫度和濕度可以看做是影響空氣質量最主要的兩個因素,因此,在平時空氣污染較嚴重的情況下,可以向空中灑水,加大空氣中的濕度來降低空氣污染。 本研究以數據分析為前提,結合數學模型對空氣質量檢測數據進行了差異分析并校準,有效利用了數學建模教學中數據處理的方法和分析原理,是以現實數據為依據演示數學建模教學過程的典型范例。
4 結論