


摘要:指出了隨著城鎮(zhèn)化進(jìn)程的快速發(fā)展,空氣質(zhì)量問題受到極大關(guān)注。大數(shù)據(jù)背景下,基于人工智能相關(guān)技術(shù),對(duì)“霧霾”天氣進(jìn)行科學(xué)、合理地預(yù)測與預(yù)警已經(jīng)成為研究的熱點(diǎn)。基于遺傳法算法和BP人工神經(jīng)網(wǎng)絡(luò),建立了“霧霾”預(yù)測模型,收集了長春市的PM,.s含量數(shù)據(jù),通過實(shí)例進(jìn)行了驗(yàn)證,結(jié)果表明:該模型相較于傳統(tǒng)的BP人工神經(jīng)網(wǎng)絡(luò)模型,在預(yù)測的準(zhǔn)確度上有了較大的提高。為長春市空氣質(zhì)量的預(yù)測、預(yù)警提供了可行的理論依據(jù)。
關(guān)鍵詞:遺傳算法;BP神經(jīng)網(wǎng)絡(luò);“霧霾”預(yù)剛
中圖分類號(hào):X51 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-9944(2019)22-0095-03
1 引言
近幾年,隨著空氣質(zhì)量相關(guān)研究,有關(guān)政策的出臺(tái),長春市的環(huán)境質(zhì)量得到了進(jìn)一步的提高。空氣質(zhì)量尤其是“霧霾”的預(yù)測可以為環(huán)境保護(hù)部門提供科學(xué)依據(jù),及時(shí)有效的預(yù)警可以減少惡劣天氣給百姓生活帶來的影響。因此,研究并建立科學(xué)合理的“霧霾”天氣預(yù)測模型顯得尤為重要。傳統(tǒng)的“霧霾”預(yù)測方法主要包括MS方法、MLRM、ANN等方法[1]。“霧霾”天氣的形成一般與氣候因素、顆粒污染物含量等因素有關(guān),尤其是PM2.5的含量。而這些因素具有明顯的非線性、不確定性。傳統(tǒng)的BP人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型雖然在該領(lǐng)域取得了一定的研究成果。但是BP神經(jīng)網(wǎng)絡(luò)在探尋較大的解空間時(shí)易陷入局部最優(yōu)的缺點(diǎn),降低了該模型的預(yù)測準(zhǔn)確度,而遺傳算法利于全局擇優(yōu)[2]。為了提高預(yù)測的準(zhǔn)確性,本文提出了基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
2 遺傳算法
遺傳算法借鑒了進(jìn)化生物學(xué)中的一些現(xiàn)象而發(fā)展起來的,用于解決最優(yōu)化的搜索算法。隨著近幾年人工智能研究的發(fā)展,遺傳算法也是該領(lǐng)域的重要分支。遺傳算法具有以下特點(diǎn):①利于全局擇優(yōu);②時(shí)算法本身易于實(shí)現(xiàn)并行化;③采用概率的變遷規(guī)則指導(dǎo)搜索方向;④具有自組織、自適應(yīng)和自學(xué)習(xí)性。
3 BP人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)作為人工智能的一個(gè)重要分支,在很多領(lǐng)域得到了很好的應(yīng)用,并體現(xiàn)其應(yīng)用價(jià)值。在人工神經(jīng)網(wǎng)絡(luò)的眾多網(wǎng)絡(luò)模型中,BP神經(jīng)網(wǎng)絡(luò)應(yīng)用尤為廣泛,該網(wǎng)絡(luò)模型是一種按誤差逆向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò),具有非線性動(dòng)力學(xué)特征[3]。BP人工神經(jīng)網(wǎng)絡(luò)經(jīng)典模型為三層結(jié)構(gòu),即;Input Layer(輸入層)、Mid-dle Layer(中間層或隱含層)和Output Layer(輸出層)。
BP人工神經(jīng)網(wǎng)絡(luò)的原理描述如下:一般將收集到的數(shù)據(jù)劃分為訓(xùn)練樣本和測試樣本兩部分,通過訓(xùn)練樣本集來訓(xùn)練網(wǎng)絡(luò)模型,然后根據(jù)訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行測試驗(yàn)證,保證該模型的有效性。基于訓(xùn)練樣本的學(xué)習(xí)過程可細(xì)分為兩個(gè)階段,一個(gè)階段為信息數(shù)據(jù)的正向傳遞,另一階段為誤差的反向傳遞,相對(duì)誤差采用梯度下降算法[4]。對(duì)于激活函數(shù)的選擇上可根據(jù)數(shù)據(jù)集的特點(diǎn)進(jìn)行有效選擇,由于本研究的數(shù)據(jù)集不存在負(fù)數(shù)的情況,故選擇了S型函數(shù)作為激活函數(shù)[5]。
4 基于GA改進(jìn)BP神經(jīng)網(wǎng)絡(luò)
由于BP神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用中不僅收斂速度慢,同時(shí)非常容易陷入誤差局部極小值等缺點(diǎn)。而遺傳算法具有全局搜索最優(yōu)解的功能。為了提高預(yù)測準(zhǔn)確率,本研究將結(jié)合GA算法與BP神經(jīng)網(wǎng)絡(luò)的各自優(yōu)點(diǎn),建立“霧霾”預(yù)測模型。該模型將利用遺傳算法來處理BP人工神經(jīng)網(wǎng)絡(luò)的連接權(quán)值和閾值,在BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中使用GA算法優(yōu)化后的閾值和連接權(quán)值,這樣能夠使得BP神經(jīng)網(wǎng)絡(luò)快速獲得全局最優(yōu)解[6]。不僅提高了該模型的運(yùn)行效率,同時(shí)大大提高了預(yù)測的準(zhǔn)確率。
5 基于GA-BP神經(jīng)網(wǎng)絡(luò)的“霧霾”預(yù)測實(shí)例
5.1 數(shù)據(jù)的獲取
本研究所用的數(shù)據(jù)均來源于空氣質(zhì)量數(shù)據(jù)查詢網(wǎng)。具體數(shù)據(jù)為吉林省長春市2018年4~11月共237d的數(shù)據(jù),該數(shù)據(jù)具有真實(shí)性和可靠性,不存在缺失和無效數(shù)據(jù)。為了得到合理的預(yù)測結(jié)果,本研究主要針對(duì)“霧霾”主要污染物PM2.5含量進(jìn)行研究和預(yù)測,不考慮區(qū)域特征污染物和周邊區(qū)域可能出現(xiàn)的大面積污染源所帶來的影響。原始數(shù)據(jù)如表1所示。
5.2 數(shù)據(jù)預(yù)處理
根據(jù)收集到的監(jiān)測數(shù)據(jù)特點(diǎn),為了提高模型處理效果,采用簡單的歸一化處理方式,具體如下:
經(jīng)過歸一化后的數(shù)據(jù)介于0.2~0.95之間,y'表示處理后數(shù)據(jù),y表示原始數(shù)據(jù),ymin表示樣本數(shù)據(jù)集中的最小值, ymax表示樣本數(shù)據(jù)集中的最大值。處理后的數(shù)據(jù)如表2所示。
5.3 預(yù)測模型建立
根據(jù)前文所提到的GA及BP神經(jīng)網(wǎng)絡(luò)構(gòu)建“霧霾”預(yù)測模型,其具體流程如圖1所示。
在該預(yù)測模型中,經(jīng)過大量的實(shí)驗(yàn),BP神經(jīng)網(wǎng)絡(luò)模型采用的是三層結(jié)構(gòu),其中輸入層設(shè)置為4個(gè)節(jié)點(diǎn),隱含層設(shè)置為5個(gè)節(jié)點(diǎn),輸出層設(shè)置為1個(gè)節(jié)點(diǎn)。同時(shí)在所有的參數(shù)設(shè)置中,為了達(dá)到快速收斂,并有效防止過擬合,將該網(wǎng)絡(luò)的學(xué)習(xí)速率設(shè)置為0.05,誤差設(shè)置為0.0001。對(duì)于遺傳算法的應(yīng)用,該算法主要是對(duì)BP神經(jīng)網(wǎng)絡(luò)的連接權(quán)值和閾值進(jìn)行優(yōu)化處理。通過驗(yàn)證,為了得到最優(yōu)解,適應(yīng)值的設(shè)定為PM2.5含量實(shí)際值與預(yù)測值的誤差平方和的倒數(shù),在選擇操作上主要使用經(jīng)典的輪盤賭法進(jìn)行,交叉操作采用單點(diǎn)實(shí)數(shù)交叉法。
5.4 預(yù)測結(jié)果與分析
本研究將收集到的237組數(shù)據(jù)分為網(wǎng)絡(luò)訓(xùn)練樣本集(220組)和實(shí)測樣本集(17組)。通過前文的預(yù)測模型,得出了PM2.5含量的平均相對(duì)誤差以及預(yù)測的準(zhǔn)確率,并對(duì)基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測模型與結(jié)合GA算法的BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果進(jìn)行了對(duì)比,對(duì)比結(jié)果如表3。
通過以上表格可以看出,基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測模型PM2.5含量的相對(duì)誤差為0.2726,預(yù)測的準(zhǔn)確率為81.01%。而基于GA算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型PM2.5含量的相對(duì)誤差為0.2431,預(yù)測的準(zhǔn)確率為87.56%。結(jié)果表明,通過結(jié)合遺傳算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型有更高的可信度,預(yù)測準(zhǔn)確率更加理想。進(jìn)一步驗(yàn)證了該方法的可用性。
6 結(jié)語
隨著社會(huì)的進(jìn)步,經(jīng)濟(jì)的發(fā)展,環(huán)境質(zhì)量問題引起高度重視,尤其是“霧霾”天氣嚴(yán)重影響人們的健康與生活。“霧霾”的有效預(yù)測與合理控制顯得尤為重要。引起“霧霾”的主要污染顆粒物為PM2.5。BP神經(jīng)網(wǎng)絡(luò)可以對(duì)“霧霾”進(jìn)行預(yù)測,但是該模型存在一定的缺點(diǎn),預(yù)測的準(zhǔn)確性有待提高,本研究將遺傳算法的求解全局最優(yōu)解的優(yōu)勢應(yīng)用到對(duì)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值的計(jì)算中,建立了基于GA-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,并將該模型運(yùn)用到長春市的“霧霾”預(yù)測中,實(shí)驗(yàn)結(jié)果表明該方法是合理有效的,預(yù)測的準(zhǔn)確率提高顯著。預(yù)測的結(jié)果可以作為有關(guān)部門進(jìn)行科學(xué)防治“霧霾”、預(yù)警“霧霾”的理論依據(jù),具有一定的實(shí)際應(yīng)用意義。
參考文獻(xiàn):
[1]趙明艷.基于卷積神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量預(yù)測[J].科學(xué)技術(shù)與創(chuàng)新,2019(9):10~12.
[2]劉鋒,李春燕,譚祥勇,等.基于機(jī)器學(xué)習(xí)在空氣質(zhì)量指數(shù)中的應(yīng)用[J].重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,34(3):82~87.
[3]吳慧靜,赫曉慧.基于GA—BP神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量指數(shù)預(yù)測研究[J].安徽師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,42(4):360~365.
[4]艾洪福,潘賀,李迎斌.關(guān)于空氣霧履PM2.5含量預(yù)測優(yōu)化研究[J].計(jì)算機(jī)仿真,2017.34(1):392~395.
[5]蘇維,賴新云,賴勝男,等.南昌市城市空氣PM2.5和PM10時(shí)空變異特征及其與景觀格局的關(guān)系[J].環(huán)境科學(xué)學(xué)報(bào),2017,37(7):2432~2439.
[6]李俊飛.基于支持向量機(jī)的空氣質(zhì)量預(yù)測[J].黑龍江科技信息,2015(26):105~106.
[7]張立軍.地面氣象觀測管理工作存在的問題與對(duì)策[J].綠色科技,2018(18):32~33.
[8]張佳婷,余延略.青浦區(qū)旅游氣象條件分析[J].綠色科技,2019(18):32~35.
[9]馬靜楠,馬朋坤.北京市城區(qū)2018年P(guān)M2.5和氣態(tài)前體物濃度季節(jié)與日變化特征[J].綠色科技,2019(14):65~69.
[10]王珺雨,陳丹.2017年冬季南京市一次連續(xù)霧霾的氣象條件分析[7].綠色科技,2018(22):94~96.
[11]盧瑞庚.基于霧霾治理環(huán)境中的綠化廢棄物處理研究[J].綠色科技,2017(20):94~96.
[12]張耀民,張開升.從霧履的成因談三北防護(hù)林的防護(hù)作用和措施[J].綠色科技,2017(19):199~201.
[13]呂孟雨,李曉煜,董福雙,等.霧霾天氣對(duì)農(nóng)作物的影響因素研究[J].綠色科技,2016(21):43~44.
[14]裴天一,盧金輝.蘇北地區(qū)霧霾天氣的常見原因與治理[J].綠色科技,2018(4):138~139.
收稿日期:2019-10-16
基金項(xiàng)目:吉林省教育廳“十三五”規(guī)劃課題(編號(hào):JJKH20180651KJ)
作者簡介:艾洪福(1980-),男,講師,碩士,研究方向?yàn)榄h(huán)境質(zhì)量、數(shù)據(jù)挖掘。