馬占飛,江鳳月,李克見,鞏傳勝
1(內蒙古科技大學 包頭師范學院,內蒙古 包頭 014030) 2(內蒙古科技大學 信息工程學院,內蒙古 包頭 014010)
草原作為北方重要的國土資源,在人類的生產活動和自然環(huán)境的改善中發(fā)揮著不可替代的作用.近年來,隨著人口的急劇增長和經濟的快速發(fā)展,草原地區(qū)的大氣環(huán)境受到嚴重的污染,造成大面積的草原退化和沙漠化現象.因此,準確預測草原污染物的濃度,對科學治理大氣污染,維持草原生態(tài)系統的平衡具有重要的意義.在污染物預測研究中,群體智能優(yōu)化神經網絡的算法頗受研究學者青睞.灰狼群算法[1],是新型的群體智能優(yōu)化算法之一,國內外的學者們在此基礎上進行了不同的探索.例如,文獻[2]通過遺傳算法優(yōu)化的RBF神經網絡的算法,建立RBF-GA的預測模型證明預測精度有所提高;文獻[3]建立了基于徑向基函數(RBF)神經網絡的預測模型,并用粒子群算法(PSO)對神經網絡的參數進行優(yōu)化;文獻[4]通過與GWO優(yōu)化的SVM算法、遺傳算法優(yōu)化的SVM、粒子群算法優(yōu)化的SVM預測算法相比,發(fā)現改進的GWO優(yōu)化SVM的算法預測精度更準確;文獻[5]建立基于灰狼群智能優(yōu)化神經網絡的預測模型,證明了此預測模型具有較好的泛化能力;文獻[6]證明了在非線性問題的計算中,RBF神經網絡有良好的的逼近能力;文獻[7]通過與粒子群優(yōu)化算法、人工蜂群優(yōu)化算法相比較,證明所提出的灰狼群算法是一種很高效的優(yōu)化算法;文獻[8]利用群體智能優(yōu)化算法調整RBF神經網絡的學習參數,提高了算法的收斂速度;文獻[9]利用灰狼群算法,優(yōu)化RBF神經網絡的學習參數,進而提高了RBF神經網絡對非線性問題的處理能力;文獻[10]利用改進的灰狼群算法,證明此算法在徑向基網絡逼近上有全局優(yōu)化的優(yōu)勢;文獻[11]提出了對數函數描述收斂因子的改進GWO算法,避免灰狼群算法在求解復雜問題易陷入局部最優(yōu)的問題;文獻[12]通過非線性收斂和位置更新策略對基本灰狼群優(yōu)化算法進行改進,得到了最優(yōu)結構參數證明了該模型模型結構簡單,預測精度較高.
通過以上文獻可知,灰狼群算法優(yōu)化RBF網絡對于非線性預測研究,有良好的預測性能.但傳統的GWO算法尋優(yōu)能力不足,容易陷入局部最優(yōu),而大多數的研究只利用灰狼群算法優(yōu)化權值,而忽略了聚類中心參數的學習優(yōu)化,從而導致預測算法精度不高,泛化能力弱的問題.本文通過最近鄰聚類算法調整聚類中心,再結合改進后的GWO算法優(yōu)化權值參數,避免了以上問題,并用草原地區(qū)的實例驗證了該預測算法的有效性和合理性.
徑向基神經網絡(Radial Basis Function Neural Networks,RBFNN)是一種使用徑向基函數作為激活函數的人工神經網絡[13].如圖1所示.

圖1 RBF神經網絡結構

(1)
(2)
其中,‖Xp-Cl‖表示Xp與Cl之間的歐氏距離,Cl為第l個隱含層節(jié)點的聚類中心,r為寬度常數,nr表示隱含層節(jié)點的數目;Wjl是第l個隱含節(jié)點到第j個輸出節(jié)點的連接權值,輸出矩陣表示為:
Yp=W*hp=
目前,調整RBF神經網絡的中心參數的算法有很多,其中典型的算法為最近鄰聚類算法(Nearest Neighbor Clustering Algorithm,NNCA).文獻[14]證明了在調節(jié)RBF神經網絡的參數學習中,隱含層的節(jié)點個數不需要事先確定,它能在訓練當中自適應調節(jié).最近鄰聚類算法不僅能減少對聚類中心初值的依賴,而且能動態(tài)調整隱含層節(jié)點的數目,這樣縮短了網絡訓練的時間.最近鄰聚類算法描述如下:
算法1.NNCA調整聚類中心的算法描述
輸入:樣本數據集(Xp,Yp),寬度常數r
輸出:最近鄰聚類中心Cl,權值向量W,隱含層節(jié)點數目nr
1.定義g為存放各類輸出的矢量之和,b為統計各個聚類的樣本個數,W為聚類中心Cl到輸出層的權值向量
2.首先選擇第一個樣本(X1,Y1)作為初始聚類中心,nr=1,C1=X1,g=Y1,b=1,W=g/b
3.forp=2 toNdo:
4.forl=1 tonrdo:
5.計算樣本Xp到l個聚類中心的歐式距離d=‖Xp-Cl‖
6.ifd 7.更新最小的歐氏距離mind=d 8.end if 9.end for 10.ifmind<=r 11.沒有產生新的聚類中心,nr的數目不變,g=g+Yp,b=b+1,W=g/b 12.else 13.nr=nr+1,產生新的聚類中心Cnr,g=Yp,b=1,W=g/b 14.end if 15.end for 16.結束處理 3.2.1 灰狼群算法 灰狼群算法(Grey Wolf Optimization,GWO)是一種模擬灰狼群體捕食行為的新型智能優(yōu)化算法.GWO算法具有結構簡單、需要調節(jié)的參數少、簡單易用等特點,其中能夠在局部尋優(yōu)與全局搜索之間實現平衡,因此在對一些非線性求解問題的精度和泛化能力方面都有良好的性能[15].為此,本文將利用灰狼群算法對RBF網絡的權值參數進行優(yōu)化. 在GWO算法中,將狼群分為從高到低的4個等級,將根據適應度值的大小排序,適應度值最優(yōu)的灰狼為α,次優(yōu)灰狼為β,第3優(yōu)灰狼為δ,剩余灰狼為ω.在狼群捕獲獵物的過程中,首先將選擇適應度值最優(yōu)的3匹灰狼α、β、δ進行獵物的追捕,而剩余灰狼ω將跟隨前3匹灰狼α、β、δ進行圍攻,最后獵物的位置為優(yōu)化問題的解. 灰狼群的捕食行為可以分為包圍、獵捕、攻擊獵物這3個過程. 1)包圍 在狼群的捕食過程中,狼群對獵物首先采用包圍的行為.與灰狼群算法的尋優(yōu)過程相對應,先計算灰狼個體Xi(t)與獵物Xp(t)之間的距離D,而第i只灰狼Xi(t)包圍獵物Xp(t)的行為為Xi(t+1),其對應的數學模型有: D=|C·Xp(t)-Xi(t)| (3) Xi(t+1)=Xp(t)-A·D (4) A=2ar1-a (5) C=2r2 (6) (7) 其中:式(4)為灰狼的位置更新公式;Xp(t)為獵物第t代時的位置向量;Xi(t)為灰狼個體第t代時的當前位置;A、C為系數向量;t為當前的迭代次數,ɑ為收斂因子,ɑ隨著t的增加從2線性遞減到0;r1和r2為[0,1]之間的隨機向量;tmax為最大迭代次數. 2)獵捕 當灰狼判斷出獵物的位置時,需要灰狼向獵物移動,其中灰狼β、δ在灰狼α帶領下引導狼群ω對獵物采取包圍行動,由于灰狼α、β、δ的位置是最靠近獵物的,所以將利用這3匹狼的位置判斷獵物的位置,逐漸向獵物移動,進行獵捕.對應的數學模型有: Dα=|C1·Xα(t)-Xi(t)| (8) Dβ=|C2·Xβ(t)-Xi(t)| (9) Dδ=|C3·Xδ(t)-Xi(t)| (10) 其中,Dα,Dβ和Dδ分別表示α、β和δ與其他個體間的距離;Xα(t),Xβ(t)和Xδ(t)分別代表α、β和δ的當前位置;C1,C2,C3是隨機向量;Xi(t)是當前灰狼群體的位置. X1=Xα(t+1)=Xα(t)-A1·Dα (11) X2=Xβ(t+1)=Xβ(t)-A2·Dβ (12) X3=Xδ(t+1)=Xδ(t)-A3·Dδ (13) (14) 其中:前3個式子分別定義了狼群中ω個體朝向α、β、δ前進的步長和方向,Xi(t+1)是ω的更新位置即最終群體歷史最優(yōu)解. 3)攻擊 最后一個過程為攻擊階段,狼群需要完成抓獲獵物這一目標,即灰狼群算法獲得最優(yōu)解.通過前兩步可知,ɑ有著調節(jié)算法的全局搜索與局部開發(fā)的作用.在迭代過程中,當ɑ的值從2線性下降到0時,其對應A的值也在區(qū)間[-ɑ,ɑ]內變化.當│A│≤1時,狼群才能攻擊獵物(陷入局部最優(yōu)),這樣GWO算法才有良好的局部開發(fā)能力.當│A│>1時,包圍區(qū)域擴大,灰狼群能分散開搜索獵物更可能的位置,這就形成了全局搜索. 3.2.2 非線性調整收斂因子 大多數的群智能優(yōu)化算法中普遍存在著共同的問題:局部開發(fā)性能與全局搜索性能的調節(jié)問題.由上一節(jié)公式(7)可知,ɑ在迭代的過程中,由2線性遞減到0,但是結合實際優(yōu)化情況看,GWO算法的搜索過程很復雜,收斂因子ɑ線性遞減的策略不能體現實際優(yōu)化的過程,所以收斂因子ɑ應該采用非線性變化策略. 文獻[16]中提出用正弦三角函數來改進收斂因子,即: (15) 文獻[17]中提出了用正切三角函數來改進ɑ的策略公式,即: (16) 然而,該公式的收斂因子ɑ能達到非線性變化,但是圍獵的區(qū)間和非線性變化不是很理想,A的變化也會受到影響,同時會影響全局的搜索能力.針對上述不足情況,受PSO算法的啟發(fā),和sin函數在[π/2,π]區(qū)間上非線性的遞減的影響,本文將提出一種基于sin的收斂因子ɑ迭代公式,即: (17) 其中,ɑinitial和ɑfinal表示收斂因子ɑ的初始值和最終值,本文取ɑinitial=2;ɑfinal=0;t為當前的迭代次數,tmax為最大迭代次數,ε為非線性調節(jié)參數,(ε>0).而且上述改進公式相對于公式(15)的區(qū)間減小了一半,公式(15)的改進雖然使ɑ在規(guī)定的區(qū)間[π/2,π]內非線性的變化,但在[0,π/2]區(qū)間上sin函數是非線性增加的,所以在進化過程中按照上述公式(17)進行優(yōu)化,更符合收斂因子ɑ的實際變化. 3.2.3 適應度加權調整位置更新 由上一節(jié)的公式(11)-公式(14)可知,群體中的其他灰狼個體ω是根據當前最優(yōu)的3頭狼進行更新其位置,可以看出標準的GWO的位置更新只有好的開發(fā)能力而忽略了搜索能力,所以需要改進位置更新公式來協調群體和個體對GWO的搜索能力,以及保證狼群能快速有效的跳出局部最優(yōu),從而提高了GWO的尋優(yōu)能力. 文獻[18]可知,提出了加權距離灰狼群優(yōu)化算法,利用最佳位置的加權總和來改進位置更新公式,即: (18) (19) (20) (21) (22) (23) ω1=A1·C1,ω2=A2·C2,ω3=A3·C3 (24) (25) 文獻[19]可知,為了進一步加快算法的收斂速度,提出了一種適應度加權的位置更新公式,權重不再是固定的1/3,而是通過當前最優(yōu)的3匹狼的適應度來更新權重.即: (26) (27) 其中,fα,fβ,fδ分別為α、β、δ當前的適應度. 通過以上文獻,可以看出適應度加權的位置更新更適合GWO算法優(yōu)化過程的進行,適應度在優(yōu)化過程中有著很重要的作用,利用當前最優(yōu)的3匹狼的適應度來更新權重,3者的適應度不同也能表現出不同的貢獻度,不再是標準的GWO的固定權重.最后不管怎么迭代,灰狼群體不再受歷史狼群的影響,更符合狼群的多樣性的原則.所以本文利用文獻[19]的適應度加權和受PSO算法的粒子位置的影響,提出一個適合本研究的適應度加權位置更新公式如下: (28) (29) (30) f=fα+fβ+fδ (31) 在獵捕過程,是由當前3個狼的位置信息,更新其他狼個體ω的位置Xi(t+1),而在整個GWO算法優(yōu)化過程中,是根據適應度函數的值來比較確定前3個α、β、δ狼的位置信息,所以可以用當前3個狼的適應度值加權作為3個α、β、δ狼的位置系數,來更好的反應灰狼群的多樣化,從而使GWO算法的開發(fā)能力和搜索能力更好的協調.其中,μ為很小的數,在本文將取值0.01,來防止樣本輸出的誤差為0,minRi為目標函數,MSEi為第i個個體對應的目標誤差函數,MSEi的值越小代表預測精度越高,而fi為第i個個體的適應度函數.在這里引入目標誤差函數,用所有樣本的均方誤差(1+Ri)的倒數來代表個體的適應概率即fi.由于本改進算法中適應度的大小代表灰狼個體的位置優(yōu)越度,適應度大的灰狼個體的位置代表最優(yōu)解. 綜上所述,本文提出新的優(yōu)化RBF網絡的預測算法,記為NNCA-IGWO-RBF預測算法. 算法2.NNCA-IGWO-RBF預測算法的描述 輸入:高斯函數的寬度r,種群規(guī)模SN,最大迭代次數tmax,收斂因子的初始值ɑinitial和終止值afinal,非調節(jié)參數ε,當前迭代次數t,μ 輸出:聚類中心Cl、新的權值和新的RBF模型結構 1.通過算法1構建RBF神經網絡的聚類中心Cl,初始權值W 2.將待優(yōu)化的權值參數W=[W11,W12,…,W1nr,W21,W22,…,Wmnr]映射為人工狼群的位置向量{Xi,i=1,2,…,SN} 3.計算群體中每個個體的適應度值{f(Xi),i=1,2,…,SN},通過比較產生當前最優(yōu)個體α、次優(yōu)個體β以及第3優(yōu)個體δ,確定其對應的位置Xα、Xβ和Xδ 4.while(t 5.fori=1 toSNdo: 6.forj=1 tom*nrdo: 7.根據式(17)計算收斂因子ɑ的值 8.根據式(5)和式(6)計算A和C(系數)的值 9.根據式(30)更新個體ω的位置 10.end for 11.end for 12.計算群體中的個體的適應度值{f(Xi),i=1,2,…,SN},更新α、β和δ對應的位置Xα、Xβ和Xδ 13.t=t+1 14.end while 15.將Xα映射為權值矩陣W 16.構建新的RBF神經網絡結構模型 17.結束處理 草原環(huán)境的污染主要受周邊環(huán)境污染物的影響,本文將利用NNCA-IGWO-RBF預測算法,對賽汗塔拉城中草原的首要污染物(PM10)進行建模預測.因此,選擇最近的包頭市環(huán)境監(jiān)測站,能監(jiān)測到草原環(huán)境的周邊污染物數據[20].本文的實驗數據將選取該站點從2018年1月1日-2020年5月31日期間的數據,在此之前需要對離散的原始數據進行24h均值處理.污染物數據來源于空氣質量歷史數據網(1)https://quotsoft.net/air/;氣象數據來源于天氣網(2)https://weather.com.cn/.從均值處理后的數據可以看出,初步預選的特征因子:污染物因素(PM2.5、PM10、SO2、O3、CO、NO2),氣象因素(風速、溫度、濕度),如表1所示. 表1 預選特征因子的描述 表1為初步預選因子的匯總,包括:前1天24h均值處理的PM10、PM2.5、SO2、O3、CO、NO2濃度值,前2天24h均值處理的PM10、PM2.5、SO2、O3、CO、NO2濃度值,當天24h均值處理的PM2.5、SO2、O3、CO、NO2的濃度值,當天的風速,當天的濕度,當天的溫度. 為了解決實驗數據x的數量級統一,在算法訓練之前進行歸一化處理,將數據歸一化到區(qū)間[0.2,0.8]作為樣本數據,同時使神經網絡在訓練當中,避免了出現神經元飽和的現象.歸一化公式如下: (32) 式(32)中x′為歸一化后的數據,xmax、xmin為各項原始數據序列中不同時間內的最大值、最小值. 針對影響目標因子(PM10_24h)的預選特征因子,通過Pearson相關分析法進行相關系數的分析,確定更有代表性的輸入因子.Pearson用來分析篩選特征因子和目標因子的相關性強弱,其絕對值的范圍在[0,1]之間.其中相關系數的絕對值越大,相關度越強,相關系數越接近于1或-1,相關度越強;相關系數越接近于0,相關度越弱.假設2個變量元素{x,y},變量x與變量y的相關系數公式為: (33) 表2 PM10_24h與20個預選特征因子的相關系數矩陣 由表2可以知,將選擇顯著相關、高度相關、中度相關的特征因子R1、R4、R7、R10、R13、R18、R19、R20作為RBF神經網絡的輸入因子,而剔除低度相關、微弱相關的特征因子. 本文將通過平均相對誤差(Mean Relative Error,MRE)、平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)3種指標,來確保更好地分析算法的預測性能.將利用獲取的771組訓練集數據進行預測模型的訓練,對110組測試集數據進行驗證預測模型的精確度,其計算公式分別如下: (34) (35) (36) 將以8個具有代表性的特征因子為預測模型的輸入因子,而當天的PM10_24h濃度值為輸出因子,即在構建草原環(huán)境污染物的預測模型中,輸入節(jié)點數為8個,輸出節(jié)點數為1個,即NNCA-IGWO-RBF預測模型結構為8-nr-1,網絡結構圖如圖1所示.在此預測模型中,首先對歸一化后的樣本數據進行分組,共采集881組實驗數據,其中771組為訓練集數據,通過NNCA-IGWO-RBF預測算法進行模型的參數(Cl,W,r)的訓練;而110組測試集數據進行驗證模型的性能,從而得到更穩(wěn)定的預測模型.在NNCA-IGWO-RBF網絡訓練中,寬度常數r需要事先確定,通過大量的實驗對比,確定r的取值為0.3;其中最大迭代次數tmax=150,種群數量SN=80,初始值ɑinitial=2和終止值afinal=0,ε=2,t=0,μ=0.01.通過測試集驗證該模型,預測的結果與真實值的擬合情況,如圖2所示. 圖2 PM10_24h真實值和預測值的比較 從圖2可知,NNCA-IGWO-RBF算法的預測值與真實值的大部分樣本擬合度較高,個別的樣本擬合度較小,其中平均相對誤差為1.77%,平均絕對誤差為0.869μg/m3,最大的絕對誤差為6.133μg/m3,最小絕對誤差為0.003μg/m3,均方根誤差為1.301μg/m3. 為了進一步地驗證NNCA-IGWO-RBF算法的預測性能,將其與傳統RBF、GWO-RBF的預測算法進行對比,結果如表3所示. 表3為以上3種不同算法在平均相對誤差MRE、平均絕對誤差MAE、均方根誤差RMSE的預測性能對比情況.傳統的RBF算法對PM10_24h濃度預測值和實際值擬合度不高,它們在RBF網絡的學習參數調節(jié)上,易出現學習參數多而難以調節(jié),使RBF網絡陷入局部最優(yōu);與GWO-RBF算法、NNCA-IGWO-RBF算法相比,其預測的誤差較大.而對于GWO-RBF預測算法,其結果的預測誤差相對較小,但預測性能并沒有得到明顯的改善,是因為GWO-RBF預測算法只利用GWO優(yōu)化RBF的權值參數,忽略了RBF網絡的聚類參數也容易學習不足,從而導致了其預測精度低,泛化能力弱.NNCA-IGWO-RBF算法的MRE為1.77%、MAE為0.869μg/m3、RMSE為1.301μg/m3,這3個值和其他兩種預測算法相比,其預測誤差最小,預測效果明顯提高,是因為利用最近鄰聚類算法(NNCA)優(yōu)化RBF網絡的聚類參數,然后再利用IGWO算法優(yōu)化其權值參數,從而達到共同調節(jié)RBF網絡學習參數的優(yōu)化問題.其中,3種不同算法的預測結果和真實值的擬合情況,如圖3所示. 表3 不同算法的預測性能對比 圖3 3種不同算法的PM10_24h濃度預測對比 從圖3對比分析可知,NNCA-IGWO-RBF預測算法在PM10_24h濃度預測上要優(yōu)于其他兩種預測算法.因此,本文提出的預測算法對PM10_24h濃度期望值擬合度更高,且預測誤差最小,說明NNCA-IGWO-RBF算法的整體預測結果更精確,且具有很好的泛化能力,在此說明對于草原環(huán)境污染物的預測有一定的實用性和有效性. 本文提出一種組合最近鄰聚類算法(NNCA)和改進灰狼群(IGWO)優(yōu)化RBF神經網絡的預測算法.該算法通過最近鄰聚類算法調整RBF神經網絡的聚類中心參數,然后利用改進的GWO算法調整RBF神經網絡的權值參數,從而共同優(yōu)化RBF網絡的學習參數.最后將優(yōu)化后的算法應用于城中草原環(huán)境污染物PM10的預測中.結果表明,與其他2種算法相比,該算法的預測誤差最小,預測精度較高且泛化能力強,具有一定的實用性和有效性.但是在預測過程中,其他氣象因素(天氣狀況、壓強等)也對PM10有所影響,后續(xù)有待進一步研究.3.2 改進灰狼群優(yōu)化算法

3.3 NNCA-IGWO優(yōu)化RBF網絡的預測算法
4 實驗結果與分析
4.1 實驗數據的選取和處理

4.2 特征因子的降維處理


4.3 算法性能的評價指標

4.4 結果分析



5 結束語