莊玉冊,黎 蔚
(1. 信陽學(xué)院 數(shù)學(xué)與信息學(xué)院,河南 信陽 464000; 2. 河南科技大學(xué) 信息工程學(xué)院,河南 洛陽 471003)
近幾十年,空氣質(zhì)量的評價(jià)和預(yù)報(bào)研究獲得了較大進(jìn)展,指數(shù)法、層次決策法、主成分分析法、模糊理論和灰色系統(tǒng)分析等被很多學(xué)者應(yīng)用于空氣質(zhì)量評價(jià)和預(yù)報(bào).隨著計(jì)算機(jī)技術(shù)的發(fā)展和一些新學(xué)科的創(chuàng)立,國內(nèi)外又產(chǎn)生和提出很多新的方法和理論進(jìn)行多種空氣質(zhì)量的評價(jià)和預(yù)報(bào),這些方法主要有物元可拓法[1]、投影尋蹤分析法、集對分析法、新的指數(shù)評價(jià)法、遺傳優(yōu)化法及多種方法的耦合模型[2-3]等.由于上述評價(jià)和預(yù)報(bào)方法的數(shù)學(xué)基礎(chǔ)不同,因此它們的適用范圍和適用對象差異也較大,各有優(yōu)缺點(diǎn),這些方法是在原有空氣質(zhì)量評價(jià)和預(yù)報(bào)方法的基礎(chǔ)上改進(jìn)、豐富和發(fā)展而來.由于受到多種因素的影響,大氣污染物濃度的變化具有較強(qiáng)的非線性特性,很難用確定的數(shù)學(xué)模型描述,要對其進(jìn)行較為準(zhǔn)確的預(yù)測,就必須采用能捕捉非線性變化規(guī)律的預(yù)報(bào)方法,傳統(tǒng)統(tǒng)計(jì)預(yù)報(bào)方法或數(shù)值預(yù)報(bào)局限性很大[4].
神經(jīng)網(wǎng)絡(luò)具有獨(dú)特的聯(lián)想、記憶和學(xué)習(xí)功能,因此得到廣泛應(yīng)用.由于空氣質(zhì)量指數(shù)變化具有很強(qiáng)的非線性特征,結(jié)合神經(jīng)網(wǎng)絡(luò)強(qiáng)大的泛化能力和非線性刻畫能力,本文運(yùn)用極限學(xué)習(xí)機(jī)神經(jīng)網(wǎng)絡(luò)模型對A市空氣質(zhì)量進(jìn)行預(yù)報(bào)研究,并針對標(biāo)準(zhǔn)極限學(xué)習(xí)機(jī)神經(jīng)網(wǎng)絡(luò)存在收斂速度慢和局部最優(yōu)的問題,運(yùn)用粒子群算法優(yōu)化極限學(xué)習(xí)機(jī)神經(jīng)網(wǎng)絡(luò)的權(quán)值和閥值,提高了A市空氣質(zhì)量預(yù)報(bào)結(jié)果的準(zhǔn)確率.
極限學(xué)習(xí)機(jī)(ELM)是一種新型的單隱含層前饋神經(jīng)網(wǎng)絡(luò)(single-hidden layer feed-forward neural networks,SLFNs),是在Moore-Penrose矩陣?yán)碚摶A(chǔ)上所提出的快速學(xué)習(xí)算法,其結(jié)構(gòu)示意圖如圖1所示.

圖1 ELM結(jié)構(gòu)示意圖Fig.1 Schematic structure of ELM


(1)
式中:ai=[ai1,ai2,…,ain]T為連接第i個(gè)隱藏層結(jié)點(diǎn)的輸入權(quán)值;bi為第i個(gè)隱藏層結(jié)點(diǎn)的偏置;βi=[βi1,βi2,…,βim]T為連接i個(gè)隱藏層結(jié)點(diǎn)的輸出權(quán)值.上述N個(gè)方程的矩陣形式可寫為
Hβ=T
(2)
式中:
E(W)表示期望值和實(shí)際值之間的誤差平方和,問題求解就是尋找最優(yōu)的權(quán)值W=(a,b,β)使代價(jià)函數(shù)E(W)最小,其數(shù)學(xué)模型[7-9]可表示為
(j=1,2,…,N)
(3)
式中,εj=[εj1,εj2,…,εjm]為第j個(gè)樣本的誤差.
粒子群算法是一種模擬鳥群覓食的群體智能算法,每個(gè)粒子表示一個(gè)可能解向量,粒子的好壞根據(jù)適應(yīng)度函數(shù)值進(jìn)行判斷,并通過向全局和個(gè)體最優(yōu)解學(xué)習(xí)實(shí)現(xiàn)粒子位置和速度的不斷更新,最終實(shí)現(xiàn)全局尋優(yōu)的目的.若Xi=(Xi1,Xi2,…,Xid)和Vi=(Vi1,Vi2,…,Vid)分別表示粒子的位置和粒子的速度,粒子的速度和位置的更新策略表達(dá)式[10-11]為
(4)
(5)

在保證空氣質(zhì)量指數(shù)預(yù)報(bào)誤差最低的情況下,通過PSO優(yōu)化ELM的權(quán)值和閥值.由于ELM需要優(yōu)化的參數(shù)為權(quán)值和閥值,其適應(yīng)度函數(shù)[12-13]可用式(3)進(jìn)行表示,但權(quán)值和偏置的取值范圍均在0~1之間.
PSO優(yōu)化ELM的空氣質(zhì)量預(yù)報(bào)算法流程如下:
1) 歸一化空氣質(zhì)量樣本數(shù)據(jù),建立訓(xùn)練樣本和測試樣本;
2) 設(shè)定PSO算法的種群大小,最大迭代次數(shù)及學(xué)習(xí)因子c1、c2;
3) 將構(gòu)建出的訓(xùn)練樣本輸入ELM,根據(jù)目標(biāo)函數(shù)式(3)計(jì)算粒子個(gè)體的適應(yīng)度函數(shù)值,尋找粒子個(gè)體和全局最優(yōu)粒子的位置和最優(yōu)值;
4) 更新粒子速度和位置;
5) 計(jì)算適應(yīng)度同時(shí)更新位置和速度;
6) 運(yùn)用PSO優(yōu)化ELM獲取的最優(yōu)參數(shù)ai、βi、bi,實(shí)現(xiàn)空氣質(zhì)量預(yù)報(bào).
為了評價(jià)空氣質(zhì)量預(yù)測結(jié)果的優(yōu)劣,選擇平均絕對百分比誤差(meanabsolutepercentageerror,MAPE)、均方根誤差(rootmeansquareerror,RMSE)和平均絕對誤差(meanabsoluteerror,MAE)作為預(yù)測結(jié)果的評價(jià)指標(biāo),評價(jià)公式為
(6)
(7)
(8)

為了驗(yàn)證本文算法的有效性和可靠性,本文選擇A市2016年9月14日~2017年3月31日的空氣質(zhì)量指數(shù)數(shù)據(jù)為研究對象,剔除無效數(shù)據(jù),剩余數(shù)據(jù)141組.將樣本數(shù)據(jù)分成兩個(gè)部分,前97組作為訓(xùn)練數(shù)據(jù),用來建立A市空氣質(zhì)量預(yù)報(bào)模型,后44組作為測試數(shù)據(jù)集,用來驗(yàn)證所建立模型的效果.粒子群算法參數(shù)設(shè)置如下:最大迭代次數(shù)為100,種群規(guī)模為10,學(xué)習(xí)因子c1=c2=2.極限學(xué)習(xí)機(jī)參數(shù)設(shè)置如下:輸入神經(jīng)元個(gè)數(shù)為3,隱含層神經(jīng)元個(gè)數(shù)為30,輸出層神經(jīng)元個(gè)數(shù)為1,ELM神經(jīng)網(wǎng)絡(luò)訓(xùn)練次數(shù)為10 000,學(xué)習(xí)速率為0.05,訓(xùn)練誤差目標(biāo)為0.001.PSO-ELM的訓(xùn)練結(jié)果和預(yù)測結(jié)果對比圖分別如圖2、3所示.
為了驗(yàn)證PSO-ELM算法的優(yōu)越性,將PSO-ELM算法與GA-ELM、SOA-ELM、DE-ELM及ELM算法進(jìn)行對比.GA算法參數(shù)設(shè)置如下:種群規(guī)模10,最大迭代次數(shù)100,交叉概率0.7,變異概率0.1;SOA算法參數(shù)設(shè)置如下:種群規(guī)模10,最大迭代次數(shù)100,最大隸屬度值Umax=0.950 0,最小隸屬度值Umin=0.011 1,權(quán)重最大值Wmax=0.9,權(quán)重最小值Wmin=0.1;DE算法參數(shù)設(shè)置如下:種群規(guī)模10,最大迭代次數(shù)100,縮放因子0.5,交叉概率0.7.不同算法預(yù)測結(jié)果分別如圖4~11所示.

圖2 PSO-ELM訓(xùn)練結(jié)果和實(shí)際值對比圖Fig.2 Comparison between training results and actual values by PSO-ELM

圖3 PSO-ELM預(yù)測結(jié)果和實(shí)際值對比圖Fig.3 Comparison between predicted results and actual values by PSO-ELM

圖4 GA-ELM訓(xùn)練結(jié)果和實(shí)際值對比圖Fig.4 Comparison between training results and actual values by GA-ELM
由表1不同算法空氣質(zhì)量預(yù)測結(jié)果對比可知,在RMSE、MAE和MAPE三個(gè)評價(jià)指標(biāo)上,PSO-ELM的預(yù)測精度最高,優(yōu)于GA-ELM、SOA-ELM、DE-ELM和ELM;其次,GA-ELM的預(yù)測精度優(yōu)于SOA-ELM、DE-ELM和ELM;ELM的預(yù)測精度最差.通過對比可知,運(yùn)用群智能算法對ELM的輸入權(quán)值、輸出權(quán)值和偏置進(jìn)行優(yōu)化,可以有效提高ELM的預(yù)測精度,其中PSO算法對ELM的優(yōu)化效果最好,較其他智能算法相比具有更高的預(yù)測精度.

圖5 GA-ELM預(yù)測結(jié)果和實(shí)際值對比圖Fig.5 Comparison between predicted results and actual values by GA-ELM

圖6 SOA-ELM訓(xùn)練結(jié)果和實(shí)際值對比圖Fig.6 Comparison between training results and actual values by SOA-ELM

圖7 SOA-ELM預(yù)測結(jié)果和實(shí)際值對比圖Fig.7 Comparison between predicted results and actual values by SOA-ELM

圖8 DE-ELM訓(xùn)練結(jié)果和實(shí)際值對比圖Fig.8 Comparison between training results and actual values by DE-ELM

圖9 DE-ELM預(yù)測結(jié)果和實(shí)際值對比圖Fig.9 Comparison between predicted results and actual values by DE-ELM

圖10 ELM訓(xùn)練結(jié)果和實(shí)際值對比圖Fig.10 Comparison between training results and actual values by ELM
空氣質(zhì)量指數(shù)變化具有很強(qiáng)的非線性特征,為避免標(biāo)準(zhǔn)極限學(xué)習(xí)機(jī)陷入局部最優(yōu),提出一種基于粒子群算法優(yōu)化極限學(xué)習(xí)機(jī)的空氣質(zhì)量預(yù)測模型.運(yùn)用粒子群算法優(yōu)化極限學(xué)習(xí)機(jī)神經(jīng)網(wǎng)絡(luò)的權(quán)值和閥值,實(shí)現(xiàn)極限學(xué)習(xí)機(jī)的權(quán)值和閥值的最優(yōu)選擇.研究結(jié)果表明,與ELM相比,PSO-ELM可以有效提高空氣質(zhì)量預(yù)測精度,具有較好的工程應(yīng)用前景和價(jià)值.

圖11 ELM預(yù)測結(jié)果和實(shí)際值對比圖Fig.11 Comparison between predicted results and actual values by ELM

表1 不同算法的對比結(jié)果Tab.1 Comparison results of different algorithms