龔 榮,謝寧新,李德倫,洪麗啦
(廣西民族大學 a.人工智能學院,b.電子信息學院,廣西 南寧 530006)
隨著經濟快速發(fā)展,城市工業(yè)和城鎮(zhèn)化排放的大量污染氣體造成嚴重的空氣污染。空氣污染對人類健康的危害逐日遞增,環(huán)保部門逐漸重視空氣質量監(jiān)測,并實時發(fā)布監(jiān)測數(shù)據。為增強空氣質量預警能力和提高預警的精確度,學者們提出了多種空氣質量指數(shù)(Air Quality Index,AQI)預測模型。精準的預測模型能夠有效改善城市人民的生活,更是有效治理城市大氣污染的突破口之一。空氣質量指數(shù)通常反映了空氣污染的變化趨勢,可為空氣污染治理措施提供數(shù)據支撐。由于AQI的復雜性和非線性等原因導致預測精度低、穩(wěn)定性差。[1]
目前,學者提出了多種模型來預測空氣質量指數(shù),主要有時間序列模型、回歸統(tǒng)計模型、神經網絡模型[2]、組合預測模型[3]、機器學習預測模型[4]以及人工智能模型[5]等。這些模型在預測空氣質量指數(shù)上都各有優(yōu)勢和不足。神經網絡模型在處理非線性問題中表現(xiàn)良好的性能,引起學者的廣泛關注。張辰等人[6]提出深度神經網絡預測空氣質量,在一定程度上提高了預測準確性,但預測模型在訓練大量數(shù)據過程中需要耗費較多的時間。張旭等人[7]運用粒子群算法和遺傳算法優(yōu)化BP神經網絡預測PM2.5濃度,較單獨使用BP神經網絡預測具有更強的性能。但BP網絡的反向傳播更新參數(shù)過程中存在訓練速度慢、訓練過程比較復雜等問題。
極限學習機(Extreme Learning Machine,ELM)[8]是Huang等人基于廣義逆矩陣理論提出的一種神經網絡,該方法能夠在極短時間內快速獲得較好的泛化能力,且能夠避免神經網絡因訓練網絡而產生的耗時問題。周伯榮等人[9]將ELM用于短時交通流預測,比其他模型耗時更少。ELM預測模型通常采取隨機生成輸入權重和偏置,從而導致了預測精度不高。針對這個問題,學者們運用優(yōu)化算法的強大優(yōu)化能力優(yōu)化ELM的參數(shù),鄭皓天等人[10]將粒子群算法和ELM結合運用在火災探測模型中,提高了火災探測能力;汪慧陽等人[11]將遺傳算法和ELM結合用于通信干擾評估,相比傳統(tǒng)方法具有更優(yōu)的評估結果。隨著對優(yōu)化算法的深入研究,學者提出了一系列優(yōu)化能力更強的優(yōu)化算法。其中海洋捕食者算法(Marine Predator Algorithm,MPA)[12]同其他算法相比具有更好的優(yōu)化能力,該算法是由Faramarzi等人提出的一種新的元啟發(fā)式算法。MPA在解決實際問題中展現(xiàn)出了較好的優(yōu)化能力,但仍然存在優(yōu)化能力不足的問題。
為了提升MPA的性能,本文提出了一系列改進方法來提高算法優(yōu)化能力。首先在MPA中通過隨機生成初始種群,使得初始解在搜索空間分布不均,導致初始種群多樣性不足。本文運用準反射學習策略對MPA種群進行初始化,增強算法種群的多樣性,提升算法的探索能力。其次MPA的全局搜索能力不足,本文使用柯西擾動思想降低算法陷入局部桎梏的可能,在一定程度上能夠提升算法的全局搜索能力。由于MPA算法在迭代過程中部分維度還未達到最優(yōu),本文通過縱橫交叉策略實現(xiàn)對維度間的學習,進一步提升搜索精度。最后將改進后的算法優(yōu)化ELM的參數(shù),構建了一種IMPA-ELM模型用于空氣質量指數(shù)預測。實驗結果表明本文所提IMPA-ELM模型在空氣質量指數(shù)預測方面具有較高的精度和可靠性。
MPA的靈感來源于海洋生物的萊維運動和布朗運動捕食策略,以及捕食者和獵物之間的最佳遭遇策略。MPA也是一種基于種群的優(yōu)化算法,若種群數(shù)量為n并且個體維度為d,則用公式(1)表示初始種群。
公式(1)中,Xij表示第i個個體在第j維上的值,i∈[0,n],j∈[0,d]。Xmin和Xmax分別表示搜索空間的下界和上界。
MPA中的精英矩陣和獵物矩陣,分別用公式(2)、公式(3)表示:
公式(2)中,XI表示精英捕食者向量,精英矩陣是由該向量復制n次而構建。MPA的優(yōu)化過程是根據不同的速度比分為3個階段。第1階段:高速比階段(v≥10),該階段發(fā)生在迭代前期。該階段主要進行勘探行為,其位置更新如下:
在上述公式中,表示服從布朗運動的隨機數(shù)向量。P=0.5是一個常數(shù),∈(0,1)是一個均勻分布的隨機向量。
第2階段:單位速度比階段(v=1),該階段發(fā)生在迭代中期。該階段表示種群從勘探到開發(fā)的過渡,此時整個種群被劃分為兩個部分,其中一部分負責勘探,另一部分負責開發(fā)。其位置更新如下:
在上述公式中,表示萊維分布的隨機數(shù)向量;CF表示移動步長。
第3階段:低速比階段(v=0.1),該階段發(fā)生在迭代后期。該階段主要負責開發(fā)。其位置更新如下:
MPA中考慮到捕食環(huán)境變化對捕食者的影響,此階段的位置更新所示:
公式(13)中,F(xiàn)ADs=0.2表示受捕食環(huán)境變化影響的概率,U→是一個只包含0和1的二進制向量。r是[0,1]中的均勻隨機數(shù)表示種群中兩個不重復的隨機個體。
極限學習機是一種單隱層前饋神經網絡(Single-hidden Layer Feedforward Neural Network,SLFNs)[8]。極限學習機不需要像BP神經網絡中通過反向傳播訓練使誤差降低。所以ELM不僅能減少預測模型的運算量,并且該模型的學習效率高、泛化能力強。
極限學習機由輸入層、隱藏層、輸出層組成。假設有N個樣本數(shù)據為1,2,3,…,N},若具有L個隱藏層神經元,激活函數(shù)為g( ? ),則輸出層的輸出結果可用下式表示:
在ELM模型中,ω和b的值是隨機生成的,而參數(shù)β則需要計算,因此ELM模型的主要任務是對參數(shù)β的計算。而在模型訓練過程中,其輸出結果表示為:
公式(15)中,H為隱藏層節(jié)點的輸出,β為輸出權重,T為輸出層節(jié)點的期望輸出。其H,β,T用矩陣分別表示為:
為了能夠在模型訓練結束后,期望訓練的結果最大程度接近真實值,只需要ELM模型滿足公式(18)即可。
公式(18)通過數(shù)學方法可以求出:
其中,H+為矩陣H的Moore-Penrose廣義逆。
在MPA中種群的初始化是隨機生成的。這種方式使得初始解在搜索空間分布不均,導致初始種群多樣性不足。因此本文提出準反射學習(quasi-reflection-based learning,QRBL)[13]初始化種群來增強MPA初始種群的多樣性,提升算法的探索能力。
準反射學習也稱擬反射學習,是反向學習(opposition-based learning, OBL)的一種變體。文獻[14]表明準反射學習比反向學習更可能接近全局最優(yōu)解。定義1和定義2給出了準反射學習的概念。
定義1若x為實數(shù)并且x∈[a,b],那么x的準反射數(shù)可表示為xˉqr=rand((a+b)/2,x),其中rand()表示服從均勻分布的隨機數(shù)。
定 義2若P={x1,x2,…,xn}為 一 個n維 向 量 空 間 的 點,其 中x1,x2,…,xn都 為 實 數(shù) 且xi∈[a,b],?i∈{1,2,…,n}。則P的 準 反 射 點,其 中可 表 示 為,而rand((ai+bi)/2,xi)表示在(ai+bi)/2與xi之間均勻分布的隨機點。
準反射學習引入到MPA中的種群初始化階段生成初始種群的具體步驟為:假設算法初始種群數(shù)量為n,首先通過隨機策略生成n個個體,再用準反射學習方法生成n個個體。然后計算適應度函數(shù)值,根據適應度函數(shù)值選擇最優(yōu)個體,這種方法能夠有效地遍歷搜索空間,一定程度上能夠增加找到全局最優(yōu)解的概率。
柯西變異[15]來源于柯西分布,一維標準柯西分布的概率密度函數(shù)表達式為:
圖1為兩種常見分布的概率密度函數(shù)曲線,從圖1可以看出柯西分布兩端更扁平,趨近于0的趨勢更平緩,速度更緩慢,并在原點附近的峰值小于高斯分布。本文將柯西變異引入MPA的位置更新中,發(fā)揮其擾動能力,能夠在一定程度上提升算法的全局尋優(yōu)能力?;诳挛髯儺惖奈恢酶路绞綖椋?/p>

圖1 標準高斯分布、柯西分布概率密度函數(shù)曲線
公式(21)中,Cauchy表示服從柯西分布的柯西算子,Xi為當前獵物的位置,Xnewi為柯西擾動后獵物的位置。
MPA算法在迭代過程中,尤其是在迭代后期過程中,個體同化程度逐漸升高,某些個體的部分維度未達到最優(yōu),導致了這些個體的適應度差。因此在FADs影響后的種群中引入縱橫交叉策略[16-17]對種群個體進行修正,該策略能夠加快算法的收斂速度,提高算法的精度。
2.3.1 水平交叉
水平交叉是指對兩個不同的個體在所有維度上進行算術交叉,使得不同個體之間能夠相互學習,增強搜索能力。在執(zhí)行水平交叉時,將設置兩兩不重復的父代個體X(i)和X(j),并且以交叉概率p1進行算術交叉,通常設置p1=1。父代交叉通過公式(22)、(23)產生子代個體:
公式(22)、(23)中,r1、r2均為[0,1]之間的隨機數(shù);c1、c2均為[-1,1]之間的隨機數(shù);X(i,d)、X(j,d)分別表示為第d維的父代X(i)和X(j)分別表示為父代X(i)、X(j)在第d維交叉后產生的子代。生成的子代個體與父代個體進行競爭,最終保留最優(yōu)個體。
2.3.2 垂直交叉
垂直交叉是指兩個不同維度之間對所有個體進行算術交叉。在迭代過程中,垂直交叉搜索的父種群是來自水平交叉的優(yōu)勢種群,這就能夠防止種群陷入局部最優(yōu)。垂直交叉只產生一個子代個體,為停滯維度提供跳出局部最優(yōu)的機會,而不會破壞另一個可能是全局最優(yōu)的維度。假設對個體i的第d1維和d2維進行垂直交叉,子代個體可通過公式(24)得到:
基于上述分析,改進后的海洋捕食者算法流程圖如圖2所示。

圖2 改進后的海洋捕食者算法流程圖
ELM中輸入權重和偏置這兩個參數(shù)具有不確性,導致ELM預測出現(xiàn)精度低的問題。為解決該問題,本文利用IMPA對ELM的輸入權重和偏置這兩個參數(shù)優(yōu)化,從而建立IMPA-ELM模型并將應用到空氣質量指數(shù)預測中。
在建立預測模型中首先需要對數(shù)據進行歸一化處理。歸一化處理便于消除量綱差異對預測結果的干擾,能夠加快程序收斂速度。歸一化公式如公式(25)所示:
其中,X為歸一化后的數(shù)據,x為原始數(shù)據,xmin、xmax分別代表原始數(shù)據中的最小值和最大值。
基于IMPA-ELM的空氣質量指數(shù)預測流程圖如圖3所示。

圖3 IMPA-ELM模型預測流程圖
為驗證本文所提方法的有效性,本文使用的數(shù)據來自華為杯第十八屆中國研究生數(shù)學建模提供的數(shù)據。該數(shù)據集提供了從2019年4月16日至2021年7月12日的6種污染物,包括SO2、NO2、O3、CO、PM2.5、PM10的監(jiān)測濃度。由于受監(jiān)測數(shù)據權限和監(jiān)測設備功能限制,部分污染物監(jiān)測數(shù)據缺失,經過分析所給數(shù)據的關聯(lián)性,利用各污染物的日均值對數(shù)據的缺失值進行填充。在應用預測算法前,應將數(shù)據集中的異常值作為噪聲去除,否則預測結果會出現(xiàn)較大的誤差。經過處理后的數(shù)據集的各項統(tǒng)計指標如表1所示。本文按照大約8∶2的比例劃分訓練集和測試集,選取2019年4月16日至2021年3月15日的數(shù)據作為訓練集,選取2021年3月16日至2021年7月12日的數(shù)據作為測試集。實驗環(huán)境是在操作系統(tǒng)為Windows 11、處理器為Intel Core i7 2.90 GHz、內存為16 GB和MATLAB R2014b上完成的。

表1 各項數(shù)據統(tǒng)計指標
為了定量評估所提模型的預測性能,本文采用表2所示的3個指標對不同模型的預測結果進行比較。這3個指標主要衡量了預測值和真實值之間的偏差,反映了模型的預測精度,其值越小則表明模型預測精度越高。

表2 三種評估指標
為了比較所提出的IMPA-ELM預測模型的有效性,本文將粒子群算法(Particle Swarm Optimization,PSO)[18]、鯨魚優(yōu)化算法(Whale Optimization Algorithm,WOA)[19]分別和ELM結合構造了兩種預測模型,簡寫為PSO-ELM和WOA-ELM。同時也使用ELM作為對比實驗。為確保實驗的公平性,本文將優(yōu)化算法的種群規(guī)模設為20,優(yōu)化參數(shù)的搜索范圍設為[-1,1],算法的最大迭代次數(shù)設為100。由于智能算法存在一定的隨機性,因此本文將每種算法獨立重復運行10次。此外ELM的隱含層節(jié)點數(shù)設為100,激活函數(shù)使用sigmoid。在實驗過程中粒子群算法的相關參數(shù)設置為c1=1.495,c2=1.495,ω=1,ωdamp=0.99;鯨魚優(yōu)化算法的相關參數(shù)設置為b=1。
為了直觀說明IMPA-ELM預測模型的效果,圖4給出了四種模型預測空氣質量指數(shù)的預測結果圖,表3給出了四種模型在預測空氣質量指數(shù)的預測誤差;圖5為對應的直方圖。從表3可以看出在各個誤差指標下誤差最小的是IMPA-ELM模型,表明本文所提的預測模型能顯著提升空氣質量指數(shù)的預測能力;在預測誤差上,IMPA-ELM模型的平均RMSE、平均MAE和平均MAPE分別為4.287、2.188、3.933%,和ELM相比,IMPA-ELM的三種誤差平均值分別降低了30.78%、40.98%、43.84%;和PSO-ELM模型相比,IMPAELM模型的誤差分別降低了34.35%、18.11%、11.38%;和WOA-ELM模型相比,IMPA-ELM模型的誤差分別降低了32.55%、20.35%、16.50%。

表3 四種模型的平均預測誤差
從圖4可以看出IMPA-ELM模型在預測中能體現(xiàn)出更好的效果,相比其他幾種預測模型在部分單點處的預測效果更好,這說明IMPA-ELM模型的泛化能力更好,能實現(xiàn)較高的擬合精度。圖5表明IMPA-ELM模型在空氣質量指數(shù)預測問題上和其他模型相比具有明顯的優(yōu)勢,而PSO和WOA優(yōu)化的ELM模型在預測中泛化能力差,導致RMSE高于ELM預測結果。表明IMPA算法可以進一步提高全局搜索能力,能有效優(yōu)化ELM的權重和偏置。

圖4 四種模型的空氣質量指數(shù)預測值與真實值的比較

圖5 四種模型的平均預測誤差對比圖
本文針對ELM預測過程中輸入層到隱藏層權重和偏置隨機初始化導致預測結果精度不高的問題,提出了IMPA-ELM的預測模型。利用改進后的海洋捕食者算法優(yōu)化ELM的權重和偏置,將優(yōu)化后的ELM模型用于空氣質量指數(shù)預測。實驗結果表明,本文所提出的預測方法相對于其他幾種預測方法在預測精度和可靠性方面更具有優(yōu)勢。