巴艷坤,郭松林
(黑龍江科技大學電氣與控制工程學院,黑龍江哈爾濱150022)
截止到2021 年,全球已經有23414 萬人被確診為新冠肺炎,其中約有478萬病例死亡,220多個國家和地區受到巨大影響。由于新型冠狀病毒能通過多種方式進行傳播,如間接接觸、飛沫、氣溶膠等,因此新型冠狀病毒傳播速度非常快。該病癥的臨床表現有多種形式,主要有發熱、呼吸困難、渾身酸軟無力等,嚴重時可能會導致死亡。文獻[1-2]已經說明為了保障疫情的防控工作合理進行和有效調度,流行疾病的預測工作格外重要。文獻[3]表明國內外眾多學者已經做了很多工作,為了新冠肺炎疫情的發展趨勢進行預測。文獻[4]建立了非線性回歸點模型,對累計COVID-19疫情進行預測,并給了出參數估計方法;文獻[5]提出對于噪聲進行經驗模態分解可以對日新增確診人數進行有效預測。文獻[6]探討了差分自回歸移動平均模型(ARIMA)用于巴基斯坦新冠肺炎疫情發展趨勢的預測效果,為新冠肺炎疫情預測提供實踐經驗。研究表明新冠肺炎疫情的發展與時間變化存在一定的相關性,因此新冠肺炎日累計確診病例數是反映疫情變化發展的重要指標。基于此,本文建立了基于SSA 算法優化BP 神經網絡模型,對2021 年7 月2 日至9 月30日挪威新冠肺炎日累計確診病例數進行訓練和測試,為進一步掌握新冠肺炎疫情的發展規律和為全球疫情防控提供幫助。
本文分別把SSA 算法和GWO 算法與BP 神經網絡進行了融合,其中SSA 算法主要是對發現者、跟隨者和警戒者的位置更新進行迭代,GWO算法則是通過狼群的位置更新進行迭代。
麻雀搜索算法主要源于對麻雀覓食過程和躲避其他捕食者攻擊行為的啟發,麻雀在覓食期間,會將整個群體分配為發現者和跟隨者,發現者在種群中的作用最大,不僅需要尋找食物,還要為整個群體尋找覓食區域并提供方向;而跟隨者則需要跟隨發現者的飛行軌跡進行覓食行為。除此之外,當群體中的麻雀意識到危險時,還會隨機分配警戒者,做出反捕食行為。
2.1.1 發現者位置原始更新公式

式(1)中,為種群中第t 代第i 個個體的第d 維位置,α為(0,1]中的均勻隨機數,Q 為一個標準正態分布隨機數。R2為[0,1]中的均勻隨機數,ST為警戒閾值,取值范圍為[0.5,1.0]。當R2 2.1.2 跟隨者位置原始更新公式 式(2)中,、分別為當前群體中個體所占據的最優和最差位置。當i>n/2 時,說明第i 個個體適應度值較低,沒有收獲到食物,依然處于饑餓的狀態下,必須飛往另一個位置進行覓食。當i 2.1.3 警戒者位置更新公式 式(3)中,β為符合標準正態分布的隨機數,K為[1,1]的均勻隨機數,為一個較小的數防止分母唯一。其中fw為所有群體中最差的適應度值,fi為任意第i只麻雀的適應度值。當fi>f時,說明當前的麻雀正位于整個群體的邊緣,極有可能會遭到其他捕食者的捕獵行為。fi=fg時,說明群體中間的個體感受到了危險,必須靠近附近的其他麻雀來減少自己被捕食者攻擊的風險。 灰狼是一種群居的犬科動物,在其群體內部存在著非常嚴格的等級關系。在狼群處于支配地位的狼記為α狼,其對于整個算法來說被認為是最優解。α狼要領到整個狼群尋求生存。β狼是次優解,必須聽從于α狼,并幫助α狼對于群體的各種活動進行管理,在α狼去世后,β狼會成為狼的最佳繼承者,β狼可以支配除α狼外的其他所有層級上的狼。δ狼則可以支配除α狼和β狼之外的所有狼。ω狼,由于其處于群體等級的最底層,因此必須服從其他等級狼群的領導。 2.2.1 包圍行為 灰狼捜索獵物時會逐漸地接近獵物并包圍它,該行為的數學模型如下: 式(4) 至(7) 中,t 為當前迭代次數,A 和C 一樣都是協同系數;Xp表示獵物的位置向量;D為距離;在不斷地迭代過程中,α會從2慢慢減小至0;r1和r2是[0,1]中的隨機向量。 2.2.2 捕獵行為 狼群將獵物包圍后,有狼進行指揮,狼和狼協助,開展捕獵行為,捕獵的數學模型如下: 式(8)至(14)中,Xα、Xβ、Xδ分別表示當前種群中α狼、β狼、δ狼的位置向量;X 表示灰狼的位置向量;Dα、Dβ、Dδ分別表示當前候選灰狼與最優三條狼之間的距離。 本文中,將神經網絡結構設置為3層。選取預測日前三天的新冠肺炎日累計確診病例數當作輸入變量。為了提高預測模型的收斂速度,并盡可能減小誤差,可以相應地做一些工作來對數據進行處理。文獻[7]采用了最大最小化法將數據處理在[0,1]范圍之內,如式(15)所示: 式中(15),X是將要處理的數據量,Xmin是要處理數據中的最小值,Xmax將要處理的數據中的最小值,X′為對數據處理完之后得到的數據。并將預測當天的日累計確診病例作為輸出量。 在神經網絡的預測過程中,隱含層神經元個數過多會導致過擬合,個數過少會導致精度太差,因此要謹慎選擇隱含層神經元個數,這關乎整個預測模型的精度。文獻[8]表明試湊法對于選取隱含層神經元個數來說,是比較合理的。本文根據網絡訓練時不同隱含層神經元造成的誤差結果,選取誤差最小時對應的隱含層神經元個數,建立BP神經網絡模型,公式如(16)所示。 式(16)中,l為隱含層神經元個數,m為輸入層神經元個數,n為輸出層神經元個數,α是調整常數,取值范圍為[1,10]之間的整數。通過試湊法[9]可知,隱含層的神經元個數應該是在3 至12 之間,實驗結果表明隱含層節點數為9 時,預測模型的誤差結果最小。因此我們可以選取3-9-1 作為本文的神經網絡結構,此時預測結果最好。訓練目標為0.00001,學習率為0.1,最大訓練次數為1000。其適應度函數為P: 式(17)中,C 是輸出層節點數,M 為總樣本數,Si,j代表網絡輸出值,是期望值。 圖1 模型建立流程圖 本文收集了世界權威機構約翰斯霍普金斯大學發布的全球疫情統計數據,選取了挪威自2021年7月5日起到2021年9月30日為止的共85組樣本數據,其中將訓練樣本選取為統計的前75組數據,則將測試組選為后10組數據,數據統計如圖2所示。 圖2 挪威日累計確診病例 數據收集完畢后,將分別得到的10 組測試樣本的預測值與實際值做對比,得到的結果如圖3和圖4所示。 圖3 預測模型對比圖 由圖3可以看出SSABP預測模型的預測值更符合實際值。且其平均誤差僅為0.002,而GWOBP 預測模型的平均誤差為0.025,BP神經網絡的預測誤差則為0.032。因此SSA算法優化的神經網絡預測模型是切實可行的。 由圖4可以看出,SSABP預測模型收斂效果更好,在經過同樣次數的訓練下,SSABP誤差更小。 圖4 各預測模型訓練結果 SSABP 預測模型收斂速度更快,全局搜索能力更強,能更快地確定全局最優點,且SSA算法不僅能使神經網絡的收斂速度更快,還能提高神經網絡的訓練精度。因此采用SSA算法優化BP 神經網絡對新冠肺炎疫情病例進行預測,預測值和實際值能較好相符。

2.2 GWO算法


2.3 BP神經網絡結構參數的設置




3 應用案例



3 結論