陳韶金 劉子維, 周 浩 江 穎, 翟篤林
1 防災科技學院信息工程學院,河北省三河市學院街465號,065201 2 中國地震局地震研究所,武漢市洪山側路40號,430071 3 武漢引力與固體潮國家野外觀測研究站,武漢市洪山側路40號,430071
我國是一個地質災害頻發的國家,破壞性的地震往往會造成巨大的人員傷亡和經濟損失。預測震后死亡人數對救援工作和物資分配都起著十分關鍵的作用,而預測地震死亡人數的影響因素錯綜復雜,傳統的方法難以解釋地震死亡人數的關鍵影響因素。張瑩等[1]利用層次分析方法構建以地震震級、人口密度、地震烈度、建筑物抗震性能以及發震時刻等主要影響指標形成的指標體系,為后續的震后死亡人數預測提供了重要的參考。
隨著機器學習的盛行,許多學者將其應用到地震死亡人數預測中。Tang等[2]采用經驗回歸法快速估計中國地震傷亡人數;楊帆等[3]和吳昊昱等[4]建立BP神經網絡對震后傷亡人數進行快速預測;周德紅等[5]將傳統的BP神經網絡和遺傳算法優化的BP神經網絡對地震傷亡人數預測模型效果進行對比,結果表明后者精度更高;Li等[6]提出支持向量回歸(SVR)的分區傷亡預測方法;王晨暉等[7]和劉立申等[8]分別建立PCA-GSM-SVM和PCA-PSO-SVM模型對地震死亡人數進行預測,并取得良好的效果;Cui等[9]建立集成學習方法分別對地震受傷和死亡人數進行預測。上述研究主要是利用機器學習的不同方法對地震死亡人數進行建模,雖然均有良好的非線性擬合效果,但訓練速度慢,網絡易陷入局部最優。針對該問題,Huang等[10]提出一種新型的單層前饋神經網絡(single-hidden layer feedforward neural network, SLFN),該算法被稱為極限學習機(extreme learning machine, ELM)。相比于傳統的神經網絡,ELM具有學習速度快、精度高、參數設置簡單等優勢。景國勛等[11]加入預報水平作為影響指標,構建PCA-ELM的地震死亡人數評估模型,并對比ELM和傳統的BP神經網絡模型,結果表明PCA-ELM模型準確率更高。
基于此,本文對PCA-ELM模型進行改進,引入粒子群優化算法對ELM進行參數優化,構建PCA-PSO-ELM地震死亡人數預測模型。首先對影響指標進行主成分分析降維;然后通過粒子群智能算法對ELM網絡權重進行訓練優化,避免網絡陷入局部最優,得到網絡最佳參數;最后對比ELM、PCA-ELM、PCA-PSO-ELM三個模型的預測精度。
主成分分析本質上是通過線性變換方式將高維數據變換成一組各維度線性無關的數據,其具體計算過程參考文獻[12]。主成分分析算法步驟如下:
1)對數據進行標準化,消除不同量綱和量級的影響。
2)計算相關系數矩陣。
3)計算特征值和與之對應的特征向量。通過求解特征方程,計算特征根,按從大到小依次排序,同時得到對應的特征向量。
4)計算貢獻率和累積貢獻率。
5)綜合分析。當累積貢獻率達到85%~95%時,取前n個主成分作為新的綜合指標變量替代原來的高維特征變量。
在粒子群優化算法模型中,粒子通過群體信息的共享和更新不斷優化目標。粒子速度、位置計算公式以及更新公式參考文獻[13-14]。
由于慣性權重的大小對算法的搜索能力具有顯著影響,其值較大時,有利于全局搜索;其值較小時,有利于局部搜索。因此,為有效平衡全局搜索與局部搜索能力,使用線性遞減權重公式[15]:
(1)
式中,ωmax和ωmin分別為慣性權重系數的最大值和最小值,Tmax為粒子群優化算法的最大迭代次數。
ELM本質上是一種單隱含層的前饋神經網絡,其輸入權重和偏置項權重均采用隨機生成的方法進行賦值,且其訓練方式不采用傳統的梯度下降方式,而是在最小二乘法架構下,通過解算對應的廣義逆矩陣計算最優輸出權值。因此,ELM具有收斂速度快且不易陷入局部最優等優點。ELM網絡具體計算過程可參考文獻[10],其網絡拓撲結構見圖1。

圖1 極限學習機網絡拓撲結構Fig.1 Topological structure of extreme learning machine network
本文提出的PCA-PSO-ELM 預測模型流程分為3個階段:1)PCA處理階段。通過 PCA對影響地震死亡人數的7個影響因子進行降維處理,消除各個影響因子之間的相關性、冗余性。2)粒子群算法尋優階段。將 PCA 計算的主成分得分作為 PSO-ELM 預測模型的輸入,設置PSO優化算法的粒子速度、位置等參數和模型終止條件,并進行模型訓練。3)ELM網絡訓練階段。將PSO優化好的初始權重代入ELM模型進行測試并分析其結果。模型處理流程見圖2。

圖2 PCA-PSO-ELM模型流程Fig.2 The flow chart of PCA-PSO-ELM model
影響地震死亡人數的指標錯綜復雜,本文從數據獲取難易程度和重要性角度綜合考慮,選取地震震級、震源深度、震中烈度、抗震設防烈度、震中烈度與抗震設防烈度之差(ΔL)、人口密度以及發震時刻等7個影響因素作為模型輸入。
地震震級是表示地震強弱的度量,地震震級越大,其對建筑物的破壞力越強,造成的死亡人數也越多。震源深度表示震源在地面上的垂直投影距離,一般來說,震源越靠近地面,對地表的破壞力越強。震中烈度是指地面受到地震震動作用的強烈程度,在同等震級大小條件下,震源深度越淺,震中烈度也越大。抗震設防烈度是在工程建設時對建筑物進行抗震設計的地震烈度,通常情況下,抗震設防水平越高的地區,同等地震條件下造成的人員死亡越少。震中烈度和抗震設防烈度之差(ΔL)可體現建筑物抵御地震破壞的能力,如果ΔL>0且兩者差值越大,則說明建筑物抗震能力越弱,地震造成的死亡人數也越多;如果ΔL<0且兩者差值的絕對值越小,說明建筑物破壞程度越嚴重,地震造成的死亡人數也越多。此外,人口密度和發震時間也是直接影響地震死亡人數的重要指標。若地震發生在人口密度大的地區,所造成的人員死亡數遠大于人煙稀少地區;若發震時間為夜晚,由于缺少反應時間,死亡人數也會增加。
本文從相關文獻[5,7,11]中篩選42個歷史地震震例數據(表1),選取地震震級、震源深度、震中烈度、抗震設防烈度、震中烈度與抗震設防烈度之差(ΔL)、人口密度以及發震時刻7個影響因子作為網絡模型的輸入數據,實際死亡人數作為模型的輸出數據。

表1 地震震例信息
由于抗震設防烈度[16]與發震區域有關,本文選取的是發震地區抗震設防烈度的最大值。發震時刻分為2個時間段:發震時刻“1”表示白天(07:00~19:00),“0”表示夜晚(19:00~次日07:00)。
對原始數據的7個影響因子進行PCA降維處理。表2為影響因子的特征值、貢獻率和累積貢獻率,由表可知,前4個主成分累積貢獻率達88.607%,說明其包含原始數據的絕大多數信息,滿足替代條件。主成分得分是由因子載荷矩陣與原始數據線性組合,計算公式如下:

表2 特征值、貢獻率和累積貢獻率
(2)
式中,S1為地震震級,S2為震源深度,S3為震中烈度,S4為抗震設防烈度,S5為震中烈度與抗震設防烈度之差(ΔL),S6為人口密度,S7為發震時刻。將降維后的4個主成分替代原始數據的7個影響因子,并對主成分得分進行歸一化處理,公式如下:
(3)

選取經過PCA處理后的37個震例數據作為訓練樣本,其余5個數據(樣本2、9、15、29、38)作為測試樣本。由于地震死亡人數數值離散且跨度較大,為了更直觀地對比預測值與真實值,本文采用自然對數對地震死亡人數進行處理。

建立好網絡模型后,將37個震例數據分別輸入到ELM、PCA-ELM和PCA-PSO-ELM模型中進行訓練,經過多次實驗,得到粒子群優化算法的最佳參數設置和3個模型的訓練集預測值與實際值對比結果,具體見表4和圖3。

表4 PSO-ELM網絡參數

圖3 不同模型訓練集預測值與實際值對比Fig.3 Comparison between predicted values and actual values of different models
由圖3可知,除個別樣本數據是ELM或PCA-ELM預測值更接近實際值,從整體上看,PCA-PSO-ELM模型的擬合效果最好,其預測值和實際值非常接近,該模型可用于測試樣本數據進行預測。
選取樣本2、9、15、28、36作為測試樣本數據檢驗模型的準確度。將5個測試數據分別代入到ELM、PCA-ELM和PCA-PSO-ELM模型中進行實驗,可得到3個模型的預測值和平均誤差率結果(表5)。

表5 不同模型結果對比
由表5可知,未經PCA處理的ELM模型平均誤差率為29.25%,而經過PCA處理的ELM模型平均誤差率相較前者減少8.70個百分點,說明采用PCA對數據進行預處理十分必要,可以去除原始數據的冗余性。本文提出的PCA-PSO-ELM模型的平均誤差率為10.87%,比PCA-ELM模型提高9.68個百分點,說明經過優化的模型可避免網絡陷入局部最優,并找到最優的模型參數,進而提高模型的預測精度。因此,該組合模型可為地震死亡人數預測提供新方法。
本文利用主成分分析對原始數據特征進行降維,再通過粒子群優化極限學習機網絡對數據進行仿真實驗,對比3個模型的實驗結果,得到以下結論:
1)在眾多影響地震死亡人數的因素中,構建以地震震級、震源深度、震中烈度、抗震設防烈度、震中烈度與抗震設防烈度之差(ΔL)、人口密度以及發震時刻為主的影響指標體系。
2)經過PCA降維處理,能夠極大地去除原始數據之間的相關性和冗余性,可強化模型的泛化性,提升模型的預測精度。
3)對比ELM模型和PCA-ELM模型,本文提出的PCA-PSO-ELM模型不僅能避免網絡陷入局部最優,而且模型的預測值與實際值的平均誤差率最低,可為地震死亡人數預測提供一種新的評估方法。
然而,由于收集的歷史震例數據還不夠豐富,構建影響地震死亡人數的評估體系還不夠完善,此外模型精度和穩定性仍有進一步提高的空間,這將是未來研究的重點。