廖成旺 龐 聰 江 勇 吳 濤
1 中國地震局地震研究所,武漢市洪山側路40號,430071
2 武漢引力與固體潮國家野外科學觀測研究站,武漢市洪山側路40號,430071
3 湖北省地震局,武漢市洪山側路48號,430071
地震波往往是直達、反射、折射、轉換和散射體波與面波的疊加,并且含有各種背景源產生的波信號以及噪聲信號。為獲得這些類型的波中包含的信息,發展了多波成分處理技術,其中備受關注的是極化分析方法[1]。以往主要使用平動三分量(3C)速度或加速度信號進行極化分析,但存在單臺站數據無法準確計算地表地震波參數、波型識別不準確等問題。引入包含旋轉三分量的六分量(6C)極化分析已在地震波參數提取和地震信號處理等領域取得諸多進展[2-4],能克服3C分析帶來的諸多弊端。

(1)
(2)
式中,rij為向量ri中的第j個元素,V為速度調整因子。方位角φ的180°模糊度問題結合r11sinφ-r12cosφ和r16的正負符號解決。
因此,正確獲得波型參數的關鍵在于識別特征向量所對應的極化向量,即極化向量辨識是提取極化參數的前提。Sollberger等[7]提出一種應用支持向量機(SVM)辨識6C地震波極化向量所屬波型的方法,但預測準確率基本低于80%,且易混淆Love波和SH波的極化向量。為了更有效地區分6C地震波的極化向量類型,本文應用文獻[6-7]的6C地震波各波型極化向量數學模型和一系列參數進行仿真,計算得到5種實際波型和1種噪聲波型的極化向量數據集,應用機器學習中的SVM[9-11]和MFC神經網絡[12-13]構建6C地震波極化向量波型識別模型,并以機器學習混淆矩陣和統計學指標作為模型效果的評價標準進行對比實驗。
假設地震波的傳播介質為橫向各向同性的分層介質,波從彈性自由面入射,空間坐標軸的Z軸垂直向下,并給定固定角頻率ω,則P波、Love波、SH波、Rayleigh波和SV波的極化向量計算表達式為[6-7]:
(3)
(4)
(5)
(6)
(7)
式中,θS為S波入射角,θP為P波入射角,φ為方位角,β為S波速度,ps=1/V為調整比例系數,ξ為Rayleigh波的橢圓角,決定偏心率的大小,Ax(x為P波或S波)為x波入射幅值,Axy(x、y為P波或S波)為x波入射、y波反射幅值,P波速度隱含在該系數中。
按照式(3)~(7)每種波型各生成5 000個6C極化向量,各波型極化向量中參數的取值范圍如表1所示,極化參數在該范圍內隨機取值,噪聲參數在0~1范圍內隨機取值。
區別于傳統的2、3、4層神經網絡,MFC神經網絡是一種深度學習模型,可以任意修改隱藏層的數量,結合一個輸入層和一個輸出層構建超多層神經網絡,其中的每一個結點都與其相鄰的神經網絡層N個結點組成一對N映射結構并互相連接,同層結點互不干擾。MFC神經網絡的優點是可以實現無監督預測學習,隱藏層的多層結構可以實現較強的非線性求解能力。
(8)

圖1 MFC神經網絡結構
通過使用平方誤差函數和累積誤差改變結點權重wjk的值,使全局誤差E逐漸變小。wjk的變化量公式為:
(9)
通過迭代更新結點權重值,上一層結點將信號傳遞到下一層結點,并進行信號的疊加求和運算,應用指定的網絡輸出層激活函數得到最終輸出值。典型激活函數采用Sigmoid函數,即
(10)
基于MFC神經網絡的6C地震波各波型極化向量識別流程如下:1)仿真生成一個6C地震波極化向量,設置各種波型的波速、方位角、傾斜角等必要參數(表1)后,利用式(3)~(7)計算得到各波型對應的極化向量數據集(每個波型5 000個);2)隨機選擇5 000個極化向量數據集作為測試集,其余為訓練集;3)訓練集輸入MFC神經網絡進行迭代識別,測試集用來檢驗識別準確率。
為評判MFC神經網絡在6C地震波極化向量識別中的效能,采用單輪預測和多輪預測的方式進行分析,并與SVM結果進行對比。
實驗使用的軟件、操作系統等主要為:Python 3.10、PyCharm Community 17開發平臺、Windows 10 64位操作系統以及numpy、obspy、matplotlib、sklearn等Python開源庫。
MFC神經網絡主要設置為:核函數采用徑向基函數(radial basis functions,RBF),隱藏層大小為[50,50];反向傳播優化器采用可以自主學習的AdaGrad算法,其全局學習率為0.1;迭代次數為10 000次,每次迭代中訓練模型隨機抽取數量設置為100,初始化權重為0.01。
SVM是一種通過構建超平面解決二類型或多類型分類問題的經典學習器,在地震學研究中常使用核函數解決非線性問題。本實驗以機器學習中的混淆矩陣作為預測性能的指標,設計6C地震波5種波型和6種波型(將噪聲也視作一種極化向量參與識別)的極化向量識別實驗,單次波型預測的實驗結果如圖2、3所示。

圖2 SVM單輪預測結果的混淆矩陣(考慮SH波)
由圖2可見,SVM的單輪預測準確率為78.3%,其對Love波、噪聲、P波、Rayleigh波、SH波和SV波波型極化向量識別的準確率分別為39%、97%、100%、94%、61%和79%。對比發現,SVM對SH波和Love波的單一類型識別誤差較大,被誤判的極化向量類型也全部集中在Love波或SH波中,說明這2個類型存在較為相似的信號特征,較難被SVM準確區分。基于此原因,將SH波視作Love波,再次進行極化向量類型預測分析(圖3)。由圖3可見,SVM的單輪預測準確率為94%,其對Love波、噪聲、P波、Rayleigh波和SV波波型極化向量識別的準確率分別為100%、97%、99%、95%和79%。值得注意的是,有16%的SV波極化向量被錯誤識別為Love波極化向量,導致SVM的綜合識別率不高。

圖3 SVM單輪預測結果的混淆矩陣(SH波視作Love波)
基于MFC神經網絡的6C地震波波型單輪識別過程如圖4所示??梢钥闯?經過10 000次迭代,預測值從一個較低的水平持續更新并穩定到99.5%以上;訓練集和測試集的預測率迭代曲線整體變化趨勢高度一致,但由于訓練集數量遠小于測試集,故其預測準確率一直高于測試集。

圖4 MFC神經網絡單輪識別過程迭代曲線
圖5為基于MFC神經網絡的20輪6C地震波各波型極化向量識別結果??梢钥闯?5種波型(SH波視為Love波)極化向量的識別效果明顯優于6種波型。

圖5 基于MFC神經網絡的20輪6C地震波極化向量識別結果
為了比較MFC神經網絡與SVM模型識別6C地震波各波型極化向量的效果,分別進行20輪預測實驗,結果如圖6和表2所示。

圖6 基于SVM的20輪6C地震波極化向量識別結果

表2 6C地震波極化向量波型預測結果對比
圖6為基于SVM的20輪6C地震波各波型極化向量識別結果??梢钥闯?將SH波視為Love波以后,5種波型的極化向量識別效果明顯優于6種波型,二者的平均預測準確率分別為94.171%和78.955%。
表2為MFC神經網絡與SVM的6C地震波極化向量波型預測結果對比。由表2可見,MFC神經網絡預測效果顯著優于SVM,5種波型和6種波型識別條件下的平均識別率分別提升約5.6%和9.0%。對于5種波型的極化向量識別,MFC神經網絡的預測準確率較高,其均值達到99.786%,預測過程的穩定性也很高,STD僅為0.071,極差僅為0.300%;相比之下,對于6種波型的極化向量識別,SVM的預測結果均值不太理想,僅為78.955%,且其多個指標值都差于MFC神經網絡模型,證明MFC神經網絡具有更好的非線性求解能力,能更精確地識別各種6C地震波極化向量的精細化特征。
本文提出一種基于MFC神經網絡的6C地震波極化向量所屬波型識別方法,能有效識別出P波、SV波、Rayleigh波所對應的極化向量,對Love波和SH波的極化向量識別效果也相對SVM模型有所改善。
SH波和Love波是一對波形特征較為相似的地震波,其中SH波在地震工程結構動力響應研究中具有重要作用;Love波相對Rayleigh波在地震勘探和反演分析中具有更好的頻散能量譜清晰度和連續性,但二者有較多的相似性,導致難以區分其極化向量。針對這2種波型的精準區分工作仍需進一步推進,未來研究將從引入分量信號的新型特征提取方法入手。
基于MFC神經網絡的6C地震波6種波型向量識別結果均值為87.940%,仍有5%以上的提升空間。隨著人工智能技術的不斷完善,利用群體智能啟發式算法優化神經網絡模型的超參數已成為改進模型的一個重要方向,未來將從這個角度入手,改進MFC模型的部分預設參數,進一步提高6C地震波極化向量的預測準確率。
同時,在后續工作中,將應用真實6C地震波數據計算各個頻帶與時窗上的信號協方差矩陣特征向量與特征值,根據有效特征向量與標準極化向量的實數/虛數平行特性,判斷其所屬波型并提取方位角、相速度等極化參數,將兩者結合,評估本文方法的實際效果。
致謝:感謝David Sollberger、Nienke Brinkman、Sebastian Heimann、Felix Bernauer等學者提供TwistPy工具。