尹欣欣 楊曉鵬 蔡 潤 王祖東 蒲 舉 王維歡 王樹旺
1 蘭州地球物理國家野外科學觀測研究站,蘭州市東崗西路450號,730000 2 甘肅省地震局,蘭州市東崗西路450號,730000 3 中冶成都勘察研究總院有限公司,成都市三色路199號,610023
完整、準確的地震信號檢測方法是自動構建地震目錄的關鍵。目前的檢測方法在檢測中等規模地震事件方面效果良好,但這些方法會產生大量虛假結果或遺漏真實信號,需要分析人員對信號進行手動刪除、修改和添加處理。深度學習方法在地震信號識別中得到廣泛應用[1-3],其性能明顯超過傳統檢測方法(如長短時窗法STA/LTA等),計算時間遠小于模板匹配類方法,且無需進行過多的手動調整。這種深度學習方法可替代部分人工工作,但替代程度未知,需要進一步研究深度學習自動分析方法(AI方法)和人工地震信號分析方法之間存在的差異。
本文將PhaseNet模型[3]應用于2013年岷縣MS6.6地震中,探索深度學習地震信號檢測方法在地震監測中的應用效果。岷縣MS6.6地震是近年來甘肅地區發生的最強地震,余震序列眾多,且部分地震發生密集,有相互疊加的情況出現。PhaseNet模型是使用北加利福尼亞州近震數據進行訓練的深度學習模型[4],岷縣地震數據不包含在地震訓練數據集中,因此為客觀評估該方法對實際地震信號的檢測效果提供了保障。
神經網絡(NNs)可能會對具有許多標記樣本的大型數據集的分類有所幫助,因為神經網絡具有較強的特征學習能力。PhaseNet的架構基于UNet[5],UNet最初用于醫學領域內的圖像分割,PhaseNet將其用于1D輸入數據(即時間序列波形),生成P、S震相概率值。PhaseNet將來自3個分量(Z、N、E)的30 s波形作為輸入值,并輸出3個通道,每個通道在每個時間步(P震相、S震相和噪聲)上屬于該類數據點的概率值,數值用0~1表示,越靠近0說明越接近噪聲信號,反之越靠近1說明越接近地震信號。在PhaseNet文件中,波形輸入模型前沒有對輸入數據進行頻率濾波,但PhaseNet通過對訓練數據進行數據增強操作,提高了模型的泛化能力,能夠在未濾波數據中準確識別出地震信號。
隨著地震震相到時檢測方法靈敏程度的提高,特別是在地震密集的情況下,分析地震震相與震源之間的聯系變得越來越具有挑戰性[6]。例如來自多個震源的地震波可能會在時間上重疊,導致結果中出現假震相,因此需要一種自動震相關聯方法,將接收到的地震震相與震源聯系起來,并獲得震源位置[7]。為此,本文提出震相關聯方法:首先基于反投影原理選取候選震相;然后使用基于圖論的聚類方法,通過整數線性優化程序將震相與定位所需的最小數量關聯起來;最后分配所有震源和震相。地震及其初始位置是根據與候選位置一致的空間網格內的震相拾取數來確定的[8]。
通過震相關聯獲得搭配好的地震事件后,為得到地震事件的震源位置,使用Hypoinverse定位方法對所有關聯事件進行絕對定位處理,速度模型選取甘肅測震臺網使用的甘青走時模型[9]。
本文使用的數據集為2013-07-20~28甘肅省地震臺網監測數據,臺站分布如圖1所示。考慮到距離問題,本文僅選取甘肅臺網88個寬頻帶監測系統臺站中37個臺站的數據,這些地震臺站的震中距均在300 km范圍內。

圖1 臺站與岷縣地震主震震中分布
通過PhaseNet模型檢測相應的波形數據獲得震相到時數據后,將結果與人工處理結果進行比較。對比方法為測量每種方法的召回率Recall,即僅針對陽性類別的準確率預測,這種情況下正類是人工核對中確定的真實地震波。召回率是指成功識別陽性類別與所有陽性項目之間的比率:
(1)
式中,TP(真陽性)為成功鑒定陽性結果,FP(假陽性)為誤判陰性結果,TN(真陰性)為成功鑒定陰性結果,FN(假陰性)為誤判陽性結果。
除召回率外,本文還計算了2種方法的準確率Precision和F1分數,計算公式如下:
(2)
(3)
為統一震級下限,本文僅對比0級以上的地震。若發震時刻差在5 s之內且震中位置差在50 km范圍內,則認為2種目錄對應的是同一地震事件,按照這種設定條件共匹配到共同目錄509條,占人工目錄總數的85.5%,具體參數詳見表1。

表1 2種地震目錄對比結果參數
對未匹配的約15%人工地震事件進行分析可知,主要存在2種情況:1)同一時刻存在其他地方的地震事件,此時震相關聯并沒有處理成多個地震;2)波形上具有一定的獨特性,與常規地震波形相比存在明顯的差異,這可能是神經網絡訓練中的訓練集完備性欠缺所致。由于PhaseNet網絡的訓練數據集中缺乏具有類似特征的地震波形數據,導致訓練出的模型不包含此種波形的特征值,因此AI不能進行準確識別。
由圖2(a)可見,S波震相的AI檢測效果要略差于P波震相,主要原因是S波震相受P波震相的干涉疊加干擾,導致波形更復雜,難以分辨。由圖2(b)可見,AI在檢測低震級事件時具有更優的檢測能力,低震級事件檢測數量明顯多于人工分析數量。震相到時對比(圖2(a))呈現出明顯的正態分布特征,誤差集中在0 s附近,且無論是P波震相還是S波震相,相較于人工分析震相到時,AI震相到時更提前。

圖2 2種目錄的震級與P、S震相到時對比結果

圖3 AI檢測到的地震事件和人工分析目錄震級時間分布
由圖3可知,AI檢測事件總共為769個,約為人工目錄的1.3倍,0級以上AI地震事件686個,人工目錄595個。AI檢測在主震發生后約3.9 d檢測到的地震事件數量與人工分析數量接近,3.9 d后檢測事件數量超過人工分析數量,隨后差距逐漸增大。出現這種情況的原因主要是2013-07-25甘肅省地震局在震區架設4個流動臺站,并將數據傳回甘肅省測震臺網中心。流動臺的正常運行提高了主震區的地震臺網密度,使低震級地震事件的檢測能力得到大幅提升,而AI方法在這些事件的檢測中更具優勢。
甘肅省測震臺網一般采用Hyposat等定位方法,為對比分析,本文統一AI和人工定位的處理方式,人工分析震相采取Hypoinverse定位方法作重定位處理,速度模型選取甘青走時模型[9]。從圖4(b)、(c)的地震震源位置深度分布來看,相比于人工定位結果,AI定位結果更加發散,這主要是震相拾取的誤差累積所致。另外,部分區域只有人工定位結果,AI定位結果偏少或缺失,造成上述現象的原因主要有2個:1)此處的地震并未被AI方法所識別,從而造成漏檢現象;2)定位誤差導致AI結果偏離。

圖4 2種地震目錄震源分布位置對比

圖5 AI檢測地震事件與人工分析事件對比誤差統計
圖5為2種地震事件檢測方法的各參量對比誤差分布(AI-人工),結合圖2可以看出,AI自動檢測到時誤差在1 s以內,發震時刻誤差在2 s以內,定位誤差在10 km范圍內,深度差在15 km以內,震級誤差在1級左右。
1)人工方法和AI檢測方法的共同目錄為509條,占人工目錄的85.5%。對比這些共同目錄可知,AI自動檢測到時誤差在1 s以內,發震時刻誤差在2 s以內,定位誤差在10 km范圍內,深度差在15 km以內,震級誤差在1級左右。
2)AI檢測事件總共為769個,約為人工目錄的1.3倍,0級以上AI地震事件686個,人工目錄595個。在低震級和低信噪比地震事件的檢測中,AI展現了較大的拾取能力。
根據本文分析結果可知,P波震相的檢測效果優于S波震相。AI方法在低震級事件檢測中具有較強的魯棒性,提高地震監測臺網密度能進一步優化AI檢測能力。
致謝:斯坦福大學朱尉強博士提供PhaseNet程序,福建省地震局廖詩榮高級工程師提供目錄對比相關程序,甘肅省測震臺網提供地震波形和震相觀測報告資料,在此一并表示感謝。