尹欣欣, 蔡 潤, 陳文凱, 彭立順, 李少華
(1. 甘肅省地震局, 甘肅 蘭州 730000; 2.中冶成都勘察研究總院有限公司, 四川 成都 610063;3. 廣東省建筑科學研究院集團股份有限公司, 廣東 廣州 510500)
地震事件可以根據其產生機理分為天然地震以及非天然地震兩類,人工爆破以及塌陷地震屬于非天然地震中較常見的地震事件[1-2]。甘肅省測震臺網記錄到的甘肅華亭地區塌陷地震[3-4],給我們的研究提供了一定量的數據基礎。利用甘肅數字地震臺網所紀錄的地震觀測資料,深入研究主要礦區塌陷地震發生的規律,不但可以減輕塌陷地震所引起的各種災害及損失,為甘肅省防震減災工作提供決策依據,同時還可以探索和建立一種適合甘肅地區能源開發、治理和保護的方案,建立健全礦山生態環境保護長效監管機制,保證甘肅地區經濟社會健康發展,人與自然和諧相處。然而,塌陷地震與天然地震的波形具有較高的相似性,圖1(a)波形為典型天然地震事件,圖1(b)波形為典型的平涼塌陷地震事件,直觀上看二者在頻率周期以及能量分布上有一定差別,但實際上在日常工作中碰到的波形比圖中展示的更為復雜,分析人員根據經驗和波形特征進行識別要花費時間較多,缺乏時效性,因此亟需研究一種能夠及時準確地識別天然地震與塌陷地震事件的方法,建立準確的事件目錄,為快速開展塌陷災害防治工作提供重要科技支撐,為地方經濟發展、國土資源規劃提供依據,對開展地震學研究等也具有重要意義。

圖1 典型天然地震與典型塌陷地震事件波形能量特征對比Fig.1 Comparison between waveform energy characteristics of typical natural earthquakes and collapse earthquakes
現階段對于地震與礦區或是巖溶塌陷事件識別的研究主要是基于地震波形特征來區分的,如林懷存等[5]利用魯中南臺網所記錄到的地震資料,從地震初動、波速、頻率、振幅衰減以及Q值幾個方面對構造地震和塌陷地震兩類地震進行了區分;毛世榕等[6]以近年來廣西地震臺網中心記錄的天然地震和巖溶塌陷為例,嘗試利用基于小波包的分形和徑向基函數神經網絡技術對這兩類事件的波形進行識別,結果表明,基于小波包分形與神經網絡相結合的事件識別方法對天然地震和巖溶塌陷事件的識別率高達89.5%,可作為識別天然地震與巖溶塌陷的一個有效方法;陳潤航等[7]從震源波形中提取梅爾頻率倒譜系數(MFCC)圖,然后采用卷積神經網絡(CNN)進行地震波形信號的震源類型—天然地震和爆破事件—分類識別,最終得到了97.1%的正確識別率。從上述方法中不難看出卷積神經網絡方法識別率較高,卷積神經網絡方法是計算機模式識別領域很常見的圖像識別方法,本文嘗試利用該方法直接以地震波形作為研究數據來識別塌陷波形,直接利用波形進行計算可以使實時地震監測中非天然地震的識別更效率。
卷積神經網絡(Convolutional Neural Networks,CNN)是一類包含卷積計算且具有深度結構的前饋神經網絡(Feedforward Neural Networks),是深度學習(deep learning)的代表算法之一。對卷積神經網絡的研究始于20世紀80至90年代,時間延遲網絡和LeNet-5是最早出現的卷積神經網絡算法;在21世紀后,隨著深度學習理論的提出和數值計算設備的改進,卷積神經網絡得到了快速發展,并被大量應用于計算機視覺、自然語言處理等領域。卷積神經網絡長期以來是圖像識別領域的核心算法之一,并在大量學習數據時有穩定的表現。通常,一個卷積網絡架構由多個階段組成,前幾個階段包含有卷積層和池化層。圖2為基本的卷積神經網絡結構圖。

圖2 卷積神經網絡結構圖Fig.2 Structural diagram of convolutional neural network
在卷積層中,主要是使用可學習的卷積核與上一層輸出的特征圖進行卷積運算,然后通過一個激活函數傳遞給下一層。卷積層中各輸出特征圖的[8]計算公式為

池化層也稱降采樣層,計算某一位置相鄰域的統計特征作為輸出。降采樣層實質是對輸入的特征圖進行降采樣操作,例如最大池化函數給出相鄰矩形區域內的最大值。降采樣層的各輸出特征圖的計算公式為

預測值與真實值之間總是會存在誤差的,而反向傳播就是通過計算這些誤差,進而更新各層的權值,使得實際的網絡輸出更加準確。如使用交叉熵作為代價函數,計算公式為
式中:y表示目標向量;a表示輸出向量;nclass表示類別數,需要強調的是a為卷積神經網絡最后一層的輸出向量經過Softmax函數計算后得到的向量。
本文研究數據選取甘肅測震臺網監測到的甘東南地區34°~37°N,104°~107°E范圍內的100個地震事件,其空間分布見圖3。該地區是甘肅地區內地震頻發的區域,其中包括典型天然地震事件與塌陷地震事件各50個,圖中綠色圓圈代表的天然地震事件,紅色圓圈代表的塌陷地震事件,事件波形記錄臺站平均10個左右,每個臺站具有3個通道,即天然地震事件與塌陷地震事件樣本數據各為1 500條,總樣本數為3 000。塌陷地震選取甘肅華亭地區ML1.0以上地震事件,天然地震事件選取該地區附近地震事件,為使兩者在計算機進行深度學習時迭代次數接近,故選取同樣數量級的樣本數據。波形數據選取,P波到時前10 s到最大面波振幅出現后1分鐘內。為消除噪聲對信號的干擾,本研究所有數據均采用數字濾波器濾除頻率低于1 Hz的信號。待測數據為天然地震事件與塌陷地震事件各15個,為保持統一性,同樣采用數字濾波器濾除頻率低于1 Hz的信號。

圖3 樣本地震事件分布圖Fig.3 Distribution map of sample seismic events
卷積網絡框架中各層采用的激活函數為ReLU函數,使用交叉熵作為卷積網絡的損失函數,Adam算法[9]作為優化方法。網絡輸出為二維的浮點型向量,通過Softmax函數計算后,將該二維向量中的最大值置為1,最小值置為0,將震源波形特征對應的輸出向量與該震源波形的標簽進行比較,如果相同,則認為是識別正確,否則認為是識別錯誤。為了確定卷積網絡各卷積層和其對應輸出特征圖的最優個數,在實驗中,使用多種結構的卷積網絡進行測試,結果表明:卷積層為8層,池化層為7層,經過各卷積層后最終輸出特征圖個數為128,且卷積網絡的平均識別率較好(圖4)。
具體過程為:首先從樣本地震事件中挑選有效波形并進行預處理操作,該過程中為兩種事件類型的各波形分量添加標簽(塌陷地震用0表示,天然地震用1表示)。之后使用卷積神經網絡進行訓練,得到一個天然地震事件震動波形與塌陷事件震動波形分類器。對測試事件采取同樣的預處理操作后再利用訓練好的波形分類器對測試數據逐個以波形通道為單元進行分類識別,設定波形通道總數80%為地震事件分類閾值,即超過80%的波形通道為“0”或“1”即判定該待測事件為對應的事件類型。

圖4 卷積神經網絡結構圖Fig.4 Structure diagram of convolutional neural network
根據圖5波形通道總數80%為地震事件分類閾值,最終準確識別地震個數分別為塌陷地震13個,天然地震為14個,即對應的最終分類準確識別率為86.7%,準確識別率為93.3%。具體分量識別詳細結果列于表1。

圖5 兩類地震事件識別錯誤率Fig.5 Recognition error rate of two types of seismic events

表1 識別結果
卷積神經網絡在圖像識別上具有明顯的優勢,本文為了區分天然地震和塌陷地震,將地震事件作為原始圖像,然后對輸入圖像進行初始化,卷積層的卷積核對初始化的圖像進行卷積,提取圖像中最具代表性特征點;接著提取圖像特征進入池化層后池化層會對圖像特征點進行歸類壓縮,提取最具代表性的圖像特征,最終經過8層卷積過程最終得到128個特征值從而對圖像進行識別,最后輸出識別圖像。對應的塌陷地震最終分類準確識別率為86.7%,天然地震準確識別率為93.3%,總識別率為90%,具有很好的識別率,為今后平涼地區塌陷地震事件類別識別工作提供了可靠的參考價值。
在地震事件分類閾值設定過程中是個值得注意的問題,閾值太高,會降低識別率,閾值過低又將導致結果準確度不可靠,本文靠多年震相分析積累結果設定的閾值還將在今后研究中進一步驗證,另外,區域地質背景以及傳播路徑等方面差異會造成地震記錄波形特征不同。因此,本研究獲得的指標僅是在甘肅華亭地區地震類型識別中具有一定參考價值,不一定適用于其它地區。本文研究樣本為已知類型事件,今后將收集更多的事件樣本,進行更廣泛的識別訓練和研究,不斷地完善和驗證判定指標的普適性。