田宵, 汪明軍, 張雄, 王向騰, 盛書中, 呂堅
1 東華理工大學(xué)地球物理與測控技術(shù)學(xué)院, 南昌 330013 2 江西省地震局, 南昌 330039
近年來,由人類活動引起的人工爆破的頻度逐年增加.例如,用于工業(yè)生產(chǎn)的化學(xué)爆破(Ma et al., 2021), 2006年至2017年六次朝鮮地下核試驗 (謝小碧和趙連鋒, 2018) 和事故性爆炸如2015年天津爆炸、2019年江蘇響水爆炸(江文彬等,2020)和2020年黎巴嫩爆炸等.如果不能及時地進行識別分類,人工爆破事件可能被誤認(rèn)為天然地震,從而增加地震的誤觸發(fā)率,影響地震預(yù)警、地震速報以及地震應(yīng)急的時效性和準(zhǔn)確性(和雪松等,2006;Astiz et al., 2014).因此,發(fā)展天然地震與爆破事件的自動識別方法對安全生產(chǎn)以及國家防震減災(zāi)事業(yè)具有重要意義.
天然地震與人工爆破的震源性質(zhì)不同,天然地震多發(fā)生在地殼深部,震源為非對稱剪切源;而人工爆破多發(fā)生在淺層地表附近,為對稱膨脹源(黃漢明等,2010).然而,天然地震和爆破事件引起的地面震動,在臺站記錄上均顯示為波動的曲線,需要一定的經(jīng)驗才能將其區(qū)分開來.一直以來,地震臺網(wǎng)的工作人員主要是手動識別天然地震和爆破事件,手動識別事件性質(zhì)不僅需要持續(xù)的觀測和分析,識別效率較低,而且要求地震工作者具有豐富的經(jīng)驗,否則容易造成事件性質(zhì)判斷不準(zhǔn)確,混淆地震目錄,對后續(xù)的科研和防震減災(zāi)工作造成較大的影響.
早在20世紀(jì)50年代初,國內(nèi)外很多地震學(xué)家便開始對天然地震和人工爆破的識別進行了廣泛的研究.經(jīng)過近五十年的研究積累,地震學(xué)家基于地震波的輻射圖形、地震波譜分析和震相特征提出了多種識別天然地震和人工爆破的判斷依據(jù),主要包括P波初動符號(王婷婷和邊銀菊,2011;劉莎等,2012)、振幅比值(邊銀菊等,2010;Yavuz et al., 2019;Koper et al., 2016)、頻譜分布范圍(Kiszely,2001;Kekovalet al., 2012;靳玉貞等,2015)等分析方法.另外,小波算法、遺傳算法等也被廣泛用于天然地震和人工爆破事件的識別中.例如,和雪松等(2006)利用小波包識別天然地震和礦震,通過小波包對信號進行變換,并利用奇異值分解提取不同的信號特征,從而進行分類.黃漢明等(2010)利用波形記錄的小波特征對天然地震和人工爆破事件進行識別;Beccar-Varela等(2016)運用小波分析對采礦爆破監(jiān)測的地震波形與該區(qū)域的天然地震進行識別.Orlic和Loncaric等(2010)利用遺傳算法進行天然地震和爆破事件識別,分類精度為85%.這些方法在一定程度上能夠作為區(qū)分爆破事件和天然地震的依據(jù),但大多數(shù)方法局限于使用單一的輸入?yún)?shù),不僅識別速度較慢,而且準(zhǔn)確率相對較低.
近年來,隨著計算機領(lǐng)域人工智能的發(fā)展,深度學(xué)習(xí)相關(guān)技術(shù)在計算機視覺、自然語言處理等多個領(lǐng)域取得了巨大的成功(Hinton et al., 2012).深度學(xué)習(xí)算法也被廣泛地應(yīng)用在地震學(xué)領(lǐng)域,包括地震信號的檢測與拾取(Zhu and Beroza, 2019;于子葉等,2018;趙明等,2019; Duan and Zhang, 2020;Zheng et al., 2020; Wong et al., 2021; Zhou et al., 2021)、震源定位(Perol et al., 2018; Zhang et al., 2020)等.人工智能的發(fā)展也為天然地震和爆破事件的自動識別提供了新的研究思路.王軍(2018)利用支持向量機對上海周邊區(qū)域的天然地震和人工爆破進行識別,識別精度高達85%.陳潤航等(2018)利用梅爾頻率倒譜系數(shù)圖作為樣本,利用卷積神經(jīng)網(wǎng)絡(luò)進行天然地震和爆破事件分類,正確識別率約為97.1%; 任濤等(2019)利用Bagging機器學(xué)習(xí)算法對天然地震和非天然地震的事件性質(zhì)進行區(qū)分,測試數(shù)據(jù)的準(zhǔn)確度可達85%以上.Linville等(2019)分別使用卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)對美國猶他州近五年的采石場爆破事件和天然地震事件識別,使用時頻圖作為輸入數(shù)據(jù)的準(zhǔn)確度高達98%.隗永剛等(2019)利用殘差網(wǎng)絡(luò)模型對河北三河采石場的爆破事件和天然地震進行分類.Kim等(2020)使用波形信息作為輸入樣本,并利用支持向量機進行爆破和天然地震事件識別.毛世榕等(2020)結(jié)合RBF 神經(jīng)網(wǎng)絡(luò)技術(shù),利用天然地震震源和人工爆破震源之間信號能量分布的差異進行分類,識別率高達88.1%.
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種非常著名的深度學(xué)習(xí)方法,具有強大的圖像識別能力(Krizhevsky et al., 2012).相比于傳統(tǒng)的天然地震和爆破事件檢測方法,CNN不需要提前給出定性化的指標(biāo)或特征,而是通過大量已標(biāo)定事件性質(zhì)樣本的訓(xùn)練,使計算機從輸入的樣本中自動學(xué)習(xí)爆破和天然地震特征,從而實現(xiàn)對新的輸入樣本進行預(yù)測.目前,已有的基于深度學(xué)習(xí)的事件屬性識別網(wǎng)絡(luò)大都采用單一的樣本信息,即輸入樣本多為單個臺站記錄的波形(Kim et al., 2020)或時頻數(shù)據(jù)(Linville et al., 2019).Tian等(2020)利用多道數(shù)據(jù)的P波初至信息進行地面微地震極性預(yù)測,相比單道數(shù)據(jù)精度顯著增加.因此,我們提出使用混合數(shù)據(jù)作為訓(xùn)練樣本的多輸入卷積神經(jīng)網(wǎng)絡(luò)模型.混合樣本包括單道波形的時頻數(shù)據(jù)和同一事件多個臺站的波形記錄,使神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到天然地震和爆破事件的時頻、波形和極性特征.本文的研究數(shù)據(jù)為猶他州的天然地震和采石場爆炸事件,先使用2012年的數(shù)據(jù)作為樣本訓(xùn)練網(wǎng)絡(luò)模型,然后將該區(qū)域2013—2016年的監(jiān)測數(shù)據(jù)用于網(wǎng)絡(luò)模型驗證.
以美國猶他州及其周邊地區(qū)為研究區(qū)域(114°W—109°W,37°N—42°N),本文根據(jù)Linville等(2019)提供的地震目錄,從IRIS上下載了2012—2016年猶他州大學(xué)地震臺站(University of Utah Seismograph Stations,簡稱UUSS)記錄的1471個局部的天然地震事件(Local earthquake,簡稱le)和1426個采石場爆破(Quarry blast,簡稱qb)事件.震級范圍為ML-0.8~3.7,震中距范圍為0.1~432 km,信噪比范圍為0.2~6.研究區(qū)域有167個監(jiān)測臺站,最后得到11756個天然地震震相和11714個爆破事件震相.圖1為研究區(qū)域的地震臺站、天然地震和爆破事件的分布圖.其中,三角形為臺站,紅色點為爆破事件,藍色點為天然地震事件.利用地震目錄中拾取的P波到時,截取P波到時的前10 s和后70 s的波形為研究數(shù)據(jù).首先對原始波形進行100 Hz重采樣、去儀器響應(yīng)和均值傾向,然后對數(shù)據(jù)進行1~20 Hz帶通濾波.

圖1 臺站(黑色三角形)、天然地震(藍色點)與 爆破事件(紅色點)分布Fig.1 Map of stations (black triangles), earthquakes (blue dots), and quarry blasts (red dots)
由于震源性質(zhì)不同,時域波形和頻譜是常用的區(qū)分天然地震和爆破事件的有效工具.考慮到頻域分析只適用于穩(wěn)態(tài)數(shù)據(jù),不能反映頻率隨時間的變化.而地震數(shù)據(jù)屬于非穩(wěn)態(tài)數(shù)據(jù),因此時頻分析能夠更好地分析地震信號的時頻特性.Linville等(2019)利用時頻數(shù)據(jù)作為輸入樣本進行爆破事件和天然地震事件識別.根據(jù)地震目錄中給出的標(biāo)定結(jié)果,圖2畫出了一個天然地震事件的波形數(shù)據(jù)和時頻圖,波形數(shù)據(jù)長度為80s,每個臺站的波形均歸一化到[0,1]區(qū)間.時頻圖的橫坐標(biāo)是時間,縱坐標(biāo)為頻率,時頻數(shù)據(jù)也歸一化到[0,1]區(qū)間.
波形圖和時頻圖包含了天然地震和爆破事件的震相能量、頻率分布等絕大多數(shù)信息,但是P波初至極性特征(爆破事件的P波初動方向一般向上,而天然地震的P波初動方向為四象限分布)很難在單臺站記錄中體現(xiàn).例如,當(dāng)單臺的P波初至向上時,無法通過極性判斷天然地震還是爆破事件.本文提出采用多臺站波形作為輸入樣本,不僅有助于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到天然地震和爆破事件的極性特征,相鄰臺站的記錄組合更有利于特征提取.圖3給出了2012—2016年的天然地震和爆破事件的臺站記錄個數(shù)直方圖.據(jù)統(tǒng)計,接近90%的事件同時被4個以上的臺站記錄到.因此,本文采用某臺站和其相鄰的三個臺站的波形作為輸入樣本,如圖4所示.測試結(jié)果表明,多臺站波形只使用30s的波形數(shù)據(jù)便可以得到較好的精度,同時可縮短訓(xùn)練時間.
波形數(shù)據(jù)、時頻數(shù)據(jù)和多臺站波形數(shù)據(jù)均可作為訓(xùn)練樣本,并采用相同的標(biāo)簽:天然地震樣本標(biāo)定為0,爆破事件樣本標(biāo)定為1.本文采用UUSS在2012年記錄的數(shù)據(jù)進行模型訓(xùn)練,共有5529個天然地震震相和4358個爆破事件震相.將所有樣本分為訓(xùn)練集和測試集,其中訓(xùn)練樣本集和測試樣本集分別占3/4和1/4,兩個樣本集的樣本互不重疊.

圖2 天然地震的(a)波形圖和(b)時頻圖Fig.2 The waveform (a) and spectrogram (b) of an earthquake

圖3 天然地震和爆破事件的記錄臺站數(shù)直方圖Fig.3 Histogram of the number of recorded stations for natural earthquakes and quarry blasts
CNN是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò).CNN每個卷積層由一組濾波器組成,這些濾波器對前一層的輸出結(jié)果進行卷積計算,以此來提取數(shù)據(jù)集的屬性特征從而用于天然地震和爆破事件識別.一般通過優(yōu)化學(xué)習(xí)過程和網(wǎng)絡(luò)結(jié)構(gòu),微調(diào)整個網(wǎng)絡(luò)的權(quán)重和偏差可以最大限度地提取這些特征.本文基于Keras平臺分別設(shè)計了單輸入CNN模型和多輸入CNN模型進行天然地震和爆破事件分類.

圖4 天然地震和爆破事件的多臺波形數(shù)據(jù)Fig.4 Multi-waveforms of earthquake and quarry blast
CNN的輸入層可以處理多維數(shù)據(jù),可以是一維數(shù)組,也可以是二維或三維數(shù)組.根據(jù)單道波形、時頻圖和多道波形數(shù)組維度的區(qū)別,可分為以下三種CNN模型:
(1)基于波形的單輸入CNN模型(簡稱CNN-waveform):截取80s的波形記錄作為輸入樣本,大小為1×8000的向量,其中1代表道數(shù),8000為時間域采樣點的個數(shù).
(2)基于時頻的單輸入CNN模型(簡稱CNN-spectrogram):對波形數(shù)據(jù)進行短時傅里葉變換,得到的時頻信息作為輸入樣本,大小為39×48.其中39為采樣時間個數(shù),48為采樣頻率個數(shù).
(3)基于多道波形的單輸入CNN模型(簡稱CNN-multi-waveform)利用同一事件在多個臺站的波形記錄作為輸入層,大小為4×3000,其中4個臺站個數(shù),3000為時間域采樣點的個數(shù).
輸入樣本經(jīng)過若干個相互交替的卷積層、池化層提取極性特征后,再經(jīng)過一個或一個以上的全連接層,最后由Softmax分類器輸出兩個值,分別對應(yīng)輸入樣本為天然地震和爆破事件的概率值,其中最大概率值所對應(yīng)的類別即為該網(wǎng)絡(luò)的預(yù)測結(jié)果.分類問題一般采用交叉熵?fù)p失函數(shù)來優(yōu)化網(wǎng)絡(luò)參數(shù),交叉熵通常用于衡量輸入(真實)概率分布p和預(yù)測概率分布q之間的差異:
(1)
公式(1)中,N是訓(xùn)練數(shù)據(jù)集的大小.損失函數(shù)可使用隨機梯度下降算法迭代求解,每次迭代后,卷積核和權(quán)重將會被更新.在訓(xùn)練過程中,損失值(‘loss’)和準(zhǔn)確度(‘a(chǎn)ccuracy’)為判斷CNN模型的性能指標(biāo).

圖5 多輸入卷積神經(jīng)網(wǎng)絡(luò)框架示意圖. 該模型 具有兩個輸入分支,最終合并產(chǎn)生一個輸出Fig.5 Diagrammatic sketch of the multi-input convolutional neural network. This model has two input branches that ultimately merge and produce one output
以上三種單輸入CNN模型不能夠同時利用波形和頻率信息.多輸入CNN利用Keras的函數(shù)式API構(gòu)建,網(wǎng)絡(luò)框架示意圖如圖5所示.經(jīng)過測試,采用時頻數(shù)據(jù)和多道波形作為神經(jīng)網(wǎng)絡(luò)的輸入得到的模型精度較高.因此,多輸入CNN包括時頻和多道波形兩個輸入分支,先各自經(jīng)過卷積層、池化層、激活函數(shù)、全連接層的處理,分別提取天然地震和爆破事件的時頻特征和波形特征,然后進行模型融合,再通過一個或一個以上的全連接層,最后由Softmax分類器輸出為天然地震和爆破事件的概率.
利用美國猶他州2012年監(jiān)測數(shù)據(jù)分別訓(xùn)練三個單輸入CNN模型和一個多輸入CNN模型.在喂入神經(jīng)網(wǎng)絡(luò)前,所有輸入樣本均進行歸一化處理.四種網(wǎng)絡(luò)模型均使用四組卷積層,每組卷積層包含卷積層,最大池化層和Dropout層.其中卷積操作通過ReLu激活函數(shù)實現(xiàn)從輸入數(shù)據(jù)中提取特征.在卷積層之后緊跟著是最大池化層,主要功能為降維、對特征進行壓縮、簡化網(wǎng)絡(luò)復(fù)雜度等.Dropout層是指按照一定概率將神經(jīng)元從網(wǎng)絡(luò)中丟棄,從而降低模型的過擬合風(fēng)險.CNN的最后一層是全連接層,用于連接所有的輸出,并用Softmax激活函數(shù)計算分類概率.基于波形的CNN網(wǎng)絡(luò)在全連接層加入L2正則化以減小過擬合問題.三個單輸入CNN模型的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表1、表2和表3所示.多輸入CNN的兩個分支仍采用表2和表3的參數(shù),只是在128通道的全連接層后進行模型融合,然后利用Softmax實現(xiàn)分類.所有的CNN網(wǎng)絡(luò)均采用隨機梯度下降優(yōu)化方法進行訓(xùn)練,學(xué)習(xí)率設(shè)定為0.01.基于波形數(shù)據(jù)的CNN模型的批量大小為8,迭代次數(shù)為200,另外三種CNN模型的批量大小為16,迭代次數(shù)為100.

表1 CNN-waveform網(wǎng)絡(luò)參數(shù)Table 1 The architecture parameters of CNN-waveform

表2 CNN-spectrogram網(wǎng)絡(luò)參數(shù)Table 2 The architecture parameters of CNN-spectrogram

表3 CNN-multi-waveform網(wǎng)絡(luò)參數(shù)Table 3 The architecture parameters of CNN-multi-waveform
四個CNN模型訓(xùn)練都是在英偉達(NVlDIA)GTX1080圖像處理單元上進行的.基于波形、時頻和多道波形的CNN模型的訓(xùn)練時間分別為0.57、0.24和0.45 h,多輸入CNN模型的訓(xùn)練時間為0.52 h.四個CNN模型的準(zhǔn)確度-損失曲線如圖6所示.經(jīng)過多次迭代,訓(xùn)練集和測試集的準(zhǔn)確度-損失曲線均得到收斂.四個模型的訓(xùn)練數(shù)據(jù)集準(zhǔn)確度均接近99%.基于波形、時頻和多道波形的CNN模型的測試集準(zhǔn)確度分別為90.07%、94.13%和97.08%;基于時頻和多道波形的多輸入CNN模型的測試集準(zhǔn)確度為97.41%.

圖6 四種網(wǎng)絡(luò)訓(xùn)練過程的準(zhǔn)確度和損失曲線Fig.6 The training accuracy and cross-entropy loss function curves for four CNNs
支持向量機(Support Vector Machine, SVM)是機器學(xué)習(xí)領(lǐng)域中常見的分類算法,也被廣泛用于爆破事件和天然地震識別.相比于SVM,CNN的優(yōu)勢在于能夠直接從已標(biāo)定樣本中自動學(xué)習(xí)特征,不需要提前提取爆破事件和天然地震的數(shù)據(jù)特征.表4分別對比了卷積神經(jīng)網(wǎng)絡(luò)和支持向量機基于波形、時頻和多道波形數(shù)據(jù)作為訓(xùn)練樣本的測試集準(zhǔn)確度.結(jié)果表明,當(dāng)SVM直接采用波形數(shù)據(jù)(單道波形或多道波形)作為樣本特征時,SVM的準(zhǔn)確度遠遠低于CNN.而當(dāng)SVM使用時頻數(shù)據(jù)作為訓(xùn)練樣本時,即采用頻譜作為數(shù)據(jù)特征,此時的測試集準(zhǔn)確度高達90%,但仍低于CNN模型的準(zhǔn)確度(94%).由此可以看出,CNN在沒有預(yù)先提取數(shù)據(jù)特征的情況下,具有較高的準(zhǔn)確度.

表4 卷積神經(jīng)網(wǎng)絡(luò)和支持向量機的測試集準(zhǔn)確度對比Table 4 Comparison of test accuracy between CNN and SVM
將訓(xùn)練好的四個CNN模型對猶他州2013—2016年發(fā)生的天然地震和爆破事件進行分類.本文選用的事件分為:2013年的217個天然地震、2014年544個天然地震、2013年283個爆破事件、2014年158個爆破事件、2015年224個爆破事件以及2016年363個爆破事件.首先,對預(yù)測數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理,分別產(chǎn)生波形數(shù)據(jù)、時頻數(shù)據(jù)和多道波形數(shù)據(jù).然后,根據(jù)預(yù)測結(jié)果與地震目錄中標(biāo)簽的差異評價網(wǎng)絡(luò)模型的準(zhǔn)確度.
首先,以每個測試樣本(臺站記錄)識別的正確率作為衡量標(biāo)準(zhǔn),簡稱為基于臺站的識別率.圖7和表5為基于波形、時頻以及多道波形樣本的單輸入CNN模型以及多輸入CNN模型對猶他州2013—2016年記錄數(shù)據(jù)的預(yù)測結(jié)果與地震目錄標(biāo)簽的差異.對比不同的CNN模型可以發(fā)現(xiàn),基于波形的CNN模型的識別率最低,而基于多道波形數(shù)據(jù)的CNN模型的識別率在大多數(shù)情況下優(yōu)于基于時頻數(shù)據(jù)的CNN模型.此外,對比圖7的三角形和正方形線段,可以發(fā)現(xiàn)采用時頻數(shù)據(jù)和多道波形數(shù)據(jù)作為訓(xùn)練樣本時,能夠有效提高爆破事件的識別率.從數(shù)據(jù)類型上來看,天然地震(le2013,le2014)的識別率要普遍高于爆破事件(qb2013,qb2014,qb2015,qb2016).

圖7 基于臺站的識別率對比Fig.7 Comparison of station-based discrimination rate

表5 基于臺站的識別率對比Table 5 The comparison of discrimination accuracy based on station records
然后,以每個事件被識別的正確率作為衡量標(biāo)準(zhǔn),簡稱為基于事件的識別率.圖8為基于波形(圖8a)、時頻(圖8b)、多道波形的單輸入CNN模型(圖8c)以及多輸入CNN模型(圖8d)對猶他州2013—2016年記錄事件的識別率.圖8中的橫坐標(biāo)為事件被所記錄臺站識別的正確率,0代表所有臺站記錄均識別錯誤,1代表所有臺站記錄均識別正確.從圖8中能夠明顯看出,采用多道波形作為輸入樣本(圖8c和圖8d),事件的臺站識別率得到了大幅度的增加.表6和表7分別給出了四種網(wǎng)絡(luò)基于50%記錄被正確判別的識別率和基于90%記錄被正確判別的識別率.通過對比基于50%記錄被正確判別的識別率可以發(fā)現(xiàn),使用多道波形數(shù)據(jù)樣本并沒有優(yōu)勢,但是基于90%的臺站記錄的識別率得到了很大的提高.結(jié)合圖8分析可知,利用多道波形數(shù)據(jù)作為輸入樣本,使CNN能夠結(jié)合多個臺站記錄一起判斷事件屬性,提高識別率.

圖8 基于事件的識別率對比 (a) 基于波形樣本的CNN; (b) 基于時頻樣本的CNN; (c) 基于多道波形樣本的CNN; (d) 基于時頻數(shù)據(jù)和多道波形數(shù)據(jù)的多輸入CNN.Fig.8 Comparison of event-based discrimination rate (a) CNN-waveform; (b) CNN-spectrogram; (c) CNN-multi-waveform; (d) CNN-mixed.

表6 4種網(wǎng)絡(luò)基于事件的50%識別率對比Table 6 Comparison of the four networks with 50% event-based discrimination accuracy

表7 4種網(wǎng)絡(luò)基于事件的90%識別率對比Table 7 Comparison of the four networks with 90% event-based discrimination accuracy
最后,分析了事件的震級和信噪比對多輸入CNN模型的準(zhǔn)確度的影響.圖9a為波形信噪比與識別準(zhǔn)確度的關(guān)系,可以看出當(dāng)信噪比較低時(0.2~0.6),多輸入CNN模型的準(zhǔn)確度只有72%.隨著信噪比的增加,準(zhǔn)確度逐漸增加到90%左右,當(dāng)信噪比大于1時,準(zhǔn)確度趨于穩(wěn)定.由此可以看出,多輸入CNN模型具有較強的抗噪能力.圖9b為不同的震級對應(yīng)的事件100%識別率,圖中可以明顯看出,隨著震級的增加,地震事件和爆破事件的識別率線性增加,當(dāng)震級大于2時,識別率基本上穩(wěn)定在74%左右.卷積神經(jīng)網(wǎng)絡(luò)是基于數(shù)據(jù)驅(qū)動的算法,樣本標(biāo)簽的準(zhǔn)確度會直接影響模型的檢測能力.當(dāng)數(shù)據(jù)信噪比較低、震級較小時,人工給定的數(shù)據(jù)標(biāo)簽的正確率也會降低,從而導(dǎo)致事件誤識別率增加.

圖9 波形數(shù)據(jù)的信噪比(a)和事件震級(b)對多輸入CNN模型準(zhǔn)確度的影響 Fig.9 The effect of the signal-to-noise ratio (a) and event magnitude (b) of the recorded data on the discrimination accuracy of the multi-input CNN
本文將卷積神經(jīng)網(wǎng)絡(luò)算法應(yīng)用到美國猶他州的天然地震和爆破事件識別中.不同于傳統(tǒng)的機器學(xué)習(xí)算法,卷積神經(jīng)網(wǎng)絡(luò)不需要手動提取特征數(shù)據(jù),而是直接從輸入樣本中自動提取天然地震和爆破事件的特征.因此,輸入樣本所包含的特征信息對卷積神經(jīng)網(wǎng)絡(luò)算法至關(guān)重要.通過比較天然地震和爆破事件屬性識別的四種CNN分類網(wǎng)絡(luò):基于波形、時頻數(shù)據(jù)、多道波形的單輸入網(wǎng)絡(luò)和基于時頻數(shù)據(jù)和多道波形的多輸入網(wǎng)絡(luò),我們發(fā)現(xiàn)以時頻數(shù)據(jù)作為訓(xùn)練樣本的單輸入CNN模型精度遠高于以波形數(shù)據(jù)為樣本的模型.多輸入CNN模型不僅能夠?qū)W習(xí)到波形、時頻和極性信息,還可以通過多臺站的相互約束提高網(wǎng)絡(luò)模型的精度.根據(jù)美國猶他州2012年已知事件屬性標(biāo)簽的地震資料,對卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,并將此模型應(yīng)用于2013—2016年間的數(shù)據(jù),驗證了多輸入CNN模型的有效性.
本文訓(xùn)練的多輸入CNN模型的不足之處在于限制了事件的臺站數(shù),只有臺站數(shù)大于等于4的事件才能夠利用該模型進行屬性識別.在實際應(yīng)用中,可根據(jù)研究區(qū)域的臺站分布訓(xùn)練出不同臺站數(shù)的多輸入CNN模型,當(dāng)事件的臺站數(shù)不滿足模型要求時,可使用基于時頻數(shù)據(jù)的單輸入CNN模型進行預(yù)測.此外,文中訓(xùn)練的多輸入CNN模型能夠用于美國猶他州未來的天然地震和爆破事件識別,但對其泛化能力還有待測試研究.本文提出的基于時頻數(shù)據(jù)和多道波形的多輸入CNN網(wǎng)絡(luò)算法對于其他區(qū)域的事件屬性識別,包括天然地震、爆破和塌陷事件的分類具有一定的參考意義.
致謝感謝IRIS網(wǎng)站提供的地震數(shù)據(jù)(https:∥www.iris.edu)以及審稿人提出的寶貴意見.