中圖分類號:TP183;TP39;P315. 7 2 + 6 文獻(xiàn)標(biāo)識碼:A
文章編號:2096-4706(2025)08-0041-05
Abstract: This research proposes an anomaly detection method in earthquake precursor gravity data based on the CNNLSTM-CBAMmodel.The anomalydetection inearthquake precursor gravitydata is crucial for improving the timelinessof earthquakepredictions.Itextracts spatial features ofthegravitydata using CNN,anduses theLSTMtocapture long-term dependencyrelationships inthe time series.The CBAMisintroduced toenhance the model's abilityto focusonimportant features,thereby improving anomaly detection performance.Experimental comparisons with the anomaly detection methods suchas AutoEncoder,CNN,LST,andCNN-LSTmethodsshowthattheproposedmodelinthispaperoutperformsotrsin metrics such as MAE,MSE,RMSE,and .This model effectively identifies potential and abnormal dataand providesa reliable foundation forearthquakeriskmanagementandearly waming.Thisresearchofersnewinsights into theanalysisofearthquake precursor data.
Keywords: earthquake precursor anomaly; gravity data; time series; LSTM; Atention Mechanism
0 引言
在印度板塊與歐亞板塊相互作用及太平洋板塊影響下,中國是板塊內(nèi)地震活動最強(qiáng)烈、頻率最高的地區(qū)之一{I]。隨著對地震預(yù)報(bào)理解的深入,地震前兆被認(rèn)為是地震發(fā)生的直接標(biāo)志,因此尋找前兆異常在預(yù)報(bào)研究中具有重要意義[。大規(guī)模數(shù)字地震臺網(wǎng)平臺能夠收集形變、流體、地磁等海量前兆觀測資料,為相關(guān)研究提供關(guān)鍵數(shù)據(jù)。
目前的數(shù)據(jù)檢查主要依賴人工方法,存在煩瑣和低效的問題,不同臺站的異常判定標(biāo)準(zhǔn)不一,導(dǎo)致結(jié)果中存在主觀因素[3]。因此,結(jié)合現(xiàn)有異常檢測算法,提出針對前兆數(shù)據(jù)的自動異常檢測方法,可以顯著提高工作效率,減輕工作強(qiáng)度,減少人為主觀影響,確保數(shù)據(jù)客觀性。
現(xiàn)有大多數(shù)前兆異常檢測方法主要基于統(tǒng)計(jì)方法,例如通過計(jì)算正常數(shù)據(jù)的基線和變化率,判定超出范圍的觀測為異常[4]。此外,還有小波變換[5]和經(jīng)驗(yàn)?zāi)B(tài)分解[等數(shù)字信號分析技術(shù),這些方法通過時域到頻域的轉(zhuǎn)換進(jìn)行異常分析。然而,這些技術(shù)僅適用于特定類型的時間序列異常,且不同類型的重力異常常常重疊,使得高精度檢測所有異常的推廣具有挑戰(zhàn)性。因此,需要一種能夠統(tǒng)一識別大多數(shù)異常的新方法。
深度學(xué)習(xí)技術(shù)已成為流行的機(jī)器學(xué)習(xí)方法,通過自學(xué)習(xí)提取深度特征,在有監(jiān)督和無監(jiān)督學(xué)習(xí)中表現(xiàn)優(yōu)異[7-8]。地震前兆重力數(shù)據(jù)是典型的時間序列,LSTM網(wǎng)絡(luò)能夠處理長期依賴關(guān)系,捕獲深層特征,從而提高地震異常自動識別的準(zhǔn)確性。然而,LSTM在處理長序列時可能面臨梯度消失或爆炸的問題,影響其學(xué)習(xí)效果,仍需改進(jìn)以適應(yīng)地震異常檢測的需求。
由于前兆數(shù)據(jù)特殊的觀測目標(biāo)和自身獨(dú)有的特點(diǎn),目前基于深度學(xué)習(xí)的異常檢測算法在前兆數(shù)據(jù)中的應(yīng)用仍較少,本文嘗試引入基于CNN-LSTM-CBAM的異常檢測模型,對前兆重力數(shù)據(jù)進(jìn)行檢測,以解決臺網(wǎng)海量數(shù)據(jù)人工檢測效率低下和人為主觀影響的問題,探索地震前兆數(shù)據(jù)分析與異常檢測的新方法。
1前兆重力數(shù)據(jù)預(yù)處理
1.1 數(shù)據(jù)介紹
本文研究所用的連續(xù)觀測重力數(shù)據(jù)由江蘇省地震局提供,主要圍繞重力儀的秒采樣數(shù)據(jù)展開,時間范圍為2022年1月1日至2022年1月31日。
在對前兆數(shù)據(jù)進(jìn)行分析之前,必須進(jìn)行科學(xué)有效的數(shù)據(jù)存儲。由于前兆數(shù)據(jù)包含多種觀測指標(biāo)且數(shù)據(jù)量日益增長,規(guī)范的數(shù)據(jù)編制對于保證科學(xué)存儲至關(guān)重要。規(guī)范的要點(diǎn)包括數(shù)據(jù)類型、臺站、測點(diǎn)、測項(xiàng)和采樣率等指標(biāo)。在文件命名時,各項(xiàng)要點(diǎn)應(yīng)以下劃線形式隔開,例如:DYU32011_F_21210_02.txt,其中:DYU表示預(yù)處理前兆數(shù)據(jù);32011表示具體臺站;F表示臺站的某個具體測點(diǎn)(每套儀器對應(yīng)一個測點(diǎn));21210表示具體的測項(xiàng),2xx指代地形變觀測,即對由地殼運(yùn)動引起的垂直形變、水平形變、斷裂錯動、重力及應(yīng)力應(yīng)變等變化量的觀測;21210特指重力潮汐變化測項(xiàng),表示測量臺站重力數(shù)據(jù);02表示采樣率為秒。
此外需要特別注意的是,當(dāng)儀器無法采集數(shù)據(jù)或數(shù)據(jù)上傳過程中出現(xiàn)問題時,檢測儀會自動填補(bǔ)缺失數(shù)據(jù),但這些填補(bǔ)的數(shù)據(jù)可能顯著高于或低于正常數(shù)據(jù)的數(shù)倍甚至百倍,缺失數(shù)據(jù)的標(biāo)志值默認(rèn)為999999。測項(xiàng)對應(yīng)的編號及說明如表1所示。
1.2 重采樣
前兆重力數(shù)據(jù)作為一組秒采樣的時間序列數(shù)據(jù),一天的數(shù)據(jù)量為86400條數(shù)據(jù),數(shù)據(jù)量較大。為方便后續(xù)分析與可視化,對預(yù)處理后的前兆重力數(shù)據(jù)進(jìn)行重采樣,重采樣為每30分鐘1個數(shù)據(jù)點(diǎn),這意味著每個重采樣后的數(shù)據(jù)將包含1800條秒級數(shù)據(jù)。重采樣后數(shù)據(jù)的平滑程度和整體趨勢更為明顯,有助于我們更好地識別潛在的異常變化和趨勢,為異常識別提供可靠的基礎(chǔ)。重采樣前后的數(shù)據(jù)如圖1和圖2所示。
1.3 數(shù)據(jù)標(biāo)注
在對重采樣后的數(shù)據(jù)進(jìn)行異常檢測前,采用人工標(biāo)注的方法來識別異常數(shù)據(jù)。基于原始數(shù)據(jù),新增了label列,其中正常數(shù)據(jù)被標(biāo)注為0,而異常數(shù)據(jù)則被標(biāo)注為1。經(jīng)過標(biāo)注處理后的數(shù)據(jù)如圖3所示,其中虛線代表被標(biāo)記為異常的數(shù)據(jù)點(diǎn)。
2 CNN-LSTM-CBAM網(wǎng)絡(luò)模型結(jié)構(gòu)
本文提出的CNN-LSTM-CBAM異常檢測模型結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)(CNN)、長短期記憶網(wǎng)絡(luò)(LSTM)和通道-空間注意力模塊(CBAM),旨在有效檢測地震前兆重力數(shù)據(jù)中的異常。這一模型不僅能夠捕捉時間序列數(shù)據(jù)中的時序特征,還能增強(qiáng)對數(shù)據(jù)內(nèi)部結(jié)構(gòu)的解釋能力,從而提高異常檢測的精度。
CNN作為深度學(xué)習(xí)的一個重要組成部分,廣泛應(yīng)用于時間序列預(yù)測等領(lǐng)域。其結(jié)構(gòu)包括卷積層、池化層和全連接層[9。在卷積層中,模型通過對一維矩陣提取最佳特征,生成卷積輸出,如式(1)所示:
其中 表示卷積輸出,tanh表示激活函數(shù),
表示輸入值,
表示權(quán)重,
表示偏置。
從而為后續(xù)處理提供有效信息。池化層則通過最大池化等方式,減少特征維度并保留重要信息。最終,全連接層對經(jīng)過處理的數(shù)據(jù)進(jìn)行分類或回歸任務(wù)。
在地震前兆重力數(shù)據(jù)的應(yīng)用中,CNN通過自動提取重力數(shù)據(jù)中的關(guān)鍵特征,幫助識別可能的異常模式。
LSTM是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),專門設(shè)計(jì)用于處理長期依賴問題和梯度消失問題[10]。它通過輸入門、遺忘門和輸出門的門控機(jī)制,有效地管理信息流,決定在每個時間步應(yīng)保留多少信息,如圖4所示。
LSTM的設(shè)計(jì)使其在處理時間序列數(shù)據(jù)時具有顯著優(yōu)勢,能夠捕捉數(shù)據(jù)的動態(tài)變化和非線性關(guān)系。
一個標(biāo)準(zhǔn)的LSTM單元包括三個門:遺忘門 決定要遺忘多少先前的數(shù)據(jù);輸入門
,用于計(jì)算要寫入單元存儲器的信息;輸出門
,決定如何計(jì)算當(dāng)前信息的輸出,如式(2)~式(4)所示:
其中, W, R 和 變量表示可訓(xùn)練的矩陣和向量參數(shù)。
LSTM單元定義,如式(5)~式(8)所示:
候選細(xì)胞狀態(tài) 是使用輸入數(shù)據(jù)
和前一個隱藏狀態(tài)
計(jì)算的。細(xì)胞記憶或當(dāng)前細(xì)胞狀態(tài)
是使用遺忘門
前一個細(xì)胞狀態(tài)
、輸入門
和候選細(xì)胞狀態(tài)
計(jì)算的。Hadamard積 ? 表示所涉及矩陣的元素積。輸出
是通過將相應(yīng)的權(quán)重(
和
)應(yīng)用于隱藏狀態(tài)
來計(jì)算的。
在地震前兆重力數(shù)據(jù)的分析中,LSTM能夠?qū)νㄟ^CNN提取的特征進(jìn)行時間序列建模,學(xué)習(xí)數(shù)據(jù)中的時間依賴性,從而更準(zhǔn)確地預(yù)測異常事件的發(fā)生。
CBAM是一種有效的注意力機(jī)制,旨在通過選擇性地聚焦于重要特征,增強(qiáng)模型的表達(dá)能力[]。在CBAM中,通道注意力模塊和空間注意力模塊相輔相成,分別對特征的通道和空間維度進(jìn)行加權(quán)處理,從而提高網(wǎng)絡(luò)的利用率和異常檢測能力,其結(jié)構(gòu)如圖5所示。
通道注意力和空間注意力的計(jì)算如式(9)~式(10)所示:
其中, 表示通道注意力模塊計(jì)算因子,
表示空間注意力模塊計(jì)算因子, ε 表示Sigmoid激活函數(shù),MLP表示多層感知器, F 表示特征向量,unit表示通道組合,conv表示卷積操作。
在地震前兆重力數(shù)據(jù)中,CBAM通過增強(qiáng)重要特征的權(quán)重,減少低效信息的影響,從而提升模型對異常情況的敏感性和識別能力。
結(jié)合以上三個模塊,CNN-LSTM-CBAM模型能夠在時間序列數(shù)據(jù)處理上實(shí)現(xiàn)更高的效果。CNN層提取輸入重力數(shù)據(jù)的高維卷積特征,LSTM層對這些特征進(jìn)行序列建模,學(xué)習(xí)其內(nèi)部的時間依賴性,而CBAM模塊則動態(tài)調(diào)整每個通道和空間位置的加權(quán)系數(shù),進(jìn)一步提升模型的擬合精度和適應(yīng)性。
通過這種組合,模型能夠有效捕捉地震前兆重力數(shù)據(jù)中的時序特征和動態(tài)變化,顯著提高異常檢測的準(zhǔn)確性。模型的整體結(jié)構(gòu)如圖6所示。
3 實(shí)驗(yàn)結(jié)果及分析
3.1 實(shí)驗(yàn)流程
基于CNN-LSTM-CBAM模型的地震重力前兆重力異常檢測算法的整體流程如圖7所示。
在本研究中,首先對地震前兆重力數(shù)據(jù)進(jìn)行標(biāo)注,將數(shù)據(jù)劃分為正常數(shù)據(jù)和異常數(shù)據(jù)。正常數(shù)據(jù)不包含異常情況,用于訓(xùn)練模型以學(xué)習(xí)正常模式;異常數(shù)據(jù)則包含異常樣本,用于測試模型性能。此外, 1 5 % 的數(shù)據(jù)被劃分為驗(yàn)證集,以平衡模型訓(xùn)練和驗(yàn)證的需求。
接下來,構(gòu)建CNN-LSTM-CBAM模型,并使用訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練。訓(xùn)練完成后,模型將對測試數(shù)據(jù)進(jìn)行預(yù)測,通過輸入前一段時間的重力數(shù)據(jù),預(yù)測接下來的重力變化。模型的性能通過均方誤差(MSE)[12]、平均絕對誤差(MAE)[13]、均方根誤差(RMSE)[14]和決定系數(shù) )等指標(biāo)進(jìn)行評估[15]。
異常分?jǐn)?shù)的計(jì)算基于模型預(yù)測值與實(shí)際重力數(shù)據(jù)之間的差異,常用的距離度量包括均方誤差和絕對誤差。計(jì)算后的異常分?jǐn)?shù)經(jīng)過標(biāo)準(zhǔn)化處理,范圍調(diào)整為0到1,便于比較。異常分?jǐn)?shù)越接近1,表示數(shù)據(jù)越可能是異常值。
設(shè)定合理的閾值以標(biāo)記異常數(shù)據(jù)。例如,若閾值設(shè)為0.5,則所有異常分?jǐn)?shù)高于該值的數(shù)據(jù)將被標(biāo)記為異常。最終,通過檢測到的異常分?jǐn)?shù)繪制異常檢測圖示,以便于分析人員快速識別和響應(yīng)異常現(xiàn)象。
3.2 實(shí)驗(yàn)分析
為了更好地評估CNN-LSTM-CBAM模型的前兆重力數(shù)據(jù)異常檢測算法的有效性,本文選擇了經(jīng)典的異常檢測算法作為對比模型,具體包括AutoEncoder(自編碼器)、CNN、LSTM和CNN-LSTM。
本文提出的CNN-LSTM-CBAM模型在CNN-LSTM的基礎(chǔ)上引入了通道和空間注意力機(jī)制,進(jìn)一步增強(qiáng)了模型對重要特征的關(guān)注能力。通過這種方式,模型能夠更精準(zhǔn)地捕捉異常數(shù)據(jù),提高檢測效果。
各模型的異常檢測的實(shí)驗(yàn)結(jié)果如表2所示。
從實(shí)驗(yàn)結(jié)果來看,AutoEncoder的重建誤差相對較高,顯示其對數(shù)據(jù)特征的學(xué)習(xí)能力有限。盡管能夠檢測到一些異常,但整體效果較差,特別是在復(fù)雜數(shù)據(jù)場景中。相比之下,CNN顯著提升了檢測性能,其強(qiáng)大的局部特征提取能力使得異常識別更加準(zhǔn)確,但仍缺乏處理時間序列信息的能力。
LSTM在處理時間序列數(shù)據(jù)方面表現(xiàn)出色,能夠有效捕捉數(shù)據(jù)中的時序特征。盡管在誤差指標(biāo)上與CNN相似,但在動態(tài)數(shù)據(jù)分析中,LSTM更能識別潛在的異常模式。結(jié)合CNN和LSTM優(yōu)勢的CNN-LSTM模型在空間特征提取和時間序列處理上都有所增強(qiáng),其 值的提升表明該模型能夠更準(zhǔn)確地識別異常情況,顯著降低了重建誤差。
引入CBAM后,CNN-LSTM-CBAM模型表現(xiàn)出色,所有性能指標(biāo)均達(dá)到了最佳水平。該模型在特征選擇上更為精細(xì),能夠更有效地關(guān)注關(guān)鍵特征,進(jìn)一步提升了異常檢測的準(zhǔn)確性。
綜上所述,CNN-LSTM-CBAM模型在異常檢測任務(wù)中展現(xiàn)了最高的性能,尤其是在 值上達(dá)到了0.887,表明其對數(shù)據(jù)異常的捕捉能力極強(qiáng)。相比于其他模型,該算法在處理復(fù)雜數(shù)據(jù)時能夠更精準(zhǔn)地識別潛在異常。實(shí)驗(yàn)結(jié)果清楚地表明,結(jié)合空間和通道注意力機(jī)制的CNN-LSTM-CBAM模型顯著優(yōu)于傳統(tǒng)的單一模型,為異常檢測提供了更為有效的解決方案。
為了進(jìn)一步優(yōu)化異常檢測過程,本文設(shè)置了一個合理的閾值,用于將異常分?jǐn)?shù)與該閾值進(jìn)行比較。當(dāng)樣本的異常分?jǐn)?shù)高于這一閾值時,對應(yīng)的重力數(shù)據(jù)將被標(biāo)記為異常。例如,將閾值設(shè)為0.5,所有異常得分高于0.5的樣本將被視為異常。這種方法使得異常檢測過程更加系統(tǒng)化,并有效減少了誤報(bào)。得到的異常分?jǐn)?shù)如圖8所示。
根據(jù)異常檢測分?jǐn)?shù)的結(jié)果,將高于設(shè)定閾值的點(diǎn)標(biāo)記為異常。基于重采樣數(shù)據(jù),標(biāo)記檢測到的異常并繪制了異常檢測圖示,如圖9所示,其中虛線代表被檢測為異常的數(shù)據(jù)。這種可視化方式便于分析人員快速識別異常,提升了對重力數(shù)據(jù)異常的響應(yīng)效率,同時也有助于進(jìn)一步追蹤和研究這些異常現(xiàn)象的潛在原因及后果。
4結(jié)論
本研究提出的CNN-LSTM-CBAM模型在地震前兆重力數(shù)據(jù)的異常檢測中表現(xiàn)出色。該模型通過結(jié)合CNN和LSTM,有效捕捉多維時序數(shù)據(jù)中的潛在非線性關(guān)系和長期特征。CNN負(fù)責(zé)提取重力數(shù)據(jù)的空間特征,而LSTM則專注于學(xué)習(xí)時間序列的動態(tài)變化。引入的CBAM注意力機(jī)制進(jìn)一步增強(qiáng)了特征提取能力,使模型能夠更精準(zhǔn)地關(guān)注重要特征。這種綜合方法不僅提高了異常檢測的準(zhǔn)確性,還能有效識別潛在的異常數(shù)據(jù),為地震前兆信號的監(jiān)測提供了可靠依據(jù)。
模型通過其高效的特征學(xué)習(xí)和異常檢測能力,為地震前兆的研究提供了一種科學(xué)、系統(tǒng)的方法,增強(qiáng)了對地震風(fēng)險(xiǎn)的管理能力,助力于提升地震預(yù)測的準(zhǔn)確性和及時性,研究人員和決策者可以更有效地利用這些數(shù)據(jù)進(jìn)行前期預(yù)警和防災(zāi)減災(zāi)工作。
參考文獻(xiàn):
[1]李艷娥.基于孕震過程追蹤的強(qiáng)震預(yù)測方法研究[D].北京:中國地震局地球物理研究所,2023.
[2]徐錫統(tǒng).地震擾動下地球多圈層異常分析及其演化模式研究[D].長春:吉林大學(xué),2024.
[3]池成全.鉆孔應(yīng)變前兆觀測數(shù)據(jù)分析與異常提取研究[D].長春:吉林大學(xué),2020.
[4]辛建村,方煒,楊宜海,等.2021年酒泉阿克塞縣MS(S下標(biāo))5.5地震前地電場變化分析[J].地震,2023,43(4):153-168.
[5]劉杰.基于循環(huán)神經(jīng)網(wǎng)絡(luò)的汶川地震地下流體前兆識別方法研究[D].成都:成都理工大學(xué),2021.
[6]孫一書.城市拖電瞬變電磁數(shù)據(jù)降噪與反演方法研究[D].長春:吉林大學(xué),2023.
[7]王洪洲.基于深度學(xué)習(xí)的地震勘探數(shù)據(jù)去噪及速度模型反演技術(shù)研究[D].長春:吉林大學(xué),2024.
[8] KAVIANPOUR P,KAVIANPOUR M,JAHANI E,etal.ACNN-BiLSTMModelwithAttentionMechanism forEarthquake Prediction [J].Journal of Supercomputing,2023,79(17):19194-19226.
[9] ZHANG H,ZHAI H,LIU T T,et al. Short-termComprehensive Prediction Method for Regional EarthquakesBased on Multi-source Information Fusion [J].Proceedings of theIndian National Science Academy,2024 (prepublish):1-11.
[10]BUDAKC,GIDERV.LSTMBasedForecastingof theNext Day's Values of Ionospheric Total Electron Content (TEC)as an Earthquake Precursor Signal [J].Earth Science Informatics,2023,16(3):2323-2337.
[11] LIHY,LIJH,LIXG,et al. Seismic PickingAttention Module[J].IEEE TransactionsonGeoscienceandRemote Sensing,2024,62:1-6.
[12] MOUDDEN TEL,AMNAI M,CHOUKRIA,etal. Artificial Intelligence for Assessing the Planets' Positions asa Precursor to Earthquake Events [J].Journal of Geodynamics,2024,162:102057.
[13]羅旭辰.基于多源深度學(xué)習(xí)的地震預(yù)測模型研究[D].成都:電子科技大學(xué),2023.
[14] ZHANGJY,SUNK,ZHUJQ,et al.ApplicationofModel-based Time Series Prediction of Infrared Long-waveRadiation Data for Exploring the Precursory Patterns Associatedwith the 2021 Madoi Earthquake[J].Remote Sensing,2023,15(19):1-22.
[15]史翔宇.基于機(jī)器學(xué)習(xí)回歸算法的地震預(yù)測研究及其在中國地震科學(xué)實(shí)驗(yàn)場的應(yīng)用[D].北京:中國地震局地震預(yù)測研究所,2021.
作者簡介:邢乾龍(1999一),男,漢族,河南商丘人,碩士在讀,研究方向:地震前兆異常、大數(shù)據(jù)處理、深度學(xué)習(xí);通信作者:劉慶杰(1978一),男,漢族,河南洛陽人,教授,碩士,研究方向:大數(shù)據(jù)處理。