常魯冀 郝洪濤,3 胡敏章,3
1 防災科技學院信息工程學院,河北省三河市學院街465號,065201
2 中國地震局地震大地測量重點實驗室,武漢市洪山側路40號,430071
3 湖北省地震局,武漢市洪山側路48號,430071
地震是造成人員傷亡和經濟損失最為嚴重的自然災害之一。自19世紀70年代后期現代地震學創立以來的140余年里,地震孕育與發生的規律和機理一直是地震學研究的重要方向[1]。
地表重力變化包含有豐富的構造運動信息,是研究地震孕育與發生過程的重要數據和手段[2-4]。近年來,我國研究人員利用基于地震重力觀測獲取的地表重力變化結果,在2008年汶川8.0級地震[5]、2013年蘆山7.0級地震[6]、2016年門源6.4級地震[7]等強震地點判定工作中取得良好效果,顯示出重力場變化信息在認識地震孕育和發生規律中具有的獨特作用。一些學者對地震前后重力變化特征進行總結,進一步獲得一些典型的地震前重力變化異常現象指標,如四象限分布特征中心附近往往對強震發生地點的判定具有指示意義[8]。
然而,前述研究對于重力變化異常特征區的識別主要采用人工判讀方式,一方面耗時費力,另一方面也存在對研究人員的經驗依賴問題。在分析不同研究區域、不同時間尺度和不同空間尺度的大量重力變化圖像時,往往難以對重力異常特征區進行全面統計分析。近年來快速發展的基于機器學習的圖像識別方法為重力變化異常特征區的快速自動化識別提供了可能。
2010年,Mikolov等[9]提出初代圖像識別算法R-CNN。此后,基于深度學習的目標檢測方法不斷涌現,如Faster R-CNN、Mask R-CNN、YOLO(you only look once)等。其中,YOLO算法在檢測速度上較R-CNN等算法具有明顯優勢,經過多次迭代升級,其算法結構逐漸完善成熟,已成為當前目標檢測研究應用的熱點之一。在YOLO各版本算法中,YOLOv5在算法性能和檢測速度上具有較好的均衡性,具有更廣泛的應用。Liu等[10]對YOLOv5各分支訓練的平均精度與速度的對應關系的統計結果表明,YOLOv5s在高精度的情況下識別速度最快。
本文擬采用YOLOv5s算法,以近年來我國南北地震帶地區不同時空尺度的重力變化圖像為例,研究重力變化四象限異常特征區自動化識別方法。本文結果可為強震前重力變化異常快速識別提供技術支撐,并為重力場變化異常特征與地震孕育發生的機理研究提供參考。
YOLOv5是目前應用較為廣泛的單階段目標檢測模型。該模型不僅在YOLOv4的基礎上延續使用Mosaic數據增強功能,同時升級自適應錨框匹配、標簽縮放以及圖像自適應等數據增強功能,可有效提高對小圖像的識別精度,代碼結構也更加簡潔,運行速度顯著提高。
YOLOv5由Input(輸入端)、Backbone(骨干網絡)、Neck(頸部結構)、Head(頭部結構)4個部分組成,網絡架構如圖1所示。

圖1 YOLOv5結構示意圖Fig.1 YOLOv5 structure diagram
算法從Input開始,選取640像素×640像素作為輸入,隨后傳輸至Backbone提取圖像信息,再將初始輸入圖像轉化為多層特征圖,用于后續目標檢測。Backbone部分主要由Focus模塊、CBL模塊、CSP1_X模塊組成,其中Focus模塊將多個經Slice層切割后的結果綜合起來,交由CBL模塊處理。CBL模塊由卷積層、BN層和激活函數Leaky Relu三個部分組成,主要功能為提取局部空間信息,同時Leaky Relu函數可以避免神經元死亡,從而進一步提高模型的性能。CSP1_X模塊是在CBL模塊上增加Res單元層、CONV層以及Concate層升級而來,其結構圖如圖2所示。

圖2 CSP1_X模塊結構示意圖Fig.2 CSP1 _X module structure diagram
Neck網絡處于Backbone與Head之間。YOLOv5中添加FPN+PAN結構,將Concat操作后的CBL模塊更換為CSP2_1模塊,利用該模塊進一步提取Backbone部分的特征,借此提高特征的多樣性,同時增強模型的魯棒性,加強模型的抗噪能力。Head輸出端獲取網絡的輸出,完成目標檢測結果的處理,利用已經提取的特征作出預測。
YOLOv5模型的分支子模型眾多,按模型復雜度可依次排列為YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x等,由于復雜度不同,每個模型具有不同的優缺點,模型復雜程度越高,則訓練精度越高,訓練時間也越長;相反,模型復雜度越低,則訓練精度越低,訓練時間也越短。YOLOv5各函數分支訓練的平均精度與速度的對應關系表明,YOLOv5s在高精度的情況下識別速度最快。因此,本文選擇YOLOv5s模型,在保證對四象限區域識別準確性的前提下,相同時間內可識別更多區域。
模型預測結果的類別可分為正例(positive,P)與負例(negative,N)兩種,正例與負例的布爾類型分為真(true,T)與假(false,F),故預測結果共有4種,4種結果的混淆矩陣如表1所示。

表1 預測結果的混淆矩陣
模型的優劣可用精度(precision)、召回率(recall)、平均精度(average precision,AP)3個指標進行衡量。精度(precision)是衡量模型預測準確率的重要標準,表示預測的正例(TP)在包含正例與反例(FP)所有預測結果總數中的占比,精度越高,模型預測越準確。其計算公式如下:
(1)
召回率(recall)是預測成功的正例與總正例的比值,總正例包含預測成功的正例與未預測成功的正例(FN)。召回率越高,漏判的情況越少,因此應盡量降低召回率,以提高模型的準確性。召回率計算公式如下:
(2)
平均精度是precision-recall曲線所圍成的面積值,在全類別內進行平均可得到全類平均精度(mAP)。由于在本次實驗中只有四象限特征區一種識別內容,故平均精度與全類平均精度相等,其計算公式如下:
(3)
式中,N為類別數量。
南北地震帶是我國地震重力監測的重點地區之一。該地區自2014年起形成常態化的整體觀測(測點分布如圖3所示,圖中藍色五角星為絕對重力測點,紅色圓點為相對重力測點,淺藍色線為活動塊體邊界線),至2022年總計獲得18期觀測成果。根據國家地震科學數據共享中心提供的地震目錄,2014~2022年期間南北地震帶重力測區內共發生7.0級以上地震2次、6.0~6.9級地震13次、5.0~5.9級地震62次。豐富的觀測數據和頻繁發生的中強地震使南北地震帶地區成為研究重力場變化與地震發生關系的理想區域。本文將中國地震局重力技術管理組提供的南北地震帶地區重力變化圖像作為圖像識別訓練的數據集。經統計,2014~2022年時段內共有153幅不同時間尺度的重力變化圖像。

圖3 南北地震帶地區重力測點分布Fig.3 Distribution of gravity measurement points in the north-south seismic zone
重力變化圖像處理時首先要通過人工判別的方式對四象限特征區域進行標注。由于四象限區域的面積具有大小不唯一的特點,故而選取標簽區域的大小會影響識別結果,標簽區域過小,會導致異常區域的特征不明顯;標簽區域過大,則會導致背景區域中摻雜的重力變化區域的特征影響實際異常區域的特征,從而影響識別精度。本文利用改變圖片大小、固定標簽大小的方式,以保證不同范圍內的四象限區域標簽大小一致,并通過縮放,減少標簽中最終劃定區域所受邊界位置模糊的影響,以保留更多特征。此外,由于重力變化區域的特征較少,為降低識別區域周圍的重力變化對最終訓練結果產生的負面影響,在劃定標簽區域時,應盡可能涵蓋完整的異常區域,同時提高異常區域占標簽總面積的比例。
重力變化圖像中的四象限區域分為以正變化區域為主的連通類型與以負變化區域為主的連通類型,兩種標簽類型同屬重力異常四象限區域,異常區域的色度結構相反。本文將兩種區域標記為相同標簽,預測結果中同樣標為同種類別,圖4為兩種不同相連方式的四象限區域的標簽示例。使用LabelImg對153幅圖像進行四象限區域標注,共獲得237個四象限區域標簽。

圖4 不同類型的標簽示例Fig.4 Examples of different types of labels
為滿足機器學習中模型訓練對訓練集數量的要求,利用翻轉、鏡像、色度調整、亮度調整、隨機添加噪聲等數據增強方式對標注好的數據集進行進一步擴增,最終獲得2 065幅圖像、3 199個四象限標簽區域。將數據集制作為VOC格式,按照9∶1的比例分為訓練集與測試集,其中訓練集為1 858幅圖像,測試集為207幅圖像。圖5為經處理后的訓練集示例。

圖5 訓練集示例Fig.5 Example of training set
Pytorch深度學習框架具有簡潔高效、性能優良等優點,本文使用該框架進行模型搭建,模型環境及參數如表2所示。經過計算,使用該參數總步長可達50 000以上,對模型訓練具有良好的效果。

表2 實驗環境
總體訓練前,進行預訓練能有效提升訓練效率,節省計算資源。本文使用少量樣本進行預訓練,將所得參數作為初始訓練參數加入到大樣本的訓練中。對比結果如圖6所示,圖中Loss值代表收斂效果。結果表明,經過預訓練,模型獲得更快的收斂速度,在相同迭代次數內收斂程度更好。

圖6 預訓練與非預訓練收斂效果對比Fig.6 Comparison of convergence effect between pre-training and non-pre-training
利用訓練后模型對207幅測試集圖像進行識別測試,結果如表3所示。模型總體精度為94.09%,YOLOv5s在實際圖像識別應用中,對于小目標的識別精度普遍優于90%,本模型精度處于合理范圍,結果具有參考價值。模型召回率為89.74%,說明能夠有效識別約90%的重力變化四象限特征區域,具有較好的預測結果。模型平均精度達到95.25%,表明模型與所識別圖像擬合程度達到較好水平,目標區域的識別定位準確且覆蓋范圍合理。

表3 測試結果統計
對測試集中不同相連類型的重力異常區域進行統計,正變化連通為主的區域共116個,精度為92.92%;負變化連通為主的區域共93個,精度為95.54%。將兩種連通類型的不同區域標為同種標簽時,二者識別精度接近,對總體精度影響較小,顯示模型在不同類型區域的識別效果較為穩定。因此,選擇此類標簽方式可以在不影響最終結果的情況下減少前期標注工作量,尤其在大量數據需要進行標識的情況下具有較為明顯的優勢。
圖7為測試集中2021-09~2022-05約0.5 a時間尺度的重力變化圖像識別結果,圖中紅色方框為模型識別區(S為四象限區域標簽名稱,0.95為置信度),下部黑色五角星為瀘定6.8級地震震中,上部黑色五角星為蘆山6.1級地震震中。識別區域預測框較為完整地包含了龍門山斷裂南段至安寧河斷裂地區重力變化四象限區域。2022-06-01四川蘆山地區發生6.1級地震,同年09-05瀘定地區發生6.8級地震,兩次地震的震中都位于模型識別圈定的四象限特征區范圍內。這一方面進一步表明四象限特征對于地震地點判定具有重要的參考意義,另一方面也表明本文基于機器學習的四象限特征區識別方法對于重力異常區域的篩選以及潛在的地震風險研判具有較好的應用潛力。

圖7 識別結果示例Fig.7 Example of recognition results
為進一步驗證訓練模型的識別效果,另選取部分現有文獻中發布的具有四象限特征的重力變化圖像進行測試。首先,對文獻中發表的基于位錯理論計算的2003年大姚MS6.2、MS6.1兩次地震同震變化結果[11]進行識別測試。由圖8可知,重力變化圖像表現出較為標準的四象限分布特征,而識別區域則準確覆蓋了四象限中心區域。其次,對文獻中發表的基于實測數據計算的2016-12呼圖壁6.2級地震前1 a時間尺度重力變化結果[12]進行識別測試,但結果顯示(圖9)模型未能識別出紅色虛線框內基于人工判讀劃定的四象限特征區。對圖9進行分析發現,文獻中標注的四象限特征相比標準四象限特征存在明顯的畸變,這也表明,由于四象限特征區的人工判讀仍具備較大的不確定性,異常特征區識別仍需要更多的樣本進行訓練,以進一步提高模型對于非標準四象限特征區的識別效果。

圖8 標準四象限識別結果示例 (重力變化圖引自文獻[11])Fig.8 Example of standard four-quadrant recognition results (the gravity change map is cited from the literature[11])

圖9 2016年呼圖壁MS6.2地震震前重力變化圖像 (重力變化圖引自文獻[12])Fig.9 Image of gravity change before Hutubi MS6.2 earthquake in 2016(the figure of gravity change is cited from literature[12])
針對基于人工判讀方式對重力變化異常特征區進行識別存在效率低下的問題,本文提出利用YOLOv5s算法進行重力變化四象限特征區識別的方法,并基于南北地震帶地區實測重力變化圖像進行訓練和測試,主要得出以下認識:
1)對基于YOLOv5s進行重力變化異常識別所涉及的訓練集建立和訓練方法進行探索測試,結果表明,采用圖像增強、對圖像進行尺寸調整并同時保持標簽大小不變等策略,可利用有限數量的重力變化圖像構建訓練效果較為理想的數據集。采用在總體訓練前先進行預訓練的策略,可使模型獲得更快的收斂速度,在相同迭代次數內收斂程度更好。此外,將正變化為主和負變化為主的兩種區域連通類型的四象限特征區域標注為同種標簽,對圖像識別結果無影響,但可顯著減少圖像特征區標注的工作量。
2)測試集圖像識別統計結果表明,模型預測結果的精度、召回率、平均精度等指標均處于合理范圍。南北地震帶2021-09~2022-05時段的重力變化圖像識別結果表明,模型較為準確地識別出龍門山斷裂南段至安寧河斷裂地區重力變化四象限特征區域,且識別區域內先后發生2022-06蘆山6.1級地震和2022-09瀘定6.8級地震。這也表明,本文方法對于重力異常區域的篩選以及潛在的地震風險研判具有較好的應用潛力。
3)對現有文獻中標注有四象限特征區的重力變化圖像的識別測試結果表明,本文模型對標準四象限特征區具有較好的識別能力,但對于非標準四象限特征區的識別仍存在一定不足。由于四象限特征區的判定目前缺少較為嚴格的標準,因此想要獲取更為合理的四象限相關特征,更為全面和準確地識別四象限異常特征區,仍需要構建數量更多、標注更為合理的數據集。