宋奕瑤 李忠 安建琴 張麗娟 史鵬飛



摘 要:為提取汶川大地震前的電離層異常信息,特選取汶川大地震前10天的DEMETER衛星電場數據作為研究對象,以均值、均方差、偏度和峰度等四類隨機信號數字特征作為輸入層,經過若干次樣本訓練建立SOM網聚類模型。結果表明,汶川地震前衛星采集的震區信號存在若干異常數據,可能與震前電磁波輻射引起電離層擾動有關。
關鍵詞關鍵詞:SOM網絡;聚類;DEMETER衛星;異常分析;超低頻電場數據
DOIDOI:10.11907/rjdk.161986
中圖分類號:TP319
文獻標識碼:A 文章編號:1672-7800(2016)008-0140-03
0 引言
近年來,伴隨著國際地震電磁衛星研究的迅速發展,利用衛星觀測數據提取地震電離層前兆信息成為地震預測研究中倍受關注的新手段[1]。法國于2004年發射的DEMETER衛星是一顆專門用于地震監測的電磁衛星,其科學目標是觀測地震或者火山活動引起的空間電離層擾動現象以及電場、磁場等變化情況,吸引了大批科學家參與其中的研究工作。Pulinets、Chuo等[2-3]的研究表明,由地震活動引起的電離層變化不僅確實存在,而且在5級以上地震發生前的幾個小時到幾天會發生電離層擾動。閆相相等[4]利用GPS和DEMETER數據分析汶川地震前電離層變化,對基于巖石圈—大氣層—電離層耦合的地震電離層異常機理進行了研究分析。
顏蕊等[5]利用DEMETER衛星數據分析了強震前后的電離層異常,認為異常可能與地震發生的關系較大。溫巖等[6]將SOM網絡模型應用在地震預報研究中,得到了較好的聚類結果。項月文等[7]將人工神經網絡應用在未來地震震級預測中,并將SOM與RBF兩種模型相結合,有效提高了預測精度。競爭SOM網絡不需要學習樣本,能夠通過自動尋找數據中的內在規律和本質屬性,自組織、自適應地改變網絡參數與結構,適合對海量地震電磁監測衛星數據進行聚類,分析預測區電磁數據與地震發生的相關性,為進一步的地震監測預報提供科學依據。
本文利用DEMETER電場數據研究汶川大地震前10天的數據變化特征,采用SOM網對電磁衛星數據進行聚類分析。
1 SOM神經網絡
1.1 工作原理
SOM神經網絡模擬大腦神經系統的自組織特征映射的功能,是一種由全互連的神經元陣列組成的自組織、無監督的競爭式學習網絡,通過對輸入樣本的自組織學習,可以在無教師示范情況下對輸入樣本實現自動聚類[8]。此網絡在數據聚類、模式分類、故障診斷方面應用廣泛。
SOM神經網絡的網絡結構分為輸入層和輸出層,輸出層即競爭層,兩層之間實現全連接。輸入層通過權向量將外界信息匯集到輸出層的各神經元。輸出層的神經元排列組合有多種多樣,常用的是一維線陣和二維平面陣。輸出層是一維線陣是最簡單的,其結構如圖1(a)所示,輸出層的每個神經元之間都有側向連接。而輸出層是二維平面陣結構,更加類似大腦皮層,輸出層每個神經元和它附近的每個神經元均側向連接,構成棋盤狀平面,其結構如圖1(b)所示。
SOM神經網絡在訓練時,隨機選取訓練集中的樣本作為輸入向量,通過計算,尋找與之距離最短的輸出層節點,對其更新,此過程即尋找獲勝神經元的過程。與此同時,獲勝神經元臨近的神經元權值也按照某個臨近的函數進行更新。經過學習訓練,得到一個以最終獲勝的權值向量為中心,周圍分布著與之相關數據的網絡,如此反復迭代以后,本身有聯系的數據就會聚集到一起,形成一類,這就是SOM的聚類過程。
1.2 訓練過程
SOM網訓練過程如下:
(1)初始化網絡。初始化輸出層權向量以及學習率,歸一化輸入向量和輸出層權向量,設置初始優勝鄰域。
(2)檢索獲勝神經元。將當前輸入向量與輸出層權向量按照歐氏距離進行相似性比較,距離最小者為獲勝神經元。
(3)權值調整。調整獲勝神經元鄰域區內的所有權值,使其向輸入向量靠攏。
(4)結束。繼續提供新的輸入向量進行訓練,收縮鄰域半徑、減小學習率、重復以上過程,直到小于學習率的允許值,輸出聚類結果。
2 數據來源及特征提取
本文選擇2008年5月2日至2008年5月12日的DEMETER地震電磁衛星軌道數據進行分析。在此期間,電磁衛星記錄到13條半軌數據,其中7條升軌和6條降軌,總數據量為69.3MB,每256個數據為一組,共計4086組,錄入數據庫保存。相關數據可以從 DEMETER 衛星中心網站上下載。
DEMETER衛星采集的超低頻電場數據是以時間為參變量的隨機序列。隨機信號序列的數字特征包括均值(mean value)、均方差(mean square error)、偏度(skewness)和峰度(kurtosis)等4個數字特征[1]。均方差反映數據內部個體間的離散程度,偏度是統計數據分布偏斜方向和程度的度量,是統計數據分布非對稱程度的數字特征,而峰度表征概率密度分布曲線在平均值處峰值高低的特征數。
對于每組數據計算4個隨機信號特征值,作為SOM網輸入層進行訓練。采集數據的隨機信號特征如圖2所示,可以看出特征值變化較大。
3 SOM網在空間電場數據聚類中的應用
3.1 輸出層設計
3.1.1 一維SOM和二維SOM的比較
輸出層網絡結構的設計關系著整個網絡的優劣。直覺上,二維SOM比一維SOM能保持更多的數據集結構信息。但是,已有對一維SOM神經網絡的聚類及數據分析方法研究表明,一維SOM在聚類方面不僅不遜色于二維SOM,而且在類邊界識別、樣本之間的相似關系表達和類間相鄰關系表達方面更容易和明確[9]。
將隨機信號的4個數字特征作為輸入層,以歐氏距離來描述兩個輸入模式間的相似性,尋找獲勝神經元,學習率取0.05,訓練次數為5000次,設置輸出層網絡結構分別為2*2和4*1進行訓練,得到的聚類結果如圖3、圖4所示。
可以看出,同樣是聚成4類,一維SOM比二維SOM的結果更為明確。
3.1.2 一維SOM網結構分析
對于一維SOM網,按照不同的網絡結構進行訓練(見表1)。可以看出,當節點數過少時,不足以區分所有模式類,可能會導致異常信息的缺失,如2*1和3*1的網絡結構,當節點數大于4時,由于這些節點遠離其他獲勝節點,故其權向量從未得到調整。因此本文選取4*1的輸出層網絡結構。
3.2 結果分析
以表1中4*1網絡結構計算結果繪制聚類圖形,從圖3可以看出,絕大多數數據屬于第1類,這部分數據可認為是正常值。將其它3類數據繪制在一張圖上,如圖5所示。
可以看出,第4類數據遠離汶川震中位置,在南緯50度以上,數量較少,可認為是噪聲;而第2類和第3類數據位于汶川地震震中以南區域,向赤道方向偏移,呈放射狀分布。對比半軌文件發現,放射線與衛星軌道重合,這反映出在汶川地震前存在信號異常。這與文獻[10]、[11]的研究結果一致[11]。
4 結語
本文分析了汶川地震前10天DEMETER衛星空間電場的ULF頻段數據,以均值、均方差、偏度、峰度等4個隨機信號數字特征作為輸入層參數,建立了SOM網聚類模型,計算結果表明,汶川大震前空間電場數據存在異常。結論如下:①空間電場聚類分析結果顯示,數據異常主要集中在汶川震中南部區域,可能與地震破裂從南往北走向有關;②SOM網聚類模型可以較好地實現空間電場數據的聚類分析,并從中獲取異常信息,對地震前兆異常分析研究具有重要意義。
本文研究了天基衛星采集的電場數據,來源較單一,后續將加入地基觀測數據,通過空間數據挖掘的方法對天基和地基數據進行綜合分析,以期達到更好的識別效果。
參考文獻:
[1]安張輝,譚大誠,陳軍營,等.DEMETER衛星磁場波形數據分析方法初探[J].華南地震,2011(3):55-64.
[2]PULINETS S A,LEGEN′KA A D,KARPACHEV A T,et al.The earthquake prediction possibility on the base of topside sounding data[J].Izmiranpreprint,2001(981):25.
[3]CHUO Y J, CHEN Y I, LIU J Y, et a1.Ionospheric fof2 variations prior to strong earthquakes in Taiwan area[J].Advances in Space Research, 2001(27):l305-1310.
[4]閆相相.基于GPS和DEMETER衛星數據的地震電離層電子濃度異常變化研究[D].北京:中國地震局地質研究所,2013.
[5]顏蕊,王蘭煒,胡哲,等.利用DEMETER衛星數據分析強震前后的電離層異常[J].地震學報,2013(4):498-511.
[6]溫巖,張晨俠.自組織競爭網絡模型在地震預報研究中的應用[J].東北地震研究,2003(4):18-23.
[7]項月文.基于SOM自組織神經網絡的地震預報技術研究[D].南昌:南昌大學,2012.
[8]韓立群.人工神經網絡理論、設計及應用[M].北京:化學工業出版社,2007:71-85.
[9]于鷃.基于一維SOM神經網絡的聚類及數據分析方法研究[D].天津:天津大學,2009.
[10]劉靜,萬衛星.中國6.0級以上地震臨震電離層擾動時空分布特征研究[J].地球物理學報,2014(7):2181-2189.
[11]閆相相,單新建,曹晉濱,等.利用DEMETER衛星數據統計分析全球M_w≥7.0地震的電離層電子濃度異常[J].地球物理學報,2014(2):364-376.
(責任編輯:陳福時)