(上海工程技術大學 電子電氣工程學院,上海 201620)
傳統地震儀可以提供地震發生時間、地震波相關數據等必要信息,能幫助迅速判斷地震震級等內容,為預警與后續救災措施提供幫助。但是寬頻帶地震儀在需要密切關注的強震預測方面表現不佳。文獻[1]中指出強震會導致傳統地震儀數據缺失,無法完整反映相關數據,且難以準確獲得地殼形變信息,并提出引入強震儀數據作為補充手段,完善預警能力。文獻[2]中同樣提到了了強震儀數據對傳統地震儀的補足能力。文獻[3]給出了利用長短期神經網絡對補全GPS 數據的辦法。而在深度學習方面,文獻[4]早已證實卷積神經網絡與長短期神經網絡的聯合使用,并加以驗證。文獻[5]則是機器學習領域在地震預警方面的應用,結合分類算法與數學優化算法來嘗試解決復雜的地震預測問題。
本文認為可以通過把卷積神經網絡出色的特征提取能力與長短期記憶神經網絡在時間序列數據方面的學習能力結合在一起,學習地震監測時間序列數據與震級之間的關系。借鑒孿生神經網絡的設計思想,來快速預測震級。以下將就該神經網絡模型如何實現進行說明。
將地震震級預測看成一個多分類問題來求解。
考慮到數據分傳統GPS 數據與strong-motion(強震)數據,因此作為將兩個輸入作為一組樣本,一起放入神經網絡模型中進行訓練與測試。由于GPS 數據與strong-motion數據在時間間隔、基站經緯度,甚至部分海拔高度也不盡相同,因此,包括與地震波相關的N、E、U三個方向上的差異量在內,額外增加經度、緯度、海拔高度、時間間隔等共七個特征數據,形成時間序列,以地震震級作為標簽。在神經網絡模型上,借鑒孿生神經網絡的設計,內部采用卷積神經網絡(CNN)與長短期記憶神經網絡(LSTM)聯合使用的方式來處理。
首先介紹本文使用的幾個神經網絡具體實現,接著說明選取的損失函數。實驗整體框架如圖1 所示。

圖1 實驗整體框架
孿生神經網絡(Siamese Network)用于衡量兩個輸入的相似程度,其最大的特點是兩個神經網絡權重相同且完全相同。這兩個神經網絡分別將輸入映射到新的空間,形成輸入在新的空間中的表示,最終通過損失函數計算來評判輸入相似度。最早出現在支票上的簽名驗證[5]。隨著發展,也有偽孿生神經網絡(Pseudo-Siamese Network),特點在于兩邊不共享權值。本實驗模型主體參考傳統孿生神經網絡設計。傳統孿生神經網絡如圖2 所示。

圖2 傳統孿生神經網絡
人工智能發展至今,卷積神經網絡可以說是最廣為人知,也是最具代表性的神經網絡之一。這主要得益于它在圖像特征提取方面上非常出色的表現。也正是通過這一特點,讓它在與圖像特征提取相關的應用場景都有著難以撼動的地位并取得了許多卓越成就。近些年,其主要與其他神經網絡聯合使用以進一步提高準確度。
長短期記憶網絡是一種時間遞歸神經網絡,適合于處理和預測時間序列中間隔和延遲相對較長的重要事件。作為循環神經網絡(RNN)的變體,它保留了RNN 的功能:向前傳遞相關信息,同時處理當前信息。變化在于,它在這基礎上增加了遺忘門、輸入門、輸出門,通過這三個門獲得了保留或者遺忘信息的能力。因此,LSTM 擁有著記住長期信息的能力。本文實驗主要是卷積神經網絡與長短期記憶神經網絡的聯合運用。本文神經網絡結構如圖3 所示。

圖3 本文神經網絡結構
對于一個二分類問題,一般做法是將神經網絡節點的輸出通過某一個激勵函數轉化為屬于某一類的概率。多分類問題神經網絡最常用的方法是根據類別個數n,設置n個輸出節點,這樣每個樣本神經網絡都會給出一個n維數組作為輸出結果。
本文將地震震級預測可以看作為一個多分類問題,因此,在網絡模型后將softmax 作為激勵函數,將交叉熵(Cross entropy)作為損失函數。現在大多數框架都將兩個函數合并在一起使用,使代碼實現變得十分簡單。
本文主要以海外地震相關信息作為數據進行研究,且較少量數據情況下,也能取得較好的預測結果。數據有5 172組的情況下,有效準確率在87.12%。