杜星,孫永福,宋玉鵬,修宗祥,單治鋼
( 1.中國電建集團華東勘測設計研究院有限公司,浙江 杭州 311122;2.自然資源部第一海洋研究所,山東 青島 266061;3.青島海洋科學與技術(shù)試點國家實驗室 海洋地質(zhì)過程與環(huán)境功能實驗室,山東 青島 266237;4.國家深海基地管理中心,山東 青島 266237)
海底滑坡是一種極具破壞力的海洋地質(zhì)災害現(xiàn)象。大型海底滑坡甚至能夠引起數(shù)千立方千米的沉積物進行長距離運移[1],對海洋采油平臺[2]、海底光纜[3]、電纜等各類工程設施造成損害甚至引發(fā)海嘯,造成通信中斷、平臺倒塌等一系列事故,給人類的生命安全和財產(chǎn)造成巨大的威脅[4–5]。因此,研究海底滑坡的特征、機理并進行危險性預測對于海洋工程的安全性具有重要作用。
目前,海底滑坡的研究方向主要有:利用高精度地球物理探測進行滑坡形態(tài)識別和分類[6–8]、通過數(shù)值分析的方法開展海底滑坡穩(wěn)定性計算[9–10]以及使用常規(guī)水槽或離心機等物理模型試驗模擬滑坡過程[11–13]。雖然通過上述常規(guī)研究取得了較大的進展,然而受海底滑坡自身控制條件復雜、觸發(fā)影響因素眾多、監(jiān)測難度大等原因的影響,危險性評價分級方面的研究仍然較為不足。基于機器學習進行滑坡危險性預測的方法在陸上滑坡研究[14–17]中已有運用并成為一種熱門的研究手段,然而該方法用于海底滑坡的研究仍然較少。同時由于陸上滑坡規(guī)模相對較小、結(jié)果易于監(jiān)測、影響因素單一等原因,適用于有監(jiān)督機器學習,而海底滑坡大多無法得到明確的影響因素和危險性結(jié)果,所以不太適用于陸地上常用的方法。為此,本文引入了無監(jiān)督機器學習中的譜聚類算法構(gòu)建海底滑坡危險性評價體系,結(jié)合研究區(qū)各類地質(zhì)環(huán)境影響因子展開海底滑坡危險性評價分級。
譜聚類算法(Spectral Clustering)是人工智能領(lǐng)域的一種無監(jiān)督機器學習算法,主要用于處理沒有標識信息的數(shù)據(jù)。通過對樣本數(shù)據(jù)的拉普拉斯矩陣的特征向量進行聚類,從而達到對樣本數(shù)據(jù)聚類的目的。譜聚類將高維空間的數(shù)據(jù)映射到低維,然后在低維空間用其他聚類算法進行聚類。與最常用的Kmeans聚類方法相比,譜聚類算法使用了降維技術(shù),更適用于高維數(shù)據(jù)的處理,同時對于處理稀疏數(shù)據(jù)更為有效。海底滑坡危險性評價的輸入因子類別多、數(shù)據(jù)不集中,因此采取譜聚類比傳統(tǒng)的聚類方法更為適用。譜聚類通過輸入n個樣本點X={x1,x2,···,xn}和聚類簇的數(shù)目k,最終輸出聚類簇A1,A2,···,Ak。具體算法步驟為:
(1)計算n×n的相似度矩陣W(包括最小鄰近值法、k臨近法及全連接法),下式為本文使用的全連接法表達式:

式中,W為sij組成的相似度矩陣;核函數(shù)參數(shù)σ控制著樣本點的鄰域?qū)挾龋处以酱蟊硎緲颖军c與距離較遠的樣本點的相似度越大;
(2)計算度矩陣D:
di=,即相似度矩陣W的每一行元素之和。
D為di組成的n×n對角矩陣;
(3)計算拉普拉斯矩陣L=D?W;
(4)計算L的特征值,將特征值從小到大排序,取前k個特征值,并計算前k個特征值的特征向量u1,u2,···,un;
(5)將上面的k個列向量組成矩陣U={u1,u2,···,un},U∈Rn×k;
(6)令yi∈Rk是U的第i行的向量,其中i=1,2,···,n;
(7)使用Kmeans算法將新樣本點Y={y1,y2,···,yn}聚類成簇C1,C2,···,Ck;
(8)輸出簇A1,A2,···,Ak,其中Ai={j|yi∈Ci}。
以上為譜聚類算法的描述。即先根據(jù)樣本點計算相似度矩陣,然后計算度矩陣和拉普拉斯矩陣,接著計算拉普拉斯矩陣前k個特征值對應的特征向量,最后將這k個特征值對應的特征向量組成的矩陣U,U的每一行成為一個新生成的樣本點,對這些新生成的
樣本點聚成k類,最后輸出聚類的結(jié)果。
本文研究數(shù)據(jù)由自然資源部第一海洋研究所在黃河口埕島海域通過地球物理探測、鉆探及監(jiān)測調(diào)查等手段獲得[18],包含了研究區(qū)詳細的各類地質(zhì)特征資料,并根據(jù)地質(zhì)環(huán)境數(shù)據(jù)特點將水深、波浪、液化深度等各類影響因素分為4個級別。黃河口埕島海域分布著大規(guī)模的海底滑坡體系,具有高含水、淺表多發(fā)、廣泛分布等特點[19–20],水深普遍小于 18 m,底質(zhì)類型在15 m水深以淺主要為粉土夾雜少量砂土,大于15 m時為粉質(zhì)黏土和黏土(圖1)。海底坡度較大的區(qū)域大于0.002°,主要分布在6 m和12 m水深等深線周圍。易液化區(qū)域集中于3~15 m水深之間,從區(qū)域中央至外緣液化強度逐漸減小。同時,中石化勝利油田采油廠的主力區(qū)塊也位于本研究海域內(nèi)部,分布著上百座海上采油平臺以及數(shù)十條海底輸油、輸氣管道和海底電纜。該區(qū)域具有大量詳細的物探、鉆探以及現(xiàn)場監(jiān)測獲得的各類數(shù)據(jù),能夠準確有效地為無監(jiān)督機器學習提供輸入數(shù)據(jù)。
由于海底滑坡問題的環(huán)境影響因素、觸發(fā)因子眾多且難以實時監(jiān)測,無法使用地質(zhì)參數(shù)與滑坡危險性之間對應的結(jié)果進行有監(jiān)督學習,因此本文以無監(jiān)督學習方法為基礎(chǔ)建立黃河口水下三角洲海底滑坡危險性評價模型。基于譜聚類算法的海底滑坡危險性評價主要分為輸入輸出參數(shù)類別確定、原始數(shù)據(jù)處理、網(wǎng)絡參數(shù)選取以及評價4個部分。
(1)輸入、輸出參數(shù)類別
海底滑坡危險性影響因素眾多,主要可以分為內(nèi)因和外因,其中內(nèi)因是滑坡體本身的物理力學性質(zhì);外因則受不同地質(zhì)環(huán)境的影響存在多樣性。本研究區(qū)的內(nèi)因主要有沉積物類型、海底地形坡度、土體強度,表征了滑坡體本身;外因為水深、50年一遇波高大小、底層最大流速、液化、海底沖刷以及人類工程活動情況。另外,將區(qū)域評價結(jié)果分為4類是評價分級較為常用的一種方式。因此本研究中輸入節(jié)點數(shù)為9個,對應輸入類別的9個參數(shù);輸出節(jié)點數(shù)為4個,分別為危險性高、危險性較高、危險性較低和危險性低(圖2)。
(2)原始數(shù)據(jù)處理
根據(jù)圖1所示研究點位,按照研究點位的坐標分別從輸入?yún)?shù)中獲取相對應的數(shù)據(jù)。文中所使用的9個輸入?yún)?shù)的數(shù)據(jù)已按照不同參數(shù)類型及數(shù)據(jù)特點分為了4個級別,因此每個研究點位擁有9個參數(shù),每個參數(shù)的數(shù)值為1~4的不同類別。

圖1 研究區(qū)位置及研究點位Fig.1 Location of studying area and points

圖2 海底滑坡危險性評價網(wǎng)絡結(jié)構(gòu)示意圖Fig.2 Schematic diagram of submarine landslide risk assessment network structure
(3)核函數(shù)參數(shù)選擇
本文計算相似度矩陣式使用全連接方法,其中的核函數(shù)為高斯核函數(shù)(數(shù)值大于0)。對核函數(shù)參數(shù)進行調(diào)參時,保持數(shù)據(jù)及其他網(wǎng)絡參數(shù)不變,令核函數(shù)參數(shù)為0.01~2.3,以0.01為間隔進行變化,針對每個核函數(shù)參數(shù)均進行聚類并使用Calinski?Harabasz評分標準對結(jié)果進行打分,選擇評分最高時的核函數(shù)參數(shù)作為評價網(wǎng)絡最終的參數(shù)。
(4)海底滑坡危險性評價分區(qū)
使用確定了輸入輸出參數(shù)類別、網(wǎng)絡參數(shù)后可得到最終的海底滑坡無監(jiān)督學習評價網(wǎng)絡,使用該網(wǎng)絡對研究點位數(shù)據(jù)進行譜聚類訓練可獲得具有相同特征研究點位的無標簽分類結(jié)果。
(5)區(qū)域標簽的賦予
根據(jù)譜聚類分析得到的無標簽分類結(jié)果,結(jié)合研究區(qū)地質(zhì)環(huán)境因素分布特征,對分類結(jié)果賦予滑坡危險性評價等級標簽,得到最終的海底滑坡危險性評價結(jié)果。
通過對不同的核函數(shù)參數(shù)展開海底滑坡危險性聚類分析后,基于Calinski-Harabasz評分標準的得分結(jié)果見圖3。隨著核函數(shù)參數(shù)逐漸增加,聚類效果得分先增加后減小,在核函數(shù)參數(shù)為0.08時具有最大的得分。得分反映了聚類結(jié)果的優(yōu)化程度,得分越高則說明優(yōu)化性越好,因此選擇核函數(shù)參數(shù)值為0.08作為滑坡危險性評價網(wǎng)絡的最終參數(shù)。

圖3 評價網(wǎng)絡得分隨核函數(shù)參數(shù)的變化Fig.3 Evaluation network score changes with kernel function parameters

圖4 黃河口海底滑坡危險性評價結(jié)果Fig.4 Risk assessment result of submarine landslides in the Yellow River Estuary
使用建立的基于無監(jiān)督學習模型對黃河口海底滑坡危險性進行了評價(圖4),整個研究區(qū)從西南至東北被分為了4個區(qū)域。分別為水深5 m以淺、水深14 m以深、水深6~12 m之間及其周邊區(qū)域。海床受到的水動力作用在波浪、水深及海流共同作用影響下,隨著水深從淺到深變化首先逐漸增強,在9~10 m附近達到最大值,隨后逐漸減弱。同時,研究區(qū)大致以水深14~15 m等深線為分界線,深水區(qū)海底土體為黏土類沉積物,淺水區(qū)為粉土夾雜少量粉砂。另外,地球物理探測調(diào)查結(jié)果顯示,研究區(qū)內(nèi)15 m以深基本沒有液化的發(fā)生,而9~10 m水深等深線附近最易發(fā)生液化等現(xiàn)象。因此不難判斷,海底滑坡危險性高的區(qū)域:大致范圍在6~12 m水深等深線內(nèi)呈條帶狀分布,長軸方向與水深等深線方向平行,代表了本研究區(qū)內(nèi)最容易出現(xiàn)海底滑坡的區(qū)域;危險性較高的區(qū)域:分布在危險性高的部分外圍,水深范圍擴展至5~14 m,代表了本研究區(qū)內(nèi)較為容易出現(xiàn)海底滑坡的區(qū)域;危險性較低的區(qū)域:分布在研究區(qū)的水深小于5 m位置,表示研究區(qū)內(nèi)較不容易出現(xiàn)海底滑坡的區(qū)域;危險性低的區(qū)域:位于研究區(qū)水深14 m以深的位置,表示本研究區(qū)內(nèi)最不容易產(chǎn)生海底滑坡的區(qū)域。
本文得到的聚類結(jié)果顯示,黃河口海底滑坡危險性較高和高的區(qū)域位于水深5~14 m區(qū)域內(nèi),其他水深位置危險性較低。彭俊等[21]通過高精度地球物理探測手段對黃河三角洲水下岸坡展開了調(diào)查,調(diào)查結(jié)果顯示,在水深6~14 m區(qū)域主要發(fā)育了海底滑坡,6 m以淺和14 m以深未見海底滑坡發(fā)育。該物探調(diào)查結(jié)果與本文利用無監(jiān)督機器學習得到的海底滑坡危險性分區(qū)結(jié)果一致性較高,均顯示水深5~14 m的區(qū)域內(nèi)容易產(chǎn)生海底滑坡。表明本文使用的算法可以取得與真實情況較為接近的結(jié)果,能夠較好地適用于海底滑坡危險性評價。
研究區(qū)海底滑坡危險性隨著水深逐漸增加總體上呈現(xiàn)較低?較高?高?較高?低的趨勢變化。當水深小于5 m時,波浪、海流等水動力作用較小,因此滑坡的觸發(fā)因子強度不足,導致了水深小的區(qū)域危險性較低。隨著水深逐漸增加,海床受到的水動力作用越來越強,但水深增加至一定程度時海床受到的水動力作用又會減小。因此滑坡危險性也呈現(xiàn)先增強后減弱的趨勢,最嚴重位置在水深9~10 m附近。若研究區(qū)海底沉積物類型一致,則在14 m水深位置應先出現(xiàn)危險性較低的區(qū)域再逐漸過渡至危險性低的區(qū)域。但由于海底沉積物類型由可液化的粉土突變?yōu)殡y以液化的黏土類沉積物,因此造成了危險性分區(qū)的突變(圖4,突變分界線為a)。在水深變深引起的水動力作用減弱和海底沉積物性質(zhì)的共同影響下,研究區(qū)內(nèi)水深大于14 m的區(qū)域成為了最不容易產(chǎn)生海底滑坡的部分。坡度、土體強度和沖刷雖然與最終結(jié)果呈現(xiàn)相關(guān)關(guān)系,但遠沒有水動力和沉積物類型與結(jié)果相關(guān)性程度高。而人類工程活動分布對結(jié)果影響最小,研究區(qū)內(nèi)海底滑坡的分布幾乎未受到人類活動的影響。總的來說,研究區(qū)內(nèi)水深、波高、底層最大流速和海底沉積物類型是最重要的影響因素,坡度、土體強度和沖刷影響程度次之,人類工程活動影響最弱。
通常情況下海底滑坡的外界影響觸發(fā)因子有地震、天然氣水合物、波浪作用、火山活動、海嘯等一系列條件,不同的海域受周邊地質(zhì)環(huán)境條件的影響存在不同的因子。本文研究區(qū)內(nèi)并不存在地震、海嘯、火山等劇烈地質(zhì)現(xiàn)象,主要外界影響因子為波浪引起的海底土體液化。黃河口埕島海域在50年一遇波浪工況下的液化深度分布如圖5所示[22],隨著水深逐漸加深,液化深度也呈現(xiàn)先增加后減小的分布情況,在水深6~12 m之間具有較大的液化深度分布。對比圖4、圖5可知,研究區(qū)液化深度分布的特征與本文得到的海底滑坡危險性評價結(jié)果有著密切的相關(guān)性和一致性,均在水深10 m等深線附近分布著地質(zhì)災害最嚴重的區(qū)域,當水深減小或繼續(xù)增加時地質(zhì)災害的嚴重性越來越弱。足以充分表明波浪作用下海底沉積物液化是研究區(qū)內(nèi)海底滑坡最重要的觸發(fā)因子。
本文采用了沉積物類型、海底地形坡度、土體強度、水深、波高、底層最大流速、液化、海底沖刷以及人類工程活動情況9種參數(shù)作為網(wǎng)絡輸入因子,進行海底滑坡危險性分析。因某些海域輸入因子的難獲取性,也可以選擇沉積物類型、水深、波高和底層最大流速作為輸入因子進行譜聚類。沉積物類型能夠表述海底土體的性質(zhì)。水深、波高、底層最大流速能夠代表水動力作用強度,也可換算求得海底地形坡度,并影響液化、沖刷。因此簡化的模型選擇沉積物類型、水深、波高和底層最大流速作為輸入因子進行譜聚類。評價結(jié)果如圖6所示,與未簡化評價結(jié)果對比,危險性低和較低的區(qū)域基本一致,但是危險性高的區(qū)域范圍減小、危險性較高區(qū)域范圍擴大且二者未呈現(xiàn)包含關(guān)系。由此可見,適當?shù)貙斎胍蜃舆M行簡化能夠較為粗略地對研究區(qū)展開海底滑坡危險性評價,但評價結(jié)果的準確度相對降低。

圖5 黃河口埕島海域液化深度分布[22]Fig.5 Distribution of liquefaction depth in Chengdao sea area of the Yellow River Estuary[22]
為檢驗該參數(shù)對聚類結(jié)果的影響程度,令核函數(shù)參數(shù)分別為0.1、1、5、10,并構(gòu)建4個不同參數(shù)的評價網(wǎng)絡進行海底滑坡危險性評價。評價結(jié)果如圖7所示,隨著核函數(shù)參數(shù)的逐漸增加,危險性高的區(qū)域呈現(xiàn)一種擴大的趨勢。σ為0.01和0.1時評價結(jié)果與上文得到的結(jié)果相似,只是危險性高的區(qū)域范圍稍有變化。當σ為1時,危險性高的區(qū)域已完全與危險性較低區(qū)域相鄰,未能體現(xiàn)出二者間危險性較高區(qū)域的過渡。當σ為10時,該模型已經(jīng)無法進行有效的評價。以上研究結(jié)果表明,核函數(shù)參數(shù)評分相近時都可以較好地對研究區(qū)進行聚類分析,但相差較大時則無法準確對數(shù)據(jù)進行聚類分析。
海底滑坡、海底地震等多種海底地質(zhì)災害難以有效地監(jiān)測到產(chǎn)生的過程和結(jié)果,因此并沒有初始因素–最終結(jié)果一一對應的數(shù)據(jù)用于有監(jiān)督機器學習的訓練。然而無監(jiān)督機器學習算法以其不需要結(jié)果、可以自行學習的功能可以有效克服這一問題,所以無監(jiān)督機器學習算法成為了能夠解決此類問題的關(guān)鍵。

圖6 簡化輸入因子得到的海底滑坡危險性評價結(jié)果Fig.6 Risk assessment results of submarine landslides from simplified input factors
結(jié)果表明,譜聚類方法得到的海底滑坡危險性分類與實際海底滑坡區(qū)域分布較為一致,具有較高的相似性和可靠性。研究區(qū)內(nèi)產(chǎn)生的滑坡與傳統(tǒng)海底滑坡相比具有規(guī)模小、坡度緩、滑動距離短等特點,二者的滑坡危害性顯然無法相提并論。因此,聚類的結(jié)果并不表示海底滑坡危險性的絕對值,而表示了在研究區(qū)內(nèi)危險性的相對值,不同危險性高低代表了在研究區(qū)內(nèi)產(chǎn)生海底滑坡現(xiàn)象的可能性和嚴重程度。使用譜聚類方法進行分類后,可以良好地估計研究區(qū)域內(nèi)海底滑坡危險性的相對高低,有利于進行海洋工程建設時的選址。
現(xiàn)場實測數(shù)據(jù)的缺乏仍然是限制海底滑坡危險性分析發(fā)展的最重要因素,5.1節(jié)結(jié)果表明只有獲得更豐富、更精確、更詳細的現(xiàn)場地質(zhì)環(huán)境數(shù)據(jù),才能夠更加準確的評價結(jié)果。進行其他海域的海底滑坡危險性評價時,需要根據(jù)研究區(qū)地質(zhì)環(huán)境因素特點,選擇適宜的輸入因子和輸出因子。受深海調(diào)查數(shù)據(jù)的影響,本文未選在東海、南海等滑坡發(fā)育更為明顯的區(qū)域,接下來將進一步搜集資料與現(xiàn)場探測相結(jié)合,本文提出的算法可用于更加廣泛的研究區(qū)域。
本文使用了無監(jiān)督機器學習的技術(shù)手段,構(gòu)建了海底滑坡危險性評價方法,通過對黃河口埕島海域的多種地質(zhì)參數(shù)分析并進行了計算,分析了海底滑坡危險性評價結(jié)果并對算法參數(shù)展開了討論,主要得到以下結(jié)論:
(1)使用基于無監(jiān)督機器學習的譜聚類算法能夠?qū)S河口海底滑坡進行準確的評價分類,表示研究區(qū)內(nèi)不同分組的海底滑坡相對危險性,當網(wǎng)絡中含有9個輸入節(jié)點、4個輸出節(jié)點、核函數(shù)參數(shù)為0.08時具有最好的聚類效果。
(2)黃河口埕島海域海底滑坡危險性與水深分布相關(guān)性較大,危險區(qū)域分布于6~12 m水深,較危險區(qū)域分布于危險區(qū)域外圍的5~14 m水深,較安全區(qū)域分布于水深小于5 m的位置,安全區(qū)域位于水深大于14 m的位置。
(3)基于譜聚類方法得到的黃河口埕島海域海底滑坡危險性分區(qū)結(jié)果與各類地質(zhì)環(huán)境因素都存在相關(guān)關(guān)系,其中,沉積物類型和水動力作用是最根本的影響因素,液化是本研究區(qū)海底滑坡最重要的觸發(fā)因子。
(4)模型核函數(shù)參數(shù)應選擇聚類結(jié)果評分高的,輸入因子類別在數(shù)據(jù)不足時可適當簡化,需包含海底滑坡自身條件和觸發(fā)因子兩方面,評價結(jié)果與充足輸入因子結(jié)果相比精度降低。

圖7 不同核函數(shù)參數(shù)海底滑坡危險性評價結(jié)果Fig.7 Risk assessment results of submarine landslides with different kernel function parameters