張龍,王志勇,葉凱樂,常棟
(1.山東科技大學 測繪與空間信息學院,山東 青島 266590;2.中國測繪科學研究院,北京 100036)
海岸線是確定海岸帶管理范圍的重要依據,然而,海岸線的侵蝕與增長已成為全世界廣為關注的問題之一[1]。黃河三角洲是中國乃至世界各大河三角洲中海陸變遷最活躍的地區[2],自1855年以來,由于受自然變化和人工干預影響,黃河經歷了多次改道,黃河三角洲不斷向渤海延伸。在淤進造陸[3]的同時,三角洲也受到海洋動力的侵蝕,在二者的雙重作用下,海岸線淤進蝕退交替演變迅速。因此快速準確了解和掌握海岸線的動態變化特征,提取海岸線分布,對于海岸帶資源使用、管理、保護規劃及災害的預防具有重要意義。
相比于光學傳感器,合成孔徑雷達(synthetic aperture radar,SAR)傳感器可以在不受時間和天氣的限制下連續工作,因此SAR數據更適合作為海岸線監測的原始數據。基于SAR影像進行海岸線的提取已經成為現今重要的研究方向[4]。
目前,利用SAR影像提取海岸線的方法主要可分為三類:基于邊緣、基于區域和基于閾值的方法[5-6]?;谶吘壏椒ㄆ湓硎抢煤j戇吘壴谟跋裆纤从吵龅幕叶瓤臻g突變來尋找邊緣像素點[7],但其受SAR影像斑點噪聲影響較大且很容易出現內陸地區虛檢測情況,這增加了海岸線提取工作的復雜性?;趨^域的方法是以圖像的全局或者局部同質區域為對象,相比基于邊緣的方法,具有抗噪性強、檢測邊緣連續的優點[8],又可細分為面向對象法和主動輪廓模型法。鄧瀅等[9]基于面向對象的思想,提出一種高精度、低虛警率的SAR影像水體提取方法,其分割技術能夠保持完整的水陸邊界,但無法充分利用SAR影像中隱含的信息,使得提取精度降低。Liu 等[10]利用基于區域的幾何輪廓演化方法,其海岸線檢測結果更加準確快速,但該方法需要給出初始輪廓,對于不同影像要進行多次實驗以取得最優化的初始輪廓,需進一步研究得以廣泛應用?;陂撝捣椒ㄊ浅S玫暮j懛指罘椒?,因其實現簡單、計算量小而成為海岸線提取的一種常用方法[11],但其分割效果對確定閾值的依賴性強,如很多學者應用經典OTSU閾值分割方法進行海陸分割[12-13],但該算法并非針對分割水陸而設計,因此所獲得的閾值并非最佳閾值。Nunziata等[14]對多極化SAR圖像提取海岸線進行了一系列的研究,建立極化SAR物理模型以獲得海陸分割閾值對影像二值化以提取海岸線,但其仍受不同統計分布限制,無法適用于任意場景。
影像分類的方法進行海岸線提取原理與基于閾值方法相同,區別在于以不同步驟獲得海陸二值圖像,以此來獲得海岸線的位置。全極化SAR包含了HH、HV、VH、VV 4種極化方式,可以展示不同模式下的圖像信息,描述的地面信息更加豐富,更大限度地揭示了地物的散射差別,更有利于將各類地物進行區分[15]。本文針對目前利用SAR數據提取海岸線方法的各自局限性及閾值分割方法中最優分割閾值較難確定的缺點,考慮全極化SAR影像分類的巨大潛力及可行性,提出了一種結合SAR影像的極化及紋理特征,利用隨機森林分類獲得海陸分割閾值并進行海岸線自動提取的方法。利用多極化SAR數據的多特征性來增強海陸對比從而進行分割,是基于多極化SAR數據影像方法提取海岸線的優越性。
由于海岸線無時無刻不在發生著變化,且受海岸線類型等諸多原因影響,真正海岸線的位置難以確定,因此,本文將衛星過境時的瞬時水邊線認定為海岸線進行實驗,該定義方法也是一種國內外較為認可的海岸線確定方法[16]。
針對黃河三角洲復雜的背景條件,基于高分三號全極化SAR數據,提出了一種結合多特征選擇和隨機森林分類算法的海岸線提取方法,通過極化分解提取極化特征、灰度共生矩陣提取紋理特征,并進行特征的優化選擇,得到最優特征參數組合,對最優特征組合進行分類、水陸分割及海岸線的提取。將海岸線提取結果與閾值分割算法海岸線提取結果做精度對比。
目標極化分解提取的特征是與物理散射相關的極化特征,直接與物理意義相聯系,如奇次散射、偶次散射、體散射等。利用SAR影像上水體的散射特征相對其他地物差異較大的特點,將極化分解的分量組合構建特征向量,發揮各自的特征優勢,能提高分類效果[17],更有效地區分水體與其他地物類型。本文選擇了3種極化分解方法:Pauli分解[18]、Krogager分解[19]和H/α/A分解[20]。
水體與其他地物在SAR圖像上表現為不同的紋理特征,且紋理作為區域統計量,減弱了噪聲對區域特征的影響,穩定性更強。因此,有必要將紋理特征作為分類參數的一種,提高分類的精度。由Haralick[21]于1973年提出的基于灰度級共現矩陣(gray level co-occurrence matrix,GLCM)的特征被廣泛應用于紋理分割中,是目前最常見、應用最廣泛、效果最好的一種紋理統計分析方法。GLCM的構造依賴于兩個參數,即相對距離(d)和方向(φ),在像素對之間,d以像素數來度量,φ通常從4個方向(水平-0°、對角線-45°、垂直-90°和反對角線-135°)度量。GLCM的計算公式參見文獻[21]。
在極化SAR影像分類中,利用多特征更準確地反映出地物差異,有效地改善分類結果精度。特征的組合不是固定的,較多的特征參數會造成數據的冗余,增加計算量的同時影響了分類效率[22];較少的特征參數不能準確地表達地物特點,從而降低分類精度,因此需要對所提取的特征進行降維選擇[23]。本文所遵循的原則是特征之間低相關性及特征本身信息豐富性,并以此選擇出最優特征組合。
隨機森林(random forest)算法是Breiman[24]于2001年提出的一種基于決策樹的集成算法,它的基本單元是決策樹。每棵決策樹都是一個分類器,那么N棵樹會有N個分類結果。這些決策樹組成的集合構成隨機森林,最后取所有決策樹的預測平均值作為最終預測結果。隨機森林集成了所有的分類投票結果,將投票次數最多的類別指定為最終輸出,它可以很方便地并行訓練。
圖像二值化后,總會存在一些異質斑塊,因此利用孔洞填充算法去除這些異質區域,孔洞填充算法[25]的基本思想是:從圖像的多邊形區域的一個內點開始,該點即被稱為種子點,由內向外用給定的顏色填充直到邊界為止。種子填充算法常用的方法有四向聯通填充方法和八向聯通填充方法。
算法流程如圖1所示,填充由內部像素點所組成的多邊形區域,取種子像素是(4,3)。具體的填充流程從種子像素出發,沿線段路徑填充,當周圍像素均為所給出像素值,則該填充流程完畢。

圖1 種子填充算法流程圖
本文聯合極化特征和紋理特征的隨機森林分類算法對黃河三角洲地區海岸線提取的具體步驟如下,提取流程如圖2所示。
1)高分三號數據進行預處理。預處理過程包括輻射定標、極化矩陣轉換得到極化矩陣T3、ReLee濾波及地理編碼等處理。
2)極化特征提取。對極化矩陣T3進行極化目標分解,基于Pauli分解、H/α/A分解和Krogager分解,提取9個極化特征。
3)紋理特征提取。本文沒有直接計算高分三號極化影像的紋理,而是基于其HV極化和HH極化,利用雷達水體指數模型最大化水陸差異,計算模型結果的灰度共生矩陣來提取圖像的紋理特征。
4)特征優選。利用特征選擇模型,在所獲得的極化紋理特征中進行篩選,選擇9個特征構建特征向量并進行分類。
5)確定分類的類別數,選擇訓練樣本,訓練隨機森林分類器。特征向量作為輸入數據,應用訓練好的隨機森林分類器,獲得分類結果圖像。
6)分類結果進行類別合并獲得海陸二值圖像,利用孔洞填充算法去除二值圖像中的艦船、近岸養殖池等有干擾性質的斑塊區域,對優化后的二值圖像利用邊緣檢測算法提取獲得最終的海岸線。
7)參照編碼后的SAR影像和天地圖影像通過人工勾繪方式獲得實驗區域的參考海岸線,對本文方法提取的海岸線進行精度分析。

圖2 實驗流程圖
實驗區為山東省東營市東北部的黃河三角洲部分地區,北鄰渤海,東接萊州灣。黃河三角洲地處中緯度,位于暖溫帶,背陸面海,受歐亞大陸和太平洋的共同影響,屬于暖溫帶半濕潤大陸性季風氣候區,冬寒夏熱,四季分明[26]。黃河所攜帶的大量泥沙,導致黃河三角洲正不斷向海洋延伸,成為世界上最年輕的陸地之一[27]。選擇兩景位于黃河三角洲的GF-3全極化條帶1(QPS1)模式的Level 1A級(即單視復影像,SLC)圖像進行海岸線提取實驗。兩景GF-3影像的成像時間分別為2018年11月5日和2019年3月13日,空間分辨率均為8 m。實驗數據極化假彩色合成圖如圖3所示。

圖3 實驗區域Pauli假彩色合成圖
對極化矩陣T3進行極化分解,基于Pauli分解、H/α/A分解和Krogager分解獲得以下極化特征:Pauli分解體散射分量PVOL、Pauli分解奇次散射分量PODD、Pauli分解偶次散射分量PDBL、Krogager分解球散射體分量Ks、Krogager分解螺旋體分量Kh、Krogager分解二面角散射體分量Kd、H/α/A分解極化散射熵H、H/α/A分解反熵A、H/α/A分解平均散射角α。極化分解合成結果如圖4所示。

圖4 極化分解合成圖
基于灰度共生矩陣提取以下紋理特征:均值、方差、同質性、反差、差異性、熵、角二階矩相關性。所獲得的初始特征集包括9個極化特征和8個紋理特征。將所提取的17個特征進行特征優選,所選擇的最優特征參數組合中各個特征的詳細信息如表1所示,利用優擇的特征參數構建特征向量并分類。

表1 篩選后的特征參數
由于黃河三角洲地區地物類型錯綜復雜,僅選擇水陸兩類樣本其分類誤差大且耗時長,為獲得較好分類結果及保證分類效率,本文確定類別數量為4類(水體、植被、潮間帶、其他)。利用兩幅影像數據以相同的訓練樣本進行分類實驗,其初始分類結果如圖5所示。

圖5 初始分類結果
根據初始分類結果,首先進行類別的合并獲得初始海陸二值圖像,二值圖像如圖6(a)所示。可看出,在白色的陸地區域存在黑色的池塘、水田、河道等白色水體區域,在黑色的海面區域內存在的大量的白色雜散點,為提高提取精度及減少人工工作量,利用孔洞填充算法來填充這些斑塊區域,進行海陸二值圖像的優化,優化結果如圖6(b)所示。
最后利用Canny二值圖像邊緣檢測算子提取海陸邊界線,獲得矢量的瞬時海岸線。本文方法和OTSU法的兩幅影像海岸線提取結果如圖7和圖8所示,在圖8(c)中可看出閾值方法提取的結果存在著一些誤分區域。

圖6 海陸二值圖

圖8 OTSU閾值法海岸線提取結果
真實的參考海岸線難以獲取,以人工勾繪的海岸線作為參考海岸線,對本文方法的海岸線提取結果精度進行分析,并與OTSU閾值分割方法得到的海岸線提取結果作對比。為定量分析提取方法的精度,本文基于ROC[28]曲線匹配原則,選擇緩沖區分析方法[29]為評價方法,其主要思想是計算驗證海岸線落在參考海岸線緩沖區的像素點個數,實現對提取結果的定量分析,其示意圖如圖9所示。

圖9 緩沖區分析示意圖
評價步驟為:首先以人工提取的參考海岸線為匹配標準,建立緩沖區,緩沖區寬度r為20 m和40 m,并以各個岸線提取結果的長度為權Pi,在提取的海岸線上取NPi個點,判斷點相對于緩存區的位置,判定點位于緩沖區內的點個數記為TP1(true positive),緩沖區外地點個數記為FP(false positive);然后建立提取海岸線的緩沖區,并在參考海岸線上取點,如果點落入該緩沖區,認為其同提取的海岸線相匹配,點的個數記為TP2,否則定義為不匹配,個數即為FN(false negative)。定義correct、complete、quality 3個參數指標[30],分別表示海岸線提取結果的正確程度、完整程度和提取質量。海岸線提取結果的精度對比如表2所示。

表2 海岸線提取結果精度對比
由表可以看出無論哪種緩沖區半徑,本文方法精度都要優于OTSU閾值分割方法;且當緩沖區半徑增加,兩幅影像的海岸線提取結果各項精度指標有明顯提升,當緩沖區半徑為40 m時,其提取結果的完整性、正確度及提取質量都在90%以上,提取結果的可靠性高。
紋理提取過程中,不同計算參數對結果紋理的豐富度存在較大影響。本文紋理提取參數選擇如下:比較自己所選擇的實驗數據,影像紋理信息在對角方向上比較多,因此確定窗口滑動方向為右下45°?;瑒硬介L選擇為1,即滑動窗口每個中心像素均與鄰近像素進行比較,不易丟失紋理信息。紋理分析中,過小的窗口不能很好表示紋理信息,過大的窗口會掩蓋紋理間的差異。變異系數可以用來衡量紋理濾波窗口的大小合適與否,變異系數大,說明變異幅度大,整齊性較差,穩定性??;反之,變異系數小,說明變異幅度小,整齊性較好,穩定性大,變異系數計算方法見文獻[31]。
選擇同質性、反差、差異性、角二階矩和相關性來計算各個特征變異系數,分析其變化情況結果,如圖10所示,并根據圖中變異系數曲線變化來確定紋理提取窗口的大小。

圖10 變異系數隨窗口增大變化曲線
從圖10可以看出,隨著窗口大小的逐漸增加,從7×7窗口大小開始,不同紋理統計量的變異系數也趨于穩定,因此,在窗口大小的選擇上,7×7的滑動窗口最為合適。綜上,本實驗進行紋理特征提取的參數如下:矩形窗口大小為7×7,方向為45°,步長為1,灰度量化級為32。
本文在分類方法的選擇上做了一些工作,利用相同的訓練樣本及輸入特征,采用最大似然比分類、隨機森林分類、神經網絡分類、支持向量機分類4種方法,對兩幅研究區影像數據(影像數據1、影像數據2)的特征選擇結果進行分類,比較分類結果的精度,選擇較好的分類方法。針對兩幅影像數據,4種分類方法的分類精度如表3所示。

表3 分類方法精度對比
由表3可以看出,最大似然分類方法和神經網絡分類方法在面對兩種不同影像數據時其分類結果表現得不夠穩定,而隨機森林分類方法和支持向量機分類方法則都有較好的穩定性,且隨機森林方法的精度最優,因此選擇隨機森林分類方法為本文的分類方法。
本文利用極化分解及灰度共生矩陣分別提取了共計9種極化特征及8種紋理特征,并進行特征優選,選擇9個特征組成最優特征組合進行隨機森林分類獲得水陸二值圖像,孔洞填充算法對二值圖像優化后,利用邊緣檢測算子追蹤二值圖像邊緣得到研究區域的海岸線。
為避免單幅影像出現提取結果精度偶然性的影響,選擇了兩景全極化SAR影像數據進行實驗。相比于利用閾值分割法或是邊緣檢測法直接提取SAR影像中的海岸線,全極化SAR影像進行大范圍的海岸線提取能有效利用多極化信息的豐富性提高海陸辨識度,具有提取精度高、海岸線連續的優點,在40 m分析精度情況下,兩幅影像提取質量均達到了90%以上,方法結果穩定可靠。
本文方法從精度上來看,可以代替人工目視解譯的方法從極化SAR數據中提取海岸線,但仍存在著一些不足,如提取的海岸線為獲取數據時刻的瞬時海岸線等問題,后續的工作還要針對這些方面進行研究,并針對海岸線提取的自動化和提取精度作進一步提高。