常 樂,韓 磊,陳宗強,盛 輝,劉善偉
(1.青島市勘察測繪研究院,山東 青島 266033; 2.中國石油大學(華東)海洋與空間信息學院,山東 青島266580; 3. 海陸地理信息集成與應用國家地方聯合工程研究中心(青島),山東 青島 266033)
地下巖體、地層、礦床等露出地表后形成野外地質露頭,其中蘊含著豐富的地質信息[1]。地質露頭研究是地質工作者的必修課,其中地質露頭巖性識別是地質學的一個重要研究領域,同時也是地質調查的一項重要工作。
巖石巖性是反映巖石特征的屬性,如顏色、成分、結構及特殊礦物等[2]。傳統的地質露頭巖性判別方法主要依靠野外地質調查,由外業人員通過野外踏勘采集巖石巖性樣本,然后帶回實驗室進行分析,最后由人工填圖,整個識別過程費時費力;且野外地質露頭大多垂直于地面且跨度、高度較大,有些區域地質人員無法到達,導致地質露頭的巖性難以判別。國內外諸多學者提出了多種方法進行巖石巖性分類,如物理實驗方法[3-4]、數學統計分析方法[5-7]、智能學習方法[8-9]等。物理實驗方法和數學統計分析方法對巖石巖性分析具有較好的效果,但需要在眾多特征中找出規律,主觀性強,要求研究人員具有專業的理論水平。
隨著圖像處理和遙感技術的不斷發展,其相關技術和算法在巖性識別中得到了廣泛應用。如文獻[10—14]通過機器學習算法對巖石巖性圖像進行分類,并取得了較好的分類精度。但大部分的巖性分類研究主要以遙感影像或巖石圖像為數據源,而大坡度地質露頭大多垂直于地面,衛星遙感數據受限于角度,無法有效采集地質露頭數據。當前無人機多光譜數據獲取便捷、成本低、空間分辨率高,給大坡度地質露頭巖性分類帶來新的遙感數據源[15]。部分學者將深度學習引入巖性分類,但大多基于卷積神經網絡的分類模型,只考慮光譜信息,忽略了空間信息對巖性分類的增強作用。無人機多光譜影像中具有豐富空間信息和光譜信息,如何有效地利用這些信息進行高精度的巖性分類是一個亟待解決的問題。
針對以上問題,本文首先使用多光譜無人機,以貼近攝影測量[16]的方式采集地質露頭數據,利用面向對象的分類方法提取巖石分布的精確區域;然后基于此區域采用多尺度混合特征網絡模型進行巖性分類,并與SVM、MLC、Inception V3、ResNet16和Hybrid CNN模型進行精度對比;最后在河南云臺山地區進行應用,實現高精度的自動化巖性分類,以期為野外地質調查、地質填圖、巖性分類提供可行的參考。
云臺山公園位于山西省晉城市和河南省焦作市交界處。云臺山峽谷出露的地層主要為中元古屆云夢山組和古生屆寒武系-奧陶系,其中中元古屆云夢山組紅色石英砂巖構成了峽谷內的主要景觀。試驗對象高300 m,長700 m,平均坡度大于85°,主要以肉紅色石英砂巖、紫紅色石英砂巖和深紫色石英砂巖3種巖石為主。如圖1所示。
本次試驗采集設備為大疆P4 Multispectral,該無人機重1487 g,最大飛行速度為72 km/h,最長飛行時間為27 min,懸停定位精度能達到毫米級,通過云臺搭載集成鏡頭,包括1個用于可見光成像的彩色傳感器和5個用于多光譜的單色傳感器(藍(B):450±16 nm;綠(G):560±16 nm;紅(R):650±16 nm;紅邊(RE):730±16 nm;近紅外(NIR):840±16 nm),傳感器所獲圖像的有效像素為208萬,分辨率為1600×1300像素。
無人機通過貼近攝影測量的方式進行數據采集,在數據采集過程中始終保持無人機鏡頭垂直于露頭剖面,在光照條件不充足時,可適當調整鏡頭角度。無人機手控飛行路線如圖2所示,箭頭為無人機移動方向。飛行需要確定的參數如下。

圖2 無人機手控飛行路線
無人機采集超高精度的影像時與露頭剖面的距離公式為
(1)
式中,L為無人機鏡頭與露頭剖面間的距離(m);GSD為地面分辨率(mm);d為相機傳感器的像元大小;f為相機的焦距(mm)[17]。
航線上無人機的飛行速度根據標準航線重疊度(80%)進行計算,公式為
V=(0.2·W1·L)/(T·f)
(2)
式中,W1為相機飛行航線方向上的傳感器寬度(mm);T為影像采集的時間間隔(s)。
無人機飛行時兩條航線之間的距離公式為
S=(0.3·W2·L)/f
(3)
式中,S為兩條航線之間的距離;W2為與無人機飛行航線方向垂直方向的傳感器寬度(mm)。
飛行前后設置地面輻射標定板,用于后期影像輻射校正,飛行中保證航線重疊度和旁向重疊度大于80%,共獲取多光譜圖像9750張。通過Agisoft Metashape軟件進行影像拼接,經輻射校正處理得到5個波段的多光譜圖像,影像分辨率為0.03 m。
無人機影像內除主要研究對象巖石外,還有大量植物覆蓋及巖層間的裂縫產生的陰影。若不剔除植物和陰影,將影響巖性分類的結果。因此,在進行巖性分類前,應首先去除植物和陰影,確定巖石的空間分布區域。然后在巖石分布區域內通過目視解譯方式提取3種巖石的樣本點,以選取的樣本點為中心向外擴展成25×25像素大小的圖像,圖像的類別由中心像素點的類別決定。所有樣本按照7∶2∶1的比例分為訓練集、測試集、驗證集,利用本文多尺度混合特征分類模型和多種分類模型進行分類。最后選取研究區域內的巖層分布清晰區域進行精度對比。本文的技術路線如圖3所示。

圖3 技術路線
遙感圖像分類中大多是基于像素的分類方法,很少考慮地物的空間特征,忽略相鄰像素的相互關系,這不可避免地導致在分類結果中出現碎斑現象,分類效果較差。面向對象的分類方法以影像分割后多個像素組成的對象為分類目標,在分類過程中面向對象操作的是有意義的影像對象,而不是單個的像素,充分考慮了光譜特征和對象的空間特征,克服了基于像素分類方法的缺點。因此,本文采用基于面向對象的分類方法提取巖石精確的分布區域。為了消除植被影響,選取歸一化植被指數(NDVI)、差值植被指數(DVI)、比值植被指數(RVI),以及5個光譜波段作為分類特征。
(1)歸一化植被指數。歸一化植被指數特征可通過增加植被之間的光譜差異,增強植被信息,抑制非植被的信息,常被用于檢測植被生長狀況、植被覆蓋度等,計算公式為
(4)
式中,NIR和R分別表示近紅外波段和紅波段的反射率。
(2)差值植被指數。差值植被指數也可增強植被信息,反映土壤與植被的覆蓋面積,其計算公式為
DVI=NIR-R
(5)
(3)比值植被指數。其計算公式為
(6)
卷積神經網絡主要分為一維卷積神經網絡、二維卷積神經網絡、三維卷積神經網絡。大部分的經典網絡模型都是二維卷積神經網絡,只能提取空間特征,無法有效利用光譜特征。三維卷積神經網絡可以提取空間特征和光譜特征,但計算量大。
為了充分利用二維卷積神經網絡和三維卷積神經網絡提取不同特征的能力,文獻[18]提出了一個混合特征學習框架(Hybrid CNN)。該學習框架將三維卷積核和二維卷積核混合使用,可以有效利用圖像中的光譜特征和空間特征,同時減小了計算量。本文在混合特征學習框架的基礎上,提出了一種多尺度混合特征網絡模型(如圖4所示)。它將三維卷積神經網絡與二維卷積神經網絡相結合,充分利用光譜和空間信息,同時擴展分支,加入不同尺度的卷積核,獲取不同粒度的局部相關性,得到多尺度的特征信息,實現更高精度的分類結果。

圖4 多尺度混合特征網絡模型
由圖4可知,在多尺度混合特征網絡模型中使用了3×3和5×5不同尺度的卷積核,并在兩個分支中都使用了混合特征學習框架。在三維卷積階段,對輸入的光譜特征進行3次三維卷積,在不損失大量光譜信息的情況下,將輸出特征進行Reshape操作,方便后續進行二維卷積獲取不同光譜波段的空間信息;然后將不同尺度的光譜-空間特征進行串聯疊加,并進行GAP操作,完成最后的分類。
在原始混合特征學習框架的分類階段,提取特征后連接了3個全連接層,而本文多尺度混合特征模型中的混合特征學習框架利用GAP操作替代全連接層。引入GAP操作可以使模型具有全局的感受野,使低層網絡也能夠利用全局信息,更加直觀地展示各類別與特征圖之間的聯系,使得特征圖轉化為分類概率也相對容易;此外,GAP層中沒有需要調整的參數,也簡化了計算量和參數量,使模型更加穩健,不易產生過擬合的現象。
無人機多光譜影像作為分類對象,以提出的植被指數和影像的5個光譜波段為分類特征,利用面向對象的分類方法進行分類,確定巖石的分布區域。
面向對象分類的主要步驟為:基于無人機影像,首先進行尺度分割,選取訓練樣本,添加上述分類特征進行分類;經過反復試驗,影像分割時的分割尺度為150,顏色因子設置為0.6,緊密度設置為0.8,影像分割效果最佳。樣本選取與影像分割結果如圖5示。

圖5 樣本選取與分割結果
圖6為利用面向對象的分類方法對無人機影像進行分類的結果。可以看出,面向對象的分類結果非常接近露頭實際情況。
為了能夠直觀地反映面向對象分類方法對巖石分布區域的精度,計算分類混淆矩陣。各地物的分類精度見表1。Kappa系數為0.87。

表1 分類精度 (%)
可以看出,面向對象的分類方法能夠準確地提取巖石的分布區域。光譜指數的選擇可以有效突出植被信息,將得到的分類圖像進行分類后處理,并利用得到的巖性分布區域進行掩膜處理,得到巖石分布區域,如圖7所示。

圖7 巖石分布區域
以提取的巖石分布區域作為巖性分類數據,以3類巖石的樣本點為中心,向外擴展成25×25像素大小的圖像,圖像的類別由中心像素點的類別決定,共4888個訓練樣本。所有訓練樣本按照7∶2∶1的比例分為訓練集、測試集、驗證集。利用本文提出的多尺度混合特征網絡模型進行訓練和分類,并與卷積神經網絡模Inception V3、ResNet18、Hybrid CNN,以及傳統機器學習分類模型SVM、MLC進行精度對比。
試驗采用Sgdm優化器進行更新,L2范數項的系數為0.004,采用批量訓練的方法訓練模型,每個批次訓練的樣本數為64個,共迭代50次,初始學習率設置為0.000 1。試驗環境為Matlab 2021a,計算機配置如下:CPU為i5-10300H,內存為16 GB,GPU為NVIDIA GeForce GTX 1650。該模型運行時具體網絡結構結果見表2。
利用本文多尺度混合特征網絡模型進行訓練和分類,并與卷積神經網絡模Inception V3、ResNet18、Hybrid CNN,以及傳統機器學習分類模型SVM、MLC進行精度對比,巖性分類結果如圖8所示。

圖8 巖性分類結果
選擇總體分類精度及Kappa系數作為驗證區域精度主要評價指標,分類精確率對比見表3。通過比較不同模型的分類精度可知,SVM和MLC的總體分類精度較低,分別為75.10%、76.74%,Kappa系數分別為0.62、0.64。Inception V3和ResNet18的總體分類精度和Kappa系數有所上升,但整體分類精度依舊偏低。Hybrid CNN和本文模型由于三維卷積核的加入,可以充分提取空間特征和光譜特征,總體分類精度和Kappa系數大幅提升。最終試驗結果表明,多尺度混合特征網絡模型相比于其他分類模型,在總體精度和Kappa系數上都達到最優,分別為89.91%、0.85。

表3 分類精確率對比
本文針對大坡度地質露頭,利用無人機采集巖性數據,提出了多尺度混合特征網絡模型,通過對比分類精度,得到以下結論。
(1)針對大坡度地質露頭的特點,采用無人機與貼近攝影測量技術相結合的方法,在采集地質露頭數據中具有較強的可行性和優勢。
(2)以植被指數和光譜特征為分類特征,利用面向對象的分類方法,可以有效地區分植被與巖石,提取巖石精確的分布區域。
(3)本文多尺度混合特征網絡模型與InceptionV3、ResNet18、SVM和MLC相比,可以充分提取多光譜圖像中的光譜特征和空間特征,在總體分類精度、3類巖石分類精度及Kappa系數上均達到更高的精度,其中總體分類精度為89.91%,Kappa系數為0.85。