敖瑞貴,閆曉惠,許士國
(大連理工大學,遼寧 大連 116024)
水質探測是水生態環境保護工作中的重要環節,但傳統的野外采樣或傳感器監測等方法具有觀測范圍小、人力物力成本高等缺點。遙感技術具有觀測范圍廣、數據獲取速度快和成本低等優點,已經成為傳統水質調查方法的有力補充,而近年來發展起來的無人機航測技術可以提供更高的時間與空間分辨率且受水汽的影響較小,因此有望進一步提高水質參數的調查效率。之前的學者已嘗試采用無人機多光譜影像對小微水域的總磷、懸浮物濃度、濁度等水質參數進行反演,證明了該方法在小微水域水質調查中的可行性。但是,無人機飛行高度受限,無法直接獲取整個大面積水域的完整正射影響,而為了獲得較好的拼接質量,需要確保無人機飛行的航向重疊度和旁向重疊度,增加了無人機的操控難度。此外,無人機在航測過程中也易受風速等影響而發生傾斜,進一步增大圖像的拼接難度。因此,目前的無人機多光譜技術尚難以應用于較大水域的水質探測中。
鑒于此,本文以懸浮物濃度為例,提出并測試一種基于無人機多光譜點云數據和MGGP人工智能算法的水質探測方法。首先利用無人機搭載多光譜相機在研究區域上空獲取大量的多光譜數據,得到懸浮物濃度的點云數據,再分別利用傳統的克里金空間插值法和MGGP人工智能方法得到驗證點的懸浮物濃度值。結果表明,基于無人機多光譜點云數據和MGGP人工智能算法的方法可有效解決大面積水域的水質探測問題,為水質參數的調查提供新的技術手段。
研究區域面積約為76372m2,周長約為1109m。本研究采用的無人機為大疆悟Inspire 2,搭載Mica Sense Red Edge多光譜傳感器獲取數據。于2021年5月27日進行無人機航拍作業,得到140組帶有GPS定位的多光譜影像,每一組有Blue(0.450~0.515μm)、Green(0.525~0.605μm)、Red(0.630~0.690μm)、Red edge position(0.670~0.760μm)、NIR(0.770~0.890μm)5個光譜帶的數據。根據已有的研究成果,應用紅光波段與近紅外波段之和與綠光波段的比值作為光譜參數,即公式(1)。
(1)
式中,V—用于反演模型的光譜參數;R2、R3、R5—分別為綠光波段、紅光波段和近紅外波段的光譜反射率數據。
對所有的多光譜影像進行輻射校正和輻射定標,在MATLAB軟件中得到每個像元的地物反射率數據,由反射率得到光譜參數,經過數據質量檢測,應用已有的懸浮物濃度模型(公式2)得到140個位置點的懸浮物濃度點云數據。點云數據的空間位置采取隨機布設方式以降低其有序性,可更好地驗證MGGP方法的性能,具體的位置點如圖1所示。將點云數據隨機劃分為兩組,其中112組數據(約80%)用于模型訓練,而剩余的數據則假設為未見數據以用于算法驗證。

圖1 點云數據位置分布圖
本文的研究目的是提出并測試無人機多光譜點云數據結合MGGP方法的可行性而非測試已有懸浮物濃度模型的精確度。模型參數對濃度絕對值略有影響,但基本不改變濃度的空間分布規律。因此,在后續的分析中,將模型的計算值假定為實際值,用于測試MGGP方法的水質參數估算性能。
y=-2582x2-2408x+7473
(2)
式中,y—懸浮物濃度, mg/L;x—光譜參數。
傳統空間插值法選取克里金空間插值法,利用訓練組的112組點云數據進行空間插值,得到驗證點位置的預測值,與真實值比較,分析克里金法的可行性。克里金法以變異函數理論與結構分析為基礎,在區域化變量間存在空間自相關性的前提下,根據未知點和其周圍影響范圍內樣本點的距離及空間關系擬合模型確定權重,對未知點的取值進行無偏最優估計。該方法的計算公式為:
(3)
式中,z(x)—未知點的預測值;z(xi)—樣本點處懸浮物濃度值;λi—權重;n—樣本數。
多基因遺傳規劃(MGGP)是遺傳規劃(GP)的發展,結合了GP的模型構建能力和統計回歸方法的參數估計能力,能夠通過一系列過程找到輸入和輸出變量之間的關系。在傳統的遺傳規劃中,進化模型由單棵樹組成,而在多基因遺傳規劃中,每一個回歸模型都是多棵樹的加權線性組合。其工作流程可以概括為:隨機產生初代種群,包含一組由函數和變量組成的個體;計算種群中每個個體的適應度;選擇適應度好的優良個體為母體;通過突變、交叉、復制等方式產生新的個體,創造新的一代(子代);重復第二步和第三步,直到滿足終止準則。
采用均方根差(RMSE)和R2值來量化方法的精準度,其中R2越接近1、RMSE越小則表示預測值與實測值誤差越小。公式分別為:
(4)
(5)
式中,y—預測值;x—實際值:N—驗證點的個數。
無人機多光譜的典型影像如圖2所示,對每個目標范圍,多光譜相機拍攝5通道影像,通過輻射校正和輻射定標后得到光譜反射率,再通過懸浮物濃度反演公式得到每個點的懸浮物濃度。本水域的懸浮物濃度平均值為8.97mg/L,處于較低水平。最小值為0.45mg/L、最大值為16.16mg/L、中間值為9.05mg/L、標準差為4.09mg/L、方差為16.73(mg/L)2、峰態系數為2.13、偏態系數為-0.12。

圖2 水面多光譜影像
利用篩選出的112個樣本點(訓練組)、采用Arc GIS的克里金法進行空間插值,估算了28個驗證點(驗證組)位置的懸浮物濃度值。如圖3所示為克里金法估算值與實際值的對比圖,其中橫坐標為實際值,縱坐標為克里金估算值,中間線為1∶1等值線。當各散點位于等值線上時,表明估算值完全等于實際值;當散點位于等值線的左上側時,表明該方法高估了實際值;當散點位于等值線的右下方時,表明該方法偏向于低估實際值。由圖3可知,各散點較為均勻地分布于等值線的兩側,且偏離較小,因此預測值與實際值相差不大。經計算,R2值為0.936,RMSE為1.338mg/L,其中R2值較高而RMSE值較低,則證明了該方法具有一定的可行性。

圖3 基于克里金空間插值法的實際值與估算值
采用與克里金法一致的112個樣本點云數據作為訓練數據。MGGP模型的訓練演化過程如圖4(a)所示,其中橫坐標為進化代數,每代產生500個模型,橫坐標代表模型的RMSE值。在進化初期,MGGP算法隨機產生數學模型,其誤差較大,但經過復制、突變、交叉等算法處理,模型的誤差迅速下降,在第10代左右模型種群的誤差值變化幅度即已較小,運行更多的進化代數不再顯著提高種群的精確度,因此將最終的總進化代數設置為100即可滿足要求。圖4(b)對比了懸浮物濃度的實際值與MGGP預測值。由圖可知,相比于克里金空間插值方法,MGGP預測數據與實際數據更加接近。其驗證數據集的R2值為0.964,高于克里金法的0.936,說明MGGP方法可更為準確地判斷數據的升降變化規律。RMSE值為0.926mg/L,低于克里金法的1.338mg/L,因此在本案例中,MGGP法可將傳統空間插值法的誤差降低約30%。克里金方法已經預設了基本的模型結構(公式3),而該結構未必精確。MGGP算法則可排除人為預設模型結構的誤差且可深度挖掘變量之間的相互影響關系,因此MGGP方法的估算結果更為準確。綜上,基于無人機多光譜點云數據結合MGGP人工智能算法的水質探測方法具有較好的可行性。

圖4 基于MGGP的實際值與預測值
本文提出了基于無人機多光譜與MGGP人工智能算法的水質參數探測方法。結果證明,采用該方法估算研究范圍內未知點的水質參數是可行的。估算值與實際值之間的誤差很小,且相比傳統的克里金空間插值法, 該方法的R2值從0.936提升到0.964,而RMSE值則從1.338mg/L下降到0.926mg/L,表明該方法可將克里金空間插值法的RMSE值降低約30%,具有非常好的推廣價值。采用該方法,可在不進行圖像拼接的情況下準確地估測大型水體的水質參數,大幅度地降低了無人機遙感技術的探測難度,可成為當前水質調查技術的有力補充。在下一步的研究中,可以進行更多的案例以測試該方法的有效性。同時,也可嘗試采用計算機視覺等技術對多光譜影像進行處理,以實現大型水體多光譜影像的有效拼接,從另一條途徑解決無人機多光譜水質探測中的難題。