杜坤娟,高 軍,武希峰
(1.科爾沁右翼前旗防汛抗旱服務(wù)中心,內(nèi)蒙古 興安盟 137400;2. 興安盟水務(wù)投資集團有限責(zé)任公司,內(nèi)蒙古 興安盟 137400)
基于遙感數(shù)據(jù)的水資源變化分析與預(yù)測系統(tǒng)的硬件設(shè)計中,計算機服務(wù)器型號采用Dell PowerEdge R740,用于存儲、處理和分析大量的遙感數(shù)據(jù),實現(xiàn)數(shù)據(jù)挖掘、模型訓(xùn)練和預(yù)測等任務(wù)。遙感數(shù)據(jù)采集設(shè)備選用航空遙感儀及衛(wèi)星遙感傳感器,用于獲取水資源相關(guān)的遙感數(shù)據(jù),如衛(wèi)星影像、雷達圖像等。全球定位系統(tǒng)(GPS)設(shè)備采用Garmin GPSMAP 64 sx,用于記錄遙感數(shù)據(jù)采集設(shè)備的位置信息,以便后續(xù)的地理定位和數(shù)據(jù)對應(yīng)。系統(tǒng)中的數(shù)據(jù)存儲設(shè)備選擇Synology DS920+系統(tǒng),用于存儲大量的遙感數(shù)據(jù)、預(yù)處理數(shù)據(jù)和中間結(jié)果,提供可靠的數(shù)據(jù)存儲和訪問功能。
圖形處理單元(GPU)選擇NVIDIA GeForce RTX 3080,用于加速計算機服務(wù)器上的遙感數(shù)據(jù)處理和深度學(xué)習(xí)任務(wù),提供并行計算能力。數(shù)據(jù)顯示和可視化設(shè)備為Dell UltraSharp U2720Q高分辨率顯示器,展示和查看遙感數(shù)據(jù)、分析結(jié)果和預(yù)測模型輸出,以便用戶進行數(shù)據(jù)分析和決策。網(wǎng)絡(luò)設(shè)備中的交換機、路由器主要用于構(gòu)建局域網(wǎng)(LAN)或廣域網(wǎng)(WAN),實現(xiàn)設(shè)備之間的數(shù)據(jù)傳輸和通信。傳感器設(shè)備包含水位傳感器、雨量傳感器,以便實時監(jiān)測水資源相關(guān)的環(huán)境參數(shù),提供實地觀測數(shù)據(jù)與遙感數(shù)據(jù)的對比和校準。
數(shù)據(jù)獲取是基于遙感數(shù)據(jù)的水資源變化分析與預(yù)測系統(tǒng)中的關(guān)鍵步驟之一,具體的獲取步驟如圖1所示。

圖1 遙感數(shù)據(jù)獲取流程
如圖1所示,首先選擇Sentinel-2高分辨率的光學(xué)衛(wèi)星平臺進行遙感數(shù)據(jù)獲取。挑選具有多個波段的遙感影像,以獲取豐富的地物信息,根據(jù)具體的數(shù)據(jù)源進行后續(xù)處理和分析[1-5]。根據(jù)研究需求和預(yù)算確定數(shù)據(jù)采集的時間、頻率和區(qū)域范圍,制定一個符合具體測算區(qū)域的計劃。
使用衛(wèi)星平臺和數(shù)據(jù)傳感器,根據(jù)預(yù)定的計劃進行數(shù)據(jù)采集,該數(shù)據(jù)采集是一項操作性任務(wù),只需操控Sentinel-2系統(tǒng)并制定出具體區(qū)域的數(shù)據(jù)即可。利用衛(wèi)星數(shù)據(jù)傳輸通道或互聯(lián)網(wǎng)傳輸數(shù)據(jù),并使用云存儲服務(wù)進行數(shù)據(jù)存儲和備份,將高速數(shù)據(jù)傳輸通道和云存儲服務(wù)進行數(shù)據(jù)傳輸和存儲。對數(shù)據(jù)進行校正、去噪、輻射定標等處理,應(yīng)用大氣校正、輻射定標算法進行數(shù)據(jù)校正,并使用濾波和去噪技術(shù)降低數(shù)據(jù)噪聲,確保數(shù)據(jù)質(zhì)量。最后,將原始遙感數(shù)據(jù)轉(zhuǎn)換為適合分析和處理的格式,轉(zhuǎn)換為GeoTIFF柵格數(shù)據(jù)格式或Shapefile矢量數(shù)據(jù)格式,以此來完成對遙感數(shù)據(jù)的采集工作,以方便對數(shù)據(jù)進行預(yù)處理。
2.2.1 圖像幾何校正
在基于遙感數(shù)據(jù)的水資源變化分析與預(yù)測系統(tǒng)設(shè)計中,圖像幾何校正是遙感數(shù)據(jù)預(yù)處理的一個重要步驟。校正圖像幾何旨在將采集到的遙感影像進行幾何校正,以消除由于平臺運動、地球曲率和地形變化等因素引起的幾何畸變,使得影像在地理坐標系統(tǒng)下的位置和尺度準確。首先需要收集參考數(shù)據(jù),獲取精確的地面控制點(GCPs)數(shù)據(jù),如已知位置的地物或人工標志物的地理坐標,這些GCPs將用于校正遙感影像。使用多項式幾何校正模型來描述影像的幾何畸變特征,具體的二階多項式模型如式(1)所示:
X′=a0+a1X+a2Y+a3XY+a4X2+a5Y2
Y′=b0+b1X+b2Y+b3XY+b4X2+b5Y2
(1)
式中:X′和Y′為校正后的地理坐標,(°);X和Y是原始影像的像素坐標,pixel;a0~a5、b0~b5為模型的參數(shù),通過擬合GCPs得到。在遙感影像和參考數(shù)據(jù)中定位GCPs,進行GCP的匹配,建立遙感影像和地理坐標系統(tǒng)之間的關(guān)聯(lián)。利用匹配的GCPs最小二乘法等擬合方法,通過最小化殘差平方和來估計模型參數(shù),以使得校正后的影像像素與GCPs的地理坐標之間的差異最小化。根據(jù)估計的幾何校正模型參數(shù),對整個遙感影像進行幾何校正,對每個像元進行重采樣操作,將其從影像坐標轉(zhuǎn)換到地理坐標,對校正后的影像進行降噪和平滑處理,以提高影像質(zhì)量和幾何精度。
2.2.2 影像配準
影像配準旨在將不同時間、不同傳感器或不同平臺獲取的遙感影像進行空間對齊,以實現(xiàn)精確的比較和分析。在采集遙感數(shù)據(jù)過程中,將采集到兩幅遙感影像,一幅是待配準影像(Image A),另一幅是參考影像(Image B)。為實現(xiàn)影像配準,首先選擇使用SIFT(尺度不變特征變換)算法進行特征提取,用現(xiàn)有的SIFT算法庫或開源工具來實現(xiàn)SIFT特征提取,并根據(jù)具體需求進行調(diào)整和優(yōu)化。采用最佳候選匹配算法,基于特征點的描述子進行特征匹配,建立待配準影像和參考影像之間的對應(yīng)關(guān)系。選擇仿射變換模型,使用最小二乘法估計待配準影像和參考影像之間的初始變換參數(shù),具體的仿射變換如式(2)所示:
(2)

(1)確定待插值位置(x,y)所在的四個已知像素點的位置和像素值。
(2)獲取水平方向上的插值結(jié)果Va和Vb。
(3)獲取垂直方向上的插值結(jié)果Vs。
(4)得到最終的插值像素值Vz。
通過上述流程,對經(jīng)過幾何變換的待配準影像進行像素值插值處理,以保持圖像的空間連續(xù)性。
2.2.3 影像濾波
在基于遙感數(shù)據(jù)的水資源變化分析與預(yù)測系統(tǒng)設(shè)計中,影像濾波是一種常用的預(yù)處理步驟,用于去除噪聲、平滑圖像、增強特定信息等,均值濾波(Mean Filtering)的整體影像濾波流程如圖2所示。

圖2 影像濾波流程
首先要定義濾波窗口的大小,選擇5 pixel×5 pixel的正方形。移動濾波窗口,以每個像素點為中心,依次遍歷整個圖像。對于濾波窗口中的每個像素,計算其與鄰域像素的平均值作為濾波后的像素值,均值濾波如式(3)所示:
(3)
式中:Ifiltered(x,y)為濾波后的像素值;N、M為濾波窗口的尺寸,pixel;i、j分別為濾波窗口的行列索引;I(x+i,y+j)為濾波窗口中的像素值,pixel。將計算得到的均值賦值給當(dāng)前像素,完成濾波操作。
當(dāng)設(shè)計基于遙感數(shù)據(jù)的水資源變化分析與預(yù)測系統(tǒng)時,水資源變化分析旨在識別和理解水資源在時間和空間上的變化趨勢、規(guī)律和影響因素。根據(jù)遙感影像預(yù)處理結(jié)果,對校正后的影像進行地物分類和提取,目的是獲取感興趣的水體區(qū)域。使用時間序列分析方法對水資源數(shù)據(jù)進行建模和分析,以揭示長期趨勢、季節(jié)性變化和周期性變動等,對不同地區(qū)的水資源數(shù)據(jù)進行比較和分析,以尋找空間上的差異和變化模式。使用線性回歸進行水資源變化預(yù)測時,具體如式(4)所示:
S=a+bH
(4)
式中:S為水資源變化量(例如,水體面積變化),m2;H為時間,d;a、b為回歸系數(shù)。得知水資源變化量之后,探索水資源變化與其他影響因素之間的相關(guān)性,如氣候因素、土地利用變化等,使用相關(guān)系數(shù)來評估不同變量之間的關(guān)聯(lián)性。利用機器學(xué)習(xí)算法進行水資源變化的預(yù)測,支持向量機模型如式(5)所示:
f(x)=sign(wx+b)
(5)
式中:f(x)為向量機模型;w為權(quán)重向量;b為偏置項。建立決策樹對歷史數(shù)據(jù)進行訓(xùn)練,學(xué)習(xí)出數(shù)據(jù)中的模式和規(guī)律,并預(yù)測未來的水資源變化。同時,數(shù)據(jù)的質(zhì)量和準確性也對預(yù)測結(jié)果產(chǎn)生重要影響,因此,在預(yù)測過程中,數(shù)據(jù)預(yù)處理、特征選擇和模型評估等步驟也是必不可少的。
試驗使用一臺配置較高的Dell PowerEdge R740服務(wù)器,其具備足夠的計算能力和存儲容量。安裝適用的操作系統(tǒng)、開發(fā)環(huán)境和相關(guān)軟件,包括Python、GDAL遙感數(shù)據(jù)處理庫、Scikit-learn、TensorFlow機器學(xué)習(xí)庫。選擇Landsat系列遙感數(shù)據(jù)源,從數(shù)據(jù)源中獲取多期的水體遙感影像數(shù)據(jù),涵蓋一定時間范圍內(nèi)的變化。對獲取的遙感影像進行輻射校正、大氣校正、地物分類和提取等預(yù)處理步驟,得到水體的面積變化數(shù)據(jù)。根據(jù)預(yù)處理后的數(shù)據(jù),提取每期水體面積、氣象數(shù)據(jù)(如降雨量、溫度等)等作為特征,選擇合適的機器學(xué)習(xí)模型,使用歷史數(shù)據(jù)進行模型的訓(xùn)練,以此來測試系統(tǒng)的性能。
通過測試系統(tǒng)在長時間運行下的表現(xiàn)來評估構(gòu)建平臺的穩(wěn)定性,抽選3組數(shù)據(jù)集,記錄系統(tǒng)運行的穩(wěn)定性指標。根據(jù)訓(xùn)練得到的模型進行水資源變化預(yù)測,記錄系統(tǒng)在處理不同規(guī)模數(shù)據(jù)集時的時間消耗,包括數(shù)據(jù)加載、預(yù)處理、模型訓(xùn)練和預(yù)測等環(huán)節(jié),監(jiān)測系統(tǒng)在運行過程中的計算資源利用率,如CPU和內(nèi)存的使用情況,具體的試驗結(jié)果數(shù)據(jù)如表1所示。

表1 測試試驗結(jié)果
從表1中各項結(jié)果指標的詳細分析可以看出,RMSE(均方根誤差)在數(shù)據(jù)集1、數(shù)據(jù)集2和數(shù)據(jù)集3中分別為0.123、0.234和0.178,表明模型的預(yù)測誤差相對較小。MAE(平均絕對誤差)在數(shù)據(jù)集1、數(shù)據(jù)集2和數(shù)據(jù)集3中,MAE分別為0.086、0.129和0.101,表明模型的平均預(yù)測誤差相對較小。預(yù)測模型在準確性方面表現(xiàn)良好,具有較小的RMSE和MAE值,這意味著模型能夠較為準確地預(yù)測水資源變化,并與實際觀測值較為接近。在數(shù)據(jù)集1、數(shù)據(jù)集2和數(shù)據(jù)集3中,加載數(shù)據(jù)集所需的平均時間分別為2.34 s、3.67 s和1.98 s,表明數(shù)據(jù)加載的速度較快。內(nèi)存利用率在數(shù)據(jù)集1、數(shù)據(jù)集2和數(shù)據(jù)集3中,分別為55%、58%和52%,表明系統(tǒng)能夠有效利用計算資源,提高數(shù)據(jù)處理和模型訓(xùn)練的效率。
基于遙感數(shù)據(jù)的水資源變化分析與預(yù)測系統(tǒng)旨在提供一個全面、準確的工具,幫助監(jiān)測、分析和預(yù)測水資源的變化和趨勢。通過對遙感數(shù)據(jù)的獲取和處理,結(jié)合機器學(xué)習(xí)技術(shù),該系統(tǒng)能夠準確提取水體變化信息并建立預(yù)測模型,為水資源管理和決策提供重要的支持。在系統(tǒng)的設(shè)計和實現(xiàn)過程中,本文詳細介紹了數(shù)據(jù)預(yù)處理和預(yù)測模型建立的關(guān)鍵步驟。通過對試驗數(shù)據(jù)的測試和分析,驗證了系統(tǒng)的穩(wěn)定性和性能。結(jié)果表明,該系統(tǒng)具有較高的準確性,能夠準確分析水資源變化,并提供未來趨勢的預(yù)測。