張宏,韓震,2,3
( 1. 上海海洋大學海洋科學學院,上海 201306; 2. 上海海洋大學防災減災中心,上海 201306;3. 大洋漁業資源可持續開發省部共建教育部重點實驗室,上海 201306 )
基于神經網絡的長江口深水航道海域懸浮泥沙濃度研究
張宏1,韓震1,2,3
( 1. 上海海洋大學海洋科學學院,上海 201306; 2. 上海海洋大學防災減災中心,上海 201306;3. 大洋漁業資源可持續開發省部共建教育部重點實驗室,上海 201306 )
航道治理和維護的核心問題為泥沙問題。在充分分析遙感和遙測數據的基礎上,利用BP神經網絡方法對長江口深水航道海域懸浮泥沙濃度進行了研究。當隱含層神經元個數為8時,預測效果最好,網絡的RMSE僅為0.102,網絡的擬合度達到0.899。預測的最大相對誤差為28%,最小相對誤差為6%,總的相對誤差為21.5%。
遙感;遙測;懸浮泥沙;BP神經網絡;長江口深水航道
研究河口區高濃度懸浮泥沙水體,傳統的方法多是采取定點測量,這不僅不能全面地反映整個水域的情況,而且耗費大量的人力、物力和財力。而衛星遙感技術在大面積水域懸浮泥沙定量監測研究中具有一定的優勢。關于利用衛星遙感數據進行懸浮泥沙濃度的研究,國內外學者已經做了大量的工作。李四海等[1]利用海洋水色衛星SeaWiFS數據和準同步實測表層含沙量資料,建立了長江口區懸浮泥沙遙感定量模式;王芳等[2]建立了基于MODIS遙感數據和泥沙粒徑二元特征參數的主成分和神經網絡兩種泥沙濃度的反演模型,并對比分析了這兩類模型的反演精度以及泥沙粒徑因子對模型的影響;Keiner等[3]利用TM影像前3個波段作為神經網絡的輸入,估算了特拉華灣海域表層懸浮泥沙的濃度,模型的RMS小于10%,比多元回歸模型的效果好;Zhang Yuanzhi等[4]結合TM數據和SAR數據,利用神經網絡算法估算了芬蘭河灣的懸浮泥沙濃度,模型的R2和RMSE分別為0.89和0.72;Kishino等[5]利用神經網絡模型,使用ASTER數據反演了東京海灣懸浮物質的濃度,取得了較好的效果。盡管國內外學者在懸浮泥沙遙感領域做了許多工作,但是利用遙感和遙測數據相結合的方法,進行懸浮泥沙濃度反演研究的較少。本文在充分分析遙感和遙測數據的基礎上,利用BP神經網絡方法對長江口深水航道海域懸浮泥沙濃度進行了研究,取得了比較理想的結果。
遙感影像數據源為2007年7月28日、2008年3月24日和2008年4月25日的TM數據。懸浮泥沙實測濃度為長江口深水航道科學試驗中心“長江口深水航道水文、泥沙、波浪自動遙測系統”的同步遙測數據,本次研究數據總共有22組,從低濃度到高濃度隨機選取16組數據作為BP神經網絡的訓練樣本,剩余的6組數據用于BP神經網絡的驗證。圖1為“長江口深水航道水文、泥沙、波浪自動遙測系統”站位示意圖。

圖1 “長江口深水航道水文、泥沙、波浪自動遙測系統”站位分布圖Fig. 1 Station distribution map of “Hydrology, sand, wave automatic telemetry system of the Yangtze estuary deepwater channel”
TM數據的反射率采用式(1)和式(2)進行計算。
輻射亮度計算:

式中:DN為圖像的像元灰度值,取值范圍為0—255;Lλ為輻射亮度;Gain為增益;Bias為偏差; 為行星反射率;d為日地距離參數;ESUN為太陽光譜輻射量;θ為太陽天頂角。表1 為反射率計算所使用的各參數值。

表1 反射率計算使用的各參數值Tab. 1 Parameter values for computing reflectance
此外,利用ENVI 4.5軟件對TM反射率圖像進行了幾何校正,配準圖像采用研究區1∶5萬地形圖,校正后的像元誤差小于0.5個像元。
傳統的泥沙觀測方法為利用測量儀器(例如OBS)進行現場單點或走航測量。由于監測費用昂貴,往往現場僅布置少數幾個單點(垂線)或斷面,且易受氣候環境影響,如無法獲取臺風、暴雨等惡劣氣候條件下的泥沙數據。“長江口深水航道水文、泥沙、波浪自動遙測系統” 是在YJD-500NT基礎上開發出來的水文氣象多要素實時監控系統軟硬件平臺,可全天候、實時地接收長江口深水航道水域的水文、泥沙、波浪數據,主要由7個浮標和3個平臺構成(見圖1)。各個站點的懸浮泥沙濃度數據見圖2,其中0值代表該站點數據缺失。從圖2可以發現,南槽東平臺站位的懸浮泥沙濃度最高,其次就是南槽東站位,2007年7月28日南槽上、牛皮礁、W3、北槽中、橫沙各站位泥沙濃度緩慢增大,但都低于0.3 g/L ;2008年3月24日南槽上、牛皮礁及W3站位泥沙濃度大約為0.6 g/L,而口外、北槽中、橫沙及北槽中平臺各站位泥沙濃度則低于 0.6 g/L;2008年 4月25日南槽上、牛皮礁、W3站位泥沙濃度呈逐步上升趨勢,但都低于0.6 g/L,而北槽中站位懸浮泥沙濃度與2008年3月24日基本持平。(經和遙測系統人員溝通,南槽東平臺和浮標站位數據偏高屬于異常點,故未采用)。

圖2 各站位實測懸沙濃度Fig. 2 Suspended sediment concentration in different stations
人工神經網絡是20世紀80年代迅速發展起來的一門非線性科學,它能夠解決那些由數學模型或描述規則難以處理的問題,且具有較好容錯性能。本研究所使用的BP神經網絡是一種非線性映射人工神經網絡,即誤差反向傳播網絡,具有很強的學習和記憶能力,以及結構簡單、可調參數多、訓練算法多、可操控性好的優點。
本文主要是從網絡的層數、每層的神經元個數和傳輸函數、初始權值、以及學習速率、期望誤差的選取等幾個方面來考慮[8],利用MATLAB 7.0軟件進行了BP網絡的設計。本研究采用的神經網絡模型為三層的反向傳輸神經網絡,第一層為輸入層,中間層為隱含層,第三層為輸出層。各層的神經元之間形成連接,各層內的神經元之間沒有連接。圖3為一個簡單的人工神經網絡的結構。
對于輸人層神經元,其輸出和輸入相同。隱含層的神經元的輸出為:

圖3 人工神經網絡結構Fig. 3 Artificial neural network structure

當對該網絡進行訓練時,首先有若干組訓練樣本,其中的每個樣本由輸入和理想輸出組成;當網絡的所有實際輸出與理想輸出一致時,訓練結束。否則,通過修改權重,使網絡的實際輸出與理想輸出一致。
本文在進行神經網絡設計時,隱含層和輸出層的傳輸函數分別為S型正切函數 (tansig) 和S型對數函數 (logsig),因為 S型函數的極限值落在 [0,1] 之間,使得網絡訓練時能夠快速地收斂,同時采用自適應的Levenberg-Marquardt快速學習算法訓練網絡[9]。在設計網絡的訓練過程中,期望誤差值也應當通過對比訓練確定一個合適的值,合適的程度相對于隱含層神經元的數目而言,本網絡的訓練誤差設置為0.01。考慮到長江口懸浮泥沙光譜反射率具有雙峰特征(第一反射峰位置在600 ~ 700 nm,第二反射峰位置在760 ~820 nm[10]),為了更好地反映懸浮泥沙濃度與遙感影像反射率之間的關系,輸入層含有三個神經元,分別對應TM影像的2波段、3波段和4波段的反射率。
為了找到最佳的隱含層神經元個數,通過計算樣本模擬值與實測值之間的Pearson相關系數 (R) 的平方值和均方根誤差 (RMSE) 來完成,二者的計算公式為:


表2列出了不同神經元數目下模型的預測結果。從表2可以發現,隱含層神經元為8的BP網絡對函數的逼近效果最好,因為它的誤差最小。另外,網絡的性能并非隱含層神經元的個數越多越好,當神經元個數增加到10時,誤差反而增大了。圖4是當隱含層神經元為8時的網絡訓練停止圖。從圖4可以看出,模型經過26次訓練就達到了目標誤差。

表2 不同隱含層神經元神經網絡模型的R2 和RMSETab. 2 R2 and RMSE of different hidden layer neurons neural network model
為了檢驗所建立的神經網絡模型的預測精度,本文選取剩余的6組數據對網絡進行了驗證(表1)。從表1可以看出,當選擇隱層神經元為8時,網絡的RMSE僅為0.102,網絡的擬合度達到 0.899。劉志國等[11]在最小二乘法的基礎上建立了單波段反射率與泥沙濃度關系的回歸方程,模型的最小RMSE為0.108,模型的最大RMSE為0.316,相對應的R2分別為0.916 3和0.869 6。由此可見,本文的擬合度小于文獻[11]的研究結果,原因在于文獻[11]模型建立的是單一波段,而本文是整個波段的,但是本文的RMSE比其要好。圖5是神經網絡所模擬的值與實測值的一個對比。從圖5可以發現,4號浮標(南槽東平臺)位置處的誤差較大。這可能與該水域附近的水動力條件有關,因為南槽東平臺剛好處于南槽航道(圖1),這里由于淺灘地形和潮流掀沙過程引起的泥沙再懸浮,使懸浮泥沙濃度較高[12]。但是整體來看,預測的最大相對誤差為28%,最小相對誤差為6%,總的相對誤差為21.5%。對比李四海等[13]利用像元灰度法建立的長江河口表層懸浮泥沙線性反演模式(其誤差為24.35%),這個結果還是比較理想的。

圖4 神經網絡模型訓練停止示意圖Fig. 4 Stop training of neural network model

圖5 BP神經網絡模擬值和實測值對比Fig. 5 Measurement values and prediction values of BP neural network
本文以TM影像2、3、4波段的反射率作為輸入,懸浮泥沙濃度作為輸出,結合遙測的懸浮泥沙濃度,利用BP神經網絡對長江口深水航道水域懸浮泥沙濃度進行了研究。當隱含層神經元數目為8個時,BP神經網絡的訓練效果最好,RMSE僅為0.102,擬合度達到0.899;BP神經網絡預測的最大相對誤差為28%,最小為6%,總的相對誤差為21.5%。本文研究結果說明,BP神經網絡能比較準確地反演長江口深水航道懸浮泥沙的濃度,可揭示長江口深水航道海域懸浮泥沙的時空分布規律,為其治理和維護提供技術支撐。
致謝:對上海河口海岸研究中心劉杰高工在本次研究工作中給予的幫助在此深表謝意。
[1] 李四海,唐軍武,惲才興. 河口懸浮泥沙濃度SeaWiFS遙感定量模式研究 [J]. 海洋學報, 2002, 24(2): 51-58.
[2] 王芳, 李國勝. 海洋懸浮泥沙二元特征參數MODIS遙感反演模型研究 [J]. 地理研究, 2007, 26(6): 1 186-1 196.
[3] Keiner L E, Yan X H. A Neural Network Model for Estimating Sea Surface Chlorophyll and Sediments from Thematic Mapper Imagery [J].Remote Sensing of Environment, 1998, 66(2): 153-165.
[4] Zhang Y Z, Jouni P, Sampsa K, et al. Application of an empirical neural network to surface water quality estimation in the Gulf of Finland using combined optical data and microwave data [J].Remote Sensing of Environment, 2002, 81(3): 327-336.
[5] Motoaki K, Akihiko T, Joji I. Retrieval of Chlorophyll a, suspended solids, and colored dissolved organic matter in Tokyo Bay using ASTER data [J].Remote Sensing of Environment, 2005, 99(1): 66-74.
[6] 韋玉春, 黃家柱. Landsat5圖像的增益、偏置取值及其對行星反射率計算分析 [J].地球信息科學, 2006, 8(1): 110-113.
[7] Chander G, Markham B L. Revised Landsat-5 TM Radiometric Calibration Procedures and Post-Calibration Dynamic Ranges [OL]. http://landsat.usgs.gov/documents/L5TMCal2003.pdf.
[8] Demuth H, Beale M. Neural Network Toolbox user's guide, for use with MATLAB,Version4. The MathWorks, online only, 2002.
[9] Hagan M T, Menhaj M. Training feedforward networks with the Marquardt algorithm [J]. IEEE Transactions on Neural Networks,1994, 5(6): 989-993.
[10] 韓震, 惲才興, 蔣雪中. 懸浮泥沙反射光譜特性實驗研究 [J]. 水利學報, 2003, (12): 118-121.
[11] 劉志國, 周云軒, 沈芳. 河口水體泥沙濃度的水面光譜統計模式分析 [J]. 水利學報, 2007, 38(7):799-805.
[12] 陳沈良, 張國安, 楊世倫, 等. 長江口水域懸沙濃度時空變化與泥沙再懸浮 [J]. 地理學報, 2004, 59(2): 260-266.
[13] 李四海, 惲才興. 河口表層懸浮泥沙氣象衛星遙感定量模式研究 [J]. 遙感學報, 2001, 5(2): 154-160.
Research on suspended sediment concentration of the Yangtze River estuary deepwater channel sea area using neural network
ZHANG Hong1, HAN Zhen1,2,3
( 1. College of Marine Sciences, Shanghai Ocean University, Shanghai 201306, China;2. Ocean Disaster Prevention and Reduction Center, Shanghai Ocean University, Shanghai 201306, China;3. Key Laboratory of Sustainable Exploitation of Oceanic Fisheries Resources, Ministry of Education, Shanghai 201306 , China)
Suspended sediment is one of the most important factors concerning the maintenance of the Yangtze River estuary deepwater channel. By analyzing the remote sensing data and the telemetry data, the paper estimated the suspended sediment concentration in the Yangtze River estuary deepwater channel with BP neural network method.While the neurons number of hidden layer is 8, the prediction is the best, the RMSE is only 0.102 and the fitting degree reaches 0.899. The maximal relative error is 28%; the minimum relative error is 6%; and the total relative error is 21.5%.
Remote sensing; Telemetry; Suspended sediment; BP neural network; The Yangtze River Estuary deepwater channel
TV148.1
A
1001-6932(2010)02-0213-06
2008-05-11;
2009-08-13
上海市教育委員會科研創新重點項目(08ZZ81)、上海市科委重點項目(08230510700)、教育部科學技術研究重點項目(209047)、水利公益性行業科研專項(200701026)資助
張宏 (1984-),男,安徽涇縣人,碩士研究生,主要研究方向為環境遙感,電子郵箱:lkdd10000@163.com
韓震,教授,博士,電子郵箱:zhhan@shou.edu.cn