劉 博, 肖長來, 梁秀娟
1.吉林大學環境與資源學院,長春 130021 2.吉林大學地下水資源與環境教育部重點實驗室,長春 130021
?
SOM-RBF神經網絡模型在地下水位預測中的應用
劉 博1,2, 肖長來1,2, 梁秀娟1,2
1.吉林大學環境與資源學院,長春 130021 2.吉林大學地下水資源與環境教育部重點實驗室,長春 130021
利用自組織映射(SOM) 聚類模型優化徑向基函數神經網絡(RBFN)隱層節點的方法,減小了RBFN由于自身結構問題在地下水水位預測中產生的誤差。采用SOM對已有樣本進行聚類,利用聚類后的二維分布圖確定隱層節點的數目,并根據聚類結果計算徑向基函數的寬度,確定徑向基函數的中心,由此建立SOM-RBFN模型。以吉林市豐滿區二道鄉為例,采用2000——2009年觀測的地下水位動態資料,利用SOM-RBFN模型對地下水位進行預測,驗證其準確性,并分別以5、7、10 a的地下水位動態數據為研究樣本建立模型,考查樣本數量對預測結果的影響。研究結果表明:SOM-RBFN模型預測地下水水位過程中,均方根誤差(RMSE)的均值為0.43,有效系數(CE)的均值為0.52,均達到較高標準,因此SOM-RBFN模型可以作為有效而準確的地下水水位預測方法;同時RBF7的RMSE和CE均值分別為0.38和0.68,結果優于RBF5和RBF10,這就意味著在模型計算中樣本數量不會直接影響預測結果的精度。
地下水位預測;SOM;RBF;神經網絡
淺層地下水水位的預測,可為水資源管理、城市規劃、土木工程設計等提供重要的背景資料。因此,有關地下水水位預測的研究已成熱點。傳統的地下水水位預測方法采用簡單的線性函數描述地下水水位的動態特征,但結果往往難以令人滿意。隨著學科的發展,地下水水位預測方法也不斷演化進步。早在20世紀末、21世紀初,金菊良等[1]、Savic等[2]、Chen等[3]、杜超等[4]將數學模型應用于地質及水文地質預測和分類中,但這些模型的建立需要大量的參數和高質量的數據來刻畫其物理過程,因而沒有得到廣泛應用。基于時間序列分析的模型也是地下水水位預測的一個重要工具,例如,Box 與Jenkins提出的傳遞函數模型(transfer noise model, TFN)[5],Hipel 和Mcleod提出的環境系統和水資源的時間序列模型(autoregressive exogenous variable model, ARX)等[6]。Knotters 和 Van Walsum[7]運用隨機模型通過地下水埋深的時間序列估算水量的變化情況;Ahn 與 Salas[8]還介紹了一種運用在不同的時間間隔下非穩定地下水水位數據建立時間序列模型的方法,但由于時間序列模型過于突出時間序列,忽略了外界因素的影響,因而在預測過程中存在缺陷,當外界發生較大變化時,往往會有較大偏差。另外地質統計學的方法也被應用于地下水水位的預測中[9-10]。
近年來,隨著計算機技術的發展,基于大量運算的人工神經網絡(artificial neural network, ANN)模型作為一種新的信息處理模式被運用于地下水水位預測中,且都取得了一定的成果[11-13]。理論上,人工神經網絡是一種通用的近似函數,它可以在服從一定精度的條件下滿足任意非線性的組合[14]。人工神經網絡在地下水水位預測應用最多的是BP神經網絡,但由于自身存在訓練時間長、局部最小化、算法收斂速度過慢等缺點,逐漸被放棄使用。徑向基函數神經網絡(radial basis function neural network, RBFN)作為一種優越的多層前饋式神經網絡,有著較高的運算速度和很強的非線性映射功能,可較好地克服上述問題,更適于非線性時間序列的預測問題;但對于RBFN,隱層節點的數目、隱層徑向基函數的中心以及隱層徑向基函數的寬度都是難以確定的,這就需要一種方法來確定上述參數。很多學者將聚類的思想應用于RBFN的優化設計中,提出了基于減聚類、K-means聚類、中心聚類和對手受罰的競爭聚類等拓撲結構的設計方法,取得了一系列的成果[15-20]。自組織映射(self-organizing map, SOM)以其清晰的計算原則和簡單的結構較好地彌補了RBFN自身的缺點。Chen Luhsienm等人[21]已經運用SOM-RBFN對地下水位進行了預測,但在其預測過程中僅用聚類來確定隱層節點的數目。隱層徑向基函數的寬度通過下式計算:

式中:β為徑向基函數的寬度;dmax為節點之間的最大距離;p為隱層節點的數目。利用上式計算將導致RBFN隱層中徑向基函數的寬度都是相同的,但事實并非如此。因此,筆者通過SOM神經網絡對樣本進行聚類,從而確定隱層節點數,并利用聚類后的結果求出徑向基函數的中心及寬度,這樣RBFN的隱層得到了更大程度的優化。
1.1 徑向基函數神經網絡
RBFN由輸入層(X)、隱層(H)、輸出層(Y)3部分組成,其網絡拓撲結構如圖1所示。RBFN從輸入層到隱層的變換是非線性的,而從隱層到輸出層的變換則是線性的。這種網絡結構,隱層單元輸出為
Rj(Xi)=Rj(‖Xi-Cj‖)
式中:Xi為第i個輸入量;Cj是隱層第j個神經元的中心;‖·‖為歐氏范數;Rj(Xi)為第i個輸入量在隱層中第j個神經元的輸出;R( )為RBFN的基函數。
基函數一般都是徑向對稱的,最常見的是高斯核函數,因此,式(1)可以表達為
R(X)=exp[-‖
式中:R(X)為輸入向量X通過隱層節點C的輸出;X=[X1,X2,…,XN]T,C=[C1,C2,…,CQ]。
輸出單元即對隱節點的輸出進行線性加權組合,并加一個偏移量,具體表達式如下:
式中:yr是輸入向量X在輸出層第r個節點的輸出向量;Nr為輸出層單元的數目;Nh為隱層節點的數目;Rq(X)是輸入向量X在第q個隱層節點的輸出向量;Wq r是連接第q個隱節點和第r個輸出單元的權重;W0是偏移矢量[22]。

圖1 RBFN結構Fig.1 Architecture of RBFN
1.2 自組織映射
SOM也是神經網絡的一種,它由輸入層和輸出層(競爭層)組成(圖2)。輸入層的神經元數為N,競爭層是由M個神經元組成的一維或者二維平面陣列,也可以是更高維的,不過并不常見。
設輸入向量為X=[X1,X2,…,XM]T,與輸出層神經元j相應的權值向量Wj可以表示為Wj=[W1j,W2j, …,WMj]T,j=1,2,…,N。確定獲勝輸出層神經元,相當于選擇權值向量Wj與輸入向量X最為匹配的輸出層神經元,即選出Wj與X具有最小歐氏范數距離dj的神經元作為獲勝神經元,其計算公式為
dj=‖X-Wj‖
鄰域函數hj定義了圍繞獲勝神經元鄰近區域的大小。典型的鄰域函數為高斯函數:

權值向量變化值ΔWj可由下式獲得:
式中,η為學習率參數。
因此,權重的更新可以通過下式計算[23]:
式中,t為時間。
通過式(7)可以調整拓撲鄰域內所有神經元的權值向量。通過對訓練數據的反復運算,權值鄰域不斷更新,確定輸入模式在競爭層中所對應的映射位置,并在一定范圍內對權值進行調整。通過以上過程可以得到各類別集合的中心即獲勝神經元,以及其相應的分布范圍,即獲勝神經元的鄰域。SOM的具體輸出可以通過一個二維網格表示,從中可以清晰地看到獲勝神經元的位置,網格中每一個格代表的是在輸出層中輸入向量的位置。

圖2 SOM神經網絡結構Fig.2 Architecture of the SOM neural network
至今還沒有一個理論能確定最優的輸出層網格大小,因此網格必須足夠大,能夠涵蓋大量數據分類后所形成的子集合。對于迭代次數,通用的原則是至少在訓練數據數的500倍以上[23]。
1.3 SOM-RBFN模型
SOM-RBFN設計由兩步組成。


其中,Xij表示映射到第i個獲勝神經元的第j個樣本,j=1,2,3…,N。令ri=max{dij},則R=[ri]即為各聚類的半徑。
第二步:將SOM競爭層各獲勝神經元的連接權值向量Wg和所對應的聚類半徑R傳送到RBFN的隱層節點,Wg作為隱層徑向基函數的中心C,相應的R就作為隱層徑向基函數的寬度σ;然后再將已知樣本X作為RBFN的輸入向量,最終建立完整的RBFN模型,完成預測。
2.1 研究區域概況
吉林市由4個行政區組成,分別為龍潭區、昌邑區、豐滿區、船營區。本文所選長觀井為豐滿區二道鄉2000——2009年地下水位觀測資料。歷年各月平均地下水位變化如圖3所示,共有120組水位數據。選擇其中前108組作為訓練數據,后12組作為驗證模型數據。本文分別選擇5、7、10 a的數據做3組訓練預測,即分別記為RBF5、RBF7、RBF10,以考查數據長度對預測結果的影響。

圖3 2000——2009年研究區地下水位動態變化曲線Fig.3 Time series plots for monthly average groundwater head data at the station from 2000 to 2009
2.2 SOM-RBFN模型的建立
首先,利用K-S檢驗對數據集進行檢驗,判斷其是否服從正態分布,通過SPSS19 計算得到在0.05的顯著性水平下,數據檢驗統計值P=0.07,因此本數據集服從正態分布,符合RBFN中高斯核函數的應用。然后對訓練數據進行預處理,即將它們分為3個輸入量{X1,X2,X3},分別是月預測水位的前12個月平均水位,前13個月的平均水位,前1個月的平均水位,作為RBFN模型的3組決定預測的輸入變量。
利用SOM神經網絡對樣本進行分類,使樣本數據結構由高維降到低維,便于研究,但選擇的目標網格要足夠大,使其能較好地將樣本進行分類。3組訓練數據分別選用8×8、8×8、12×12的網格,SOM中連接輸入層和競爭層的初始權向量設定在0和1之間,學習速率為0.1遞減為0.01之間的不斷變化值。分別經過2 400、3 600、5 400次迭代運算,SOM完成其對樣本數據的分類,并在二維網格中反映出來。分類結果如圖4所示。
2.3 模型預測結果分析
從圖4a中可見,前期48組觀測數據被分為7組,即隱層節點數為7,然后利用分類后的結果可以計算出Wg=[0.897 0.834 0.620 0.479 0.367 0.254 0.193],R=[0.421 0.386 0.360 0.206 0.188 0.237 0.178]。從圖4b中可以看出,前期72組觀測數據被分為11組,即隱層節點數為11,利用分類后的結果計算出Wg=[0.906 0.857 0.755 0.644 0.540 0.483 0.423 0.345 0.297 0.235 0.173],R=[0.440 0.214 0.256 0.207 0.181 0.148 0.152 0.133 0.100 0.111 0.159]。同上,從圖4c中可以看出,前期72組觀測數據被分為15組,分類后的計算結果Wg=[0.215 0.264 0.301 0.320 0.341 0.362 0.468 0.448 0.522 0.562 0.608 0.775 0.648 0.808 0.867],R=[0.203 0.091 0.083 0.082 0.311 0.144 0.143 0.182 0.164 0.142 0.120 0.288 0.288 0.189 0.497]。將這些參數分別代入各自的神經網絡模型(RBF5、RBF7、RBF10)中,計算得出模擬期(2001——2008年)及2009年預測水位與實際水位的對比,如圖5所示。

a. RBF5;b. RBF7;c. RBF10。圖4 觀測井數據二維分類圖Fig.4 2D feature map for the different models of the observation well

a.訓練數據;b.驗證數據。圖5 預測水位與實測水位對比Fig.5 Comparison of observed groundwater heads and forecasted values
從圖5中可以清晰地看出3個不同系列長度訓練數據集和驗證集的預測水位與實測水位的擬合情況。圖5a中易見,無論哪組擬合效果都不是很完美,例如峰值出現的時間存在一定的延遲或超前,但總體趨勢基本符合。圖5b清晰地顯示RBF7神經網絡預測的地下水位與實測水位的擬合效果較優一些,RBF5和RBF10都是在曲線兩端擬合偏差較大,從而導致了總體的擬合效果較差。具體擬合情況可以從均方根誤差(RMSE)、有效系數(CE)評價標準來看(表1)。均方根誤差的數值越小代表實測數據與預測數據之間的差距越小,即預測效果越好;有效系數的值越大代表模型模擬精度越高。由表1可知:3組訓練數據在訓練預測中,RBF7相比其他2個的預測結果更好;驗證數據即2009年各月的預測水位的誤差分析,也同樣是RBF7數據擬合得最好,但仍有很大改進空間,它也只能做到在趨勢上預估一個區間范圍,畢竟地下水位變化除了與氣象、下墊面等自然因素有關外,很大程度上還受地下水開采量變化影響;如果在研究區出現一種開采情況是與往年不同的,就可能會打破原有的預測模式,使預測結果產生較大偏差。總之,改進后的RBFN已經能夠更簡單有效地對地下水位進行預測了。
表1 訓練與驗證數據的3種模型預測結果對比
Table 1 Performance comparison of three models for training data and testing data

模型RMSECE訓練RBF50.410.62RBF70.360.62RBF100.330.43平均值0.370.56驗證RBF50.510.30RBF70.400.74RBF100.580.43平均值0.500.49
通過SOM改進的RBFN預測地下水水位,解決了RBFN模型自身參數確定上的問題,實現了SOM-RBFN在地下水動態預測中的應用,并且對吉林市豐滿區二道鄉地下水水位進行了預測。由此得出如下結論:
1)SOM-RBFN可以作為預測地下水動態的簡單而有效的工具,尤其是在資料相對缺乏的地區,能夠在一定程度上為水資源管理提供參考。
2)將觀測井動態資料分為3組,構成RBF5、RBF7、RBF10三組模型,分別訓練模擬計算,最終發現RBF7的擬合結果更加理想,表明數據的多少并不能直接影響模型預測的結果,而是要看訓練數據的組成是否和預測水位有更大的類似性,如果數據組成結構相差較遠,會增大預測結果的誤差。
3)從擬合效果上看, SOM-RBFN在預測地下水位的精度上仍有很大的提升空間,如何提高RBFN的適應能力仍是后續研究的重點,并且在今后的工作中將加入其他觀測井資料,進一步觀察模型預測結果與數據多少的關系。
[1] 金菊良,楊曉華,金寶明,等.基于遺傳算法的地下水位動態預測雙線性模型[J].水科學進展, 2001, 12(3): 361-365. Jin Juliang, Yang Xiaohua, Jin Baoming, et al. A Bilinear Time Series Model Based on Genetic Algorithm for Predicting Groundwater Level Regime[J]. Advances in Water Science, 2001, 12(3): 361-365.
[2] Savic D A, Walters G A, Davidson J W. A Genetic Programming Approach to Rainfall-Runoff Modeling[J]. Water Resour Manage, 1999, 13(3): 219-231.
[3] Chen S K, Mangimeli P, West D. The Comparative Ability of Self-Organizing Neural Networks to Define Cluster Structure[J]. Omega, 1995, 23(3): 271-279.
[4] 杜超,肖長來,呂軍,等.地下水水質實時預報系統開發及利用:以下遼河平原為例[J].吉林大學學報:地球科學版,2014,44(5): 1625-1632. Du Chao, Xiao Changlai, Lü Jun, et al. Development and Application of Real Time Groundwater Quality Prediction System: An Example in Lower Liaohe River Plain[J]. Journal of Jilin University: Earth Science Edition, 2014, 44(5): 1625-1632.
[5] Box G E P, Jenkins G M. Time Series Analysis, Forecasting and Control[M]. San Francisco: Holden-Day, 1976.
[6] Hipel K W, Mcleod A I. Time Series Modeling of Water Resources and Environmental Systems[M]. Amsterdam: Elsevier, 1994.
[7] Knotters M, Van Walsum V. Estimation Fluctuation Quantities from Time Series of Water Table Depths Using Models with a Stochastic Component[J]. Journal of Hydrology, 1997, 197(1/2/3/4): 25-46.
[8] Ahn H, Salas J D. Groundwater Head Sampling Based on Stochastic Analysis[J]. Water Resour Res, 1997, 33(12): 2769-2780.
[9] Kumar D, Ahmed S. Seasonal Behaviour of Spatial Variability of Groundwater Level in a Granitic Aquifer in Monsoon Climate[J]. Current Science, 2003, 84(25): 188-196.
[10] Gundogdu K S,Guney I.Spatial Analyses of Ground-water Levels Using Universal Kriging[J]. Journal of Earth System Science, 2007, 116(1): 49-55.
[11] Nag A K, Mitra A. Forecasting the Dailu Foreign Exchange Rates Using Genetically Optimized Neural Networks[J]. Journal of Forecasting, 2002, 21(7): 501-511.
[12] Zhang G, Patuwo B E, Hu M Y. Forecasting with Artificial Neural Networks: The State of the Art[J]. International Journal of Forecasting, 1998, 14(1): 35-60.
[13] Bulsari A, Saxen H. Nonlinear Time Series Analysis by Neural Networks: A Case Study[J]. Int J Neural Syst, 1993, 12(1): 1-10.
[14] Atiya A F. Prediction for Credit Risk Using Neural Networks: A Survey and New Results[J]. IEEE Trans Neural Netw, 2001, 12(4): 929-935.
[15] 孟艷,潘宏俠.PSO聚類和梯度算法結合的RBF神經網絡優化[J].自動化儀表,2011,32(2): 6-8. Meng Yan, Pan Hongxia. Optimization of RBF Neural Network Based on Combination of PSO Clustering and Gradient Algorithms[J]. Process Automation Insterumentation, 2011, 32(2):6-8.
[16] 朱明星,張德龍. RBF網絡基函數中心選取的算法研究[J]. 安徽大學學報:自然科學版,2000,24(1): 72-74. Zhu Mingxing, Zhang Delong. Study on the Algorithms of Selecting the Radial Basis Function Center[J]. Journal of Anhui University: National Science Edition, 2000, 24(1): 72-74.
[17] 方力智,張翠芳,易芳.基于改進差分進化算法的RBF神經網絡優化方法[J].成都大學學報:自然科學版,2009,28(3): 231-234. Fang Lizhi, Zhang Cuifang, Yi Fang. Optimization Approach Based on Modified Differential Evolution Algorithm for RBF Neural Network[J]. Journal of Chengdu University: Natural Science Edition, 2009, 28(3): 231-234.
[18] 張江濤,劉旭敏.一種基于代數算法的RBF神經網絡優化方法[J].計算機工程與應用, 2008, 44(5):96-98. Zhang Jiangtao, Liu Xumin. Optimization Approach Based on Algebraic Algorithm for RBF Neural Network[J]. Computer Engineering and App-lications, 2008, 44(5): 96-98.
[19] 馬洪偉,趙志剛,呂慧顯,等.基于蟻群聚類和裁剪方法的RBF神經網絡優化算法[J].青島大學學報:工程技術版,2008,23(3): 35-38. Ma Hongwei, Zhao Zhigang, Lü Huixian, et al. Optimization Algorithm of RBF Neural Networks Based on Ant Colony Clustering and Pruning Method[J]. Journal of Qingdao University: Engineering and Technology,2008, 23(3):35-38.
[20] 涂松,賁可榮,徐榮武,等.采用SOM和RBF優化下的水下航行器噪聲源識別[J]. 計算機工程與科學,2007, 29(10):112-114. Tu Song, Ben Kerong, Xu Rongwu, et al. Identification of the Acoustic Fault Sources of the Underwater Vehicles Based on the SOM and RBF Neural Network Optimization[J]. Computer Engineering & Science, 2007, 29(10):112-114.
[21] Chen Luhsienm,Chen Chingtien,Pan Yangu.Ground-water Level Prediction Using SOM-RBFN Multisite Model[J]. Journal of Hydrologic Engineering, 2010, 15(8):624-625.
[22] ASCE Task Committee on Application of Artificial Neural Networks in Hydrology. Artificial Neural Network in Hydrology[J]. Journal of Hydrologic Eng, 2000, 5(2): 142-137.
[23] Haykin S.Neural Networks:A Comprehensive Foun-dation[M]. London: Macmillan, 1994.
Application of Combining SOM and RBF Neural Network Model for Groundwater Levels Prediction
Liu Bo1,2, Xiao Changlai1,2, Liang Xiujuan1,2
1.CollegeofEnvironmentandResources,JilinUniversity,Changchun130021,China
2.KeyLaboratoryofGroundwaterResourcesandEnvironment,MinistryofEducation,
JilinUniversity,Changchun130021,China
As the hidden units of radial basis function network (RBF) were optimized by the theory of self-organizing map (SOM), the groundwater levels forecasting error range, due to its structural problems, could be reduced. With the two-dimensional feature map and clustering results of SOM, the number of hidden units, the position and the width of the radial basis centers can be easily determined. The SOM-RBFN model can be established. The accuracy of the model was verified by predicting groundwater level at Erdao Town in Fengman District of Jilin City based on observed groundwater level from 2000 to 2009.In addition, dynamic data of groundwater level for five years (2005-2009), seven years (2003-2009), ten years (2000-2009), are used as study samples and make forecast one by one, which can examine that if the sample size could influence the forecast result. The results prove that SOM-RBFN model can be used in groundwater levels dynamic forecasting, because the averages ofRMSEandCEare 0.43 and 0.52, respectively, which are the relatively good outcomes. And, the averages ofRMSEandCEof RBF7 are 0.38 and 0.68, whose results are better than RBF5 and RBF10. Therefore, it can be known that the amount of data cannot directly influence the accuracy of results.
groundwater level prediction; self-organizing map; radial basis function; neural networks
10.13278/j.cnki.jjuese.201501204.
2014-06-26
吉林省科技引導項目(20080543);高等學校博士學科點專項科研基金項目(200801830044);教育部國家潛在油氣資源項目(OSR-01-07)
劉博(1987——),男,博士研究生,主要從事地下水科學與工程研究,E-mail:liu-bo727@163.com
肖長來(1962——),男,教授,博士生導師,主要從事資源與水環境、地下水資源評價與開發利用研究,E-mail:xcl2822@126.com。
10.13278/j.cnki.jjuese.201501204
P641
A
劉博,肖長來,梁秀娟. SOM-RBF神經網絡模型在地下水位預測中的應用.吉林大學學報:地球科學版,2015,45(1):225-231.
Liu Bo, Xiao Changlai , Liang Xiujuan. Application of Combining SOM and RBF Neural Network Model for Groundwater Levels Prediction.Journal of Jilin University:Earth Science Edition,2015,45(1):225-231.doi:10.13278/j.cnki.jjuese.201501204.