王權威,唐 莉
(太原理工大學水利科學與工程學院,山西太原030024)
基于ABC-BP的土壤侵蝕量預報模型研究
王權威,唐 莉
(太原理工大學水利科學與工程學院,山西太原030024)
以預測土壤沖刷量為目標,根據《中國河流泥沙公報》數據資料,建立了以土壤類型、地形、坡度、植被、降雨為輸入因子,土壤侵蝕量為輸出因子,拓撲結構為5-7-1的BP神經網絡預測模型。針對BP神經網絡模型缺陷,采用了人工蜂群算法(ABC)對BP神經網絡的權值和閾值進行優化,建立了ABC-BP模型,并對該模型的性能進行了驗證。結果表明,所建立的ABC-BP土壤侵蝕量預報模型模擬值與實測值的相關系數、平均相對誤差分別為0.994 2和4.13%,兩者之間無顯著的統計學差異,具有較好的一致性和較高的模擬精度。
水土流失;土壤侵蝕量;t檢驗;人工蜂群算法;BP神經網絡模型
土地是維系人類繁衍生息的基本資源,嚴重的水土流失問題會導致土壤養分流失[1]、溝壑面積增多和農田破壞嚴重[2]、河床淤積和河道抬高[3]等諸多問題,阻礙了經濟社會的可持續性發展。因此,開展水土流失機理、防治和預報等方面的研究工作有極其重要的現實意義。目前,諸多學者圍繞水土流失問題展開了大量的研究工作,取得了一定的研究成果。在水土流失機理方面,降雨是徑流產生的必要條件和水土流失的原動力[4],坡度和坡形對產流的影響極為顯著[5]。不同的植被類型和植被覆蓋度對坡面產流及水土流失的影響極為重要,主要表現在攔截降雨和入滲方面[6]。有學者指出,不同土壤類型的坡面產流特性存在明顯差異[7],如相同試驗條件下,褐土的坡面徑流量要高于棕壤土[8]。耕作措施對水土流失的影響也有相關報道。與橫廂耕作措施相比,縱廂耕作措施的水土流失問題更加嚴重[9];與常規耕作比較,深松覆蓋處理能有效減少徑流和土壤流失,少耕僅僅能減少土壤流失[10]。水土流失預測方面,目前采用的方法主要包括一些經驗模型和物理模型[11]。土壤侵蝕預測模型研究多集中于小流域尺度范圍[12-15],大尺度范圍的預測工作相對較少,并多以遙感和GIS技術為主[16-18]。
人工智能算法的預報方法將為大尺度范圍的土壤侵蝕預測工作提供重要的科學依據和全新的研究手段,但采用該方法進行大尺度范圍的土壤侵蝕預測工作相對較少。前人在使用神經網絡模型進行小尺度土壤侵蝕預測時,部分模型的輸入端常常忽略了一些重要因素,主要包括植被覆蓋程度、土質因素、降雨等。目前,這些模型所適用的范圍相對較小,對全國范圍內土壤沖刷量預測研究有待進一步深入。前人在構建此類模型時,一般均采用傳統的神經網絡算法,在使用過程中會存在搜索空間大、易陷入局部極值點等問題,限制了實際預測中的廣泛應用。因此,對該模型的優化改進是十分必要的。人工蜂群算法(ABC)作為一種模擬蜜蜂蜂群智能搜索行為的生物智能優化算法,由于其控制參數少、易于實現和計算簡潔,從而成為學術界研究的焦點[19]。目前,基于ABC優化后的BP神經網絡模型在水土流失方面的預測還未見報道。本文旨在構建基于ABC優化后的BP神經網絡模型(ABC-BP模型),以實現土壤侵蝕量的準確預報,為水土流失預測工作提供技術支持。
1968年,以Rumelhart和McCelland為首的科學家小組首次提出了BP神經網絡,它是目前模擬精度相對較高、應用范圍最廣的神經網絡模型之一,由輸入層、隱含層、輸出層3部分構成。圖1為BP神經網絡的工作原理和基本網絡結構。圖中,m、q和n分別為輸入層節點、隱含層節點和輸出層節點。誤差反向傳播算法的學習過程由信息的正向傳播和誤差的反向傳播2個過程組成。外界的輸入信息首先由輸入層接收,并傳遞給中間層神經元,然后經過中間層的信息處理后,最終傳輸給輸出層,并由輸出層向外界輸出信息。當輸出信息與期望不吻合時,便進入誤差反向傳播機制,各層間的權值矩陣和閾值矩陣進行不斷調整,如此反復直至達到期望要求為止。

圖1 BP神經網絡基本結構及工作原理
在ABC中,人工蜂群主要由采蜜蜂、觀察蜂和偵察蜂3個組成部分。在蜂群進化過程中,前2個負責執行開采過程,后者執行探索過程。ABC的實現步驟及具體過程如下:
(1)隨機產生SN(蜂群規模)個初始解,將其中一半與采蜜蜂對應,并計算各個解的適應度值,將最優解記錄下來。
(2)設置循環數Cycle=1。
(3)采蜜蜂進行鄰域搜索產生新解vij,計算其適應度,并對原蜜源位置xij和新解vij進行貪婪選擇,即
vij=xij+φij(xij-xkj)
(1)
式中,k為不同于i的蜜源;φij為[-1,1]之間的隨機數,控制著原蜜源位置xij鄰域內蜜源位置的產生。候選位置形象地代表著原蜜源位置xij與鄰域內隨機的一個蜜源xkj之間的對比關系。
(4)計算與xi相關的選擇概率Pi,即
(2)
式中,fiti為xi的適應度值,i=1,2,…,SN。
(5)觀察蜂根據輪盤賭選擇法,以概率Pi選擇食物源,并根據式(1)進行鄰域搜索產生新解,計算適應度,并對xij和vij進行貪婪選擇。
(6)判斷是否有要放棄的解,如果存在,則采用式(3)進行搜索產生1個新解替代舊解,即
(3)

(7)記錄迄今為止最好的解。
(8)Cycle=Cycle+1,若Cycle<最大循環次數MCN,則轉(3);否則,輸出最優結果。
本文選取的蜂群大小為200個,極限值limit需要大于每個解的維數D,可表示為
D=Nmin×Nhidden+Nhidden+Nhidden×Noutput+Noutput
(4)
式中,Nmin、Nhidden、Noutput分別是神經網絡的輸入層、隱含層、輸出層的神經元個數。初始解是隨機產生的(-1,1)之間的數,計算得到D值為50。
結合前人研究現狀,水土流失的關鍵影響因素可歸結為土壤類型、地形、坡度、植被和降雨等。因此,本研究將上述5項作為該模型的輸入項,土壤侵蝕量作為模型的輸出項。本研究的數據主要來源于《中國水土保持公報》,經過整理得到全國不同水土流失典型監測點的土壤侵蝕量資料,資料分別來自東北黑土區、北方山地丘陵區、西北黃土高原、南方紅壤區、西南紫色土區、西南巖溶區和青藏高原區。部分數據資料見表1。總樣本數為194個,以7∶3的比例將該樣本分為訓練集和預測集,即樣本數分別為136個和58個。

表1 基礎樣本資料
隱含層數目與模擬精度呈正比,但過多的隱含層也可能會造成模型過于復雜等問題,通常選擇單隱含層為宜。隱含層節點數可以根據相關的經驗方法進行確定。首先根據式(5)確定節點數大致范圍為4~12,通過多次試算從而確定最優節點數。為保證BP 神經網絡模型的非線性,從輸入層到隱含層的信息傳遞采用logistic函數,隱含層到輸出層信息傳遞采用purlin 函數,神經網絡的訓練采用trainlm 函數。訓練目標誤差為0.000 1,最大訓練次數為5 000次,即

(5)
式中,q為隱含層節點數;m為輸入層節點數;n為輸出層節點數;a為1~10之間的整數。
圖2為不同節點數條件下神經網絡模型精度。從圖2可以看出,當隱含層節點數增加時,神經網絡模型模擬值與實測值的平均相對誤差MAPE和均方根誤差RMSE均呈現先逐漸減小,然后逐漸增大的變化趨勢。在多次試算中,當隱含層節點數為7時,經過2 384次訓練后,模型的訓練誤差為0.000 1,能夠達到模型的訓練精度要求。因此,認為7為合理的節點數。綜上所述,本研究中模型的拓撲結構為5-7-1。

圖2 不同節點數條件下神經網絡模型精度
圖3為沖刷量實測值與預測值的相關關系。從圖3可以看出,BP模型和ABC-BP模型的預測值和實測值構成的線性擬合模型的擬合度分別達到0.994 0和0.997 1,方程的斜率分別為0.999 4和0.999 8,說明這2種模型的預測值與實測值之間均具有較強的線性相關性,并且預測值與實測值之間能夠保持較好的一致性。圖4為各個樣本的相對誤差。從圖4可知,BP模型和ABC-BP模型預測值與實測值間的最大相對誤差分別為7.56%和9.12%,最小分別為0.003%和0.439%,平均分別為3.42%和5.24%。可以看出,ABC-BP模型的訓練誤差明顯更小。此外,本文采用統計學方法對模型預測值與實測值之間的差異性進行了統計學分析,分析結果見表2。從表2可以看出,t值的絕對值小于t檢驗臨界值,即|t| 圖3 沖刷量實測值與預測值相關性 圖4 樣本相對誤差 方法自由度t檢驗臨界值顯著性結果ABC-BP135-0.2910.771BP135-0.2290.819 圖5為沖刷量實測值與預測值的相關關系。從圖5可以看出,BP模型和ABC-BP模型的預測值與實測值構成的線性擬合模型的擬合度分別達到0.988 8和0.994 2,方程的斜率分別為1.007 4和1.007 3,說明2種模型的預測值與實測值之間均具有較強的線性相關性,并且預測值與實測值之間能夠保持較好的一致性。圖6為各個樣本的相對誤差。從圖6可知,ABC-BP模型和BP模型實測值與預測值之間的最大相對誤差分別為7.37%和9.36%,最小分別為0.13%和3.33%,平均分別為4.13%和6.43%,ABC-BP模型具有更高的預測精度。表3為樣本的實測值與模擬值間的統計學差異性分析結果。經計算,實測值與預測值之間并無顯著的統計學差異。綜上所述,2種模型均可滿足模擬預報精度要求,相對而言,ABC-BP模型的預測效果更優。 圖5 沖刷量實測值與預測值相關性 圖6 樣本相對誤差 表3 實測值與預測值t配對檢驗結果 本文將人工蜂群算法(ABC)與BP 神經網絡相結合,建立土壤侵蝕量預報模型,把求解BP 神經網絡各層權值、閥值的過程轉化為蜜蜂尋找最佳蜜源的過程,以全國不同水土流失典型監測點的土壤侵蝕量資料作為研究樣本,構建了ABC-BP土壤侵蝕量預報模型。ABC-BP模型訓練組的平均相對誤差為3.42%,訓練效果均優于BP模型;預測組的平均相對誤差為4.13%,預測效果均優于BP模型。ABC-BP土壤侵蝕量預報模型可以實現全國水土流失典型監測點土壤沖刷量的準確預報。 中國的水土流失具有較為明顯的時空動態分布特征,將水土流失監測點的地域位置信息及隨時間的演變特征融入黑箱模型,以實現全國水土流失的時空動態演變還有待進一步深入研究。此外,多種預測模型的相互結合以及模擬算法的改進,也是進一步的研究方向。 [1] 趙心暢, 徐洪霞. 溧陽抽水蓄能電站水土流失防治措施的分析[J]. 水力發電, 2010, 36(7): 22- 24. [2] 高照良, 穆興民. 黃土水蝕風蝕交錯區土地利用/覆被時空變化研究——以陜西省神木縣六道溝流域為例[J]. 水土保持學報, 2004, 18(5): 146- 150. [3] 張洪江, 吳發啟, 胡春元, 等. 土壤侵蝕原理[M]. 北京: 中國林業出版社, 1999. [4] 金雁海, 柴建華, 朱智紅, 等. 內蒙古黃土丘陵區坡面徑流及其影響因素研究[J]. 水土保持研究, 2006, 13(5): 292-295, 298. [5] 吳星鑫, 陸寶宏, 趙超, 等. 降雨徑流預報方案的設計研究[J]. 水力發電, 2014, 40(7): 18-21, 56. [6] 喻定芳, 戴全厚, 王慶海, 等. 北京地區等高草籬防治坡耕地水土流失效果[J]. 農業工程學報, 2010, 26(12): 89- 96.[7] 徐永年, 蘇曉波, 王向東, 等. 綠化植生帶在不同坡面上的水土保持效果[J]. 水利水電技術, 2002, 33(7): 62- 64. [8] 王志偉, 艾釗, 張國慶, 等. 沂蒙山區坡面侵蝕過程[J]. 中國水土保持科學, 2013, 11(5): 42- 47. [9] 金軻, 蔡典雄, 呂軍杰, 等. 耕作對坡耕地水土流失和冬小麥產量的影響[J]. 水土保持學報, 2006, 20(4): 1- 5, 49. [10] 菊燕寧, 張壯志. 水電站建設中新增水土流失預測及防治措施研究[J]. 水利水電技術, 2015, 46(9): 128- 134. [11] RENARD K G, FOSTER G R, WEESIES G A, et al. RUSLE: Revised universal soil loss equation[J]. Journal of soil and Water Conservation, 1991, 46(1): 30- 33. [12] 洪華生, 楊遠, 黃金良. 基于GIS和USLE的下莊小流域土壤侵蝕量預測研究[J]. 廈門大學學報: 自然科學版, 2005, 44(5): 675- 679. [13] 蔡崇法, 丁樹文, 史志華, 等. 應用USLE模型與地理信息系統IDRISI預測小流域土壤侵蝕量的研究[J]. 水土保持學報, 2000, 14(2): 19- 24. [14] 段軍彪, 景旭, 上官周平. 基于遺傳算法的BP網絡在小流域侵蝕量預測中的應用[J]. 西北農業學報, 2008, 17(2): 317- 320. [15] 胡亞萍, 董貝貝, 姜宏立, 等. SVR與BP神經網絡對小流域次降雨侵蝕產沙預測結果的比較[J]. 北方環境, 2013, 29(1): 114- 117. [16] 楊勝天, 程紅光, 步青松, 等. 全國土壤侵蝕量估算及其在吸附態氮磷流失量匡算中的應用[J]. 環境科學學報, 2006, 26(3): 366- 374. [17] 祝贏, 章文波, 劉素紅, 等. 第一次全國水利普查侵蝕模數的批量計算方法——基于CSLE和GIS的土壤水蝕模數計算器設計與應用[J]. 水土保持通報, 2012, 32(5): 291- 295. [18] 趙曉麗, 張增祥, 劉斌, 等. 基于遙感和GIS的全國土壤侵蝕動態監測方法研究[J]. 水土保持通報, 2002, 22(4): 29- 32. [19] 秦全德, 程適, 李麗, 等. 人工蜂群算法研究綜述[J]. 智能系統學報, 2014, 9(2): 127- 135. StudyonSoilErosionPredictionModelBasedonArtificialBeeColonyAlgorithmandBPNeuralNetwork WANG Quanwei, TANG Li (School of Hydraulic Science and Engineering, Taiyuan University of Technology, Taiyuan 030024, Shanxi, China) Taking the prediction of soil erosion amount as a goal, a BP neural network model with a topological structure of 5-7-1 is established according to the data from the Bulletin of River Sediment in China. In the model, the soil type, topography, slope, vegetation and rainfall are taken as input data and the soil erosion amount is taken as output. In view of the shortages of BP neural network method, the weight value and threshold value of BP neural network are optimized by using Artificial Bee Colony algorithm, and then the simulation effect of ABC-BP model is analyzed. It shows that the correlation coefficient and average relative error between simulation value and measured value are 0.9942 and 4.13% respectively. The ABC-BP neural network model has perfect consistency and higher prediction precision. soil and water loss; soil erosion amount; t-test; Artificial Bee Colony algorithm; BP neural network model S157 A 0559- 9342(2017)09- 0001- 04 2017- 03- 02 國家自然科學基金資助項目(51509176) 王權威(1992—),男,山西呂梁人,碩士研究生,主要從事水文及水資源研究;唐莉(通訊作者). (責任編輯楊 健)


3.3 預測組模擬效果



4 結 語
