楊曉霞, 賈 嵩, 張承明, 程 清, 張 航
(1.山東農業大學信息科學與工程學院,山東泰安 271018; 2.山東省數字農業工程技術研究中心,山東泰安 271018;3.中國聯通有限公司泰安市分公司,山東泰安 271000)
土壤濕度是陸地和大氣能量交換過程中的重要因子,在農業中扮演著關鍵的角色[1]。作為植物生長必不可缺的養料[2],土壤濕度是主導農作物長勢及產量的最重要的因素之一,因此高質量的土壤濕度時序預測是指導農業生產的基本要求。
在時間序列數據預測方面,國內外學者做了大量的研究工作,提出了很多不同的預測方法。這些方法可以分為物理方法、統計學模型和人工智能方法等,不同方法各有其適用場合。物理學方法利用相關量進行時間序列預測,例如利用降水、徑流、溫度等物理量預測土壤濕度,李雨鴻等利用土壤濕度與氣象因子、環流因子相關關系,甄選土壤相對濕度主要影響因子,建立回歸方程預測土壤濕度,模型預測精度達到80%[3];孫倩倩等基于東北地區近30年土壤濕度觀測資料,采用CAST聚類方法進行土壤濕度區劃,對各區域土壤濕度的時空變化特征展開分析,通過篩選對土壤濕度影響顯著的關鍵因子,并利用他們建立多元線性回饋方程建立土壤濕度分區預報模型,該模型的預測誤差低于13%[4]。這種物理學方法的預測依賴于與土壤濕度相關的數據,這些數據往往種類很多,并且有些數據難以獲取。Ren等提出物理學模型的輸出結果往往可以作為統計學模型的輔助輸入數據[5]。統計學方面在描述歷史數據之間的關聯時,AR、ARMA、ARIAM、SARIMA等模型都被用于時間序列預測[6-12]。這些基于統計學的時間序列預測方法往往假設時間序列數據之間存在線性相關的關系。但是土壤濕度時間序列數據具有非線性的特點,利用統計學模型難以得到較高的預測精度[13-15]。
為了克服這一問題,人工智能的方法越來越多地被使用到時間序列預測當中[16-20],Ho等將神經網絡模型與ARIMA模型同時用于時間序列模型預測,結果顯示在時間序列分布隨機和非線性情況下,神經網路模型比ARIMA模型擁有更好的預測精度[19]。Li等利用feed-forward ANN模型進行時間序列預測,并與ARIMA預測結果進行比較,結果顯示ANN預測結果精確度更高[20]。
作為人工神經網絡的典型,由于BP神經網絡具有良好的非線性映射能力而被廣泛地應用于時間序列預測中[21-26]。Yang等[21]和Wang等[22]利用BP神經網絡對時間序列數據進行預測,并且都得到了理想的預測結果。BP模型的預測精度及訓練時間往往依賴于其初始權值和閾值的選定,而在標準BP算法中初始權值和閾值是隨機設置的。為了克服BP算法的這一缺點,一些啟發式的算法例如遺傳算法(GA)、粒子群算法和蟻群算法等往往用于進行BP初始權值和閾值的優化。Zhang等使用GA優化BP神經網絡的初始權值和閾值,然后利用BP網絡預測激光焊接時的焊接外觀,試驗結果表明經過GA優化之后的BP網絡的預測精度比標準BP網絡提高10%[23]。Zhen等首先使用PSO優化BP神經網絡的初始權值和閾值,然后利用優化后的BP神經網絡進行高速銑削力建模,與標準BP相比,經過PSO優化后的BP的訓練時間減少,并且預測精度增加[24]。
本研究將提出一種將BP神經網絡和PSO相結合的新型土壤濕度預測方法,針對BP和PSO的局限性,提出2種算法的改進方法并用于預測。以“渤海糧倉”山東試驗區東營市墾利縣20個觀測站點2013—2014年的土壤濕度時序數據為對象進行了試驗,并在同組數據上分別使用不同預測方法進行對比試驗,驗證文章所提出方法的有效性。
2013年我國啟動“渤海糧倉”農業科技工程,計劃通過對環渤海地區266.7萬hm2中低產田和66.7萬hm2鹽堿荒地的改造,實現到2017年增糧30億kg,到2020年增糧50億kg的目標,將長期遭受旱澇堿災害的環渤海地區建成我國重要的“糧倉”,圖1為渤海糧倉山東項目區示意圖,其中黑色框內是本研究區。本研究選擇“渤海糧倉”山東項目區的東營市墾利縣作為試驗區,該試驗區位于山東省東北部黃河三角洲的黃河最下游入海口處。其位置為37°24′~38°10′N,118°15′~119°19′E。試驗區地處溫帶季風氣候區,冬季干冷,夏季濕熱,四季分明,平均降水為547.2 mm/年,其中夏季占67.8%,冬季僅占3.6%。該地區有潮土和鹽漬土2大土壤類型,質地偏輕、養分貧乏、鹽堿較重,是我國重要的鹽堿荒地改造區。

時間序列數據由試驗區布設的監測點產生,試驗區內共布設了10個監測點,圖2是試驗區及監測點布設情況,10個監測點的土壤類型均為鹽漬土。每個監測點的觀測頻率為 1 h/次。文章選取監測點2013年1月1日至2014年12月31日的數據,共計175 200條數據記錄。

由于傳感器故障或者傳輸原因,在某些監測點的數據中存在有一小部分缺失數據,其值為0(數據缺省值),這些數據會影響預測精度。針對這些缺失數據,利用歐氏距離選擇同一個監測點上最接近的前后6組數據進行加權平均。
Dk=ωk+3Dk+3+ωk+2Dk+2+ωk+1Dk+1+ωk-1Dk-1+ωk-2Dk-2+ωk-3Dk-3。
(1)
式中:Dk為缺失數據,Dk+i表示時間上滯后Dk的數據,Dk-i表示時間上超前Dk的數據,ωk-3為相應權值,在本研究的處理過程中取所有ω相等(1/6)。
得到10組時間序列數據,利用統計學方法對10個監測點數據做分布特性分析,圖3為監測點1、3、8、9的觀測數據分布情況。從圖3可以看出4個監測點數據的分布大致相同,進一步將10個觀測點同一時刻數據取算數平均,得到 17 520 條時間序列數據,將這些數據作為試驗數據進行預測方法的研究。

圖4為預測流程,首先確定BP神經網絡結構,然后利用PSO進行初始權值和閾值的優化,最終訓練網絡并得到最終預測結果。

2.1.1 網絡層次 根據Kolrnogorov’s定理,一個3層BP神經網絡能夠實現對任意非線性函數進行逼近,所以本研究選取3層BP神經網絡進行土壤濕度預測研究,也就是網絡中包含1個隱含層。
2.1.2 輸入層、輸出層和隱含層結點的確定 這里將網絡輸出層結點數量確定為1個。Liu等提出ARIMA模型的參數估計過程中利用自相關函數ACF、偏自相關函數PACF等,可以用于神經網絡輸入層節點數量的確定[11]。依據該方法首先分析各子序列的ACF和PACF,并得到輸入層節點數目。隱含層節點的選取,依據Hecht-Nelson’s方法:如果輸入層節點數目為n,則隱含層節點數目為2n+1。這樣最終確定輸入層節點數目為7個,輸出層節點數目為1,隱含層節點數據為15。
圖5為PSO優化BP的流程,初始化PSO算法參數,更新速度和位置2個變量,利用適應度值確定個體最優和全局最優,然后迭代計算,直到滿足精度要求。

在標準粒子群算法中采用公式(2)和(3)進行粒子速度和位置的更新。
vid(t+1)=ωvid(t)+c1r1[pid-zid(t)]+c2r2[pgd-zid(t)];
(2)
zid(t+1)=zid(t)+vid(t+1)。
(3)
式中:vid(t+1)和zid(t+1)分別為粒子i第(t+1)次迭代之后的速度和位置,pid和pgd分別為迭代到目前為止粒子i的個體最優解和種群最優解。c1和c2為加速常數,r1和r2為隨機數。ω表示慣性權重,在標準粒子群算法中取線性遞減的慣性權重[公式(4)],其中ωmax和ωmin分別表示慣性初值和慣性終值,iter表示當前迭代次數,itermax表示最大迭代次數。
(4)
在標準粒子群算法中,由于ω取線性遞減,且c1和c2取值為常數,這些不滿足學習過程特點,導致在迭代過程中(尤其是迭代后期)收斂速度慢且易陷入局部最優解[27-28]。
在粒子群算法中ω決定了算法的搜索能力,c1和c2分別決定了自我學習和種群學習能力。適應度值是評價算法解的“好壞”的標準,適應度值較大的粒子質量較差,反之粒子的質量較好。按照粒子群算法的特點,在迭代初期應當有較強的搜索能力、較大的自我學習能力和較小的種群學習能力。而在迭代后期則相反。同時當粒子質量較差的時候,應當具有較強的搜能力和種群學習能力,此時的自我學習能力應當適當減弱,在粒子質量較好的情況下,則需要增強粒子的自我學習能力,減弱搜索能力和種群學習能力。
本研究提出一種將適應度值與迭代次數相結合優化ω、c1和c2的方法[公式(5)],根據粒子的適應度值求出所有粒子的適應度平均值fA。根據該值將粒子分為f>fA和f (5) 標準BP算法采用梯度下降依次修正各層權值。即 ωij(t+1)=ωij(t)+Δωij(t); (6) ωij(t+1)=φij(t)+Δφij(t)。 (7) 在上述公式中可以看出,η一旦設定之后在整個學習過程中不會發生變化,如果η設置過大會導致網絡錯過最優解,而η設置過小則網絡迭代速度慢且易陷入局部最優。并且在學習過程中,如果誤差曲面存在極值點,Δωij或者Δφij為0,ωij(t+1)=ωij(t)或者φij(t+1)=φij(t),此時網絡容易陷入局部最優值而停止學習。基于這些問題,首先利用動量因子將公式(6)和(7)修改如下: ωij(t+1)=ωij(t)+(1-α)Δωij(t)+αΔωij(t-1); (8) φij(t+1)=φij(t)+(1-α)Δφij(t)+αΔφij(t-1)。 (9) 從式(8)和(9)中可以得到,當α=0時,權值的變化完全與標準BP算法中權值修改一致;當α=1時,新的權值變化等于前一次權值的變化。通過α的調整,可以減少網絡訓練時的震蕩現象,避免網絡陷入局部最優。同時在學習過程中自適應的調整學習率,當新的調節誤差比設定的最大調節誤差大時,將η降低,即將上一步η乘以一個小于1的系數,并將α置0;當新的調節誤差比上一步調節誤差小時,用η乘以一個大于1的值增加其大小。這樣在確保迭代速度的同時,有效避免網絡陷于局部最小值。 為驗證研究提出方法的有效性,筆者進行了另外4種方法的對比試驗,5種方法分別為BP、PSO-BP、IPSO-BP、PSO-IBP、IPSO-IBP。其中BP是利用神經網絡直接對時間序列進行預測;PSO-BP利用PSO優化BP網絡初始權值和閾值,再用BP進行時間序列數據的預測;PSO-IBP利用PSO優化BP網絡初始權值和閾值,再用改進的BP進行時間序列數據的預測;IPSO-BP首先對PSO進行優化,然后利用優化后的PSO優化BP網絡初始權值和閾值,最后用BP進行時間序列數據的預測;IPSO-IBP首先對PSO進行優化,然后利用優化后的PSO優化BP網絡初始權值和閾值,最后用改進的BP進行時間序列數據的預測。表1為5種方法描述對比結果。在5種不同的方法中,BP網絡結構完全相同,并且采用相同的針對于PSO和BP的改進方法。 表1 5種方法描述對比 圖6為5種方法預測結果對比,橫軸為迭代次數,縱軸為預測結果的均方誤差(mean squared error,MSE)(由于數據較小,MSE經過自然對數轉換)。5種方法中標準BP的MSE最高為3.57×10-5,在迭代30次時MSE迅速降低,然后在55次迭代、80次迭代和110次迭代時MSE分別降低,最終在110次迭代時降低至最低值。PSO-BP方法在迭代60次左右MSE達到穩定,在80次迭代時經過小幅度降低至最低值 3.16×10-6,經過PSO優化之后的預測結果明顯好于標準BP網絡的結果。PSO-IBP和IPSO-BP方法最低MSE與PSO-BP方法較為接近,但是從圖中可以看到,PSO-BP方法在60次迭代后MSE達到基本穩定,而PSO-IBP和IPSO-BP方法都在20次迭代時迅速達到MSE的最低值,說明后2種方法有更快的收斂速度。IPSO-IBP方法在10次迭代時迅速降低至MSE最低值1.01×10-9,然后一直保持穩定,可以看出IPSO-IBP方法具有更小的預測誤差。 由圖7可以看出,BP方法在120次迭代之后運算結束,PSO-BP方法迭代次數為82次,PSO-IBP方法迭代次數28次,IPSO-BP方法迭代24次,IPSO-IBP方法迭代14次。本研究所提出的方法能有效減少迭代時間,提高運行效率。 本研究提出了一種將離散小波變換、PSO和BP相結合的土壤濕度時間序列預測方法,針對土壤濕度時間序列的非平穩性,首先利用離散小波變換將其分解為若干個相對平穩的自序列,再用改進后的神經網絡對各子序列分別進行預測,最后重構得到預測結果。針對BP神經網絡收斂速度慢、易陷入局部最優的問題,提出利用PSO算法優化BP網絡的初始權值和閾值,同時提出了針對PSO收斂速度慢和易陷入局部最優等問題的改進方法。試驗結果表明,此方法能有效減少迭代次數,提高預測精度。 參考文獻: [1]Qiu J X,Gao Q,Wang S,et al.Comparison of temporal trends from multiple soil moisture data sets and precipitation:the implication of irrigation on regional soil moisture trend[J]. International Journal of Applied Earth Observation and Geoinformation,2016,48(4):17-27. [2]Nunzio R. Soil moisture at local scale:measurements and simulations[J]. Journal of Hydrology,2014,516(6):6-20. [3]李雨鴻,李倩倩,李 輯,等. 東北地區春播期土壤水分預測方法研究[J]. 干旱地區農業研究,2013,33(6):178-183. [4]孫倩倩,劉晶淼,梁 宏,等. 東北地區土壤濕度的區域性預報模型研究[J]. 自然資源學報,2014,29(6):1065-1075. [5]Ren C,An N,Wang J,et al. Optimal parameters selection for BP neural network based on particle swarm optimization:a case study of wind speed forecasting[J]. Knowledge-Based System,2014,56(3):226-239. [6]Tascikaraoglu A,Uzunoglu M. A review of combined approaches for prediction of short-term wind speed and power optimal parameters selection for BP neural network based on particle swarm optimization:a case study of wind speed forecasting[J]. Renew and Sustain Energy Reviews,2014,34(6):243-254. [7]Huang Z,Chalabi Z S. Use of time-series analysis to model and forecast wind speed[J]. Journal of Wind Engineering & Industrial Aerodynamics,1995,56(2/3):311-322. [8]Erdem E,Shi J. ARMA based approaches for forecasting the tuple of wind speed and direction[J]. Applied Energy,2011,88(4):1405-1414. [9]Su Z,Wang J,Lu H,et al. A new hybrid model optimized by an intelligent optimization algorithm for wind speed forecasting[J]. Energy Conversion and Management,2014,85(9):443-452. [10]Lydia M,Suresh Kumar S,Immanuel Selvakumar A,et al. Linear and non-linear autoregressive models for short-term wind speed forecasting[J]. Energy Conversion and Management,2016,112(6):115-124. [11]Liu H,Tian H Q,Li Y F. Comparison of two new ARIMA-ANN and ARIMA-Kalman hybrid methods for wind speed prediction[J]. Applied Energy,2012,98(1):415-424. [12]Liu H,Chen C,Tian H Q,et al. A hybrid model for wind speed prediction using empirical mode decomposition and artificial neural networks[J]. Renewable Energy,2012,48(6):545-556. [13]師洪濤,楊靜玲,丁茂生,等. 基于小波-BP神經網絡的短期風電功率預測方法[J]. 電力系統自動化,2011,35(16):44-48. [14]劉 莉,葉 文. 基于BP神經網絡時間序列預測模型的降水量預測[J]. 水資源與水工程學報,2010,21(5):156-159 [15]Meng A B,Ge J F,Yin H et al.Wind speed forecasting based on wavelet packet decomposition and artificial neural networks trained by crisscross optimization algorithm[J]. Energy Conversion and Management,2016,114(6):75-88. [16]Haque A U,andal P M,Meng J,et al.Wind speed forecast model for wind farm based on a hybrid machine learning algorithm[J]. International Journal of Sustainable Energy,2015,34(1):38-51. [17]Hassen B. Multiple architecture system for wind speed prediction[J]. Applied Energy,2011,88(7):2463-2471. [18]Erasmo C.Wind speed forecasting in three different regions of Mexico,using a hybrid ARIMA-ANN model[J]. Renewable Energy,2010,35(12):2732-2738 [19]HO S L,Xie M,Goh T N,et al. A comparative study of neural network and Box-Jenkins ARIMA modeling in time series prediction[J]. Compute & Industrial Engineering,2002,42(2/3/4):371-375. [20]Li G Q,Xu S W,Li Z M. Short-term price forecasting for agro-products using artificial neural networks[J]. Agriculture and Agricultural Science Procedia,2010,1(156):278-287. [21]Yang H X,Zhao C,Du X J,et al. Risk prediction of city distribution engineering based on BP[J]. Systems Engineering Procedia,2012,5(3):55-60. [22]Wang Z,Wang F,Su S. Solar irradiance short-term prediction model based on BP neural network[J]. Energy Procedia,2011,12(39):488-494. [23]Zhang Y X,Gao X D,Katayama S. Weld appearance prediction with BP neural network improved by genetic algorithm during disk laser welding[J]. Journal of Manufacturing Systems,2015,34(11):53-59. [24]Zhen J X. Application of PSO-trained artificial neural network in high speed milling force modeling[J]. Comput Integrated Manufacturing Systems,2008,14(9):1709-1716. [25]胡壽松,張正道. 基于神經網絡的非線性時間序列故障預報[J]. 自動化學報,2007,33(7):744-748. [26]楊 娜. 利用BP神經網絡由特征氣象要素預測土壤濕度[J]. 土壤通報,2011,42(6):1324-1329. [27]Chang Q L,Zhou H Q,Hou C J. Using particle swarm optimization algorithm in an artificial neural network to forecast the strength of paste filling material[J]. Internation Journal of Mining Scicence and Technology,2008,18(4):551-555. [28]Liang G M,Zheng X. An improved BP Neural Network based on IPSO and its application[J]. Journal Computes,2013,8(5):1267-1272.2.3 利用BP網絡進行時間序列預測

3 試驗結果及討論



4 結論