趙丙秀,董 寧
(武漢軟件工程職業(yè)學院, 武漢 430205)
馬鈴薯是我國重要的糧食兼經濟作物之一[1-2],也是湖北地區(qū)重要的糧食作物之一,在我國糧食安全中占據(jù)重要地位[3]。目前,我國馬鈴薯單產與發(fā)達國家相比還存在一定的差距,供需矛盾較為突出[4]。馬鈴薯產量的預測對于發(fā)展我國馬鈴薯生產、穩(wěn)定市場經濟、調整農業(yè)結構及優(yōu)化馬鈴薯田間種植與管理措施具有重要的指導意義[5-6]。馬鈴薯產量呈現(xiàn)出強烈的空間變異性,與田間環(huán)境、大氣溫度、濕度、光照強度及降雨量等因素密切相關,其產量的高低影響著該地區(qū)的經濟發(fā)展[7-11]。
目前,作物產量預測方法主要包括遙感技術法、統(tǒng)計動力學法、氣象產量法、農學作物模型預測法、數(shù)理統(tǒng)計法及深度學習法等[12-19]。BP(Back propagation)神經網絡是目前應用場景最多、較為廣泛的人工神經網絡之一,國內學者通過相關環(huán)境參數(shù)及生物參數(shù)為輸入量,基于BP神經網絡實現(xiàn)了對小麥、馬鈴薯、西紅柿、菜花等糧食作物產量及其它行業(yè)輸出進行預測效果分析[20-21]。上述研究對于馬鈴薯產量的預測分析起到了重要的推動作用,但目前研究很少將氣象數(shù)據(jù)與農作物田間的環(huán)境數(shù)據(jù)相結合來微觀預測某一區(qū)域的糧食產量,且考慮影響因素過于單一,傳統(tǒng)BP神經網絡存在過擬合、容易陷入局部最優(yōu)解及收斂速度慢等問題。因此,利用遺傳算法、粒子群、鯨魚算法及蟻群算法等用于優(yōu)化初始權重和閾值,更有利于提高模型學習效率并進行全局優(yōu)化,改善原有網絡結構[22-23]。
本研究試驗數(shù)據(jù)采用湖北地區(qū)田間環(huán)境數(shù)據(jù)、氣象數(shù)據(jù)及馬鈴薯產量信息(數(shù)據(jù)來源:https://www.heywhale.com/home),數(shù)據(jù)覆蓋時間范圍為2009—2021年,基于鯨魚算法優(yōu)化建立WOA-BP神經網絡預測模型,并分析傳統(tǒng)的BP預測模型及GA-BP預測模型訓練前后的精度及預測誤差,對湖北地區(qū)馬鈴薯生產具有重要的指導意義。
本研究選取大氣溫度、大氣濕度、降雨量、土壤含水率及土壤溫度作為影響因子,以月最高土壤溫度(X1)、月最低土壤溫度(X2)、月土壤平均溫度(X3)、月土壤平均含水率(X4)、月大氣最高溫度(X5)、月大氣最低溫度(X6)、月大氣平均溫度(X7)、月降雨量(X8)及月大氣平均濕度(X9)這9個指標作為輸入,以馬鈴薯產量作為輸出構建網絡模型進行訓練和預測。以2009—2021年度5個試驗地點馬鈴薯產量為訓練樣本,以1個試驗地點2010—2021年數(shù)據(jù)作為驗證。分別采用BP模型、GA-BP模型及WOA-BP模型進行預測,并采用MatLab進行編程與模型建立。
1.2.1 BP神經網絡

(1)

隱藏層神經元和輸出層神經元的閾值分別為θ1和θ2,則有
(2)
所以,隱藏層神經元輸出為
(3)
輸出層神經元的輸出為
(4)
實際輸出和預期輸出之間的誤差為
(5)
1.2.2 WOA-BP神經網絡模型
鯨魚優(yōu)化算法工作流程主要分為以下3個步驟:
1)包圍捕食階段。WOA優(yōu)化算法首先將距離魚群最近的鯨魚最為局部最優(yōu)解,其余周圍的鯨魚個體會自己計算距離最優(yōu)解的距離,進而逐步向最優(yōu)解慢慢靠攏,逐漸包圍魚群,這個階段數(shù)學模型為
R=|C·X*(t)-X(t)|
(6)
X(t+1)=X*(t)-A·R
(7)
式中A、C—系數(shù)向量;
R—距離向量;
X*—局部最優(yōu)解;
X—位置向量。
A、C數(shù)學表達式為
A=2a·r-a
(8)
式中a—從2到0線性減小的向量;
r—隨機向量,r∈[0,1];
A—距離系數(shù),其變化受a影響。
2)在縮小魚群的活動范圍后,鯨魚會朝著魚群吐氣泡,形成“泡泡網”,將魚群包圍圈住后使其無法逃脫,進而實現(xiàn)在該區(qū)域尋求最優(yōu)解的目的。
3)根據(jù)式(8)對魚群進行收縮包圍后,當距離魚群的系數(shù)|A|<1時,鯨魚個體會朝著最優(yōu)解逐漸逼近;在|A|<1的前提下,|A|越大,鯨魚個體越能在較大的空間范圍內游走,使鯨魚算法更具有全局尋優(yōu)的能力;|A|越小,鯨魚個體可以在較小的空間內行走,仔細尋覓魚群,使得鯨魚算法更具有布局巡游的能力。由于采用氣流撿拾,本撿拾裝置的傷薯率遠低于機械式撿拾裝置傷薯率。
為了定量評估GA優(yōu)化的神經網絡預測模型的有效性和準確性,分別考慮MSE(均方誤差)、RMSE(均方誤差根)、MAE(平均偏差)和MAPE(平均誤差),則有
(9)
(10)
(11)
(12)
通過前期試驗,采用試湊法得到本次試驗設置BP神經網絡中相應參數(shù):收斂誤差為0.000 65,學習速度為0.05,最大訓練次數(shù)為50 000。當收斂誤差滿足最初設置值時,完成訓練。
根據(jù)所測數(shù)據(jù),構建基于BP神經網絡、GA-BP神經網絡、WOA-BP神經網絡共3種預測模型,各模型對馬鈴薯產量預測結果如圖1所示。

圖1 不同神經網絡模型預測的預測曲線Fig.1 Forecast curves predicted by different neural network models
由圖1(a)可以看出,BP預測模型預測誤差較大,經過算法優(yōu)化后,GA-BP預測模型和WOA-BP模型的預測值與實測值擬合程度較高(圖1b、c),但GA-BP預測值在馬鈴薯產量低于2400kg/hm2的范圍內模型預測誤差較大,且算法步驟復雜,運算繁瑣;WOA模型具有良好的收斂性、適應性和預測精度(圖1c),實測值與預測值曲線擬合更接近,說明WOA-BP預測模型具有更好的擬合效果和泛化能力,體現(xiàn)了優(yōu)化算法的相對優(yōu)越性。
為了驗證3種模型的預測性能,采用驗證數(shù)據(jù)的實測值與預測值的相關系數(shù)曲線如圖2所示。不同網絡模型的擬合程度依次為WOA-BP網絡模型>GA-BP網絡模型>BP神經網絡模型。WOA-BP網絡模型回歸擬合較好,相關系數(shù)R值增加到了0.9881,決定系數(shù)R2增加到了0.9764。

圖2 不同神經網絡模型預測值與實測值間的相關性分析Fig.2 Correlation analysis between predicted values and measured values of different neural network models
對3種預測模型的預測結果進行量化,并利用模型評價指標對模型進行對比分析,結果如表1所示。與傳統(tǒng)的BP預測模型、GA-BP預測模型相比,WOA-BP模型的RMSE分別降低了46.94%、29.77%,MAPE分別降低了58.88%、34.02%,MAE分別降低了27.27%、22.83%。

表1 模型預測性能分析Table 1 Model prediction performance analysis
不同模型的預測誤差分布如圖3所示。其中,水平軸代表實測值與預測值之間的誤差值,縱軸表示訓練集的預測樣本。以分布誤差為0的分界線,向兩端擴散增大,0軸表示真實值與預測值結果一致,越接近0,代表預測值與實測值的差值越小,模型的預測精度越高。由圖3可以看出:與BP、GA-BP模型相比,WOA-BP預測模型的誤差直方圖誤差接近0的個數(shù)更多且誤差更小。其中,在組合預測模型里,本文提出的WOA-BP模型在零區(qū)間分布的數(shù)量更多,誤差更小,其他組合模型在零區(qū)間分布數(shù)量較小,誤差較大。

圖3 不同神經網絡模型預測誤差分布圖Fig.3 Forecast error distribution of different neural network models
運用BP神經網絡對馬鈴薯產量預測效果較差,模型預測不穩(wěn)定,個別預測結果誤差較大,預測值與實測值的R2僅為0.8731。通過構建WOA優(yōu)化后的BP神經網絡模型,得出最優(yōu)權重組合,經過不斷迭代訓練,WOA-BP網絡模型的預測精度R2達到0.9764,MAPE僅為1.1068%,RMSE為28.1983。這一預測精度滿足馬鈴薯生產的實際需要,對于制定馬鈴薯生長期間的種植管理模式及農藝管理措施具有指導意義。