王輝 付虹雨 岳云開 崔國賢 佘瑋



摘要:苧麻產量與生長期間的氣候因子具有極高相關性,基于氣候變量構建的苧麻產量預測模型能夠有效精準預測最終產量。BP(back propagation)神經網絡具有強大的數據分析能力,在作物產量預測建模中得到廣泛應用,然而傳統BP 神經網絡存在精度低、魯棒性差等問題,可采用麻雀搜索算法(sparrow searchalgorithm,SSA)對BP神經網絡模型進行優化。基于2010—2019年苧麻長期定位試驗采集的纖維產量、鮮皮產量和氣候數據,分析氣候因子在10年內的變化趨勢及其對多年生苧麻產量的影響,對比構建的BP神經網絡模型及優化后的SSA-BP神經網絡模型預測苧麻產量的性能,確定最佳的苧麻產量預測模型。結果表明,苧麻產量與季平均氣溫、季極端最高氣溫均值、季極端最低氣溫均值、季日照時數均值4項氣候因子具有極顯著相關關系。SSA算法能有效優化BP神經網絡,基于SSA-BP的苧麻纖維產量預測模型和鮮皮產量預測模型的R2分別為0.591 3和0.679 1,高于BP神經網絡的苧麻纖維產量預測模型(R2=0.405 7)和鮮皮產量預測模型(R2=0.551 8)。因此,SSA-BP模型能夠更加科學、合理地預測苧麻產量,對于苧麻生產的田間管理及統籌規劃具有重要指導意義。
關鍵詞:產量預測;氣候因子;麻雀搜索算法;BP神經網絡
doi:10.13304/j.nykjdb.2023.0557
中圖分類號:S126;S563 文獻標志碼:A 文章編號:10080864(2024)01011009
苧麻(Boehmeria nivea L.)是具有中國特色的纖維作物和水土保持作物[1],其產量預測對于生產過程精細管理、纖維棉紡市場風險管理具有重要意義[2]。然而,由于影響苧麻產量的因素復雜,其產量預測極具挑戰性[34]。
作物產量具有強烈的空間變異性,與田間環境、大氣溫度、濕度、光照強度、降雨量等因素密切相關[5-7]。以往研究表明,苧麻對不同地區環境的適應性差異明顯,而氣候因素,尤其是降水量、日照時間、相對濕度3個氣候要素,是導致苧麻產量在不同生態區域存在差異的重要原因[8]。除了空間變異外,氣候因素的時間變異也同樣重要[9],但對其在產量預測研究中的關注有限。在當前全球極端天氣事件高頻發生的情況下,了解氣候因素的多變性對農業生產的影響顯得尤為重要,因此有必要探究苧麻產量隨氣候變化的規律,以及時預測產量信息并調整生產管理。
經驗模型是當前作物產量估測常用的方法,該方法通過建立變量因子與產量之間的經驗模型來監測不同情景下的作物生長[10]。徐敏等[11]結合溫度、日照、降水適宜度等氣象因子,采用最優相關和逐步回歸等方法構建了水稻年景綜合指數的預測模型,為水稻產量分析預測提供依據。劉振洋等[12]使用關聯規則算法確定了云南省甘蔗產量的5個主要影響因子,基于此構建了各大主產區的多元線性回歸產量預測模型,準確率較單一回歸模型分別提升了14.3%、3.5%、30.1%、8.7%、17.7%。在利用經驗模型進行作物產量預測研究時,可選擇線性回歸方法(線性回歸、多元線性回歸等)或非線性回歸方法(隨機森林、支持向量機、神經網絡等)[13-18]構建模型。相比于線性回歸模型,基于機器學習技術的非線性回歸模型在解決復雜的非線性問題上具有獨特優勢,為包含不同氣候因素、基因型信息的數據建模提供了解決方案。BP(back propagation)神經網絡具有強大的數據分析能力,廣泛用于作物產量預測建模。但是它也需要先進的訓練技術來優化以提高其模型學習的效率和精度。麻雀搜索算法(sparrow searchalgorithm,SSA)是受麻雀覓食和反捕食行為啟發而提出的一種新的優化算法,具有較強的全局尋優能力,為進一步優化估產模型初始權重和閾值提供了新的解決方案[1920]。為探究不同時間氣候因素的變異對苧麻產量的影響,分析導致產量差異的關鍵氣候要素,本文基于2010—2019年連續采集的苧麻產量數據及對應年份氣象因子,構建了SSA-BP苧麻產量預測模型。該模型能較為精確地預測苧麻產量模型,為苧麻生產管理措施調整及決策提供技術支撐。
1 材料與方法
1.1 試驗設計
試驗于2010—2019年在湖南農業大學國家麻類長期定位試驗基地進行(113° 04'E,28°10'N)。試驗品種包括中苧1號、多倍體1號、湘苧3號3個苧麻品種,材料由湖南農業大學苧麻研究所提供。2009年6月7日,將育好的麻苗(幼苗生長約20~30 cm)移栽到長期定位試驗小區,每個品種4個重復,小區面積約20 m2。
1.2 數據采集
1.2.1 產量數據采集 于苧麻成熟期收割每個小區地上部分,然后將苧麻鮮皮從苧麻莖稈上剝離后,采用電子秤(TCS- 永彩防水秤,承重150 kg,精度0.01 kg)稱重獲取其鮮皮產量。采用剝麻機獲取苧麻纖維,干燥后稱其重量記為纖維產量。
1.2.2 氣候數據獲取 選取長沙市區季平均氣溫、季極端最高氣溫均值、季極端最低氣溫均值、季降水量均值、季日照時數均值、季相對濕度均值6項氣候指標作為氣象因子,數據來源于2010—2019年《中國氣象年鑒》。
1.3 數據處理方法
1.3.1 BP神經網絡 基于BP的苧麻產量預測模型拓撲結構如圖1所示。將6項影響苧麻產量的氣象因子(季平均氣溫、季極端最高氣溫均值、季極端最低氣溫均值、季降水量均值、季日照時數均值、季相對濕度均值)和實測產量數據作為輸入層,確定輸入層、隱含層和輸出層各層的節點數并采用誤差反向傳播對網絡中每個權重系數進行更新,最終輸出預測苧麻產量。
1.3.2 SSA搜索算法 在麻雀搜索算法中,發現者的位置更新如下。
式中,xbest (t)為全局中最佳位置;β 和K 均起到控制參數步長的作用,前者為標準正態分布的隨機數,后者為?1到1之間的隨機數,代表麻雀的移動方向;ε 為常數項,其作用是確保分母不為0;fi為第i 只麻雀適應度值;fg和fw分別為當前全局適應度的最佳值和最差值。
1.3.3 基于SSA-BP 的苧麻產量預測模型構建 基于麻雀搜索算法改進的SSA-BP苧麻產量預測模型具體構建步驟如下。
①利用獲取的90份樣本數據,按2:1的比例劃分為訓練集和預測集,對訓練集全體數據以及測試集的輸入指標數據進行歸一化處理。
②對BP神經網絡模型的結構參數進行確認,例如隱含層的層數及節點個數、層與層之間的傳遞函數等。本研究采用的BP神經網絡包含2個隱含層和1個輸出層,共3層人工神經網絡結構。其他參數設置如下:傳遞函數為tansig,包含神經元15個;輸出層傳遞函數為purelin,包含神經元1個。模型學習率0.01,學習函數trainscg,最大訓練次數為10 000次,神經模型的訓練收斂于3.12×10?4。
③輸出BP神經網絡的預報結果,并在反歸一化后依據評估指標進行后續評估。
④設置SSA中麻雀種群的相關參數。確定麻雀種群規模為100只,麻雀之間信息交換100次,發現者占總麻雀規模的比例為0.20,同時設置預警值和警戒者數量。
⑤確定每只麻雀的初始位置。
⑥依據公式(1)~(3),對每只麻雀的位置分別進行更新。
⑦輸出最優的麻雀個體位置和全局最優解,分別作為BP神經網絡各層之間的權值和閥值;完成BP神經網絡各參數的優化。
⑧使用優化后的 BP 神經網絡進行訓練,并比較各項評估指標。根據誤差指標的符合度來確定是否結束計算,若符合則停止計算并輸出結果,若不符合則返回到步驟④重新執行直至符合要求。
算法具體流程見圖2。
1.3.4 模型性能驗證 為定量評估SSA 優化后BP 神經網絡預測模型的準確性,采用決定系數(R2)、均方根誤差(root mean square error, RMSE)、均方誤差(mean square error, MSE)、平均絕對誤差(mean average error, MAE)和平均誤差(meanabsolute percentage error, MAPE)加以評價作為評價指標。通常R2越接近于1,RMSE越小,說明模型預測能力越好[18]。
式中,yi 為苧麻產量參數實測值,?i 為苧麻產量參數預測值。? 為苧麻產量參數平均值,n為樣本個數。
2 結果與分析
2.1 苧麻產量描述
圖3和表1展示了苧麻纖維、鮮皮產量的統計結果。苧麻纖維產量集中分布在500~1 100 kg·hm?2,最小值為493 kg·hm?2,最大值為1 228 kg·hm?2,變異系數為3.32%,整體分布符合正態分布。鮮皮產量也是衡量苧麻纖維產量的重要參數之一,集中分布在5 000~9 000 kg·hm?2,最小值為2 570 kg·hm?2,最大值為10 520 kg·hm?2,變異系數為2.98%。綜上,2種苧麻產量均具有較大變異幅度,數據具備建模所需的差異要求。
2.2 變量相關性分析
為分析氣候因子與苧麻纖維、鮮皮產量之間的相關性,將相關變量分別歸一化到[?1,1]之間,以消除變量大小差異帶來的誤差。圖4與表2分析了各季苧麻產量及最佳氣候因子的變化趨勢和相關系數,可以看出,頭麻產量性狀與季平均氣溫的變化趨勢一致性最高,與纖維產量的相關系數為?0.27,與鮮皮產量的相關系數為0.45。二麻產量因素與季極端最低氣溫的變化趨勢一致性最強,與纖維產量的相關系數為?0.33,與鮮皮產量的相關系數為?0.37。三麻產量參數與季日照時數相關性最高,纖維產量與季日照時數的相關性系數為0.32,鮮皮產量與季日照時數的相關性系數為0.54。
結合連續10年數據,分析6項氣候因子與苧麻纖維、鮮皮產量的相關性(表3)。除季降水量均值和季相對濕度均值2項指標外,其他氣候因子與苧麻纖維、鮮皮產量均呈極顯著相關,相關系數絕對值均高于0.42,說明利用氣候因子預測苧麻產量具有可行性。
2.3 苧麻纖維產量估測
將苧麻纖維產量分別采用BP網絡和SSA-BP組合模型進行預測,并對得到的結果進行擬合分析。由圖5可知,BP網絡模型的R2僅為0.405 7,擬合程度差,而采用SSA優化后的SSA-BP網絡模型的擬合程度明顯優于BP神經網路,模型R2達到0.591 3。
由表4 可知,采用SSA 優化后,模型MSE 由1.93降低到1.33,RMSE由1.39降低到1.15,MAE由1.06 降低到0.89,MAPE 由12.61% 降低到10.73%,表明SSA算法優化后的SSA-BP神經網絡模型對于苧麻纖維產量的估測能力優于BP神經網絡模型。
2.4 苧麻鮮皮產量估測
將苧麻鮮皮產量分別采用BP 網絡和SSABP組合模型進行預測,并對得到的結果進行擬合分析(圖6),SSA-BP網絡模型與期望值的擬合程度優于BP神經網絡,回歸擬合性較好,SSA-BP神經網絡模型決定系數R2 從0.551 8 增加到0.679 1。
由表5 可知,采用SSA 優化后,模型MSE 由1.32降低到0.94,RMSE 由1.15降低到0.97,MAE由0.83 降低到0.77,MAPE 由12.10% 降低到11.43%,表明SSA算法優化后的SSA-BP神經網絡模型對于苧麻鮮皮產量的估測能力優于BP神經網絡模型。
3 討論
苧麻是喜溫、短日照和充足水分的作物,苧麻產量與田間環境的氣溫、降水量、光照強度、濕度等因素密切相關。本研究采用相關性分析及趨勢分析方法探究氣候因素時間變異對苧麻產量的影響,結果表明,苧麻產量參數(苧麻纖維、鮮皮產量)與氣候因子之間存在較高的相關性,季平均氣溫、季極端最高氣溫均值、季極端最低氣溫均值、季日照時數均值4項因子與苧麻纖維、鮮皮產量的相關系數絕對值均高于0.42。劉頭明等[8]研究發現,苧麻的產量與其生長期間降水量、日照時間和相對濕度均呈顯著相關性,其中日照與降水量呈正相關關系,而相對濕度則呈負相關關系,這與本研究結果存在差異,導致的原因可能與苧麻對不同的生態區域適應能力不同有關[21];袁晉琰等[22]研究也表明苧麻生長期間的溫度和降雨量是影響產量的重要因素。
BP神經網絡是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,由輸入層、隱含層和輸出層組成,含多層神經元。當前,BP方法在產量預測應用上取得了極大進展,但是它仍然需要先進的優化技術來提高其學習的效率和精度。本研究采用BP神經網絡構建的苧麻纖維產量、鮮皮產量預測模型效果均較差,預測精度R2 分別為0.405 7和0.551 8,為此,引入麻雀搜索算法對BP神經網絡閾值與權值進行優化,結果表明,SSA的引入有效地提高了苧麻估產模型精度,基于SSA-BP網絡的苧麻纖維產量估測模型精度達到0.591 3,而SSA-BP網絡的苧麻鮮皮產量估測模型精度達到0.679 1。SSA算法能有效提高BP神經網絡模型預測的準確性和穩定性,這與前人[23]研究結果一致。
總體來說,本文提出的基于氣候變量和SSA算法優化神經網絡的苧麻產量預測模型預測效果較好,能夠滿足苧麻生產的實際需要,對提高苧麻的生產效率具有指導作用與參考依據,后續研究還需在不同地域、田間動態監測等條件下對苧麻產量預測模型進行優化。
參 考 文 獻
[1] 楊潔, 唐昀, 申香英, 等. 我國苧麻產業現狀與振興發展[J].中國麻業科學, 2022, 44(4): 253-256.
YANG J, TANG Y, SHEN X Y, et al .. Current situation anddevelopment of ramie industry in China [J]. Plant Fiber Sci.China, 2022, 44(4): 253-256.
[2] 付虹雨, 崔國賢, 李緒孟, 等. 基于無人機遙感圖像的苧麻產量估測研究[J]. 作物學報, 2020, 46(9): 1448-1455.
FU H Y, CUI G X, LI X M, et al .. Estimation of ramie yieldbased on UAV remote sensing image [J]. Acta Agron. Sin.,2020, 46(9): 1448-1455.
[3] 王輝, 付虹雨, 王繼龍, 等. 基于多元回歸和BP神經網絡的苧麻產量估測模型比較研究[J]. 中國麻業科學, 2020, 42(5):227-238.
WANG H, FU H Y, WANG J L, et al.. Comparative study of ramieyield estimation models based on multiple regression and BPneural network [J]. Plant Fiber Sci. China, 2020, 42(5): 227-238.
[4] 王輝, 白玉超, 付虹雨, 等. 3個苧麻品種三年間產量及其構成因子的變化研究[J]. 中國麻業科學, 2020, 42(2): 76-82.
WANG H, BAI Y C, FU H Y, et al .. Study on changes of yieldand component factors of three ramie varieties in three years[J]. Plant Fiber Sci. China, 2020, 42(2): 76-82.
[5] 于珍珍, 鄒華芬, 于德水, 等. 融合田間水熱因子的甘蔗產量GA-BP預測模型[J]. 農業機械學報, 2022, 53(10): 277-283.
YU Z Z, ZOU H F, YU D S, et al .. GA-BP prediction model ofsugarcane yield with field hydrothermal factors [J]. Trans.Chin. Soc. Agric. Mach., 2022, 53(10): 277-283.
[6] 張文婧, 趙錦, 崔文倩, 等. 氣候平均態和極端態變化對東北玉米氣象產量的影響[J]. 中國農業科學, 2023, 56(10):1859-1870.
ZHANG W J, ZHAO J, CUI W Q, et al .. Effects of climatemean and extreme changes on meteorological yield of maize inNortheast China [J]. Sci. Agric. Sin., 2019, 56(10): 1859-1870.
[7] 劉煥才, 史書琦, 李曼, 等. 疏勒河流域中游地區玉米性狀及單產的影響因子研究[J]. 干旱區地理2023, 46(9): 1453-1466.
LIU H C, SHI S Q, LI M, et al .. Study on influencing factors ofmaize character and yield in Middle reaches of Shule RiverBasin [J]. Arid Land Geography2023, 46(9): 1453-1466.
[8] 劉頭明, 湯清明, 朱四元, 等. 長江流域5個地區間苧麻產量差異的氣候影響因素分析[J]. 安徽農業科學, 2011, 39(25):15559-15562+15734.
LIU T M, TANG Q M, ZHU S Y, et al .. Analysis of climaticfactors affecting the difference of ramie yield in five regions inthe Yangtze River Basin [J]. J. Anhui Agric. Sci., 2011, 39(25):15559-15562, 15734.
[9] MELILLO J M, RICHMOND T C, YOHE G W. Climate changeimpacts in the United States [R].The Third National ClimateAssessment, 2014.
[10] 唐俊, 趙成萍, 周新志, 等. 基于EVI-RBF的玉米長勢監測及產量預測[J]. 江蘇農業學報, 2020, 36(3): 577-583.
TANG J, ZHAO C P, ZHOU X Z, et al .. Maize growthmonitoring and yield prediction based on EVI-RBF [J]. JiangsuJ. Agric. Sci., 2019, 36(3): 577-583.
[11] 徐敏, 吳洪顏, 張佩, 等. 基于氣候適宜度的江蘇水稻氣候年景預測方法[J]. 氣象, 2018, 44(9): 1200-1207.
XU M, WU H Y, ZHANG P, et al .. Annual climate predictionmethod for Jiangsu rice based on climate suitability [J].Meteorol. Monthly, 2018, 44(9): 1200-1207.
[12] 劉振洋, 趙家松, 胡仁傑, 等. 基于關聯規則與多元線性回歸的云南省甘蔗產量預測模型[J]. 廣東農業科學, 2022, 49(12):160-166.
LIU Z Y, ZHAO J S, HU R J, et al .. Sugarcane yield predictionmodel based on association rules and multiple linearregression in Yunnan Province [J]. Guangdong Agric. Sci.,2022, 49(12): 160-166.
[13] XUE J K, SHEN B. A novel swarm intelligence optimizationapproach: sparrow search algorithm [J]. Syst. Sci. Control Eng.,2020, 8(1): 22-34.
[14] E A P, D. B. D, Narendra K, et al .. A comprehensiveinvestigation of Genotype-Environment interaction effects onseed cotton yield contributing traits in Gossypium hirsutum L.using multivariate analysis and artificial neural network [J/OL].Computers Electron. Agric., 2023, 211:107966 [2023-09-06].https://doi.org/10.1016/j.compag.2023.107966.
[15] SONG S, XIONG X, WU X, et al .. Modeling the SOFC by BPneural network algorithm [J]. Int. J. Hydrogen Energy, 2021, 46(38):65-77.
[16] 婁高中, 譚毅, 白二虎. 主成分分析與改進PSO-BP神經網絡的下沉系數預測[J]. 測繪科學, 2023, 48(2): 124-130, 147.
LOU G Z, TAN Y, BAI E H. Principal component analysis andsubsidence coefficient prediction of improved PSO-BP neuralnetwork [J]. Sci. Survey. Map., 2023, 48(2): 124-130, 147.
[17] 郭倩, 魏嘉豪, 張健, 等. 基于無人機多光譜影像和隨機森林的蔬菜識別[J]. 中國農業科技導報, 2023, 25(2): 99-110.
GUO Q, WEI J H, ZHANG J, et al .. Vegetable recognitionbased on UAV multi-spectral image and random forest [J]. J.Agric. Sci. Technol., 2023, 25(2): 99-110.
[18] 薛建凱. 一種新型的群智能優化技術的研究與應用[D]. 上海: 東華大學, 2020.
XUE J K. Research and application of a new swarm intelligenceoptimization technology [D]. Shanghai: Donghua University, 2020.
[19] 顧清華, 姜秉佼, 常朝朝, 等. 求解大規模優化問題的改進麻雀搜索算法[J]. 控制與決策, 2023, 38(7): 1960-1968.
GU Q H, JIANG B J, CHANG C C, et al .. An improved Sparrowsearch algorithm for large-scale optimization problems [J]. ControlDecision, 2023, 38(7): 1960-1968.
[20] 胡建華, 黃宇龍, 張堅, 等. 基于麻雀搜索算法優化雙隱含層BP神經網絡的張力減徑鋼管壁厚預測[J]. 塑性工程學報, 2022, 29(8): 145-151.
HU J H, HUANG Y L, ZHANG J, et al .. Prediction of wallthickness of tension reduced steel pipe by double-hidden layerBP neural network based on sparrow search algorithm [J]. J.Plasticity Eng., 2022, 29(8): 145-151.
[21] 劉頭明, 湯清明, 朱四元, 等. 6個不同生態區域苧麻產量及環境影響因素分析[J]. 耕作與栽培, 2011, No.178(1): 30-32.
LIU T M, TANG Q M, ZHU S Y, et al .. Analysis of ramie yieldand environmental impact factors in six different ecologicalregions[J]. Tillage Cultivation, 2011, 178(1): 30-32.
[22] 袁晉琰, 吳春燕, 阮啟亮, 等. 分宜氣象因子對苧麻生長的影響及種植區域的劃分[J]. 中國麻業科學, 2013, 35(4): 210-213, 218.
YUAN J Y, WU C Y, RUAN Q L, et al . Influence ofmeteorological factors on ramie growth and division of plantingarea [J]. Plant Fiber Sci. China, 2013, 35(4): 210-213+218.
[23] 崔興華, 靳晟, 姚芷馨, 等. 基于麻雀搜索算法和廣義回歸神經網絡的玉米產量預測[J]. 數學的實踐與認識, 2022,52(7): 88-96.
CUI X H, JIN S, YAO Z X, et al .. Maize yield prediction basedon sparrow search algorithm and generalized regression neuralnetwork [J]. Math. Practice Theory, 2022, 52(7): 88-96.
(責任編輯:溫小杰)