謝佩軍, 張育斌
(1. 浙江紡織服裝職業技術學院機電與軌道交通學院,浙江寧波,315211;2. 西安交通大學,西安交通大學機械制造系統工程國家重點實驗室,西安市,710054)
隨著科學技術的日益更新和發展,許多先進的理念與技術被應用于農業領域,快速推進了農業現代化和農業精準化。農業節水理論的研究不斷深入和相關技術水平的逐漸提高,農業節水技術正日益走向信息化、精準化,以滿足現代農業對灌溉系統的靈活、準確、快捷等要求。水肥氣一體化是供氧、施肥和灌溉技術相結合的新技術,按照作物生長各個階段對養分的需求及氣候條件等精準補充水肥氣,不僅能夠顯著提高水肥利用率,還能為土壤提供充足的有效氧,實現作物的增產提質。水肥預測模型是水肥氣一體化技術體系中的關鍵技術,高效、精準的水肥預測模型,能夠確保水肥氣控制設備科學地調節灌溉水中營養物質的濃度和數量,有效提高作物的產量和質量,還可大幅度提高化肥和農藥的有效利用率,減少對農田生態環境帶來的污染。水肥預測模型的研究正成為國內外灌溉理論和技術研究有望取得突破點,也對我國農業現代化和農業精準化的發展具有重要意義。
分析智能灌溉技術相關文獻發現,水肥耦合及智能控制灌溉研究較多,但基于水肥氣集成的多信息融合采集系統、灌溉決策系統的自學習智能系統研究很少,尤其是可供參考、推廣的水肥預測模型的研究極少。為了建立高效、精準的水肥預測模型,提出了膜計算粒子群算法優化極限學習機的水肥預測算法,引入膜計算與粒子群算法優化極限學習機。通過獲取作物生長期中作物、土壤、天氣等實時信息,多信息融合下根據作物的生長狀況及營養需求,研究作物水肥用量預測與灌溉決策技術,建立有實際應用意義和推廣價值的水肥預測模型。
隨著機器學習算法的不斷發展,人工神經網絡(ANN)[1]、支持向量機(SVM))[2]、隨機森林(RF)[3]、高斯過程回歸(GPR)[4]、極限學習機(ELM)[5]等逐步被應用于各領域的預測模型。其中ELM具有預測精度高、計算速度快、泛化能力強等優點,結合其他算法廣泛應用于非線性過程、觀測數據缺乏的預測、評估模型。比如,文獻[6]提出了一種基于蟻群算法優化極限學習機,用于預測軟件的構件質量,預測模型有較好的靈敏度、準確度和收斂率。文獻[7]提出了一種基于蒙特卡羅算法與極限學習機的水電站產能預測模型,預測生產能力和優化能量配置,算法具有較好的準確性和適用性。文獻[8]提出一種基于HW方法和極限學習機的住宅用電量短期預測混合模型,將線性預測結果、非線性殘差和原始數據作為輸入樣本進行預測,結果表明該算法構建的模型預測誤差較小。文獻[9]選擇溫度、時間、切削速度、進料速度和粒度等工藝因素,利用支持向量機和極限學習機對木材表面涂層的粘接強度進行預測,取得較好的預測精度和效率。文獻[10]利用極限學習機通過土壤特征參數進行土壤分類評估,算法具有較好泛化能力和準確度。但由于參數隨機選擇,導致試驗結果過擬合、穩定性不高等問題依然存在。粒子群算法(PSO)具有易于實現和搜索效率較高的優勢,粒子群算法與極限學習機融合能夠較好地改進極限學習機的不足。粒子群算法優化極限學習機在預測、估計和識別模型中的理論研究與實際應用取得了快速進展,如文獻[11]采用混合PSO優化ELM可以有效估算西北干旱區有限氣候數據條件下的參考蒸發蒸騰量,文獻[12]研究基于PSO和ELM的混合模型能實現環境溫度預測以優化能源使用率,文獻[13]提出增強型PSO改進ELM可以快速有效地實現電能質量擾動的特征分類,文獻[14]提出基于改進型PSO優化ELM模型能夠較精確地預測混凝土大壩的變形,文獻[15]將PSO改進ELM應用于水電站及水庫實現運行規律的高效預測,上述算法均取得一定應用成效,但也存在復雜問題計算時間長、局部搜索能力有限、容易提前收斂等不足。
本文在已有研究的基礎上提出了基于膜計算粒子群算法改進極限學習機,利用膜計算的并行性、分布式和非確定性等優點,及粒子群算法的高效搜索性能改進極限學習機,建立膜計算粒子群算法優化極限學習機的水肥預測模型應用于多信息融合的智能灌溉系統。
極限學習機(Extreme Learning Machine,ELM)是一種高效的單隱層前饋神經網絡(SLFNs)快速學習算法,具有訓練參數少、泛化性能好、學習速度快等優點,被廣泛應用于農作物產量預測、電力負荷預測、交通流量預測等。
假設有Q個水肥用量的影響因素(平均氣溫、蒸發量、土壤濕度、日照時間等)作為輸入向量樣本(Xp,Yp),其中1≤p≤Q,Xp=[xp1,xp2,…xps]T∈Rs為第p個s維輸入樣本。以水肥用量預測值作為輸出,Yp=[yp1,yp2,…ypr]T∈Rr為第p個r維輸出樣本,s、r、l分別是輸入層、輸出層、隱含層的神經元個數。則極限學習機輸出水肥用量預測值
(1)
式中:g(x)——激勵函數;
Wi——輸入層與隱含層間的權值,Wi=[wi1,wi2,…,wis];
βi——隱含層與輸出層間的權值;
bi——隱含層第i個神經元的偏置。
(2)
對應的矩陣表達式
Hβ=Y
(3)
H是隱含層輸出矩陣,其表達式為

(4)
輸出權值矩陣
(5)
期望輸出矩陣
(6)
網絡訓練過程中,當g(x)無限可微時,初始化Wi和bi且保持不變,則利用最小二乘法對式(3)進行求解可得到β[16]。
(7)
式中:H+——H的Moore-Penrose廣義逆。
由于輸入權值和隱含層偏置的隨機性,易產生訓練精度和泛化能力的不確定性。針對這個問題,本文采用膜計算粒子群算法優化ELM的初始權值和偏置,改善不穩定性進而提高水肥預測模型的預測精度和泛化能力。
粒子群優化算法(Particle Swarm Optimization,PSO)是一種群體智能算法,通過模擬鳥類群體內個體相互之間的迭代信息共享與交流,實現群體全局最優解的搜索。該算法模擬鳥類群體覓食行為,粒子模擬鳥類個體,每個粒子表示一組候選解,不斷迭代搜索最優粒子,搜索過程被抽象為具有速度和位置兩個屬性的粒子飛行過程。
假設D維空間內存在n個粒子的種群,第i個粒子及其位置可表示為Xi=[Xi1,Xi2,…,XiD]T,其速度表示為Vi=[Vi1,Vi2,…,ViD]T。均方根誤差(RMSE)能夠描述水肥用量預測值和實際用量值之間的偏差,選擇RMSE作為適應度函數計算各粒子的適應度值。RMSE值越小則水肥預測偏差越小、預測精度越高,故RMSE值最小即為最佳粒子。第i個粒子的當前最佳值,即個體極值可表示為Pbesti=[Pbesti1,Pbesti2,…,PbestiD]T,種群的當前最佳值,即全局極值可表示為Gbesti=[Gbesti1,Gbesti2,…,GbestiD]T。
當迭代過程找到上述兩個極值時,粒子根據式(8)和式(9)更新自身速度和位置
(8)
(9)


ωi——慣性權重,用于平衡局部尋優能力和全局尋優能力;
c1、c2——學習因子,反映個體極值和全局極值的重視程度;
r1、r2——區間[0,1]內的隨機數。
膜計算(Membrane Computing,MC)也稱為膜系統、P系統,由羅馬尼亞科學家Pǎun[17]于1998年提出,是仿生自然計算的新興學科分支,從細胞結構及功能、組織器官與細胞群的信息共享、交流抽象而來,膜計算具有分布式、并行性和非確定性等優點。膜計算系統按系統模型結構與規則分為三類:組織型膜系統、細胞型膜系統和神經型膜系統[18]。當前,膜計算理論結合粒子群算法的相關研究也取得了一定進展,可以有效提高算法的尋優能力和收斂速度。
本文提出的膜計算粒子群算法(MCPSO)采用細胞型膜系統,該類型膜系統的基本膜結構如圖1所示,將粒子群放入膜系統進行尋優。

圖1 細胞膜結構圖Fig. 1 Structure of cell membrane
一個度為的細胞型膜系統的多元組
∏=(V,Σ,H,μ,w1,…wn,R1,…Rm,io)
(10)
式中:V——非空字母表,包含各元素;
Σ——輸出對象表;
H——膜標號集合,H={1,2,…,m};
m——膜系統的度;
μ——包含m個膜的膜結構;
wi——膜區域i內的對象多重集,wi∈V*(1≤i≤m);
Ri——膜區域i的進化規則,1≤i≤m;
io——系統輸出膜。
本文提出了膜計算粒子群算法,根據所實現的功能不同將膜系統內的生物膜分為主膜和輔助膜兩大類。各膜區域i內的對象多重集表示
wi=(X1i,X2i,…,Xni),1≤i≤5
式中:ni——區域i內粒子個數;

細胞型膜系統一般采用字符型對象,為了保證水肥預測模型可以應用于實際灌溉系統,本算法采用實數變量對象。膜結構包含表層膜膜0和5個基本膜,基本膜包括主膜(膜1)和輔助膜(膜2、膜3、膜4、膜5),如圖2所示。表層膜0不參與具體運算,其功能是收集主膜拋棄的適應度差的粒子。輔助膜的功能是進行搜索空間內的全局搜索,實現最優解區域的尋優,增強種群多樣性可以提高全局尋優能力。主膜的功能是在輔助膜實現最優解區域尋優的基礎上進行精細化局部尋優,膜內尋優后再加上輔助膜傳遞來的優勢粒子,進行進一步迭代實現全局最優解的搜索。

圖2 MCPSO膜結構示意圖Fig. 2 Membrane structure of MCPSO
種群多樣性反映了粒子的聚散程度,本算法將種群多樣性引入迭代尋優過程中,從而能夠保證良好的全局搜索能力。其表達式為[19]
(11)

(12)
式中:n——粒子個數;
di(t)——粒子i與其余粒子之間的最小歐氏距離;

SP(t)——第t次迭代的種群多樣性,即粒子群的聚散程度。
SP(t)值變小,說明粒子分布比較均勻、多樣性好;反之,則粒子分布不均勻、多樣性差。當慣性權重ωi較大時,說明全局尋優能力較強;當ωi較小時,則說明局部尋優能力較強。ωi能夠根據SP(t)值的情況相應進行快速調整,從而實現迭代過程中全局尋優能力和局部尋優能力的有效平衡。
膜計算系統具有良好的并行計算能力,所有基本膜能夠同時進行各自膜內局部尋優,相當于整個粒子群的全局搜索。輔助膜內的粒子每次迭代過程,根據式(11)計算SP(t)值及數值變化情況來選擇式(12)的ωi,粒子的速度和位置按照式(8)和式(9)進行更新,從而保持種群多樣性。各輔助膜每迭代一次后,都需要將膜內粒子按適應度值大小進行排序,并將膜內排在前20的優勢粒子傳送至主膜1。輔助膜傳送至主膜的交換規則為
Ri:X′1i…X′20i…X′ni→X′1i…X′20i…X′ni(X′1i…X′20i)in1,2≤i≤5
(13)
主膜膜1的迭代過程同樣以式(11)和式(12)確定慣性權重,按照式(8)和式(9)更新粒子的速度和位置。膜1內自有粒子加上輔助膜的80個優勢粒子,按適應度值進行排序,將適應度最差的80個粒子傳送至表層膜膜0進行拋棄,并將適應度最好的20個粒子進行復制,分別傳送至各輔助膜以提高輔助膜的尋優效率。主膜傳送至表層膜的交換規則
R1:X′11…X′n1…X′n1+80→X′11…X′n1(X′n1+1…X′n1+80)in0
(14)
其中,X′n1+1…X′n1+80為主膜傳送到表層膜進行拋棄的最差粒子。
主膜到輔助膜的交換規則
R′i:X′11…X′n1…X′n1+80→X′11…X′n1(X′n1+1…X′n1+80)ini,2≤i≤5
(15)
本文提出的膜計算粒子群算法優化極限學習機(MCPSO-ELM)算法,利用粒子群算法高效的尋優能力與膜計算強大的平行計算能力,不斷迭代優化提高搜索效率和預測精度,引入種群多樣性實現迭代過程中全局尋優能力和局部尋優能力的有效平衡,確保算法具有優異的尋優能力和理想的收斂速度。
算法具體步驟如下。
步驟1:確定輸入樣本,選擇水肥用量的6個影響因素平均氣溫、蒸發量、土壤濕度、土壤肥力、日照時間和作物生育期作為輸入向量,并對樣本數據進行歸一化處理。
步驟2:構建ELM模型,設置激活函數、隱含層單元數等基本參數。設定粒子群尋優參數,包括種群規模、學習因子、慣性權值和最大迭代次數等參數。
步驟3:隨機初始化輸入權值Wi和隱含層偏置bi。
步驟4:構建膜系統結構,初始化膜內粒子群。根據適應度函數RMSE計算各粒子的適應度值,RMSE值最小即為水肥預測偏差最小的最優粒子,并搜索各膜內個體最優粒子和全局最優粒子。
步驟5:根據相應規則更新各膜內粒子的位置和速度,根據式(11)計算當前次迭代的種群多樣性并選擇式(12)更新慣性權重。
步驟6:輔助膜通過交換規則將20個優勢粒子傳送至主膜;主膜接收到各輔助膜的80個優勢粒子進行精細化搜索并進行重新排序,將最差的80個粒子傳送至表層膜進行拋棄,主膜將前20個粒子回傳給各輔助膜。
步驟7:判斷是否滿足最大迭代次數或小于設定誤差,如果滿足條件則結束迭代,輸出水肥預測精度最高的最優解,并以此建立MCPSO-ELM水肥預測模型;否則,回到步驟5。

圖3 水肥預測MCPSO-ELM算法流程圖Fig. 3 Flow chart of water and fertilizer prediction model MCPSO-ELM
為了測試MCPSO算法求解復雜問題的性能,進行對比測試分析,文獻[20]提出一種改進線性遞減慣性權重的非線性遞減權重PSO算法(記為WPSO),文獻[21]提出一種線性改變學習因子和動態遞減慣性權重的PSO算法(記為IPSO),均具有較好的搜索速度和尋優性能。選取標準測試函數Rastrigin對PSO、WPSO、IPSO、MCPSO四種粒子算法進行試驗,該函數各變量之間無關聯且局部最優值隨著正弦波動,是一個具有大量正弦拐點排列的局部最優的典型復雜多峰函數
(16)
其中:τ=[τ1,τ2,…,τm]T。設置計算參數:空間維數為2,種群規模為50,學習因子c1∈[1.5,2.5]、c2∈[1.5,2.5],最大迭代次數為200次,用上述四種粒子群算法分別計算二維空間[-5,5]×[-5,5]內的f(τ)值。各粒子群算法均運行50次取平均值,運行結果對比如表1所示。

表1 四種粒子群算法的測試結果Tab. 1 Test results of four particle swarm
根據表1內四種粒子群算法運行結果的均值(MEAN)、方差(VAR)、標準差(SD)等進行對比分析,WPSO、IPSO和MCPSO的各項測試值均優于標準PSO測試值,說明三種改進算法均能提升算法性能,MCPSO的各項測試數據遠遠小于其他模型的測試數據,說明算法尋優效果更好,性能更加穩定,模型抗噪能力更強。MCPSO算法以膜系統的高效平行計算能力優化粒子群,更快找到個體最優、收斂到全局最優解,提升模型的收斂速度與預測精度。
作物水肥用量的影響因素較多,為了簡化網絡模型及優化預測計算過程,選取平均氣溫、蒸發量、土壤濕度、土壤肥力、日照時間和作物生育期6項影響因素[22-23]作為水肥預測模型的輸入向量,以水肥混合液用量作為輸出值。利用MCPSO-ELM算法建立分類器,通過樣本數據訓練學習,并將預測結果與實際值進行對比分析。
水肥用量上述影響因素的原始數據量大,若直接用于模型計算訓練,則數據處理時間長,嚴重影響模型運行效率,且在不同程度上影響模型的預測精度和算法魯棒性。因此,需要將原始數據歸一化處理至區間[0,1]。
水肥預測模型表達式
(17)
式中:YP——水肥用量;
T——平均氣溫;
E——蒸發量;
M——土壤濕度;
F——土壤肥力;
S——日照時間;
G——作物生育期;
r——輻射修正系數;
Δ——飽和蒸氣壓曲線斜率;
η——土壤有效養分系數。
選用2017年3—8月“甬甜5號”(春季甜瓜)的觀測數據作為訓練樣本集,2018年3—8月的觀測數據作為測試樣本集。3月19日移苗施基肥,3月21日移栽定植,4月19日伸蔓期追肥,5月10日膨瓜初期追肥,6月7日甜瓜成熟。甜瓜整個生育期的氮磷鉀用肥量比例為4∶2∶3,在移栽前完成基肥穴施,施用量為40%氮肥(尿素)、40%鉀肥(硫酸鉀)及70%磷肥(過磷酸鈣),剩余用肥通過水肥滴灌系統進行施肥,以田間持水率75%為灌水下限。建立四種預測模型:PSO-ELM模型、WPSO-ELM模型、IPSO-ELM模型與本文提出的MCPSO-ELM模型進行對比分析,為了簡化數據及提高模型可靠性,模型對苗期到成熟期的水肥用量進行預測。
為了驗證MCPSO-ELM模型的運算效率與預測性能,采用標準性能評價準則對上述四個模型進行性能評價,選用平均絕對誤差MAE、均方誤差MSE和自相關系數R2等3個誤差度量來檢測,進而對比分析各模型預測性能的優劣[24]。本文對MCPSO-ELM模型、PSO-ELM模型、WPSO-ELM模型、IPSO-ELM模型及ELM模型實施對比試驗,樣本進行50次訓練,取平均值作為最終計算結果。MAE和MSE值越小,則預測模型的預測偏差越小、精度越高;R2值越接近于1,則預測值與實際值吻合度越高。

表2 模型預測評價指標對比分析Tab. 2 Comparative analysis of evaluation indexes
根據表2的模型評價指標來分析,各模型都能較準確地預測水肥用量。ELM模型的自相關系數R2最小,其他模型均采用不同的粒子群算法改進極限學習機提升了R2值,說明粒子群改進極限學習機能夠有效提高模型的預測精度;MCPSO-ELM模型的自相關系數R2最接近1,說明其預測精度最高;MCPSO-ELM模型的MAE及MSE值均不同程度地小于其他模型,進一步說明本文所提出改進策略的正確性,通過膜計算和粒子群算法能夠有效提高極限學習機的預測精度,優化模型的泛化能力。
2017年3—8月“甬甜5號”的觀測數據作為訓練樣本集對四種模型進行訓練,2018年3—8月的平均氣溫、蒸發量、土壤濕度、土壤肥力、日照時間和作物生育期等影響因素作為水肥預測模型的輸入向量,通過各模型計算輸出該生育期水肥用量的預測值,將預測結果與實際值進行對比分析,如圖4、圖5所示。從水肥用量實際值與各模型的預測值對比圖來看,四種模型的預測數據總體上與實際水肥用量的變化趨勢曲線能夠基本吻合,可見各模型均具有一定的預測能力。但從預測數據與實際水肥用量數據曲線的擬合度進行分析,PSO-ELM模型、WPSO-ELM模型和IPSO-ELM模型的預測數據值與實際值存在不同程度的偏離,PSO-ELM模型的偏離程度最大,預測數據不穩定;WPSO-ELM模型和IPSO-ELM模型的部分預測數據能夠貼近實際值,擬合度和數據穩定性優于PSO-ELM模型;MCPSO-ELM模型的預測數據能夠保持最佳的擬合度和數據穩定性,說明MCPSO-ELM模型預測性能比其他三個模型更好。

圖4 水肥用量實際值與WPSO-ELM、IPSO-ELM、PSO-ELM預測值對比圖Fig. 4 Comparison chart of actual value and predictive value of WPSO-ELM, IPSO-ELM and PSO-ELM

圖5 水肥用量實際值與MCPSO-ELM預測值對比圖Fig. 5 Comparison chart of actual value and predictive value of MPSO-ELM
為了進一步分析模型的預測精度與數據穩定性,根據各模型預測值(PVi)和水肥用量實際值(RVi)分別計算預測誤差PEi=PVi-RVi,相對誤差REi=|PEi|/RVi和平均絕對百分比誤差(MAPE)。
(18)
從圖6中各模型的預測誤差和表3相對誤差對比分析可知,PSO-ELM模型的預測數據誤差值達到±140 m3/hm2左右,最大相對誤差17.6%,MAPE達5.6%;IPSO-ELM模型的預測數據誤差值降到±100 m3/hm2左右,最大相對誤差14.8%,MAPE為5.1%,預測能力比PSO-ELM模型和WPSO-ELM模型更強;而MCPSO-ELM模型預測數據誤差值保持在±30 m3/hm2之內,最大相對誤差6.4%,MAPE為2.0%,誤差波動最小,預測精度得到大幅度提升,完全能夠滿足水肥預測要求。綜合分析模型預測數據與實際水肥用量曲線的擬合度,并對比分析模型預測誤差可知,MCPSO-ELM模型的能夠有效提高收斂速度、強化學習能力,模型的預測精度和數據穩定性均優于其他模型,預測結果更接近真實水肥用量數據。

圖6 各預測模型的預測誤差對比圖Fig. 6 Comparison chart of the prediction errors of models

表3 各預測模型的相對誤差對比表Tab. 3 ComparisonTable of the relative error of models
灌溉系統的水肥用量受作物生育期內平均氣溫、土壤濕度、日照時間等因素的綜合影響,因此,水肥預測存在數據計算量大、預測難度大、預測精度不高等問題。高效的水肥預測模型能夠確保灌溉系統科學地調節水肥比例與用量,大幅度提高農作物的品質和產量,提升化肥和農藥的有效利用率,減少農田生態環境的污染。
1) 為了建立高效、精準的水肥預測模型,本文提出了膜計算粒子群優化極限學習機的預測算法,利用粒子群算法的高效率搜索能力與膜計算的平行計算優勢,引入種群多樣性有效解決了全局搜索和局部尋優之間的平衡,算法具有理想的收斂速度和優異的尋優性能,提升了極限學習機的計算速度、泛化能力和預測精度。
2) 建立了MCPSO-ELM模型、WPSO-ELM模型、IPSO-ELM模型和PSO-ELM模型,采用“甬甜5號”(春季甜瓜)不同年份的觀測數據對預測模型進行有效性驗證,根據模型預測數據擬合度和模型預測誤差進行綜合對比分析。MCPSO-ELM模型的預測誤差小于30 m3/hm2,其他模型基本都大于100 m3/hm2;MCPSO-ELM模型預測數據最大相對誤差6.4%,MAPE為2.0%,誤差波動最小,其他模型的MAPE均大于5.0%,因此,MCPSO-ELM模型的預測曲線與水肥實際用量曲線最為接近,模型預測性能更優秀。
3) MCPSO-ELM模型能夠有效提高收斂速度、強化學習能力,模型的預測精度和數據穩定性均優于其他模型,能夠根據作物生育期的影響因素數據實現水肥用量的精準預測,為多信息融合的智能水肥氣灌溉系統提供支持。