





關鍵詞:溫室風口;逐步回歸;預測;Lasso;自動控制
doi:10.13304/j.nykjdb.2022.0035
中圖分類號:S626 文獻標志碼:A 文章編號:10080864(2023)12010308
黃瓜是設施栽培蔬菜的主要種類之一,其生長對環境溫度的要求相對較高,氣溫過高或者過低都會對黃瓜正常生長發育造成影響,最終導致減產[1-3]。風口調控是溫室溫度調控的重要指標,目前我國溫室風口調控以人工經驗和現場操作為主,勞動強度大、勞動效率低、經濟效益整體偏低[45],風口開度大小的自動控制已成為提升日光溫室智能化的關鍵。
為提高溫室環境控制的精準性,對溫室環境智能控制方法進行了相關研究[6-10],部分學者以溫室環境為切入點,對環境預測模型進行了研究[11-15]。陳俐均等[16]采用連續-離散遞推預測誤差算法建立了溫室溫度預測模型,擬合優度最低為0.89;張觀山等[17]以日光溫室覆蓋層為研究對象,建立了溫室覆蓋層的溫度預測模型,均方根誤差(root mean squared error,RMSE) 最大為2.05。Jung等[18]依據預測結果制定溫室風口溫度控制策略,將預測模型應用于通風控制中,實現溫室風口的智能控制。秦琳琳等[19]利用灰色預測模型預測溫室溫度系統中可測不可控的擾動輸入,并通過分支界定法對混合整數規劃問題進行求解,最終表明溫度可被較好地控制在設定范圍內。Sumarudin等[20]利用物聯網技術監測設施黃瓜的環境參數,采用最小二乘支持向量機(leastsquares-support vector machines,LS-SVM)預測黃瓜的用水量,實現黃瓜的智能灌溉控制;Kaneda等[21]基于滑動窗口支持向量回歸提出了一種智能溫室環境控制系統,該系統基于滑動窗支持向量回歸(sliding window and support vector regression,SW-SVR)時間序列數據進行機器學習,實現了實時準確的預測,并提出相應的溫室環境控制決策。
綜上所述,溫室模型預測精度還需進一步提升,相關研究沒有融合作物長勢數據,缺乏作物專用的溫室風口控制模型。本研究針對當前模型中存在的問題,提出黃瓜溫室專用風口智能控制模型。為提升模型的專用性,結合溫度預測模型構建設施黃瓜專用溫室風口控制模型,為提升模型的精準性,綜合考慮自變量之間的關聯程度,采用解決數據多共線性問題的逐步回歸和Lasso回歸的方法建立溫室溫度預測模型和黃瓜生長模型,旨在提升設施黃瓜溫室的智能化管理。
1 材料與方法
1.1 溫室條件
試驗于2020年11月6日—2021年3月2日在山東省泰安市泰山區科技創新園區溫室中進行(116.6°E,37.3°N)。該地區屬溫帶大陸性半濕潤季風氣候,年平均氣溫12.8~14.0 ℃之間,7月份最熱,月平均氣溫27.4 ℃,1月份最冷,月平均氣溫-0.3 ℃,年平均光照時間為2 450 h。溫室設有上下2個風口,其自然通風方式為下風口進風,上風口排風。下風口距離地面高40.0 cm,最大開度為1.2 m,上風口最大開度為80.0 cm。試驗溫室為東西走向,長50.0 m,寬10.0 m,頂高4.5 m,屋頂斜角26°,為半水泥、半鋼架結構,溫室頂部安裝外遮陽簾。
1.2 數據來源
本試驗開始于2020年12月,依據農戶的操作習慣,將溫室下風口設為固定不變,上風口開度設為0%、25%、50%、75%和100%共5種狀態,考察溫室的溫度變化。
為探索溫度對黃瓜生長形態的影響,每7 d采集1次黃瓜地上部分生長數據,選取無病蟲害、長勢均勻、有代表性的20棵黃瓜植株,采集其葉面積(cm2)、葉片數(片)、最大葉片長(cm)、最大葉片寬(cm)、株高(cm)和莖粗(mm)等黃瓜長勢指標,并計算葉面積指數(leaf area index, LAI)[22]。
LAI=最大葉片長×最大葉片寬×0.657 (1)
利用物聯網技術實時監測的環境數據還包括溫室內外溫度、濕度、風速、光照和風口狀態數據等。
1.3 主成分分析
主成分分析法( principal component analysis,PCA)是將多個因子降維得出少數幾個綜合指標的統計方法。由于黃瓜生長數據指標較多,且彼此之間存在一定相關性,從而導致數據之間存在重疊。利用主成分分析法找出幾個綜合因子代表黃瓜生長的原始信息,從而達到數據簡化的目的[23]。選取株高(Z1)、莖粗(Z2)、最大葉長(Z3)、最大葉寬(Z4)、葉面積(Z5)、葉片數(Z6)作為指標評價黃瓜植株的長勢[24]。首先,利用R語言對黃瓜數據參數進行標準化處理,然后利用主成分分析法進行數據降維。
1.4 逐步回歸及Lasso 回歸
在解決多重共線性問題上,綜合考慮了可決系數、標準誤差大小等,本文采用逐步回歸進行建模。逐步回歸將變量逐步引入模型,引入每個變量后都要進行F 檢驗,并對已選入的合適變量進行t 檢驗,當原變量因新變量的引入變得不再顯著時,需將其刪除,從而確保每次引入新變量在引入之前只包含顯著性變量,最后得到的變量集都為最優[25]。
Lasso回歸方法是一種連續性收縮的變量篩選方法,在最小二乘的基礎上對系數的絕對值之和施加約束,其通過懲罰項得到自由度更小的模型,使得模型的回歸系數變小,進而提高預測的精準性[26],線性模型下Lasso的參數估計值如下。
為檢驗及評價模型精度,選取決定系數R2、均方根誤差(root mean square error,RMSE)指標進行評價,估測模型與驗證模型的R2 越大,相對應的RMSE越小,表明模型精度越高,此時實際值與預測值的一致性良好[27]。
1.5 設施黃瓜溫室溫度預測模型構建與評價
1.5.1 多重共線性檢驗 本研究采集了設施黃瓜棚內外9個環境因子為變量,包括室內空氣溫度(X1)、室內空氣濕度(X2)、土壤溫度(X3)、土壤濕度(X4)、室外溫度(X5)、室外濕度(X6)、風速(X7)、風向(X8)及有效光輻射(X9),利用SPSS Statistics27對環境變量進行相關性分析。為提高預測模型的精度,利用回歸自變量的方差膨脹因子(variance inflation factor,VIF)檢驗多重共線性。
VIF代表共線性的量度,如果VIFlt;5, 基本不存在共線性,而VIF超過10就應該認為存在共線性, 如果超過20就存在極度共線性。利用R語言分別計算不同風口開度下各個回歸自變量之間的VIF值。
1.5.2 預測模型構建 采用逐步多元回歸的方法構建1 h后的溫室空氣溫度(Y)的預測模型。利用R語言根據F 檢驗值的大小篩選引入模型的顯著變量 (Plt;0.05)及剔除不顯著變量(Pgt;0.05),引入或者剔除每個變量都需進行F 檢驗,直到逐步回歸模型無新變量引入且無變量剔除為止。
2 結果與分析
2.1 環境變量因子相關性分析
由表1可以看出,除土壤濕度(X4)、風速(X7)及風向(X8)外,其余各個環境變量之間都存在較強相關性,此現象易導致共線性問題的發生[28]。因此,為提高預測模型的精度,本研究進一步進行多重共線性檢驗,檢驗是否存在多重共線性問題。
2.2 多重共線性檢驗結果分析
由表2可知,風口開度為0%、25%和50%時,VIFgt;10,即存在多重共線性問題,為解決多重共線性問題,本文選取逐步回歸進行建模。
2.3 設施黃瓜溫室溫度預測模型的系數分析
環境變量其對未來1 h溫室空氣溫度(Y)影響的顯著程度不一,引入模型的各個變量系數如表3所示。
5 個模型自變量系數的顯著性水平均小于0.05,說明引入各回歸模型的環境變量對未來溫室1 h后的溫度影響顯著,存在顯著的線性關系,5 種風口開度(0~100%)回歸方程(Y1~Y5)分別如下。
Y1 = 1.772 + 0.56X1 + 0.105X3 + 0.412X5 +0.036X6 + 0.026X9 + 0.071X2 - 0.313X4 (4)
Y2 = -4.117 + 0.909X1 + 0.054X9 + 0.07X2 ( 5)
Y3 = -0.217 + 0.799X1 + 0.085X9 0.102X2 - 0.061X5 - 0.077X4 + 0.003X8( 6)
Y4 = -0.799 + 0.842X1 + 0.066X9 +0.054X2 - 0.134X7 - 0.002X8 - 0.035X4( 7)
Y5 = -3.319 + 0.763X1 + 0.075X9 + 0.138X5 +0.076X2 - 0.042X6 (8)
2.4 溫度預測模型的有效性分析
將9個環境變量代入回歸方程得出風口開度0%、25%、50%、75%、100%狀態下未來1 h溫室溫度預測值,將預測值與實際值進行比較,結果如圖1所示。數據點較為集中的分布在45°線周圍,表明預測值接近實際值,說明各評價模型擬合優度較高,能滿足溫度預測的需求。
為實現空氣溫度與黃瓜生長數據之間的關聯性分析,采用主成分分析法對黃瓜生長數據進行降維處理。由表5可知,設施黃瓜生長數據共提取出1個主成分,第1主成分初始特征值占據原變量特征值的95.8450%,累計貢獻率大于0.8,則可得到m=1,即選定1個主成分P1。
第1 主成分信息量代表了大部分總的信息量,表明原來6個變量反映的信息基本可由第1主成分反映。為防止自變量之間存在多重共線性問題,利用逐步回歸建立了基于環境因子的設施黃瓜整個周期的生長模型,模型如式(9)所示。
Y 長勢=0.955Z1+0.975Z2+0.995Z3+0.961Z4+0.994Z5+0.994Z6" (9)
基于逐步回歸的黃瓜生長模型標準誤差太大,R2值(0.991)過高,造成過擬合現象,模型精準度不高。為提高黃瓜生長模型的精準度,本文選
用可解決多重共線性問題的Lasso回歸方法建立基于環境因子的設施黃瓜生長模型(式10)。經分析(表6),各因素標準誤差較小,達到極顯著水平(Plt;0.001),表明Lasso方法構建的模型可有效預測黃瓜長勢,如式(10)所示。
Y 長勢=-4.48+0.952X10+0.043X11+0.060X12 (10)
式中,X10代表積溫、X11代表積光、X12代表CO2含量。
3 討論
將數字化技術與設施黃瓜溫室相結合是推進設施黃瓜智能化發展的必經之路。為了實現黃瓜不同生長階段溫室風口的智能控制,本研究利用物聯網技術實時監測不同溫室風口開度下黃瓜生長周期中的溫室內外環境數據,人工定期采集黃瓜長勢數據,對設施黃瓜溫室風口控制模型進行研究。采用相關性分析法篩選溫室溫度的關鍵環境影響因子,為提高預測模型的精準性,利用多重共線性檢驗方法對溫室溫度預測模型自變量進行共線性檢驗,并采取可解決共線性問題的逐步回歸方法建立黃瓜溫室溫度預測模型,模型的決定系數R2值最低為0.941。為提高黃瓜溫室風口控制模型的專用性,利用主成分分析法通過株高、莖粗、葉面積等指標建立黃瓜長勢的關系模型,并利用Lasso回歸分析方法建立了基于環境因子的設施黃瓜生長模型。將溫室溫度預測模型與設施黃瓜生長模型相結合,最終構建了設施黃瓜溫室專用風口控制模型。
本研究經過廣泛的現場調研及資料查詢,深入分析了設施黃瓜溫室的管控需求,設計了設施黃瓜生長環境的智能調控模型,利用Python代碼將風口控制模型嵌入至上位機系統,實現了溫室風口的自動控制,提升了設施黃瓜溫室管理的智能化水平。
(責任編輯:溫小杰)