張玉琛 張義 程瑞鋒 王超









摘要:基于物聯網以及傳感測試技術,在獲取日光溫室內外光溫環境數據的基礎上,采用皮爾遜系數法確定各環境因子間的關聯性,進而建立基于室外光溫環境因子變量的墻體放熱回歸模型。結果表明,采用聚類填充法處理缺失數據,可以保持較優的原數據樣本特征;與主成分回歸方法相比,采用偏最小二乘回歸方法擬合墻體放熱量模型,預測值與真實值的均方根誤差RMSE為0.09 MJ/m,平均絕對百分誤差MAPE為9.48%,確定系數R為0.953,精度較好。該回歸模型綜合了室外光溫環境特征信息規律,通過氣象預報,可以用于模擬預測墻體放熱量,為溫室額外加熱量的供給提供參考。
關鍵詞:日光溫室;墻體蓄放熱;環境數據;相關分析;回歸分析
中圖分類號:S625.1 文獻標志碼:A
文章編號:1002-1302(2022)11-0208-06
收稿日期:2022-02-25
基金項目:國家自然科學基金(編號:31901421);中國農業科學院基本科研業務費(編號:Y2021PT04)。
作者簡介:張玉琛(1997—),男,河北保定人,碩士研究生,主要從事設施農業信息技術研究。E-mail:82101195261@caas.cn。
通信作者:張 義,博士,副研究員,主要從事設施園藝環境工程研究。E-mail:zhangyi03@caas.cn。
日光溫室土質墻體造價成本低、取材方便,具有良好的保溫蓄熱性能。在室外,環境要素主要是氣溫和太陽輻射,其內環境變化是以天為單位的周期性能量傳遞過程,室內外系統熱量發生轉移趨于能量平衡。溫度是影響植物生長的重要環境要素之一,日光溫室墻體自身蓄放熱功能是維持夜間溫度的重要因素,科學合理地預測與評價墻體蓄放熱量是溫室夜間溫控策略制定的重要參考依據。
日光溫室后墻的熱量主要來自太陽輻射和室內空氣與墻體間的對流換熱[5-6。日光溫室墻體儲熱量大且放熱效率較高,白天墻體蓄積的熱量約有40%用于改善夜間溫室內環境。李小芳等利用熱反應系數法,根據日光溫室熱量平衡建立了墻體傳熱量模型;史宇亮等研究了日光溫室土墻體分層溫度變化規律及墻體蓄放熱量特征;彭東玲等采用有效差分法建立墻體一維非穩態導熱模型,分析了墻體熱量傳遞動態規律。眾多學者在傳熱平衡和溫室環境機理模型方面做了大量試驗和理論分析,表明墻體蓄放熱量與墻體材料特性、室外環境條件等高度相關,但以室外氣象指標作為輸入參數,進行墻體蓄放熱量預測的研究尚未見報道。在溫室結構、墻體材料已確定的情況下,墻體蓄放熱量變化主要受溫室外環境的影響。本研究在分析溫室內外光溫環境相關特性的基礎上,通過比較主成分回歸與偏最小二乘回歸2種方法的回歸準確度,最終建立溫室墻體放熱量回歸模型,并用于日光溫室墻體蓄放熱量預測。
1 材料與方法
1.1 試驗溫室
選取山東省壽光地區土后墻溫室作為研究對象。試驗日光溫室(圖1)位于山東省壽光市洛城四里村(36°86′N,118°87′E),溫室東西走向,長度 84 m,跨度13 m,脊高6.5 m。其溫室結構類型為下挖式機打土墻,后墻底寬6.5 m,頂寬2 m,溫室內種植黃瓜,土壤栽培。
1.2 環境數據獲取與預處理
采用邯鄲市若騰電子科技有限公司計算機自動采集數據系統獲取環境參數,分別為室內外氣溫(±0.3℃)、室內太陽總輻射(±40 W/m)、墻體熱通量(±5 W/m)及室外太陽總輻射(±40 W/m)。室內外傳感器距地面垂直高度為 2 m,數據采集間隔為30 min/次。數據采集時間跨度為2019年12月1日至2020年2月29日、2020年12月1日至2021年2月28日。針對數據采集過程中出現的跳變、漏采等現象,選用均值法、多重插補法、聚類填充法3種方法處理缺失值。其中設置聚類方法歐式距離步數k為10,通過尋找與缺失樣本相似的10個近似數據加權平均來填補缺失值。采用均方根誤差評估各方法填充效果,在R語言4.0.3版本中使用函數DMwR包、VIM包、mice包,執行3種插補方法。
1.3 溫室環境變量相關及回歸分析
簡單相關分析是計算2個變量之間的相關系數,衡量2個變量之間的強弱關系。本研究中的環境數據是時間連續變量,因此采用皮爾遜相關系數法進行處理。由于室外光溫環境參數和墻體蓄放熱量都是多維變量,變量之間具有顯著相關性,為避免各變量內部要素交互影響,本研究進一步采用主成分方法進行典型相關分析,得到2組變量之間整體的相關系數。主成分方法可將各變量之間互相關聯的復雜關系進行簡化,把高維空間問題映射到低維空間識辨擬合特征。典型相關分析借助主成分思想,把室外光溫環境參數與墻體蓄放熱量之間的關系轉化為2個綜合變量間的關系,利用這2個綜合變量之間的相關關系來反映2組指標之間的整體相關性。針對變量間存在共線性情況,本研究采用主成分回歸和偏最小二乘回歸方法。
1.4 數據標準化和回歸模型評價指標
溫度和太陽輻射環境要素具有不同的量綱,為去除單位影響,使各變量處于同一數量級,采用線性歸一化方法對原數據進行變換,映射到[0,1]區間。
x=x-xx-x。(1)
式中:x為環境參數采集值;x為環境參數采集最小值;x為環境參數采集最大值。
采用均方根誤差RMSE、平均絕對百分誤差MAPE、確定系數R對回歸模型進行效果評價。
RMSE=1n∑ni=1(y^-y);(2)
MAPE=1n∑ni=1y^-yy;(3)
R=SSRSST=∑ni=1(y^-y)∑ni=1(y-y)。(4)
式中:y^為模擬值;y為實測值;y為實測平均值;n為樣本數。
2 結果與分析
2.1 缺失數據處理結果
數據采集平臺根據記錄時間間隔以及“1.2”節中所列參數,記錄總樣本數應為8 592個,實際采集存儲數據為8 160個,計算可得丟失數據約占總數據的5%。根據此缺失率,隨機篩選出5 d無異常完整數據集作為基礎,設置隨機種子,人為假設含有5%缺失率的缺失數據集。采用“1.2”節中所列的3種缺失值處理方法進行填補,將完整數據集與填補后的數據集進行對比,評判各方法的填充效果。計算結果表明,均值法RMSE為3.58℃,多重插補法RMSE為2.64℃,聚類填充法RMSE為1.82℃。相比較其他2種方法,聚類填充法更能保持數據樣本特征,填補效果達到了較高準確度。因此,采用聚類填充法對平臺采集數據進行缺失值處理,共處理數據432個。
2.2 室內外環境變量相關分析
選取室外日最高氣溫、最低氣溫、平均氣溫和太陽總輻射日積累量,溫室內日最高氣溫、最低氣溫、平均氣溫和太陽總輻射日積累量以及墻體集放熱日總量,采用皮爾遜公式計算各環境因子之間的相關系數。從表1可以看出,溫室環境是個綜合系統,各環境變量之間關系密切且存在不同程度相關性。室內平均氣溫與多數變量存在顯著相關性,可以作為一個綜合指標來評價溫室熱環境性能。室外太陽總輻射日積累量和墻體集熱日總量、放熱日總量的相關系數分別為0.65、0.38,存在顯著的相關關系。室外日最高氣溫和室外平均氣溫的相關系數為0.93,和室外最低氣溫的相關系數為0.61;墻體集熱日總量和放熱日總量間相關系數為0.43。結果表明,室外光溫環境變量和墻體集放熱量各指標兩兩之間大部分存在顯著的相關關系,室外光溫環境狀況對墻體蓄放熱量有影響。但由于4項室外光溫環境變量和2項墻體集放熱量之間存在顯著的相關關系,說明各指標內部間存在相互影響,因此采用降維的典型相關分析方法進一步分析其中的相關性。
2.3 溫室外光溫環境參數與墻體集放熱量典型相關分析
為減少溫室內外環境指標內部相互影響程度,將室外環境參數(室外日最高氣溫、室外日最低氣溫、室外日平均溫度、室外太陽總輻射日積累量)作為M組變量,墻體集放熱量(墻體集熱日總量、墻體放熱日總量)作為N組變量。借助主成分分析方法尋找出2組變量的線性組合,綜合分析2組變量間的整體關系。通過檢驗典型相關系數的顯著性,確定保留典型變量的對數(表2)。
根據P值大小,只有第1對典型相關系數在0.01水平下是顯著的。第1對典型變量間的相關系數為0.92,表明室外光溫環境參數和墻體集放熱量具有顯著相關性。計算得出來自于M組的第1對典型變量U為:
U=0.752T-0.254T-0.524T+0.734Q。(5)
來自于N組的第1對典型變量V為:
V=0.672Q+0.435Q。(6)
在光溫環境參數的第1對典型變量組合U中起主要作用的是室外日最高氣溫和室外太陽總輻射日積累量。墻體集放熱量的第1對典型變量組合V中墻體集熱日總量的系數為0.672,墻體放熱日總量的系數為0.435,表明室外日最高氣溫和太陽總輻射對墻體集放熱量有顯著影響,均呈顯著的正相關關系。
2.4 溫室外光溫環境參數與墻體放熱量回歸分析
利用主成分回歸方法基于2019年冬季數據建立關于室外天氣情況和日光溫室墻體放熱量的回歸方程,表1顯示,室外環境指標各變量之間存在顯著相關性,如果變量間存在較強的相關性,直接做回歸得到的結果是不科學的。通過共線性診斷計算,室外日最高氣溫方差膨脹因子為20.36,室外日平均溫度方差膨脹因子為44.09,均大于10,與其他變量間存在較強的多重共線性。首先對自變量進行主成分分析,然后再進行逐步回歸對變量進行篩選。由表3可以看出,前2個主成分特征值均大于1且累計方差貢獻率達到96.526%,包含了室外光溫環境參數大部分信息。
根據主成分因子載荷矩陣和特征值的計算,得出對應的單位特征向量,可以計算出室外光溫環境參數主成分表達式。第1對主成分表達式為:
F=0.574T+0.526T+0.614T+0.117Q。(7)
第2對主成分表達式為:
F=0.197T-0.384T-0.029T+0.912Q。(8)
主成分回歸方程:
Q=-0.032F+0.121F。(9)
標準化回歸方程:
Q=0.008T-0.063T-0.023T+0.106Q。(10)
還原標準形式:
Q=0.331T-4.205T-1.336T+5.441Q+1 269.681。(11)
主成分回歸結果均方根誤差為0.14 MJ/m,平均絕對百分誤差為12.03%,確定系數為0.915。
利用同一數據,采用偏最小二乘回歸建立墻體放熱量模型。室外日最高氣溫、室外日最低氣溫和室外日平均氣溫綜合描述了1 d內溫度的變化情況,加入太陽總輻射參數體現了室外環境綜合變化情況。計算得標準化回歸方程:
Q=0.231T-0.322T+0.041T+0.047Q。(12)
還原標準形式:
Q=9.576T-21.504T+2.312T+2.398Q+1 181.332。(13)
偏最小二乘回歸結果均方根誤差為0.09 MJ/m,平均絕對百分誤差為9.48%,確定系數為0.953。與主成分回歸方法相比,偏最小二乘方法擬合出了較優的多元方程關系,回歸模型描述試驗數據具有較高的準確度。利用建立的偏最小二乘回歸模型對2021年1月數據進行驗證,結果如圖2所示,RMSE=0.12 MJ/m,MAPE=10.83%,R=0.921,除了少數特殊異常天氣情況,方程達到了較高的擬合度。
3 討論與結論
3.1 討論
為了進一步研究該模型的預測效果及其在溫室加溫中的應用,選取2021年冬季12月第1周的日光溫室內外環境數據(圖3),實測墻體平均日累計放熱量為1.42 MJ/m,采用偏最小二乘方法計算墻體平均日累計放熱量為 1.45 MJ/m,每天熱量變化如圖4所示。
日光溫室夜間能量來源主要為墻體放熱,但在寒冷冬季,該熱量往往滿足不了加溫需求,因此需要結合溫室采暖熱負荷確定額外加溫量。在本研究中,采用文獻[24]中的溫室采暖熱負荷計算方法。計算過程中的參數設置為:(1)日光溫室內最低溫度,根據越冬茬黃瓜夜間適宜溫度需求,設置為15℃;(2)試驗日光溫室前屋面保溫被為黑色無紡布、珍珠棉和再生棉針刺氈組合材料,傳熱系數取為1.21 W/(m·℃);(3)根據溫室使用年限及維護情況,冷風滲透量換氣次數為0.8次/h;(4)地面傳熱量采用分區傳熱系數確定;(5)墻體按照實測墻體放熱加溫室內空氣處理,無散熱損失;(6)由“1.2”節中的數據采集設備所測試的夜間溫室內溫度為參考,如低于15℃則判斷為需要加溫,測試的室外氣溫為輸入條件。
這7 d內,每天室外氣溫變化及采暖熱負荷如圖3所示,平均地面采暖熱負荷為54.58 W/m,其中日光溫室前屋面散熱量平均占比為59.11%、冷風滲透損失熱量平均占比34.66%、地中傳熱損失熱量平均占比6.23%。為方便與墻體放熱量進行比較,將地面的加熱量進行折算,夜間平均日額外加熱量為2.97 MJ/m,額外加熱量為墻體放熱量的2倍(圖4)。
采用偏最小二乘回歸法結合天氣預報,可以準確預測和評估墻體放熱量情況。若夜間墻體釋放的熱量達不到溫室內作物生長發育的溫度條件,可以采取臨時加溫措施進行室內加溫,加溫總量可利用本模型計算得出。此外通過加強溫室日常維護工作,清除膜上的灰塵,增加膜的透光率,進而增加溫室內部自身蓄熱量,也可以有效減少溫室夜間加溫能耗。
3.2 結論
針對光溫環境數據的質量情況,提出人為假設含有5%缺失率的數據集虛擬構建方法,通過評估均值法、多重插補法、聚類填充法3種方法的處理,聚類填充法的均方根誤差為1.82℃,為3種方法中最優。采用聚類填充法處理缺失值和異常值432個,該方法以數據整體分布分簇插值,適用于溫室環境類時間序列數據的清洗處理。
通過相關分析探明了溫室內外光溫環境參數之間的權重系數,環境特征變化規律聯系緊密。典型相關分析計算得出室外光溫參數和墻體放熱量指標相關系數,為0.92,達到極顯著相關性,為定量室外光溫參數和墻體放熱量研究提供了回歸分析基礎。
通過比較主成分回歸與偏最小二乘回歸2種方法的回歸準確度,確定了采用偏最小二乘回歸方法,獲得了墻體放熱量與室外光溫參數的多元方程表達式,模擬值與實際觀測值確定系數達到0.953,具有較優的擬合度。該回歸模型綜合了室外光熱環境特征的信息規律,通過氣象預報,可以用于模擬預測墻體放熱量情況,確定日光溫室額外加熱量。
本試驗只研究了室外光溫環境參數和墻體放熱性能的關聯性,但在實際生產過程中受農事操作等因素影響,日光溫室內熱量傳遞過程更為復雜。因此,建議在溫室數據信息挖掘方面開展進一步的研究,分析環境數據、生產管理數據(通風口、保溫被等控制設備)之間的隱性互作規律,墻體放熱量預測將更加準確。
參考文獻:
[1]束 勝,康云艷,王 玉,等. 世界設施園藝發展概況、特點及趨勢分析[J]. 中國蔬菜,2018(7):1-13.
[2]李光聚,劉天英,李秀欣,等. 壽光日光溫室的發展歷程及創新點[J]. 中國蔬菜,2019(10):14-18.
[3]王少杰,張廣鵬,劉 鑫,等. 日光溫室裝配式土質夾心墻體熱濕遷移及蓄放熱性能[J]. 農業工程學報,2019,35(23):209-217.
[4]佟國紅,Christopher D M. 日光溫室墻體蓄放熱層溫度變化規律研究[J]. 農業工程學報,2019,35(7):170-177.
[5]白 青,張亞紅,劉佳梅. 日光溫室土質墻體內溫度與室內氣溫的測定分析[J]. 西北農業學報,2009,18(6):332-337.
[6]李建設,白 青,張亞紅. 日光溫室墻體與地面吸放熱量測定分析[J]. 農業工程學報,2010,26(4):231-236.
[7]李小芳,陳青云. 墻體材料及其組合對日光溫室墻體保溫性能的影響[J]. 中國生態農業學報,2006,14(4):185-189.
[8]史宇亮,王秀峰,魏 珉,等. 日光溫室土墻體溫度變化及蓄熱放熱特點[J]. 農業工程學報,2016,32(22):214-221.
[9]彭東玲,張 義,方 慧,等. 日光溫室墻體一維導熱的MATLAB模擬與熱流分析[J]. 中國農業大學學報,2014,19(5):174-179.
[10]張松蘭,王 鵬,徐子偉. 基于統計相關的缺失值數據處理研究[J]. 統計與決策,2016(12):13-16.
[11]任遠航. 面向大數據的K-means算法綜述[J]. 計算機應用研究,2020,37(12):3528-3533.
[12]楊俊闖,趙 超. K-Means聚類算法研究綜述[J]. 計算機工程與應用,2019,55(23):7-14,63.
[13]魏玉龍,張秋良. 興安落葉松林緣天然更新與立地環境因子的相關分析[J]. 南京林業大學學報(自然科學版),2020,44(2):165-172.
[14]劉鴻斌,宋 留. 廢水處理過程的典型相關分析建模方法研究[J]. 山東大學學報(工學版),2020,50(1):101-108.
[15]李 博,陳 威,付 強,等. 黑龍江省環境空氣污染物和氣象要素的典型相關分析[J]. 中國環境監測,2021,37(3):103-108.
[16]姜懿芮,段玉聰,王 勇,等. 大數據在日光溫室蔬菜生產中的應用[J]. 中國瓜菜,2019,32(1):42-44.
[17]袁紅春,劉 慧,張 碩,等. 基于深度學習和典型相關分析的漁情預測方法[J]. 大連海洋大學學報,2021,36(4):670-678.
[18]He F,Ma C W. Modeling greenhouse air humidity by meansOf artificial neural network and principal component analysis[J]. Computers and Electronics in Agriculture,2010,71:S19-S23.
[19]李 寧,申雙和,黎貞發,等. 基于主成分回歸的日光溫室內低溫預測模型[J]. 中國農業氣象,2013,34(3):306-311.
[20]劉亭亭,于曉輝,呂大剛. 基于偏最小二乘回歸的地震動復合強度參數構造與統計性分析[J]. 建筑結構學報,2020,41(S1):406-416.
[21]羅博煒,洪智勇,王勁屹. 多元線性回歸統計模型在房價預測中的應用[J]. 計算機時代,2020(6):51-54.
[22]白青華,王惟晨. 張掖日光溫室最低溫度預報模型的主成分回歸法構建[J]. 中國農學通報,2015,31(32):223-228.
[23]楊曉軍,韓林君,張君霞,等. 基于偏最小二乘回歸方法的西北區寒潮延伸期預報[J]. 大氣科學學報,2021,44(3):371-380.
[24]薛東巖,黃光潔,陳啟永,等. 溫室大棚采暖熱負荷計算[J]. 吉林農業,2016(23):58.