姚忠毅,任利峰
(吉林農業科技學院,吉林 吉林 132101)
基于KNN-SVM算法的溫室番茄生長預測模型的設計與運用,能夠24 h實現對大棚番茄生長環境數據進行采集,并生成番茄生長預測模型。其中,番茄的生長觀察對于溫室大棚中番茄優化管理和產量的提升有著至關重要的作用。其中,果實橫向直徑與縱向直徑是作物生長的關鍵因素[1-2]。生長模型是以系統分析和數學模擬來定量描述生物的生長和發育以及形態建成過程,反映生物內外環境對生長發育的影響,是植物果實發育研究的重要內容和手段[3-6]。基于KNN-SNM模型的大棚番茄生長預測模型的建立,對于我國大棚番茄種植起到了重要的數據及技術支撐。SVM算法模型和KNN算法模型在機器學習中充當著重要的組成部分。其中,SVM算法支持向量機,其核心算法十分強大;KNN算法模型則為最簡便的機器學習算法。通過二者的有機結合,使得在數據分析以及模型建立上,變得更加快捷、清晰。我國作為世界第一大番茄生產、出口國,對于番茄的科學種植迫在眉睫。
基于KNN-SNM模型的大棚番茄生長預測模型的建立,對于我國大棚番茄種植起到重要的數據及技術支撐。主要的實施方案分為:(1)SVM算法的設計與改進,SVM的基本原理是在高維空間中構造一個最優超平面,從而實現對數據的分類。使得采集的數據能夠得到更加靈活快速的分析。(2)對番茄生長數據進行采集,通過大棚中的溫度、濕度、空氣質量、光照強度、土壤質量等有關數據傳感器來采集大棚中的環境數據與番茄生長數據,利用大棚中有關數據傳感器采集的數據為基礎,并收集番茄生長的環境數據,來判斷溫室番茄最適宜的生長環境。(3)大棚番茄生長預測模型的建立,對采集到的環境數據與番茄生長數據進行數據模擬,以溫度、濕度、光照強度、二氧化碳和生長天數為輸入,預測果實增量變化,通過設置多種環境參數梯度試驗,分析番茄果實直徑數據和莖直徑數據[7-8]。
(1)實現核函數緩存,皮爾遜相關系數是用來解釋2個隨機變量之間的線性相關程度,其值介于-1~1。設有2個變量X、Y,則X、Y之間的皮爾遜相關系數的關系如下:
(2)進行優化誤差值求解,在SVM模型中,首先實現了核函數緩存,對開銷最大的核函數計算進行緩存,提升了20倍效率。然后,進行優化誤差值求解:
(3)對算法進行分析改進,給g(x)求一個關于a的偏導,若變化了步長delta,即所有樣本對應的g(x)加上一個delta乘以針對的偏導數即可。每次成功更新一對以后,更新所有樣本對應的g(x) 緩存,通過每次迭代更新g(x),避免了大量的重復計算。隱藏層即一個或多個包含若干神經元的隱藏層,可以根據問題的復雜性選擇隱藏層的數量和大小。
綜合番茄溫室環境、精準性、測量范圍以及可靠性等因素選取以下幾種傳感器:土壤濕度傳感器、 二氧化碳濃度傳感器、空氣溫度傳感器。并進行如下分析,分為4個步驟:
(1)對大棚番茄與大棚內溫度、濕度、二氧化碳濃度的數據進行傳感器采集。
(2)將各傳感器采集到的數據上傳到終端,分別進行識別與處理,保留有效數據并使用最小二乘法對異常數據進行處理及特征提取。
(3)采用主成分分析、多重共線性分析、回歸分析等統計分析結合的算法進行挖掘分析。
(4)利用 SVM 算法多傳感器數據與生長參數的關系進行數據融合,構建生長模型。
針對當前大棚番茄數據收集過程中,可能會造成數據丟失或數據異常,需要對異常數據進行處理。同種傳感器的多點測量,對采集到的數據特征進行處理,增強其相關性。在綜合分析當前作物生長數據研究現狀,使用KNN算法進行長勢特征數據進行分析,并建立基于主要環境因子的大棚番茄不同時期生長模型。例如生成每日空氣相對濕度檢測模型,如圖1所示。

圖1 每日病蟲害檢測
經上述方案的實施及優化,通過數據可視化技術,將大棚番茄生長預測模型以圖像形式展現出來,并結合KNN-SVM算法,實現隨時監測、隨時生成的功能,并通過相關科學數據制定大棚番茄生長環境臨界點。超出或低于科學范圍值則立即生成模型圖,并進行報警,方便工作人員及時調控相關參數,以使大棚番茄達到更高產和最佳質量的理想狀態。
本文首先收集了豐富的番茄生長數據,并對其進行了預處理和特征提取。然后,使用KNN算法對數據進行了分類,為番茄生長情況建立了相似性模型。接著通過SVM算法,構建了一個高維的邊界,使得不同生長情況能夠被更準確地分類。研究結果表明,基于KNN-SVM算法的大棚番茄生長預測模型在準確性和穩定性方面都取得了顯著的進展。在實際應用中,希望該模型能夠為農業生產提供更多的支持和指導,促進作物的高效種植和生長。