趙立安,李修華,周永華,馬紹對,黃忠華,羅維鋼
(1.廣西大學 電氣工程學院,南寧 530004;2.南寧市灌溉試驗站,南寧 530001)
物聯網概念于1999年由美國麻省理工學院提出[1],之后物聯網技術得到了迅速的發展,在工業,醫療,安全工程上得到了廣泛的應用,農業物聯網是物聯網應用的重要發展方向之一,將物聯網技術應用在農業領域將為農業的發展帶來了不可估量的推動力和無可限量的前景[2,3]。在農業的生成過程產生的數據具有數量巨大、結構復雜、類型繁多、價值密度低、產生數度快的特點[4]。所以在對生產過程中的大量數據分析是非常必要的。
在國外,韓國、以色列通過建設農業物聯網科技創新服務體系,大大促進了農業物聯網技術的研發、推廣和應用[5],Yunseop等[6]通過無線傳感器網絡、差分全球定位等技術設計了一種可遠程監測農田現場數據并可實時控制的精密變量灌溉系統,同時定點監測6個農場的田間土壤參數,并以無線方式發送到基站以進行科學決策和精確控制。國內,夏于等[7]設計了一種基于物聯網的小麥苗情遠程診斷管理系統,通過對遠程監控節點動態數據的采集計算并進一步對小麥的生理生態特性、作物氣象災害等指標分析融合,對小麥生長生產過程和主要氣象災害進行精確監測、快速準確診斷,提供綜合分析結果和生產管理調優方案。吳秋明等[8]設計了一種為棉花灌溉決策與管理提供支持的基于物聯網的棉花智能化微灌系統,并在新疆庫爾勒棉花智能化膜下滴灌示范區的實際應用中取得了良好效果。張帆等[9]針對江西丘陵地區作物種植分布廣、布線和供電困難等特點,利用智能氣象站和高精度土壤溫濕度傳感器等設備建立了基于物聯網技術的土壤墑情監測系統,為農田精準灌溉和節水、農業抗旱減災提供技術支持和決策參考。
雖然在國內外對農業物聯網的大數據分析都取得不錯了的進展,但是在農業物聯網發展的過程中如何對生產過程中采集到的大量數據進行處理、分析和顯示,使其更好地為農業服務仍然是急需解決的關鍵問題。本文通過在南寧市灌溉實驗站火龍果實驗田安裝農田物聯網系統,長期對實驗田空氣溫濕度,CO2濃度,光照強度,土壤水分,土壤溫度,以及影像進行監測,對采集到的環境數據采用決策樹分類的方法進行數據挖掘分析,并結合當地氣象數據,為火龍果的種植管理提供科學依據。
物聯網系統主要由數據采集模塊、數據傳輸模塊、上位機遠程監控模塊三部分組成,框架如圖1所示。數據采集模塊主要包含多個傳感器構成的無線傳感器網絡模塊,影像采集模塊和電源模塊,無線傳感器模塊主要是用來獲取火龍果實驗田實時環境數據,影像采集模塊主要用來拍攝火龍果實驗田的實時環境情況。之后通過數據傳輸模塊中ZigBee無線網絡技術和3G網卡分別將環境數據和圖片傳輸到上位機中,最后通過上位機監控平臺實時查看從火龍果實驗田返回的環境數據和影像圖片。

圖1 農田物聯網監控框架Fig.1 The monitoring framework of the farmland IoT
1.1.1數據采集模塊
無線傳感器模塊主要選用了DS18B20土壤溫度傳感器,MS-10土壤水分傳感器,SHT10_SHT11數字溫濕度傳感器,MH-Z14CO2濃度傳感器以及BH1750光照度傳感器,用來監測火龍果實驗田的空氣溫濕度,CO2濃度,光照強度,土壤水分,土壤溫度。工業相機選用的是深圳市浩鑫網景網絡技術有限公司生產的NV201E工業攝像機。
電源模塊采用光伏供電,選用15 W最大輸出電壓18.5 V最大輸出電流1.08 A太陽能電池板,選用12V12AH膠體免維護蓄電池可長期在戶外使用,連續陰雨天也可以保證持續供電,采用的太陽能控制器是30A PWM Solar Panel Charge Controller,主要用來調節功率,提供電路保護功能防止反接、短路及過流。
1.1.2數據傳輸模塊
選用CC2530芯片作為傳感器節點,因為火龍果實驗田傳輸的環境數據不大,利用ZigBee這種通信數據量不大、低數據傳輸率、低成本、低功耗而且具有安全可靠性的這種無線通信技術,作為該無線傳感器網絡的組網通信方式最為合適的,而CC2530支持最新的ZigBee協議----ZigBee 2007/PRO,ZigBee 2007/PRO相對于以前的協議棧具有更好的互操作性、節點密度管理、數據負荷管理、頻率捷變等方面有重大進步,且具有支持網狀網絡和低功耗特點。使得運用CC2530設計出來的節點通信距離更遠,組網性能更穩定可靠。作為與上位機之間通信的模塊選用的是GPRS和3G網卡。在火龍果實驗田總共安裝了5個傳感器節點,節點位置如圖2所示。

圖2 節點安裝位置Fig 2 Node installation location
1.1.3上位機遠程監控模塊
本系統采用了服務器端分布式中間件,主要功能是銜接上位機客戶端(含手機監控軟件、PC 監控軟件、Web 監測系統等)與下位機實現數據的上下行通信,以及數據格式解析、存儲,可部署在云端任意計算機;下位機硬件系統是 TCP/IP 協議中的客戶端,中間件計算端是服務器端。云端 Web 系統,采用 Web Service 與中間件實現通信,采用 XML 技術與其他平臺交換數據與存儲數據,并以網頁的方式將數據數字化、圖表化呈現,可部署在云端任意計算機。數據查詢界面如圖3所示。

圖3 農田物聯網遠程數據查詢主界面Fig.3 The remote access interface of the farmland IoT system
氣象數據來自中國氣象科學數據共享服務平臺提供的API接口,訪問API接口獲得返回的Json數據,通過JAVA語言解析Json數據獲得實時的南寧氣象數據,將解析的氣象數據提取研究需要的溫度、降雨量、氣壓、濕度等部分,通過Tomcat發布到服務器上,用于歷史和實時數據查詢,查詢界面如圖4所示。

圖4 農田物聯網氣象數據查詢界面Fig.4 The meteorological data query interface of the farmland IoT system
1.3.1數據預處理
研究數據為2017年5月25日到6月16日火龍果實驗田安裝的5個傳感器節點(節點1~5)獲取的空氣溫度、空氣濕度、CO2濃度、光照強度、土壤水分、土壤溫度6種數據。各節點每隔10 min采集一次數據。
從傳感器采集的原始數據包含大量的冗余、錯誤、缺失的數據,因此需要對原始數據進行清洗,也就是數據的預處理,主要包括缺失值和噪聲的處理。
針對缺失值的處理方法主要包括刪除法和插補法。通過分析本實驗數據發現獲取的傳感器節點數據缺失率較低且數據量巨大,因此采用刪除法對原始數據進行處理,處理速度快同時也能夠很好的保證樣本數據的統計功效。
針對數據噪聲常用的處理方法有回歸法、均值平滑法、離群點分析及小波去噪等。由于研究選取的樣本數據具有連續性的特點,采用差值法對原始數據進行去噪處理,通過計算連續監測到的環境數據之間差值的絕對值大小,比較是否超出了正常數據的振蕩幅度,如果超出了就可以判定在這兩個連續獲取的數據之間存在一個異常點,分別將這兩個數據和相鄰的數據再做一次差值,如果又出現差值絕對值大小超過正常數據的振蕩幅度,就可以斷定這個數據是異常數據點,直接剔除異常數據。
1.3.2基于決策樹的數據挖掘分析
面對從火龍果實驗田獲取的大量環境數據,需要對這些環境數據進行挖掘分析,提取出對管理者有用的數據和結論。決策樹在數據挖掘分析中能夠很好地處理類別型或連續型變量的分類預測,決策樹通過不斷的劃分數據,是依賴變量的差別最大,最終目的是將數據分類到不同的組織或者分支中去。
決策樹運行流程圖如圖5所示,將訓練樣本的原始數據放入決策樹的樹根,原始數據分成兩組,一組做訓練組數據一組做測試組數據,用訓練組的數據建立決策樹,在每一個內部節點采用信息論的方法來作為分割的依據,使用測試組的數據來對決策樹進行修剪。通過不斷的循環分組,分割,修剪,直到內部的節點全為樹葉節點,這時候決策樹完成了分類,可將每個分支的樹葉節點萃取出知識規律。

圖5 決策樹運行流程圖Fig.5 The decision tree operation flow chart
為了評價決策樹分類模型的可靠性,采用混淆矩陣(如表1所示)對分類結果進行評估,并采用正確率(Accuracy)、精度(Precision)作為分類模型的評價指標。

表1 二類問題的混淆矩陣Tab.1 Confusion matrix of two types of problems
TP(True Positive):指模型預測為正(1)的,并且實際上也的確是正(1)的觀察對象的數量。TN(True Negative):指模型預測為負的,并且實際上也的確是負的觀察對象的數量。FP(False Positive):指模型預測為正的,并且實際上也的確是負的觀察對象的數量。FN(False Negative):指模型預測為負的,并且實際上也的確是正的觀察對象的數量。
正確率是指模型能正確預測、識別1和0的對象數量與預測對象總值的對比,精度是指模型正確識別為正(1)的對象占模型識別為正(1)的觀察對象總數的比值。這兩個指標可以很好的反映分類模型的性能和預測能力。二者的計算放入如式(1)與式(2)所示。
(1)
(2)
2結果與討論
以6月3日的光照度數據為例,圖6顯示了采用差值法預處理前后的數據比較結果。由于本次采用的光照度傳感器的量程僅為1~65 535 lux,在中午太陽最強的時刻出現飽和。但火龍果是陽性植物,其光飽和點在20 000~25 000 lux左右,因此數據出現飽和不會明顯影響對火龍果生長環境的評價。從圖6(b)可以看出,預處理后的光照度曲線減少了大量毛刺,更加平滑。

圖6 6月3日光照強度曲線預處理前后對比圖Fig.6 The illuminance curves on June 3rd before and after pretreatment
火龍果植株根淺,但吸收能力強,如果土壤中含水量過大,會使火龍果吸收水分過多導致果裂,如果長時間田間積水會導致火龍果根部腐爛,對火龍果的正常生長產生影響。如圖7所示,火龍果實驗田6月6-10日土壤容積含水量變化圖,可以明顯的看出,在6日下午的2點20分土壤容積含水量升高,并且在接下來幾日,其容積含水量一直保持在35%~38%的水平,可能存在積水的現象。根據實驗田的圖像監控系統拍攝的圖片(圖8),可以看出該時期火龍果實驗田的確出現積水現象,且根據氣象數據查詢平臺查詢的氣象數據得知,后續幾日的確處于連續降雨的天氣。由于本實驗田為水田改造而來,排水設施不到位,長時間的降雨使得火龍果實驗田的積水無法通過地面徑流及時排除,所以需要及時對火龍果實驗田進行人工排水,以保證實驗田的環境適合火龍果的生長。

圖7 6月6-10日火龍果實驗田土壤容積含水量曲線圖Fig.7 Soil moisture curve of the Pitaya field during June 6th-10th

圖8 物聯網系統獲取的6月10日當天的田間圖像Fig.8 The field image acquired on June 10th by IoT system
火龍果的生長受多方面環境因素的影響。已知火龍果生長最適宜的空氣溫度為25~35 ℃,在高于38 ℃時火龍果停止生長,高于40 ℃會對火龍果樹產生損害;最適宜的空氣濕度為60%~70%;由于火龍果是陽生植物,光飽和點在20 000~25 000 lux,白天光照大于8 000 lux為最佳,低于2 000 lux時對火龍果的生長會產生影響。只對單一環境數據進行統計分析,不能完全滿足管理者的需求。因此,本研究將空氣溫度、空氣濕度、光照強度這3個因素合并為一個整體,作為一個樣本來進行綜合分析。首先對訓練樣本進行標記,樣本中任何一個因素超出火龍果生長適宜范圍時將其標記為“不適宜”,反之標記為“適宜”。然后采用決策樹分類的方法,將標記好的樣本數據作為決策樹的原始數據,將原始數據分為訓練集和測試集。實驗首先選取6月3-5日傳感器節點獲取的419條樣本數據進行標記,并作為決策樹分類模型的輸入。決策樹分類方法在MATLAB中實現,其中隨機選取50%作為訓練樣本,50%作為測試樣本。測試集的正確率如表2所示。

表2 決策樹測試集正確率統計結果Tab.2 The accuracy result of the testing set by decision tree
由上文提供的計算公式可得,模型的測試集正確率為0.990 4,精度為0.993 9。為了更好地驗證決策樹分類模型的可靠性,實驗還進一步選取了6月7-10日的358條傳感器節點數據,對該決策樹模型進行了驗證,驗證結果的正確率為100%。實驗結果顯示,決策樹模型對火龍果實驗田環境適宜或者不適宜的預測具有很高的正確率和精度,管理者可以通過決策樹分類模型的預測結果實現對火龍果實驗田環境變化的預警,以更好的管理火龍果的生長,為火龍果的生長提供最適宜的生長條件。
通過在南寧灌溉實驗站搭建農田物聯網系統,對火龍果實驗田的空氣溫濕度、CO2濃度、光照強度、土壤水分、土壤溫度等參數進行了監測采集。對獲取的大量原始數據進行數據清洗,將清洗后的數據采用圖表化呈現,能夠有效地反映火龍果實驗田的生長環境變化,通過觀察火龍果生長環境的變化,能夠發現火龍果的生長環境是否發生異常變化。由于單一數據的觀察分析不能完全滿足管理者的需求,實驗采用決策樹方法對數據集進行“適宜生長”與“不適宜生長”的分類。選用6月3-5日傳感器節點的419原始數據進行了決策樹分類模型的建模及測試,測試集的正確率為0.990 4,精度為0.993 9,并采用6月7-10日的358條傳感器節點數據,對該決策樹模型進行了驗證,驗證結果的準確率高達100%。可以得出,決策樹分類模型具有可行性,能夠很好地為作物生長環境變化提供科學的指導意見。
參考文獻:
[1]Biggs P,Srivastava L. ITU Internet reports 2005: the internet of things[M]. Geverna: International Telecommunication Union,2005.
[2]汪懋華. 物聯網農業領域應用發展對現代科學儀器的需求[J]. 現代科學儀器,2010,(3):5-6.
[3]鄭小芳,張鈞媛. 農業物聯網發展模式淺析[J]. 中國電子科學研究院學報,2014,(3):250-254.
[4]李春輝. 大數據在農業物聯網中的應用研究[D]. 黑龍江齊齊哈爾:齊齊哈爾大學,2015.
[5]肖黎,劉純陽. 發達國家農業信息化建設的成功經驗及對中國的啟示----以美日法韓四國為例[J]. 世界農業,2010,(11):16-20.
[6]Yunseop K,Evans R G, Iversen W M. Remote sensing and control of an irrigation system using a distributed wireless sensor network [J]. IEEE Transac. Instrument Measure, 2008,57(7):1 379-1 387.
[7]夏于,孫忠富,杜克明,等. 基于物聯網的小麥苗情診斷管理系統設計與實現[J]. 農業工程學報,2013,(5):117-124.
[8]吳秋明,繳錫云,潘渝,等. 基于物聯網的干旱區智能化微灌系統[J]. 農業工程學報,2012,(1):118-122.
[9]張帆,肖志鋒. 基于物聯網技術的江西丘陵地區土壤墑情監測[J]. 農業工程,2013,(5):53-54.