張顥瑋 桑世慶 陳 祥
(嘉興職業技術學院,浙江 嘉興 314036)
隨著土壤數據采集技術的迅猛發展,處理、存儲以及獲取數據的成本不斷降低,運用傳統方法已不能有效地對藏紅花栽培過程中的海量數據進行分析、融合及深度挖掘。因此,亟需利用云計算、數據挖掘以及多元統計分析等技術將時間、空間與屬性注入藏紅花栽培的全過程研究中,構建面向對象的時空特征分析模型,對自然環境、經濟等多元異構時空數據信息進行重組和融合,以實現數據綜合分析與多維可視化表達的目標,為藏紅花栽培風險評價及修復等工作奠定基礎。
結合區域藏紅花栽培分部情況,以藏紅花種植的土壤環境為背景,重點采集生長過程中土壤的養分。通過傳感器動態收集土壤酸堿度、溫濕度;周期測試土壤中氮、磷以及鉀等有機質的含量;結合藏紅花栽培自然環境信息數據進行整理和綜合,初步收集、整理數據后,將其作為基礎大數據集合。經過對數據的理解和處理,獲取基于新技術分析的樣本數據。
該文主要應用理論與實際相結合的方法,利用物聯網技術、大數據技術、云計算以及多元數學統計分析等技術,將時間、空間與屬性注入藏紅花栽培環境監測研究與多維可視化中,運用大數據開發平臺、物聯網數據采集設備等軟硬件技術構建一體化藏紅花栽培大數據服務平臺,實現面向對象土壤養分的時空特征分析模型。采集的數據包括靜態歷史數據和實時采集的動態傳感器數據,主要方式是利用已知的數據環境因素對藏紅花生長的歷史數據進行整理以及建立基本屬性,利用分類與決策樹,并運用數據挖掘技術處理海量數據,分析周期土壤養分的時空變化特征,進而揭示藏紅花種植過程中出現低產、少花和無花等原因,并用實際的結果來驗證該平臺的可行性。設計平臺架構如圖1所示。

圖1 平臺的架構
物聯網采集主要具備精細化、數字化管理的功能。通過信息傳感設備獲取物理農業的各種信息,結合LoRa通信進行信息傳輸與交互,對藏紅花生產過程中生長與自然界的多種相關因素進行數字化采集,其中包括溫濕度、土壤酸堿度等。
云平臺可以構建物聯網數據中心群集,對數據進行存儲與運算;數據挖掘對數據中心數據進行整理,建立高效的數據指標體系,利用先進的事件模型抽象生產應用,提供多維度、多指標的交叉分析能力,全面滿足藏紅花的日常數據分析需求,驅動業務決策。
藏紅花栽培監測平臺主要具備大數據監測、可視化分析和成果監測的功能,直觀地揭示了藏紅花種植的規模、發展趨勢以及傳感器的分布;它還具有實時監控、監測曲線、時段統計、統計排名、歷年分析以及關聯挖掘等功能,可直接統計相關數據。
從傳感器、測試儀和專家經驗等途徑獲得的多源異構數據中抽取、整理、分類、組合轉換并建立數據集;面向藏紅花栽培土壤環境建立數據分析集,并選取數據挖掘中的決策樹、模糊評價算法等方法處理海量數據,并通過測試比較應用不同算法的優缺點,找到合適的算法,建立流失預測模型。最后對模型進行分析和評估,并用于實際的預測中。藏紅花栽培預測模型分析如圖2所示。

圖2 分析模型構建
藏紅花栽培模型根據區域氣象條件、季風特點、土壤有機質條件以及管理方案動態、定量地描述藏紅花的生長、發育過程。用數學方程描述作物、氣候和土壤之間的作用過程,構建模型最重要的意義是綜合整個藏紅花栽培過程的專業知識,并量化藏紅花生長過程與氣象、土壤的相互關系,即利用大數據挖掘滿足一定條件的依賴性關系。模型是利用大數據系統強大的信息處理和計算功能,系統地對不同生長過程進行整合和分析,相當于對系統的最新的知識進行積累和綜合。推理出數據間未知的依賴關系,并將其描述成關注數據項間的因果關系。構建模型的作用如下。
通過分析模型的基本功能可以模擬預測不同時間、不同強度藏紅花栽培和環境調控措施對作物生長發育的作用(例如作物花蕊品質、產量以及上市期),因此成為可以有效優化藏紅花栽培和調控環境的工具。其更大的價值則是可以為國家或地區的特色農業規劃及作物生產的選種,特別是對農業經濟政策的選擇提供決策支持。
藏紅花栽培模型在幫助理解藏紅花生長過程及其與影響因子間定量關系的基礎上,可以對系統過程和結果進行模擬預測。藏紅花栽培生長模型的預測功能既是建立模型的原動力之一,也是其成為作物生產管理決策工具的重要原因。
藏紅花栽培生長模型對生長發育生態過程的數字化描述可以促進對藏紅花生長發育生態規律由定性描述階段上升到定量分析階段,為特色農作物的精確化、標準化以及智能化管理提供理論依據。使研究人員可以對農作物系統的行為進行定量分析。通過藏紅花模型可以對作物的生長發育過程及產量進行預測,還可以對未來全球氣候變化對藏紅花栽培的影響進行評估。
在遠距離傳輸通信技術中,雖然NB-IoT和5G網絡都可實現遠距離傳輸通信,但實現的成本與后期運行維護投入的成本都較高,而LoRa在全球范圍內免費使用,即使在情況較為復雜的城區,其傳輸距離也可達2 km~5 km,在農村的通信距離可達15 km,適合在農業生產中應用。另外,ZigBee技術雖然同樣可進行遠距離通信,但長距離傳輸需要增設更多子節點和中繼器等設備,不但增加了投入成本,而且更不利于系統維護,同時ZigBee采用的頻率為2.4 GHz,該頻率在傳輸過程中容易受到其他無線通信技術的干擾,從而導致數據傳輸延遲或丟失,但在近距離通信中具有一定優勢。由于藏紅花栽培分為室內、室外2個生長過程,因此系統采用LoRa和ZigBee無線通信技術作為數據通信方式,經驗證,所設計的數據實時采集方案是完全可行的。
該系統采用的是溫濕度、pH值、土壤微量元素、光照傳感器和符合IEEE的無線通信協議的芯片,芯片傳輸距離符合實際的應用需求,該芯片使用性能穩定且功耗低,因此LoRa模塊采用安信可公司生產的Ra-o1型模塊,其射頻芯片SX1289主要采用LoRa遠程調制解調器,可用于遠距離的擴頻通信,抗干擾能力強。LoRa模塊通過SPI總線與PCIE插槽相連,進而通過底板與主控進行連接。在ZigBee模塊中采用了CC2530的模塊,CC2530模板的特點是分為核心板和擴展板2個部分。通過核心板和擴展板完成設備之間的無線低功耗通信。pH值傳感器采集流程如圖3所示。
以“愛國、清貧、創造、奉獻”為主體的方志敏精神,它凸顯了社會主義榮辱觀的本質內涵。用方志敏自己概括和倡導的“五種精神”來講,即贛東北蘇維埃政府所具有的“民主精神”、“創造精神”、“進步精神”、“刻苦精神”和“自我批評精神”(《我從事革命斗爭略述》)[8](P88),這些精神是中華民族道德傳統和中國共產黨人革命精神相融合的結晶,基本體現了社會主義榮辱觀各方面的內容,也是加強社會主義榮辱觀教育的極好教材。

圖3 pH值傳感器采集流程圖
系統邊緣設備采用了融合網關,集成LoRa和ZigBee通信技術,并采用了嵌入式安卓系統的7寸觸模屏。網關中ZigBee模塊作為協調模式,接收第一年10月到第二年3月藏紅花室內栽培的監控數據,包括溫濕度、pH值傳感器,并與ZigBee終端節點模塊相連,實時采集動態數據;網關中LoRa模塊作為集中器,接收第二年4月到9月藏紅花室外栽培的監控數據,包括土壤酸堿度、溫濕度,并與LoRa終端節點模塊相連,適合中長距離的數據采集。網關的嵌入式安卓系統編譯底層驅動,結合應用開發了能基于網關程序設置2種通信方式的參數和工作模式,并對統一采集的數據進行格式轉化,實現基于云的邊緣計算,最終將數據傳輸至云端,并顯示在7寸的觸模屏上。
網關的重要作用是采集數據與轉換數據,主要實現以下3種功能。
3.2.1 從設備接收數據
設備和網關通過LoRa和ZigBee接口進行無線連接,當與傳感器終端連接時,主要實現傳感器路由、終端兩類節點單方面持續通過網關向服務器發送數據的功能。如果連接的類型是控制類節點,則需要通過設備申請從外部獲取數據,服務器向設備端發送數據時,就需要通過網關申請數據。
3.2.2 生成要發送的數據
從設備接收到數據后,就需要將數據轉換成能發送給服務器的格式,主要轉化成數值數據或者字符串格式。同時,在發送數據的過程中,對數據進行整合(以減少數據量)或者合并發送。
3.2.3 把數據發送到服務器
Web服務端通過約定的協議接收來自設備端的數據,協議包括HTTP協議、WebSocket以及MQTTP等,其中WebSocket是一種在單個TCP連接上進行全雙工通信的協議。MQTT是最近幾年出來的協議,MQTT協議能夠實現一對多通信,主要由發布者、訂閱者以及中介構成。中介承擔轉發MQTT通信的服務器作用[1],發布者和訂閱者發揮客戶端的作用。發布者是發送消息的客戶端,訂閱者是接收消息的客戶端。設備傳來的數據和Web傳來的數據是有差異的,大多數是傳感器數據、語音以及圖像等數值數據。與文本相比,這樣的數據更適合采用二進制形式對其進行處理。基于物聯網服務處理這些格式時,需要把文本數據轉換成數值數據和二進制數據(也是由于調用MessagePack函數發送的是二進制數據所造成的)。
服務器接收到數據之后,接下來就需要對數據進行處理。利用大數據的處理技術,按照數據挖掘的處理流程包括數據分析、數據加工、數據保存以及向設備端發送指令。對數據的分析與加工主要采用了“批處理”和“流處理”2種典型的處理方式。
4.2.1 批處理
批處理就是每隔一段時間處理一批積累下來的數據,例如在藏紅花栽培中物聯網采集的歷史數據及專家存入數據庫中的數據,需要隔一段時間就從數據庫獲取數據,執行處理操作。批處理的重點在于在規定時間內完成處理所有的數據的任務,因此數據的數據量越大,就需要性能越好的機器。要處理由數量龐大的設備發出來的傳感器數據和圖像等大型數據,就需要使用分布式處理平臺軟件高效地對數據進行處理。
4.2.2 流處理
流處理指不保存數據,按照到達服務器的順序依次對數據進行處理。流處理是一個有效的可以實時對數據做出反應的方法,可以處理控制傳感器實時采集的數據。批處理是先積攢數據,隔一段時間后再對數據進行處理,因此從數據存儲到處理完畢會出現時間延遲。而流處理這樣根據數據到達的順序依次對數據進行處理的方法就變得比較重要。流處理基本上不會保存數據,使用過的數據直接丟棄,只需要保存處理結果。
“反控”主要是指服務器端向設備端發送數據或者控制設備指令,服務端發送采取接收時的相應協議MQTT。藏紅花栽培中物聯網通信利用MQTT實現同步異步數據傳輸。在MQTT發送數據時,首先,設備作為訂閱者,向MQTT中介進行訂閱。其次,服務器作為發布者,向MQTT中介進行發布。在MQTT模式下,發送服務器只需要把確定的數據加在主題上發送就行了,服務器和設備之間無須知道對方的地址,只需要知道中介的地址即可。一旦訂閱者斷開,中介將肩負起斷開時的發送任務,在設備重連后再次發送數據。運用MQTT協議后,服務器反控下發數據到設備就變得更簡單了。
首先通過配置ID和KEY與云服務器進行連接,其次實時監聽數據,以獲取相關傳感器的數據并對其進行處理[2],終端應用層的作用是實現客戶端瀏覽器的可視化人機交互界面。可以在網頁端實時查看智能溫室內的環境數據,且可以發送命令控制溫室內的數值,從繼電器再到終端節點執行網頁端的命令,從而使農作物在最佳的生長環境中生長。在getConnect()函數中定義了實時連接對象rtc,當連接成功時,回調函數是rtc.onConnect;同時,數據服務器掉線,回調函數是rtc.onConnectLost,消息處理回調函數是rtc.onmessageArrive。
隨著智慧農業的發展,移動嵌入式系統、大數據挖掘以及傳感器網絡等技術在農業種植中廣泛使用,物聯網技術變得越來越重要,它可以實現農業生產的全天候監測、標準化種植以及智能化管理,幫助農民減少災難,提高農業經濟效益,促進現代農業的更新換代,也發揮了技術的支柱作用。該系統是基于大數據挖掘技術的藏紅花栽培與土壤養分態勢分析模型構建及應用系統,采用物聯網技術采集數據,通過LoRa和ZigBee通信技術實現數據傳輸,利用邊緣計算統一地對數據進行處理。在云端利用數據挖掘多次對數據進行處理,并對數據挖掘的過程進行歸納和總結,構建了數據挖掘的處理應用模型。