歐非凡,張超群
(1中國農業大學信息與電氣工程學院,北京 100083;2廣西民族大學人工智能學院,南寧 530006)
農業信息處理技術是農業物聯網的一項關鍵技術,指的是利用模式識別、復雜計算、智能處理等技術,對農業經營管理、生產、服務和戰略決策過程中的有關信息進行搜集、存儲、傳遞、處理及分析的技術總稱,包括農業數據挖掘技術、農業數據處理技術、農業預測預警技術、農業人工智能技術等技術[1-3]。農業信息處理技術在農業物聯網中的地位相當重要,它能夠為農業的研究者和從業人員提供技術指導、資料查詢、輔助決策及智能調控等各種服務,不僅是實現農業信息有效傳遞、分析轉換、智能應用的重要手段,更是實現農業生產智能化的關鍵[4]。近20 年來,農業信息處理技術在國內已經得到了初步研究與應用。表1是基于中國知網(CNKI)中文文獻檢索數據,對近5 年農業信息處理技術專題的中文文獻分類統計結果。

表1 近5年農業信息處理技術專題中文文獻統計表 篇
檢索結果顯示,2016—2020年共發表農業信息處理技術論文826篇,其中農業人工智能技術文獻最多,達到587 篇。從研究主題來看,農業數據挖掘技術研究主要涉及農業數據挖掘系統的設計,以及數據挖掘技術在農業信息化、農業機械質量控制、數字化農業生產、智慧農業生產、農業信息資源等領域的應用等[5-14];農業數據處理技術研究主要涉及農業物聯網時序數據處理平臺、智能農業圖像處理系統、設施農業區多路數據采集處理軟件、農業統計數據采集與處理系統、農業物聯網大數據處理系統等的構建,以及農業經濟調查數據的缺失值處理、農業WSN數據壓縮處理、農業大棚數據融合處理、種植領域數據處理算法等[15-25];農業預測預警技術研究主要涉及農業氣象、農田土壤、漁業水位水質、農作物病蟲害、農產品產量、農產品價格等預測預警模型構建及預測預警方法等[26-41];農業人工智能技術研究主要涉及農產品價格主題搜索、農業信息搜索系統設計、垂直搜索引擎研究等農業信息搜索,玉米苗期雜草識別、果實簇識別、農業機械圖像識別、豬體尺測量及行為識別、野生食用菌特征提取識別、農田苗帶識別、葉菜質量識別系統研究等模式識別,農田保護知識圖譜、植物領域知識圖譜等知識表示,無人農場、耘農大腦管理系統的研究與應用,以及農業噴霧機器人、果蔬自動收獲機器人、采摘機器人等農業智能設備的導航路徑規劃[42-68]。下面基于中國知網(CNKI)中文文獻檢索數據,對近年中國農業信息處理技術研究與應用的進展進行簡要分析。
農業大數據是由智能農業傳感器收集到的農業信息,如土壤質量、作物生長進程、天氣狀況、動物健康狀況等,主要用于跟蹤農業的業務狀況、員工表現、設備效率等,為生產操作和經營決策提供依據。農業大數據技術包括農業數據挖掘技術和處理技術,其中農業數據挖掘技術是指農業生產環境信息、農田變量數據、農業遙感信息、農產品市場經濟信息、農業網絡信息的采集,以及生物信息智能感知等方面的技術[69]。
近年來,隨著各種傳感器等新型物聯網設備的普及使用,農業大數據呈現出快速爆發的趨勢,海量農業數據日益表現出實時性強、模態多變、結構復雜等特征,以至于原有的農業數據統計方式越來越不能適應農業智能信息處理的特殊需要,亟須抽象數據對其描述,于是大數據挖掘技術成了必然且有效的選擇[70]。農業大數據挖掘技術就是挖掘農業資源環境、生產、加工和營銷等整個產業鏈的價值信息并對其進行抽象描述的高效工具。它借助于統計學的方法,量化農業的對象、行為和關系,挖掘農業數據之中蘊藏的價值。近年來,農業數據挖掘技術研究與應用得到了很多學者的關注。有的學者探討了農業數據挖掘系統的構建與實現問題,如劉天壘[71]梳理了數據挖掘技術的常用算法,有選擇地選取了常用算法予以計算機程序實現,并以實現的算法為核心,研發了基于Web的農業數據挖掘系統;侯亮等[72]分析了農業數據的特點、數據分析現狀和大數據技術的優勢,構建了基于Hadoop的農業大數據挖掘系統;柴進[73]選取中國農科院提供的農業數據作為研究對象設計出基于Hadoop 平臺的農業數據挖掘系統,在系統架構方面設計了高效、易擴展的分布式數據挖掘系統框架,在系統算法層面對CART(分類回歸樹)算法進行了改進,在數據存儲方面利用了HDFS 進行大數據的分布式存儲;郭二秀[74]選取Hadoop 的分布式文件系統HDFS 來解決海量異構農業大數據的存儲問題,并選取基于內存的Spark 計算框架,設計了基于Spark的農業大數據挖掘系統,實現了農業大數據的實時快速處理。有的學者側重于從理論上探討數據挖掘技術在農業領域的應用問題,如王文生等[75]從農業生產環境數據獲取、農業生命信息感知等方面分析了農業大數據獲取的途徑,并從精準農業可靠決策支持系統、國家農村綜合信息服務系統等方面對農業大數據的應用進行了展望;胡怡文[76]針對大數據技術在農業選育、農業栽培、農業病蟲害防治等的應用進行研究和分析,建議應用大數據技術準確獲取農作物生長情況并建立數據庫,建立各類型的農業相關數據的知識庫,建立專家資源庫等;王志遠[77]分析了農業信息服務的數據采集手段,提出了建立農業大數據中心模型的思路,并對數據挖掘技術在農業信息服務中的應用提出了建議;王磊等[78]對云環境下的農業服務模式、技術進行了分析,構建了云技術數據挖掘下的農業服務模型體系設計結構,并詳細介紹了云技術數據挖掘功能在農業中的應用;劉劍洋[79]針對數據挖掘技術在農業機械質量控制中的具體應用進行了較為系統的分析,對其實現的方式和方法進行詮釋。整體而言,中國農業數據挖掘技術研究與應用已經取得了一定的成績,但其成果數量或水平還不盡如人意,主要表現在是理論探討的多而實際應用的少,研究方法較為單一,特別是缺乏全面、深入、系統的探索。
要想從種類繁多且體量巨大的農業數據中去偽存真、去粗取精,傳統的存儲和計算方式已經無法完成,數據的處理分析迫切需要由處理單一數據集向迭代增長數據集,由處理結構化數據向處理非結構化數據,由批處理向流處理,由驗證性分析向探索性分析,由集中式分析向分布式分析的轉變[80]。
由于農業物聯網連接著若干個節點,在剛開始部署的時候需要精準確定每個節點的位置及其獨特功能,但節點異構性和數據類型多樣性給信息處理增加了難度[81]。因此,如何提高網絡信息處理能力和網絡性能受到了重視,路由、組網和信息機制相關的方法得到了關注及研究[82]。為了提高計算能力,計算技術已經由早期的并行計算發展到今天的云計算,農業云計算最早使用的模型Map-Reduce。Map-Reduce 是谷歌(Google)2004年提出的一種面向大規模數據處理的并行計算模型和方法,后來演變成為一種分布式編程模型,其“并行處理”理念已被廣泛用于云計算的任務調度中,基本思路是在任務調度時,使用Map 程序將數據分片,發送到各個計算機進行處理,將得到的大量結果通過Reduce 程序收集并輸出。然而原始的Map-Reduce架構在今天已經漸漸退出了開發一線,取而代之的是Hadoop 架構,它的基本思路和Map-Reduce 相同,還集成了GFS(Google 文件系統)、BigTable(Google 云存儲技術)等引擎,能夠更好地服務云計算。伴隨著今天大企業對大數據處理的需求和降低成本的要求,Spark 架構開始盛行,Spark 同樣基于Map-Reduce 模型,但更強調高速計算能力,它可以和Hadoop中的分布式文件系統配合使用,高效而低成本地解決農業數據處理問題,是未來發展的一個方向。
利用大數據處理技術捕獲海量農業數據里面的有益價值關系,是破解農業變量強耦合、高維難題的主要渠道。農業大數據的優勢,就在于可以依托大體量的農業數據及其處理方法,針對某個農業問題,解讀剖析其數據變量之間的關系,研究提出具體的解決方案。農業大數據的多樣性和容量決定了其復雜的程度,而農業大數據處理方法的真實性和速度則決定了其質量。借助農業大數據處理技術,認真剖析特定的農業數據,獲取其潛在的有益價值,是農業物聯網數據處理研究的重點[83]。
農業預測預警技術是以農業物聯網收集到海量數據和作物資料為依據,通過建立數學模型,對農業研究對象未來發展的可能性進行科學預測和評估,根據具體情況做出解讀評價,對生態環境可能出現的不利于農作物或養殖對象正常生長的極端情景進行提前警示,最大程度地消除或減輕有可能遭受的損失。
農業預測預警是調節控制生態環境的前提和基礎,而實現農業預測預警就是農業信息智能處理的重要應用。在國外,美國、日本等國家研發了大批的軟件及預測模型和預警模型,并在實踐當中加以應用[84]。在國內,張克鑫等[85]學者基于BP神經網絡,對葉綠素a的濃度開展預測預警的研究,并應用于湖南鎮水庫當中;李道亮等[86]在集約化河蟹養殖水質預測模型和預警模型的研究和應用中,基于粒子群優化算法和最小支持向量回歸機(PSO-LSSVR)開發了水質預測模型,基于粗糙集和支持向量機(RS-SVM)開發了水質預警模型。
人工智能(Aritificial intelligence,AI)也可稱為機器智能或人造智能,指借助計算機程序來模擬和實現人類智能的技術[87]。農業人工智能技術可以通過優化求解過程,促進農業生產過程智能化,對農業全過程實施動態管理,提升資源利用率和勞動效率,避免不必要的投入,減少生產成本和勞動強度[88]。Dempster/Shafer 證據理論、粗糙集理論、動態貝葉斯網絡(Dynamic Bayesian Network,DBN)等人工智能理論為農業數據的挖掘和處理提供了方法,實現了感知預測,為農業決策提供了參考。人工神經網絡(Artificial Neural Networks, ANNs)、進 化 算 法(Evolutionary Algorithms,EAS)、遺傳算法(Genetic Algorithm,GA)等為農業物聯網應用提供了非線性的機器學習方法,解決了農業數據處理現存的問題,是實現農業自動決策的必然選擇[89]。
農業人工智能可分為農業信息搜索、模式識別、知識表示和智能規劃等4 個研究方向,它們的研究對象分別為農業主題信息搜索、農業對象識別方法、農業知識數字化及決策支持、農業機械作業智能化等[90]。近年國內學者重點關注農業智能規劃和農業模式識別等研究方向,農業智能規劃的研究熱點集中在建模與控制方法研究,農業模式識別的研究熱點側重于與深度學習算法相互結合;農業信息搜索的研究熱點側重在農業信息搜索引擎技術和網絡爬取技術,農業知識表示的研究熱點集中于知識圖譜[91]。農業人工智能技術已經應用到農業產前、產中、產后、運維等各階段[92]。在產前階段主要應用于土地景觀規劃、土壤分析評估、河川日常徑流量預測、灌溉用水供需分析以及種植品種鑒別等;在產中業務主要應用于水產養殖投喂管理、水質預測預警、田間雜草管理、插秧系統、作物種植和牧業管理專家系統等;在產后階段主要應用于農產品的分類、收貨、檢驗、加工過程控制,以及染料提取和蒸餾冷點溫度預測等;在運維業務主要應用于農業設施裝備的運行管控及其故障診斷等。目前,人工智能在農業領域的應用還處于初步探索的過程中,農業智能化程度還比較低,人工智能要想替代人類進行實際生產任重而道遠,亟須進一步的技術突破[93]。
深度學習算法是人工智能的一個前沿技術,它的優越性在于能夠自動提取數據當中蘊含的特征,并對高維復雜變量之間的相互關系進行數學表示。近年隨著大數據技術的迅速發展,機器學習研究取得了積極的成果,深度學習算法已經在語音識別、圖像識別和數據預測回歸等得到了相對成熟的應用,在圖像問答、圖像內容的語義表達和自然語言處理等的特征抽取及建模方面持續獲得新突破,為整合多源異構數據提供了更為可靠的解決方法。
綜上所述,中國農業人工智能研究的側重點正在從過去單純的知識表示研究,向機器學習、模式識別和復雜系統規劃研究轉移;農業人工智能技術重點聚焦在農業的產中階段,基于農業機器人的綜合性業務研究還處在前期的探索性研究之中,而農業人工智能技術應用于農產品物流的研究則更加薄弱。深度學習研究的成果及其未來方向,對農業人工智能技術的發展將產生更為深刻的影響。由于農業業務變量之間的關系既復雜又相互關聯,而且其未知變量比較多,在某個區域農業業務行之有效的農業人工智能技術對其他的區域并不能夠替代人類自身在農業業務中的特殊作用。所以,通過全新的模式識別和機器學習技術,研究農業業務變量之間的特殊關系,全面提升基于農業人工智能的復雜系統在不同區域的適切性和兼容性,從根本上促進農業機器人技術相互整合,將是農業人工智能未來發展的主要方向。
總之,農業信息處理技術的研究與應用,是現代農業發展的理性選擇,也是未來農業發展的趨勢及其發展水平的主要標志。隨著人類社會進入全新的信息化時代,傳統農業升級對農業信息處理技術提出了新的更高需求,研究農業信息處理技術在農業中的應用將具有更深遠的探索意義,未來農業信息處理技術也將會呈現出集成化、專業化和智能化的發展趨勢[94]。