摘" "要:我國存在農業數據資源質量不高、共享性差、利用率低和數字化水平低等問題。進入數智時代,大數據、人工智能、云計算等新一代信息技術能很好地解決現有問題。基于此,闡述我國農業資源整合服務建設現狀和主要問題,結合國內外農業大數據應用現狀,對農業資源整合路徑進行探索,提出建設農業大數據資源整合服務平臺,并系統分析平臺建設的總體架構和關鍵技術。
關鍵詞:農業大數據;資源整合;大數據服務平臺
中圖分類號:F322" " " "文獻標志碼:A" " " 文章編號:1673-291X(2023)21-0059-04
一、研究背景
人工智能、物聯網、云計算等新信息技術的蓬勃發展,推進著我國數字化、智能化進程。在新一輪技術創新過程中,農業大數據系統也在不斷完善,各種類型的農業信息資源迅速產生。農業資源整合服務邁進數智融合環境。但由于農業資源結構復雜,農業生產中通過各種方法獲取的資源沒有得到很好的利用,農業發展在數據整合、服務、分析應用等方面受到了約束。因此,建設通過大數據、人工智能、云計算等現代信息技術來實現對農業資源采集、存儲、分析挖掘、應用的農業大數據資源整合服務平臺,才能推動農業的高效生產、科學決策,加快農業生產方式轉型,促進我國智慧農業的發展。
二、大數據在農業資源整合服務建設中的應用現狀
(一)農業大數據概述
農業是生成大數據的活力源泉,同時也是大數據應用的無邊海洋。進入數智時代,隨著物聯網、人工智能、大數據等技術的飛速發展及其在智慧農業、精準農業上的深入應用,使得各種類型的農業數據海量增長且蘊藏巨大價值[1]。農業大數據的內涵就是運用大數據的理念、技術和方法對農業及涉農領域產生的海量不同類型數據集進行處理,解決產生的海量數據的收集、存儲、分析及應用等一系列問題,從而讓大數據理論和技術在農業領域中得以實踐應用[2]。在農業生產過程中,產前環節的耕地、育種,產中階段的灌溉、施肥、殺蟲、收割,產后階段的加工、銷售、運輸都會產生大量的數字化農業信息,這些都包含在農業大數據的研究范疇內[3]。農業生產過程的對象為生物,因此極易遭受外部環境與人為因素的影響,從而產生了復雜性、變異性。這都增加了對數據的收集分析與應用的難度。農業大數據分析應用領域存在的重大問題是怎樣正確發現數據分析價值、提高數據分析運用的能力、降低數據分析冗余[2]。
(二)國外農業大數據應用現狀
在國外,以美國為代表的發達國家,農業大數據發展水平已經相對成熟。基于農業大數據的精準化農業已經廣泛應用于農業領域,并且效果可觀。肥料、農藥等化工產品的投入在精準化管理下明顯減少,農作物質量和產量得以提高。有序化的農業經營是美國農業規模化經營的良好基礎。美國天寶公司為解決農業數據實時傳輸困難的問題,設計開發了一套“網絡農場系統”,該系統是建立在GIS之上,整個農場的軟硬件設備都可以通過系統發射的信號來連接,信息實時傳輸可以在PC、農機設備、服務器終端上進行,信息的實時傳輸不再受限[4]。美國孟山都公司作為世界上最大的種子供應商,自身擁有海量的種業數據資源,在收購了美國精密種植公司和美國意外天氣保險公司后,原有的數據資源得以擴充。把原有種業數據資源和美國意外天氣保險公司所擁有的氣象數據資源結合,利用Hadoop架構對數據分析挖掘,得出各地區氣象條件下最適合哪類種子種植,從而實現精準農業[5]。美國農業部打造的大量從數據收集到應用中的成功案例,通過運用物聯網、區塊鏈、智慧農機、信息共享等技術,大大增強了美國農產品的全球影響力,并利用大數據權威在定價中的導向效應,提高了美國政府在全球農產品交易鏈中的效率。以色列的自然條件十分惡劣,土地荒漠化嚴重,水資源極度匱乏,境內僅有一條約旦河,但以色列成功地把高科技作為農業發展的主要推動力,每一個生產環節都受到現代科技的精確管控,實現了最佳收益,農業現代化飛速發展[6]。日本建立WAGRI系統,該系統為農業科研機構和農業生產者實現數據信息共享,二者可以快速了解生產數據、市場數據,使農業生產更加有序和有預見性,有利于減少資源浪費、增加效益[7]。澳大利亞的畜牧業十分發達,為了追溯畜牧產品質量安全,澳大利亞研發了畜牧產品質量安全系統,在生物個體的身份標識上選用澳大利亞國家牲畜標識計劃統一認證過的耳標作為認定標志。把經過耳標認證的牲畜信息記錄后,統一提交澳大利亞國家中心數據庫進行管理,從而實現對生物個體生產全過程的質量安全追溯。
(三)國內農業大數據應用現狀
在國內,湖南省正在開展以全省農業數據建設、制定統一的農業數據標準、整合現有的省農委業務系統、建立具備大數據分析挖掘技術和數據可視化技術為目標的湖南省農業大數據平臺建設研究[8]。楊波等在多年的農業實踐中,采集了大量玉米等農作物產生病蟲害的數據,并通過對當地多年的氣象數據進行相關分析,利用多元線性回歸方法,建立氣象數據與玉米螟病蟲害的監測預警模型。該模型的預測準確率較之前有明顯改善。這是大數據理念在病蟲害監測預警上的應用,也是未來農業生產的發展趨勢[9]。成都市建設大數據中心,建成市農業農村局信息化系統基礎數據庫,啟動建設數字農業農村大數據平臺。江蘇徐州市豐縣建成了農村數據分析平臺,以自身豐富的農業數據分析資源為基礎,以針對當地政府農業計劃、國內涉農公司的農業可行性項目咨詢以及大量的農村咨詢項目經驗為指導,以對國內農業數據終端服務和農業大宗產品的市場價值預測模型為基礎,融合了本土氣象數據、土地數據,利用了縣域農業云端服務器數據、縣域農業農村大數據分析智慧終端、縣域農務農村一點通手機應用這三項互聯網和手機農村大數據分析軟件業務,農民可以及時了解天氣、土壤、農作物信息,精確高效管理農田,達到精準農業的目標。將收集到的數據進行分析還可以給出銷售的決策,為農民增加收入。
三、農業資源利用中存在的問題
(一)農業資源質量不高,利用率低
目前全國農業網站總數已經超過3萬個,但是由于這些網站之間缺乏有效溝通,網站上很多農業信息資源都是重復的,農業資源共享未能更好地實現。由于農業資源數據數量巨大,范圍廣闊,在各地基層單位進行采集時,沒有統一的采集標準約束,后續對這些資源數據使用時存在困難。農業資源由各地不同單位進行建設,不同單位使用的數據庫系統相互獨立,采用的標準不統一,在基層單位進行數據上報時,由于格式不同導致農業資源上報很不方便。在對農業資源進行開發利用時,不同單位使用的整合服務系統也是相互獨立、標準不一的,造成重復建設,農業資源整合共享程度低[10]。
此外,數據中心按照行政地域設立,信息資源分散管理,信息網絡不通暢,全國各地區缺少聯系,導致農業數據資源庫數量不足、數據資源質量參差不齊,很難進行數據整合挖掘。農業資源即使數字化了,也無法充分地為各個農業部門和平臺所利用[11]。
(二)我國農業信息化基礎落后,建設經費不足
我國農村土地遼闊且不夠集中,各地區自然經濟水平差異性大,主要體現在硬件和軟件服務無法配套跟上。提高農業信息化水平,需要農業信息化建設經費的支持。但計算機各類應用在數智時代中,所需要的軟硬件條件越來越高,更換速度很快,可能很多剛建成的硬件系統投入使用不久就被淘汰,這就使建設經費的投入面臨很大壓力。可能經濟發達地區尚可接受,對于大多數經濟相對困難地區,就容易造成經濟負擔,制約了農業資源整合服務建設。
(三)農業信息化專業人員缺乏
農業信息化過程中,專業人員是第一要素,大量高水平的專業人員將極大地推進農業信息化建設和推廣應用。但農業信息化建設不但要求專門的技術人員掌握有關農業知識,還需要從業人員可以利用計算機技術對網絡信息進行采集、分析。一部分農業生產者還不能很好掌握計算機技術,無法自主收集信息、科學決策。計算機領域的有關技術人員又由于缺乏農業知識,不熟悉農村商品生產經營方式而流失[12]。
四、農業大數據資源整合的路徑
(一)加大農村財政投入力度
政府制定農業信息化配套政策,成立重大工程專項。財政上安排一定規模資金,作為農業信息化引導資金,著力開展數字化農業示范項目建設,選擇農業信息化程度較高的農業企業,開展大數據、人工智能等技術在農業領域的示范應用,引導市場資金對農業信息化發展項目的持續流入[13]。政策性補貼針對精準農業、智能農業相關產品及應用進行發放,農業互聯網使用費和農業生產者通信費用適當減免。
(二)依托農業高校和科研機構資源培養專項人才隊伍
鼓勵農業高校開設精準農業專業,培養多學科綜合型應用人才,加快構建農業信息化人才培養體系和交流合作平臺,推動農學和工學學生互相交流學習,通過減稅和補貼,吸引人才參與農業信息化發展,為數字化農業基礎推廣提供人力資源支持[14]。利用網上授課、線下技術觀摩等手段,對農業生產者進行培訓,逐步提高農業生產者的信息化水平[15]。
(三)建立完善農業資源標準規范
農業信息資源除了具有一般信息資源數量較多、分布廣泛的特點外,還具有明顯的地域性、季節性等特點。因此,農業信息資源的整合就必須根據實際需要,建立一套科學合理的信息資源共享和利用的標準,提高信息資源的實用性[16]。
重點建設的農業資源規范標準分為四類:一是農業信息資源分類標準。分類標準包含數據分類目錄標準、數據分類編碼標準和名稱術語標準等。分類標準應在現有標準的基礎上,充分考慮信息服務對象的使用需求。二是農業資源元數據標準。在農業信息資源分類標準基礎上,制定元數據標準[17]。按照農業信息在產前、產中、產后的不同環節,用元數據進行描述,形成元數據標準。三是農業信息資源采集和管理標準。采集標準包括信息采集標準、異構數據轉換標準。管理標準包括數據上報標準、數據接口標準。四是農業信息資源共享標準,包括數據交換標準、共享發布規范等。
(四)建設農業大數據資源整合服務平臺
1.平臺總體架構。面對我國農業資源利用率低、數據質量參差不齊、各類農業資源標準不一、農業數據資源共享性差的問題,通過運用大數據、人工智能、云計算等新一代信息技術設計農業大數據資源整合服務平臺,將農業資源整合,充分挖掘農業大數據蘊藏的巨大價值,推進大數據在生產經營和公共服務方面的應用。
農業大數據資源整合服務平臺總體架構有四層,從下往上分別是基礎層、數據資源層、數據分析層和數據應用層。
基礎層:基礎層主要包括各類硬件設備和軟件設備,是資源整合的基礎。虛擬化平臺采用IAAS模式,運用虛擬化技術對服務器、網絡、存儲和數據安全虛擬化,形成主機資源池、存儲資源池和網絡資源池等虛擬資源,整合服務器物理資源,完成統一虛擬化資源庫。通過分布式計算機集群、集群控制管理等工具,建設包括虛擬資源管理、物理資源管理、業務性能監控和應用部署的管理平臺,實現對網絡、存儲資源的實時監控和自動分配,增強系統的可用性。
數據資源層:數據資源層主要包括對各類農業數據的采集、處理、存儲。通過利用物聯網、云計算等技術采集農業信息數據[18],作為平臺的數據資源,包括語音、圖片、遙感影像、氣象數據和土壤數據。為了確保數據資源的質量,需要多維度采集數據。增大采集數據的時間頻率來提高獲取數據的數量,設立更為密集的數據采集點來提高數據的準確率。使用ETL工具對采集到的相關數據進行清洗處理后,整合一切可利用的農業信息資源,建立相關信息數據庫系統。數據庫系統接收來自處理后的所有農業資源數據并進行存儲。
數據分析層:數據分析層是農業大數據資源整合服務平臺的核心,主要基于大數據技術建設數據分析云平臺,以機器學習算法為基礎,依托大數據云平臺強大的數據挖掘、分析能力,對采集到的數據進行實時流式匯總、挖掘和分析,設計適應不同環境的分析模型,進行智能決策,實現精準管理。
數據應用層:數據應用層是在分析層基礎上,利用海量數據和設計的分析模型進行計算分析,為主管部門、農業生產者、社會公眾和科研機構等終端用戶建設監測預警系統、智能決策系統和公共服務系統等業務和請求服務。數據應用層是所有應用系統的集合,可以使用每個系統提供的功能服務,用戶可以使用PC、手機APP、平板電腦等獲取所需信息服務。
2.平臺關鍵技術。數據采集技術:數據資源是農業大數據資源整合服務的基礎。由于農業領域不但受到自然地理環境影響,而且也同生產、經營方式以及政策等有關,所以在數據資源采集時,采集內容不僅包括農業、氣象、土壤等歷史數據,還包括相關的網絡共享經濟信息、市場信息。這類數據資源數量龐大,類型多樣,給數據采集造成了一定的困難。目前主要采用的技術方法有物聯網實時采集、互聯網采集、現場人工采集、遙感監測、歷史數據采集等方法手段。
物聯網實時采集:主要通過各類傳感器設備,如光照傳感器、氣體傳感器等,實現對氣象信息、土壤信息等各類信息的實時采集。
互聯網采集:通過互聯網技術,實現對相關網絡上農業領域信息的采集。
現場人工采集:主要針對易受人為因素影響的信息或常規方法無法獲取的信息采集。
遙感監測:通過電磁波信息對環境目標進行跟蹤和實時監控,獲取大面積同步和動態信息。
歷史數據采集:主要完成氣象數據、土壤信息、水利信息等歷史數據的收集和標準化。
數據處理技術:數據處理采用ETL工具,ETL是將采集到的數據經過抽取、清洗轉換的過程。將分散、凌亂、標準不統一的農業大數據信息整合到一起并統一存儲,建立數據倉庫,再通過平滑聚集、數據概念化和規范化等方式將數據倉庫的數據轉化為適用于數據挖掘的形式。最后對得到的數據集進行數據歸約[19],得到仍然接近于保持原數據完整性的歸約表示。
數據存儲技術:農業大數據存儲采用基于Hadoop架構的分布式計算框架(MapReduce)和分布式文件存儲系統(HDFS)[20]。利用HDFS適合處理吞吐量大的業務,存儲、管理大量農業數據,為農業大數據平臺提供便捷、高速的存儲和管理服務。
數據分析挖掘技術:數據分析挖掘是農業大數據服務平臺的核心,負責整個系統的運算、決策。通過Spark技術建立數據分析挖掘系統,使用支持向量機、回歸和人工神經網絡等機器學習方法和資源管理技術[21],尋找隱藏在農業數據中的規律[22],實現大數據的分析決策。
數據展現技術:數據展現主要是對農業大數據加以可視化解釋,把分析決策、監測預警結果以易懂的圖形、計算機視覺方式展現出來,從而科學準確地了解發展現狀和規律預測。
數據服務技術:農業大數據平臺可以為主管部門、農業生產者、社會公眾和科研機構提供監測預警、分析決策、查詢統計和信息查詢服務。
五、結束語
農業數據共享性低、利用率差,減緩了我國農業信息化步伐。隨著數智時代的來臨,大數據與人工智能相融合,將會在農業領域有更廣泛、更深層的應用。本文經過對農業資源整合的探索,構建農業大數據資源整合服務平臺,不僅解決了農業資源利用率不高、質量參差不齊的問題,而且實現了農業數據資源共享服務,為農業產業鏈提供科學預測、管理和調控服務,加快我國農業現代化、數字化發展。
參考文獻:
[1]" "孟祥寶,謝秋波,劉海峰,等.農業大數據應用體系架構和平臺建設[J].廣東農業科學,2014,41(14):173-178.
[2]" "孫忠富,杜克明,鄭飛翔,等.大數據在智慧農業中研究與應用展望[J].中國農業科技導報,2013,15(6):63-71.
[3]" "謝潤梅.農業大數據的獲取與利用[J].安徽農業科學,2015,43(30):383-385.
[4]" "王少農,王熙.美國天寶公司網絡農場系統[J].現代化農業,2015(2):59-60.
[5]" "中文互聯網數據資訊中心.中美兩國農業大數據對比與思考[J].農業工程技術,2016,36(30):63-64.
[6]" "王榮蓮,于健,趙永來,等.以色列農業發展成功的主要經驗及啟示[J].節水灌溉,2010(5):61-63.
[7]" "余凱迪,王超超.基于日本比較的重慶智慧農業發展思路研究[J].特區經濟,2020(7):106-109.
[8]" "寧江,屈亞琪.湖南省農業農村大數據建設工作探討[J].農業工程技術,2017,37(30):73-76.
[9]" "楊波,劉勇,牟少敏,等.大數據背景下山東省二代玉米螟發生程度預測模型的構建[J].計算機研究與發展,2014,51(S2):160-165.
[10]" "王慧,王海江,高攀,等.新疆生產建設兵團農業資源數據采集與整合方法研究[J].農業大數據學報,2021,3(2):31-41.
[11]" "張莉莉,張承祥.農業信息化過程中信息資源整合措施分析[J].現代農業科技,2016(11):336.
[12]" "楊明陽.河南省土地資源整合策略研究[J].鄉村科技,2019(13):39-40.
[13]" "呂文,由海霞.鄉村振興戰略背景下農業資源高效整合配置策略研究[J].農業開發與裝備,2021(4):5-6.
[14]" "王江君.蘇州信息化與現代農業發展研究:基于農業智庫資源的整合與共享視角[J].農村經濟與科技,2014,25(11):65-68.
[15]" "劉賾宇.閩南農業網絡信息資源的整合研究[J].農業圖書情報學刊,2014,26(12):33-36.
[16]" "初金星,齊國威.關于農業信息化過程中信息資源整合措施研究[J].黑龍江科技信息,2017(13):151.
[17]" "張麗君,閆東浩.農業網站信息資源整合研究:以中國農業信息網為例[J].中國農學通報,2015,31(25):269-272.
[18]" "馮開蕾,胡興球.“互聯網+”背景下傳統農業向現代農業的轉型發展[J].農業工程,2018,8(3):133-135.
[19]" "周楊.基于復雜結構的數據挖掘技術研究[D].重慶:重慶大學,2005.
[20]" "易江南.基于大數據的移動網絡覆蓋分析工具的設計與開發[D].武漢:華中科技大學,2017.
[21]" "王予辰.基于機器學習的商業銀行客戶關系管理的研究[D].杭州:浙江大學,2019.
[22]" "陳桂芬,李靜,陳航,等.大數據時代人工智能技術在農業領域的研究進展[J].吉林農業大學學報,2018,40(4):502-510.
[責任編輯" "文" "欣]