王志遠
當前,我國農業正處于傳統農業向現代農業的轉型期,農業信息化水平穩步發展,農業信息服務水平也在逐步提升。全面提高面向農業服務水平,是強化政府公共服務職能的一個重要組成部分;如何使用信息技術將農業、農村、農民信息服務產生的大數據進行采集、挖掘、研究、分析,使數據產生價值,是農業信息服務發展的一個難點。本文主要闡述目前農業信息服務的數據采集手段,以這些大數據為數據挖掘對象,嘗試建立農業大數據中心模型,并應用在生產服務、經營預警等場景中。
一、 數據采集手段
(一)基于農業生產的數據采集
農業大數據的研究應用需要重視數據的采集工作。在農業系統中需要針對不同的情況分類建設,繼續完善局部地區的數據采集體系,利用智能終端,如傳感器、無人機等,去采集實時的農情;利用數據采集傳輸控制系統,進行相關的硬件系統整合;利用傳感器來檢測農業操作棚內的光照強度、溫濕度及二氧化碳、氧氣等相關氣體的濃度,待檢測到農業操作棚中的環境數據達到用戶自行設定的相關數據后,進行相關的控制溫濕度、光照強度等活動,如自動進行灌溉、自動遮陽等相關操作。此外,在實時作物生長環境數據信息和實時視頻信息等方面,數據采集傳輸控制系統也發揮著重要的作用。如利用采集前端傳感器進行采集;將采集到的相關數據統一格式后,利用無線傳輸的方式上傳到數據平臺后,進行用戶相關需求的分析;利用硬件的自動化設計來控制后端的遮陽幕、補光燈、風機等設備的自動開啟和關閉,從而在節約人資、物資的前提下為農作物的生長提供適宜的環境,提高農產品的產量。
(二)基于農業信息服務的數據采集
一是主動人工采集。主要由專人在“菜籃子”基地、有代表性的農業龍頭企業、農產品市場等益農信息社布置信息采集點,使其能通過信息平臺上傳農產品市場信息。二是依托政務服務辦事平臺進行采集。依托政府機構建設的業務信息系統、辦事服務系統進行數據采集。兩種信息采集方式采集的數據又分為結構化數據和非結構化數據,其都要把數據經過分析、驗證、清洗、轉換,去重后進行數據存儲,然后根據應用途徑進行應用功能設計及數據計算,形成大數據報表輸出,達到數據決策支持的目的。
二、數據挖掘模型的建立與實現
數據挖掘是發現知識過程中的一個步驟,主要是從數據庫、數據倉庫以及其他信息庫的大量數據中挖掘知識的過程。其中,數據倉庫是數據挖掘的對象,通常需要對其進行的操作有數據清洗、數據集成等相關性操作及對數據對象進行初步的預處理流程;數據庫或數據倉庫服務器其主要的功能是讀取相關的數據,其讀取數據的數據是由用戶的挖掘數據請求來決定的;知識庫是將挖掘到的領域知識存放的地方,這些知識放在數據庫中,來對特定的知識進行搜索;數據挖掘引擎主要是由數據挖掘功能模塊組成,實現關聯分析、進化計算、定性歸納、偏差分析等主要功能;模式評估模塊將根據興趣度,聯合數據挖掘模塊定位到更有意義的模式,其是否能與數據挖掘模塊完美結合,主要與其使用的算法相關,正確的數據挖掘算法與知識評估方法的完美結合將有利于增強挖掘的效率和精度;可視化用戶界面主要是用戶的操作界面,幫助用戶與系統進行交流,是一個雙向傳輸的過程,首先通過用戶界面將自己的挖掘任務以及相關的要求傳輸給該系統,其次將數據挖掘到的相關信息傳輸回來。
三、數據挖掘技術在農業信息服務中的應用
(一)在農業市場中的應用
數據挖掘技術在農業市場中的應用,其數據源是多種多樣的,如農產品市場價格數據庫、外國農產品進口貿易數據庫、中國農產品出口貿易數據庫等,利用數據挖掘的算法和規則,來提取隱含模糊的、具有價值的信息。如使用預測和分類,可以對將來的農產品價格進行預測;利用關聯分析,進而來發現一些相關性的規則;使用聚類分析,可以對農產品客觀地分類(如將蛋類與油類變成一類),再利用統計技術來發現各種農產品的價格走勢(如海鮮與糧食作物的價格變動相關趨勢);使用孤立點分析技術,可以找出一些罕見的事件(如發現災情、金融事件等)。
(二)在農業病蟲害防治中的應用
數據挖掘技術在病蟲害防治中的應用主要是對病蟲害的動態監測、發生趨勢預測及風險評估等幾個方面。農作物的栽培環境、耕作條件、相關布局方式和農作物品種抗藥性、耐寒性、抗旱性及氣象條件等諸多因素都是病蟲害發生的原因,另外,還與農作物所處的地理位置及不同的氣候帶有關。
預測某段時間發生蟲害的可能性可以通過數據挖掘技術來實現,同時,通過在發生其他種類蟲害的可能性方面也可提供相關的技術支持。病蟲害的防治可以通過三個層次來實現,即表示層、邏輯層、數據層。首先,表示層的設計主要完成用戶與系統的交互功能,即用戶目的搜索的設計以及簡單的數據處理。其次,邏輯層的設計主要是完成復雜的應用,集成服務器端構件,供調用即可完成功能。最后,數據層的設計主要是利用數據庫管理系統,將搜集到的數據表和視圖等進行相應地封裝和存儲,用戶可在用戶界面,通過使用瀏覽器輸入來查詢所需的數據信息。
(三)在農業電子商務中的應用
農業電子商務是指利用互聯網的廣域性、互通性、易用性等相關特性,為從事農業生產領域的生產經營主體,提供在網上完成產品或服務的銷售和電子支付等業務交易的過程。數據挖掘技術能從海量的網絡信息中挖掘出有用的信息,能自動預測客戶的消費趨勢、市場走向,指導農業企業建設個性化的智能網站,為農業企業創造新的商業增長點。