李閏枚 孔娟娟 張立平 方鈺 徐桂珍
摘要 大數據是新型戰略資源,應用在農業領域前景廣闊,不僅能挖掘出農業資源間的發展潛力,發揮耦合效應,還可以實現精準生產和銷售,提升決策水平。相比較其他產業,農業大數據的發展相對滯后。闡述了大數據思維3個方面特征,以此為指標反觀我國農業大數據的發展現狀,并提出了建議。
關鍵詞 大數據;大數據思維;應用;反觀
中圖分類號 S-058文獻標識碼 A文章編號 0517-6611(2018)34-0190-03
2016年5月25日,在中國大數據產業峰會上,李克強總理強調“大數據為21世紀的鉆石礦”,必須下決心打通數據壁壘,實現各部門和各層級數據信息互聯互通、充分共享。為在新一輪信息化潮流中搶得先機,2016年農業部推出《關于推進農業農村大數據發展的實施意見》,牽頭建設的國家農業大數據中心已經啟動,投資3 000萬元。由此可見,信息化與國民經濟深度整合是政府的重大戰略部署。在此背景下,全國各地紛紛建立農業大數據中心,經過2年的發展,大數據在農業生產、經營、管理、服務中均有一定程度的應用,但距離大數據和現代農業發展的要求有較大差距,存在著認識不足、頂層設計缺失、采集機制不健全、基礎設施薄弱、技術支撐能力不強、深度應用滯后等一系列問題[1]。因此,發展農業大數據,首先要提高對大數據的認識水平,不僅應深入理解大數據的概念,而且要理解大數據既是一種新興的技術,也是一種思維模式,只有掌握大數據思維,才能有完善的頂層設計指導農業大數據的可持續發展。
1 從數據到大數據
大數據和傳統數據的本質都是數據,但是由于產生方式、載體、形式、體量的不同,它們有很大的區別。數據需要用一些形式表現出來,并用載體記錄下來。傳統數據的形式為文字、圖形和數字,造紙術發明以前,數據記錄在石材、羊皮、竹簡等物件上,造紙術發明以后,數據的保留和傳播得到了質的飛躍。傳統數據是一種寶貴的資源,將有價值的信息挖掘出來,需要付出努力去探索并記錄下來。計算機發明以后,特別是進入大數據時代,這些數據更多記錄在計算機里,大數據的形式多種多樣,除了文字、數字、音頻、視頻、圖片,還包括網頁瀏覽檢索痕跡、金融交易記錄、外出行程記錄等。大數據是現代生活的副產物,是各種傳感設備或者手機APP在為人提供服務時自動產生并記錄下來的,并非有目的性探索發現的結果,這些記錄在計算機里的數據,是一種更純粹意義上的數據,本身并沒有什么價值,如果不對這些大數據進行分析和挖掘,反而會浪費計算機寶貴的存儲空間。2011年5月,麥肯錫研究院發布報告,第一次給大數據做出相對清晰的定義:“大數據是指其大小超出了常規數據庫工具獲取、儲存、管理和分析能力的數據集[2]?!?/p>
2 大數據思維
大數據的產生為信息化發展開啟了新的時代,各行業紛紛進軍大數據領域,并達成了前所未有的效能。比如亞馬遜(Amazon)利用用戶的購買和瀏覽歷史數據,進行針對性的購買推薦;阿爾法圍棋(AlphaGo)在和世界圍棋冠軍的對弈中大獲全勝。這些案例的出現說明了一點,大數據時代的出現標志著思維方式的轉變,人們要學會用大數據思維去發掘數據的潛在價值。
根據維克托·邁爾·舍恩伯格在《大數據時代》一書中的看法,大數據思維有3個方面的特征:第一,需要全部數據樣本而不是抽樣樣本;第二,關注效率而不是精確度;第三,關注相關性而不是因果關系[3]。
2.1 使用全數據樣本
傳統的統計學根據有限的數據樣本去分析推理,以達到理解研究對象及規律的目的,數據及樣本的限制難免會產生誤差,當數據量足夠大的時候,就無需使用樣本來理解事物,因此,大數據是全數據思維,全方位真實立體反映客觀事物,發掘隱藏的規律和關聯,甚至可以做出準確的預測,也就是說,一切用數據說話。
2.2 重視效率而非精準度
在數據有限的情況下,數據的準確性非常重要,否則會被誤導。但當數據足夠大時,可以接受一定的錯誤存在,大數據仍然可以準確預測事物發展的趨勢,因此人們不會把精力放在少數數據是否精準之上,而是盡快根據大數據給出的趨勢,迅速采取相應的決策和行動,特別在市場銷售領域,這樣就能盡快搶占市場先機,這就是重視效率而非精準度的思維方式。
2.3 以相關思維取代因果思維
長久以來人們對世界的了解多采用因果思維的方式,數據可以展示出“是什么”,人們通過數據進而發掘“為什么”,通過這樣的過程不斷進行科學研究和探索,但大數據的出現帶來了全新認知方式。以經典的沃爾瑪“啤酒+尿布”營銷案例為例,在傳統的貨架展示中,超市會對貨品進行分門別類的擺放,啤酒和尿布這2件不相干的商品不會擺在一起,但大數據顯示,伴隨尿布被一起銷售的東西往往是啤酒,這個現象與美國文化有關,即父親會在下班路上去超市采購,他們會在買尿布時順便買啤酒,于是超市工作人員會將啤酒和尿布擺放在一起,明顯提升了銷售量。這個案例說明,大數據讓人們看到了尿布和啤酒的相關性,這是用因果思維方式看不到、想不到的。
3 大數據與農業
大數據技術掀起了新的技術革命,目前在各行各業都有了長足的發展和應用。農業大數據是指大數據技術、理念和思維在農業領域的應用。從更深層次考慮,農業大數據是智慧化、協作化、智能化、精準化、網絡化、先覺泛在的現代信息技術不斷發展而衍生的一種計算機技術農業應用的高級階段[4]。
3.1 農業大數據的產生和獲取
隨著農業信息化的發展,農業領域已經積累了大量的數據,比如政府統計部門、科研院所、植保站和農技站都擁有大量農業相關數據,這些數據雖然體量較大,整理并激活也有一定的價值,但大數據技術的核心并不在于整理存量數據,否則與傳統的統計學無異,大數據技術的關鍵是快速采集實時數據并處理和應用。農業大數據主要從3個渠道進行采集。第一是感知技術,包括各種傳感器、遙感設備、飛行器等,感知技術從不同角度和尺度感知并采集動植物生命與環境信息;第二是識別技術,包括RGID技術、光譜掃描、無損檢測技術等,主要用于農產品品質分析、產地環境監測、商品流通監控等環節;第三是智能移動采集技術,包括各種智能終端、手機APP等,主要采集農產品市場、營銷價格和農業管理信息[5]。
感知技術、識別技術和智能移動采集技術的發展,使得現代農業在全產業鏈中源源不斷產生海量數據,農業大數據的重要意義不在于獲得龐大的數據信息,而主要在于對這些數據進行挖掘和應用。
3.2 大數據在農業上的應用
大數據在農業上所發揮的作用,用一個詞來概括就是“智慧農業”,大數據思維的本質就是智慧思維,這種智慧的主體不是人類,而是經過挖掘的大數據,這是跨越式的改變。在地球上,智慧一直是人類所獨有的,現在由于大數據技術的發展,有了人工智能,這種智能在某些領域已經超越了人類。 同樣,智慧農業的出現也是農業發展突破性的改變,這種改變可以用3個關鍵詞來概括,就是耦合、精準、決策。
3.2.1 耦合。農業生產者一般只能將精力放在生產環節。農業產生是一個整體,環環相扣,但由于信息不對稱或者滯后,不能統籌規劃生產,造成了資源及產品不足或者浪費的問題。
大數據技術為解決這一難題帶來了轉機,農業不同生產環節實時數據的采集和處理可以全面立體反映生產現狀,也能體現出不同環節之間的關聯及相互作用,發揮耦合效應,挖掘農業資源間的發展潛力、搭配關系,精確計算最優化配置模式,提升效能。比如M6生鮮超市服務器從2012年開始,一邊從互聯網上采集天氣數據,一邊收集顧客的消費數據,然后分析不同節氣和溫度下顧客的生鮮購買習慣會發生哪些變化。大數據使氣象和銷售這兩個看似不相關的領域聯系起來,M6生鮮超市根據大數據分析去配送貨物,避免了不必要的損耗,這就是大數據發揮耦合作用的體現[6]。M6生鮮超市的例子是耦合效應小范圍的應用,未來有大數據的支持,可以站在全產業鏈的高度甚至跨行業進行深度耦合,農業生產力將會有跨越式的提升。
3.2.2 精準。我國農業生產由于科技含量較低,供銷信息不對稱,一直處于粗放生產和經營狀態。根據國家統計局2007—2015年的統計,我國化肥和農藥使用量呈現逐年增加的態勢,雖然用量大但效率低下。以2013年為例,農用化肥施用量為5 911.8萬t,綜合利用率僅為30%左右,農藥施用量為180.2萬t,利用率僅為35%左右。顯而易見,濫用農藥化肥的現象普遍存在。
大數據技術為精準農業帶來了可能,地面傳感器能實時捕捉地面情況,遙感技術能從空中觀測地表情況的改變,全面立體準確反映農業生產情況,不僅能及時應對出現的情況,而且能積累數據發現規律,對未來發生的情況做出預測。也就是說,有了大數據技術,才能對出現的問題進行精準描述,從而有精準決策。傳感器等設備的使用,不僅解決了人力不足的問題,而且克服了因知識、經驗以及主觀意識不同而產生的誤差。比如美國土壤抽樣分析商Solum使用整套硬件加軟件分析,實現了土壤的精準分析,幫助農民制訂合理的施肥計劃,不僅精準到土地何處施多少量的肥料,還包括施肥時間,并根據返回的土壤數據不斷修改施肥計劃[7]。這些大數據技術的應用,不僅可以在生產領域達成精準這個目標,而且可以在產前準備階段及產后銷售領域發揮精準效應。
3.2.3 決策。智慧與判斷和決策能力密不可分,智慧農業的重要特色就是決策水平的提升。在傳統農業生產及銷售過程中,常常因為農戶認知水平有限、信息閉塞不流通而做出錯誤的決策,導致出現諸多問題。有了大數據之后,海量數據能夠立體反映客觀事物,發掘隱藏的規律和關聯,通過預測分析事物未來發展的趨勢,幫助數據使用者提前做好相應決策,避免出現扎堆種植養殖,滯銷難賣的情況,真正實現從以生產為導向到以消費為導向的轉變。
4 以大數據思維反觀農業大數據
中國大數據產業結構總體而言落后于全球市場的步伐,大部分企業仍停留在基礎軟硬件設施投入和部署階段,國內大數據市場雖然在快速增長,但仍處于增長的早期階段,而農業大數據在我國大數據產業中又屬于薄弱環節。要發展農業大數據,首先要對大數據有準確而深刻的理解,才能把精力放在正確的發展方向,有的放矢。著名企業家稻盛和夫認為成功是3個要素在起作用,第一是思維方式,第二是工作熱情,第三是能力。3個要素當中,思維方式最為重要,如果思維方式錯了,工作激情與能力再強都只能加重損失與失敗[8]。同樣,理解大數據前提是掌握大數據中小的思維方式,維克托·邁爾·舍恩伯格論述大數據思維包括3個方面特征,使用全數據樣本、重視效率以及相關思維,這些特征不僅對大數據進行了描述,而且提供了一種尺度,幫助人們理解目前農業大數據。下面以這3個方面為尺度,反觀我國農業大數據發展現狀。
4.1 從全數據樣本角度
全數據可以全方位真實立體反映客觀事物,發掘隱藏的規律和關聯,因此數據成為一種新型資產和寶藏,而采集整理存儲數據是發展大數據的基礎。從政府到企業,必須有意識采集整理甚至共享數據,逐步形成全數據樣本,否則即便掌握了很好的挖掘技術,也會陷入“巧婦難為無米之炊”的境地。在某些領域,受政府需求或市場導向,數據采集方面已經發展得很好,比如電子商務、交通旅游、醫療安防。但農業是較為特殊的產業,不僅涉及農林牧副漁不同門類的生產,也涉及到市場銷售及售后,行業跨幅大,區域差別大,從業人員老齡化,跟不上信息化的步伐,僅靠公司企業很難構建全數據樣本,需要政府的財力人力支持,牽頭數據采集、整理、清洗及共享工作。
不少發達國家非常重視農業數據的采集共享,比如美國會發布年度《農業中長期展望報告》、月度《世界農產品供需預測報告》、周度《農作物生長報告》,美國政府創建了data.gov數據網站,提供了348個農業數據集,這些數據免費提供給個人以及公司企業,極大地推動了農業數據分析決策的發展[9]。
我國也越來越重視農業大數據的采集,農業部《關于推進農業農村大數據發展的實施意見》中明確提出要拓展物聯網、互聯網等數據采集渠道,但目前我國的數據積累還處于起步階段。隨著物聯網、智能終端技術的發展,涉農數據呈“爆炸式”增長,這就產生3個方面的問題亟待落實,第一,需要專人專項資金負責海量涉農數據的存儲、檢索和組織工作;第二,需要盡快攻克多種類數據標準融合技術;第三,需要建立數據長期運作及共享機制。