999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘在溫室大棚上的應用研究

2017-12-15 02:32:18,,,
計算機測量與控制 2017年11期
關鍵詞:數據挖掘方法模型

,, ,

(1.浙江大學城市學院 杭州市物聯網技術與應用重點實驗室,杭州 310015;2.浙江大學 計算機科學與技術學院,杭州 310015)

數據挖掘在溫室大棚上的應用研究

鄭增威1,陳漢群1,2,孫霖1,蔡建平1

(1.浙江大學城市學院杭州市物聯網技術與應用重點實驗室,杭州310015;2.浙江大學計算機科學與技術學院,杭州310015)

隨著物聯網的興起,數據的積累速度、維度以及體積等也越來越大,成了真正的大數據范疇;在農業溫室大棚中部署的大量各種各樣的傳感器產生了大量多源異構的傳感數據,而且這些數據中存在需要清洗的各種臟亂數據;文章按照數據清洗,模型構建和模型應用3個部分進行詳述,首先介紹數據清洗技術和多源異構數據的融合技術,然后列舉了常見的預測模型構建方法并分別指出了每種方法的適用情況,最后對常見的應用領域進行了綜述和總結,并提出了目前還存在的問題,以及對未來的展望。

數據挖掘;溫室大棚;數據清洗;異構數據

0 引言

在云計算和大數據等新興技術的興起和完善,在農業培育領域也出現了相應的新技術,其中基于物聯網技術的溫室大棚栽培技術也開始在不斷的發展。就實際的應用來看,物聯網溫室大棚技術主要是在溫室里面布設多種傳感器件、控制執行器以及由它們構成的滴管系統、變溫系統、加濕系統和通風系統等。通過各種各樣的傳感器件將農業栽培活動過程中的海量環境信息和作物生長數據通過已有的互聯網絡傳輸至云端服務器進行處理、加工,然后再通過互聯網傳輸到智能終端系統進行展示、智能化管理、電子化交易,對作物生長進行更加細粒度的控制。從而改變以往低效、粗放的農業行為,實現更加高效、節能、生態和安全的生產行為。

正由于物聯網和各種傳感信息獲取技術的不斷延伸和普及應用,使得溫室栽培領域積累的數據爆發式的增長:數據增長速度越來越快、數據體積越來越大、數據結構和維度越來越復雜、數據的冗余量越來越多、數據處理和應用面臨著越來越大的考驗等[1]。各類格式的傳感器無時無刻不在產生著大量的數據,空氣溫濕度、土壤溫濕度、農作物的葉綠素值及其病害情況等數據持續不斷的送往服務器并被存儲在云端的數據倉庫[2]中。如同互聯網[3]一樣,如今的溫室大棚研究領域也已經積累了來自傳感器的海量數據,這些數據的體積之大和結構之復雜單靠人工是無法進行全面而透徹的進行分析的,所以就需要引入數據挖掘相關的研究算法。

本文首先介紹了數據預處理的常見方法,包含數據清洗和多源異構數據的融合技術,然后對比了常見的模型構建的方法,最后簡要列舉了數據挖掘算法在溫室大棚領域中比較常見的應用以及總結,并對后續算法研究中面臨的問題進行了簡要分析總結。

1 數據清洗

數據清洗是數據預處理的主要工作,它的目的是提高數據的質量,以便下一步模型建立。一般來說,在實際傳感器中收集而來的原始數據很可能會含有很多的缺失值,也有可能包含各種數據噪音。這可能是因為傳感器本身對一些異常值的處理方式不同,也有可能是在收集和錄入數據時人為操作失誤導致異常值的產生。這些情況都會導致數據出現不穩定性,模糊性,出現殘缺數據、錯誤數據和重復數據等“臟數據”,對之后使用算法模型挖掘出有效的信息產生很大的困擾。因此,在進行模型建立之前,我們必須使用一些措施來對這些不符合要求的數據進行清洗,以便提高數據的質量。

正常情況數據清洗的第一個步驟就是對數據使用一些數學方法進行統計分析,通過一些圖表來了解哪些數據是不合理的,同時也能夠明白數據的基本情況。在分析完數據之后,需要對數據的缺失值進行處理。缺失值的產生有很多原因,可能是設備在收集的時候處理不當產生的,也有可能是人工錄入數據的時候不小心看錯或者是漏掉導致的。在處理的缺失值的時候首先應該判斷缺失值的分布情況,然后根據不同的數據場景應用不同的處理方法。比較常用的缺失值處理方法有以下幾種[4]。

1.1 中位數或均值替代法

使用均值來替代,這種方法的好處是:不會導致樣本信息變少,而且操作起來也比較簡單。但是有個缺點就是當缺失數據不是隨機數據時會產生偏差。對于正常分布的數據可以使用均值代替,如果數據是傾斜的,使用中位數可能更好。

1.2 插補法

常見的插補法主要以以下幾種:隨機插補法,從總體中隨機抽取某個樣本代替缺失樣本;多重插補法,通過變量之間的關系對缺失數據進行預測,利用蒙特卡洛方法生成多個完整的數據集,在對這些數據集進行分析,最后對分析結果進行匯總處理;熱平臺插補,指在非缺失數據集中找到一個與缺失值所在樣本相似的樣本(匹配樣本),利用其中的觀測值對缺失值進行插補,優點:簡單易行,準確率較高,缺點:變量數量較多時,通常很難找到與需要插補樣本完全相同的樣本。但我們可以按照某些變量將數據分層,在層中對缺失值實用均值插補。

1.3 建模法

可以用回歸、使用貝葉斯形式化方法的基于推理的工具或決策樹歸納確定。例如,利用數據集中其他數據的屬性,可以構造一棵判定樹,來預測缺失值的值。

以上各種缺失值處理的方法各有優劣,在實際使用的時候需要根據具體情況,如數據的傾斜度、缺失值所占的比例和分布情況等來進行選取。正常來說,建模法由于是根據已有的值來預測缺失值,準確率更高,所以是比較常見的方法。

處理完缺失值后,數據中往往還會存在著異常值。從統計圖形上來看,異常值通常也稱為“離群點”。在處理異常值的時候,可以視算法特性而定,有些算法可能對異常值并不是很敏感,那么就可以不需要對其進行處理,而有的算法對這些“離群點”比較敏感,比如K-Means,KNN之類的算法,那么就需要對異常值進行處理了。當數據中可以明顯觀察出異常數據量比較少的時候是可以直接將它們刪除掉,否則可以使用平均值替代法來進行操作,這種方法均有損失小,簡單高效的優點。還有一種方式就是將異常值當做缺失值來進行處理,使用以上處理缺失值的方法來進行。

由于一些感知信息如大棚室溫、土壤溫度、空氣濕度等并不是時刻在發生著變化,它們更多的是以小時為時間單位而發生變化,而傳感器的數據采集頻率正常是遠沒有這么久,這就導致了一個問題:數據存在極大的冗余性[2]。數據冗余性除了會增加模型的訓練時間之外,還有會加大數據的傳輸量和帶寬延遲。

在消除冗余數據方面,Jeffrey提出了基于管道的算法,根據原始數據的特性使用了兩種不同的步驟進行處理,這種算法可以很好的處理數據的重復讀取,降低冗余性[6]。Jeffrey在他的另一篇論文中提出一個基于時間相關的數據清洗策略,該策略使用一個可能性模型和來解決數據的泄露問題[4]。另外,Sarma 也介紹了一個管道算法來提高7去除冗余之后數據流的質量[8]。

2 異構信息融合方法

雖然我們在前文對數據進行過清洗,不過仍然存在問題就是數據的多源異構性。由于數據是來自各種各樣的傳感器,包括環境感知數據、作物生長數據等,這些數據從內容、格式上來分析都是不同的,因此如果想對這些數據進行下一個的加工就需要先對其進行融合,將數據格式融合統一之后才可以執行下一步的加工操作。由布設于溫室環境中大量的傳感器和執行器所構成的環境數據信息感知系統、作物生長信息感知系統以及滴管系統、變溫系統和通風系統,將所采集的大量的農業信息數據通過網絡傳輸到云端服務器進行加工處理,以幫助農民智能化農業生產活動,通過預警機制及時發現問題,準確知道發生問題的具體位置。實現以大量傳感設備和執行設備為中心的智能化生產模式,通過各種自動化、智能化、遠程控制的生產設備使得人從繁重的農務中解放出來。在上述系統中,主要的傳感器設備包括溫濕度傳感器、酸堿性傳感器、二氧化碳傳感器和光照傳感器等設備,運用這些傳感器對溫室環境進行偵測,所得結果數據類似如表1所示。將傳感器傳回來的各種數據通過儀表和各類顯示走勢圖實時展示溫室情況,對作物的生長環境進行實時監控以保證作物的健壯成長。

產生于不同種類的傳感器件的各種各樣的數據信息,對之后的數據加工有著很大的干擾,直接利用它們進行分析預測會導致結果模型不穩定,模型不夠魯棒,而且數據處理過程中由于要判斷不一樣的數據也會導致梳處理速度變慢。因此,可以使用數據融合技術對這些異構數據進行預處理,使其形成完整統一的數據,這樣才可以繼續下一步的預測模型構建,數據融合技術是數據預處理過程中的主要工作。

1991年,由美國(joint directors of laboratories, JDL)提出了一種數據融合模型[10],業界的大部分研究者都接受這個融合模型。當前,由于已有的大多數融合系統在實現的細節上還存在著諸多的不一致,所以很多學者還在尋求一種新的理想的模型框架。不過,幸運的是現有的一些工具或者方案可以符合一些功能上的要求,比如FLAMES系統、SceneGen[11]工具、MRS[12]工具等系統和工具。數據信息融合的研究設計到很多理論知識,從數據結構算法的角度來看,大概可以分為:人工智能方法和概率統計方法兩個大類。其中人工智能方法中模糊理論神經網絡、D-S 證據推理、Bayes 估計這3個占了融合算法的85%,另外粗糙集等機器、遺傳算法、支持向量機學習方法也已經開始在信息融合中深入應用。常見的機器學習融合算法主要有表2所描述的幾種。

除了從算法的角度進行分類之外,還可以從異構數據集成技術的角度來對數據融合方法進行分類,分為模式集成方法和數據復制方法。其中,模式集成方法主要思路是通過將所有的數據源集中成一個全局模式,用戶在使用的時候可以基于全局模式來透明的訪問每一個數據集里面的數據,中間件集成方法和聯邦數據庫是當下兩種比較典型的模式集成方法[15],如表3所示。而數據復制方法的主要思想是通過將異構的數據集統一存放在中央數據庫里面,其中,數據倉庫是數據復制方法中比較受歡迎的一種方法。Hadley通過定義對數據語義的理解和映射,使用典型的關系型數據庫對其做了新的定義[16],使用變量名作為數據表的列,具體的數據存放在二維表關系表的行里面,從而將多遠異構數據融合存放在一個新的統一數據庫里面[17]。

表2 常見的機器學習數據融合算法

表3 傳統的異構數據集成工程技術

3 預測模型在溫室大棚中的研究現狀

3.1 模型構建方法

在處理完大量異構數據的預處理和信息融合等工作之后,接下來的任務就是進行植物生長預測模型的構建工作。模型構建的主要過程是在缺失的、海量的、隨機和有雜音的數據中,通過一些數據挖掘算法分析出這些傳感數據信息里面所包含的、潛在有價值的信息和知識的過程。由于溫室作物栽培過程的一些特性:作物類型繁多,土壤種類復雜且不易檢測,密度、水分和氣候等多種因素之間相互影響影響,作物病害頻繁發生且不斷出現新的癥象,這樣就使得關于數據庫與知識庫具有多個維度、數據不完整、矩陣稀疏性高、數據量大、數據不確定、動態等特征,使得本來就復雜的傳感數據變得更加的模糊不清。所以,在選擇模型構建方法的時候,所選擇的方法應該要適合與處理溫室農業領域的相關數據特征。此外前面所提及的數據有領一個重要的特征,那就是它的測量方式往往是和當前時間互相掛鉤的,因此在進行數據分析的時候,應該要盡量考慮時間方面的因素。模型構建的主要步驟如下所示[20](圖1):

表4 智慧農業上常用的模型構建方法

1)數據定義:創建元數據,定義相關專業領域的情況,了解基礎知識背景,理清用戶的需求。這是創建數據質量改善方法和數據倉庫的首要步驟。

2)數據準備:這一步是數據分析挖掘過程中的重要環節,需要對原始數據進行清洗和過濾操作,然后檢驗數據的一致性和完備性,其中,主要的工作是處理噪音數據,以及對缺失的數據進行填充。

3)模型構建:通過對比多種數據挖掘算法,選出符合要求的算法,然后確定最終的預測算法。

4)數據挖掘:利用前一步驟所選擇的預測算法,從經過預處理的數據中分析出用戶想要的信息,將這些信息提煉成某種特定的規則表達式,然后持久化存儲。

5)知識評估:知識評估包含知識的解釋、知識外推和預測模型的優化等等。將挖掘得到的知識以用戶可以容易理解的方式展示出來,根據用戶的需求對數據挖掘過程中的繆寫步驟進行修改優化,直到符合用戶的要求為止。

在智慧農業發展過程中,主要有以下表4所述的幾種模型構建方法比較常見。

圖1 數據挖掘過程

3.2 常見應用方向概述

在大棚農業系統中,由于土壤類型眾多,作物品種復雜,病蟲害發生頻繁且病發癥狀不斷變化,土壤營養成分、溫濕度以及氣候相互之間的關系和影響,仍然還有許多未知的規律還未被人類所發現。在前面介紹完數據清洗和數據融合技術等預處理技術以及常見的模型構建方法之后,本節主要介紹數據挖掘技術在大棚農業系統上的常見應用場景,主要有圖2所示的幾個應用。

圖2 數據挖掘在大棚農業上的應用

3.3 作物病害預測模型的實踐研究

預測模型在大棚栽培的作物病害應用,歸納起來有這幾種:發生趨勢預測、風險評估病及其蟲害動態監測等應用。溫室作物里病害的發生條件受到了栽培耕作條件、農作物布局、氣象條件和品種抗性等多種因素的作用,另外由于氣候溫度等的原因,所以病害的發生也與地理空間有一定的關聯。預測模型能夠用來預測在某個時間段內發生病害的概率,以及所發生的病害的樂行,從而為病害的預防治理決策提供參考支持。病蟲害導致我國每年的經濟損失達到了15~25%,因此研究病蟲害的預測結果對農業的發展具有很大的意義。

關聯規則挖掘(Association Rule Mining)最早是為了發現超市交易數據庫中不同的商品之間的關系。它用于挖掘數據中隱含的練習,通過關聯規則形式表示。Apriori算法是最有影響的挖掘關聯規則的算法之一,該算法目前已應用于農業、商業、林業和教育等方面。Apriori算法通過分析事物之間的相互依賴關系,能發現和提取隱藏在在數據背后的有效知識,有助于人們認識和理解其中存在著的客觀規律,具有很大的實用價值。Perrizo et al.通過使用Apriori算法,在支持度仍然比較低的情況下,通過尋找較高的置信度規則來預測溫室中作物蟲害的數量規模[25]。Wang et al.利用已收集的溫室環境信息和Apriori算法提出了一個預測模型來構建實時的溫室環境參數監測和植大棚作物蟲害疾病監控系統[26]。Tripathy et al.使用關聯規則挖掘技術發現了在溫室環境溫度18-20攝氏度,作物葉面濕度在7~10%,以及濕度處于70%或更高的時候是容易產生蟲害的一個影響條件[27]。另外,Pratheepa et al.也發現了當溫室環境最高溫度處于28.3~33.1攝氏度,而最低溫度處于 16.5~22.07 攝氏度并且相關濕度是在45.5~60%范圍的時候,作物蟲害事件的出現概率大大提高[28]。

3.4 專家決策支持系統的研究進展

大多數決策支持系統中的專家知識庫是建立在相應領域的專家只是的基礎上的,并且大棚農業領域中的專家只是多事經驗性和描述性的,這就導致了很難使用數學模型對這些知識進行描述,所以專家決策支持系統存在著知識庫中知識獲取難度大、知識量少等難題。大棚農業生產支持決策系統是指以區域農業經濟為研究對象,以農業可持續發展為決策目標,對大棚生產中的非結構化決策問題,通過提供溫室環境和社會環境的背景資料協助明確問題、模型計算和列舉可能發案等方式,為大棚生產的管理者做出正確決策提供幫助。

M.G.Hill et al.使用2008-2011年來自新西蘭的四年的農場大棚數據,分別使用決策樹、素樸貝葉斯、隨機森林、支持向量機以及邏輯回歸等數據挖掘技術在2008-2010三年的數據上構建了5個預測模型,然后預測2011年該年是否需要對獼猴桃作物進行農藥噴灑。得出了每個模型各不一樣的預測效果,其中決策樹的準確率為49%,隨機森林的準確率為98%,而樸素貝葉斯的準確率則為95%[29]。Sadok et al.提出了一個基于決策樹算法的MASC模型,該模型將比較大而復雜的決策問題分解為一個個簡單的以經濟、社會和環境3個變量為維度的單元問題,產生32個重要的全局向量元素來評價作物系統[30]。Ellis et al.提出了包含數據庫,地理信息系統,預測模型,知識庫或專家系統,以及“混合”決策支持系統等元素的基于數據挖掘技術的決策支持工具,促進指導農林業發展,建議采納和管理方面的決策過程,提高農林業同時實現環境保護和農業生產目標的能力[31]。Latika et al.使用數據挖掘技術構建了知識管理系統和OLAP在線分析系統[32]。

3.5 數據挖掘技術在植物生長過程中的預測

在我國傳統農業的發展過程中,對于作物產量和果實質量的預測都是靠著果農的過往經驗來進行預測的,特別是在環境氣候因素與常年的情況偏離比較大的時候,這種人為預測的效果與實際值的偏差就更大了。當前在預測領域中,已經有不少的數據挖掘技術被付諸實踐,如神經網絡、遺傳算法和高斯過程等技術,在各種預測領域中發揮著重要作用。其中使用數據挖掘進行預測的思路主要是從已有的各種數據中尋找潛在的模式和趨勢的過程,目標是對大量的數據進行分類,從而發現新的信息。目前已有不少研究人員用相應的挖掘技術對大棚作物的成長過程進行了預測。

Georg et al.使用人工神經網絡技術對小麥的產量進行預測,根據季節環境信息,土壤肥沃程度等數據預測的結果在誤差允許的范圍內,并且從環境和經濟的角度實現了肥料的優化用法,提高了經濟效益[33]。Cortet et al.根據法國東北部10年以來土壤中的生物肥料和礦物質等數據進行分析,發現生物尸體堆土壤中的磷成分有很大的影響,該論文使用數據挖掘技術驗證了生物尸體對于維持土壤中的磷成分的方法是比較穩妥的[34]。貝葉斯分類技術是一種統計學分類方法,利用概率論統計知識進行分類的算法,具有分類簡單、準確率高和速度快等優點。Shahinfar et al.使用樸素貝葉斯算法結合26個農場數據,對產量進行了精準的預測[35]。

3.6 本章小結

綜合以上的概述來看,數據挖掘技術對該領域的數據分析主要還是停留在對經驗數據的概率統計上,大部分的預測模型的預測準確性并不是很高,使用的預測算法主要是來自其他領域較為成熟的應用算法,各種算法的研發和應用仍然有待提高,缺少大棚農業上的特色算法的創新和研制,研究人員應該利用溫室培植的獨有特點,然后結合已有的成熟算法進一步改造或者創造出適合溫室作物生產生長預測的模型算法。

4 總結

由于信息科學技術的高速發展,使得大棚農業也快速走上了信息化和智能化的道路。本文分別從數據預處理,模型構建和預測模型的應用。數據預處理主要包含了數據清洗和多源異構數據的融合兩部分,然后分析比較了數據挖掘在溫室大棚上常用的模型預測方法,最后對這些模型構建方法在農業大棚上的應用情況進行了分析了舉例,闡述當前的研究狀況。另外,從溫室大棚和智慧農業的角度來說,目前仍然存在以下幾個問題。

第一個問題體現在數據預處理方面的數據缺失,模糊問題。所以在未來,應該克服傳感器在收集數據時候出現的數據丟失和模糊等問題,可以在保存數據的時候對其進行格式的驗證等;第二個問題是數據異構性仍然是當前需要面對的一個問題,如果能夠統一數據格式和傳輸協議,相信這個問題也是能夠得到很好的解決;最后一個問題是預測模型的創新,研究人員應該著重于農業培植的獨有特點,結合已有的成熟算法進一步改造或者創造出適合大棚農業作物生產生長預測的模型算法。

因此,我們應當在互聯網+的時代下,把握機會努力發展智慧農業,克服以上的問題[36-38],讓智慧農業變得更加的智慧,更加自動化,以便減少人力和物力等資源的耗費。

[1] 王元卓, 靳小龍, 程學旗. 網絡大數據:現狀與展望[J]. 計算機學報, 2013, 36(6):1125-1138.

[2] Abdullah A, Hussain A. Data mining a new pilot agriculture extension data warehouse[J]. Journal of Research & Practice in Information Technology, 2006, 38(3):229-249.

[3] Brin S, Page L. The anatomy of a large-scale hypertextual Web search engine[A]. International Conference on World Wide Web[C]. Elsevier Science Publishers B. V. 1998:107-117.

[4] Bertossi L, Kolahi S, Lakshmanan L V S. Data Cleaning and Query Answering with Matching Dependencies and Matching Functions[J]. Theory of Computing Systems, 2013, 52(3):441-482.

[5] Wang L, Xu L D, Bi Z, et al. Data Cleaning for RFID and WSN Integration[J]. IEEE Transactions on Industrial Informatics, 2014, 10(1):408-418.

[6] Jeffery S R, Alonso G, Franklin M J, et al. A Pipelined Framework for Online Cleaning of Sensor Data Streams[A]. International Conference on Data Engineering. DBLP[C]. 2006:140-140.

[7] Jeffery S R, Garofalakis M, Franklin M J. Adaptive cleaning for RFID data streams[A]. International Conference on Very Large Data Bases[C]. Seoul, Korea, 2006:163-174.

[8] Sarma A D, Jeffery S R, Franklin M J, et al. Estimating data stream quality for object-detection applications[J]. Technical Report, 2006.

[9] 李治強, 苗放. 多源異構數據整合在信用系統中的應用研究[J]. 計算機技術與發展, 2007, 17(2):172-174.

[10] Dasarathy B V. Revisions to the JDL data fusion model[J]. Proceedings of SPIE - The International Society for Optical Engineering, 1999, 3719:430-441.

[11] Mehta C, Srimathveeravalli G, Kesavadas T. An approach to design and development of decentralized data fusion simulator[A]. Winter Simulation Conference[C]. IEEE, 2005:7 pp.

[12] Vanhamme L, Van d B A, Van H S. Improved method for accurate and efficient quantification of MRS data with use of prior knowledge[J]. 1997, 129(1):35-43.

[13] Zhang J, Kang D K, Silvescu A, et al. Learning accurate and concise naive Bayes classifiers from attribute value taxonomies and data[J]. Knowledge and Information Systems, 2006, 9(2):157-179.

[14] Shevade S K, Keerthi S S, Bhattacharyya C, et al. Improvements to the SMO algorithm for SVM regression[J]. IEEE Transactions on Neural Networks, 2000, 11(5):1188-93.

[15] 李曉麗. 異構數據集成技術在物聯網中的研究與應用[D]. 北京:北京郵電大學, 2013.

[16] Grolemund G, Wickham H. A Cognitive Interpretation of Data Analysis[J]. International Statistical Review, 2014, 82(2):184-204.

[17] Wickham H. Tidy data[J]. Journal of Statistical Software, 2014, 059.

[18] 朱好好. 異構數據融合中間件的研究與應用[D]. 武漢:華中科技大學, 2012.

[19] Delgado G, Aranda V, Calero J, et al. Using fuzzy data mining to evaluate survey data from olive grove cultivation.[J]. Computers & Electronics in Agriculture, 2009, 65(1):99-113.

[20] Fernandez Martinez R,Martinez-de-Pison Ascacibar F J, Pernia Espinoza A V, et al. Predictive modelling in grape berry weight during maturation process: comparison of data mining, statistical and artificial intelligence techniques[J]. Spanish Journal of Agricultural Research 2011 9(4), 1156-1167.

[21] Wu X, Kumar V, Ross Quinlan J, et al. Top 10 algorithms in data mining[J]. Knowledge and Information Systems, 2008, 14(1):1-37.

[22] Tsang I W, Kwok J T, Cheung P M. Core Vector Machines: Fast SVM Training on Very Large Data Sets[J]. Journal of Machine Learning Research, 2005, 6(1):363-392.

[23] Ahmed S, Coenen F, Leng P. Tree-based partitioning of date for association rule mining[J]. Knowledge and Information Systems, 2006, 10(3):315-331.

[24] Caruana R, Niculescu-Mizil A. An empirical comparison of supervised learning algorithms[A]. International Conference on Machine Learning[C]. ACM, 2006:161-168.

[25] Perrizo W, Ding Q, Ding Q, et al. Deriving High Confidence Rules from Spatial Data Using Peano Count Trees.[J]. Lecture Notes in Computer Science, 2001, 2118:91-102.

[26] Wang X F, Wang Z, Zhang S W, et al. Monitoring and Discrimination of Plant Disease and Insect Pests based on agricultural IOT[A]. International Conference on Information Technology and Management Innovation[C]. 2015.

[27] Tripathy A K, Adinarayana J, Vijayalakshmi K, et al. Knowledge discovery and Leaf Spot dynamics of groundnut crop through wireless sensor network and data mining techniques[J]. Computers & Electronics in Agriculture, 2014, 107(107):104-114.

[28] Pratheepa M, Verghese, Abraham, Bheemanna, H. Weighted Association rule mining for the occurrence of the insect pest Helicoverpa armigera(Hubner) related with abiotic factors on cotton[A]. International Conference on Computing For Sustainable Global Development[C]. 2016.

[29] Hill M G, Connolly P G, Reutemann P, et al. The use of data mining to assist crop protection decisions on kiwifruit in New Zealand[J]. Computers & Electronics in Agriculture, 2014, 108:250-257.

[30] Sadok W, Angevin F, Bergez J E, et al. MASC, a qualitative multi-attribute decision model for ex ante assessment of the sustainability of cropping systems.[J]. Agronomy for Sustainable Development, 2009, 29(3):447-461.

[31] Ellis E A, Bentrup G, Schoeneberger M M. Computer-based tools for decision support in agroforestry: Current state and future needs[J]. Agroforestry Systems, 2004, 61(1):401-421.

[32] Latika Sharma, Nitu Mehta. Data Mining Techniques: A Tool For Knowledge Management System In Agriculture[J]. International Journal of Scientific & Technology Research, 2012, 1(5):67-73.

[33] Rub G, Kruse R, Schneider M, et al. Data Mining with Neural Networks for Wheat Yield Prediction[J]. Lecture Notes in Computer Science, 2008, 5077:47-56.

[34] Cortet J, Kocev D, Ducobu C, et al. Using data mining to predict soil quality after application of biosolids in agriculture.[J]. Journal of Environmental Quality, 2011, 40(6):1972-1982.

[35] Shahinfar S, Page D, Guenther J, et al. Prediction of insemination outcomes in Holstein dairy cattle using alternative machine learning algorithms[J]. Journal of Dairy Science, 2014, 97(2):731-42.

[36] Qiang Y, Xindong W. 10 challenging problems in data mining research[J]. International Journal of Information Technology & Decision Making, 2006,5(4):597-604.

[37] Ojha T, Misra S, Raghuwanshi N S. Wireless sensor networks for agriculture: The state-of-the-art in practice and future challenges[J]. Computers & Electronics in Agriculture, 2015, 118(3):66-84.

ApplicationofDataMininginGreenhouse

Zheng Zengwei1, Chen Hanqun1,2, Sun Lin1, Cai Jianping1

(1.Hangzhou Key Laboratory for IoT Technology &Application, Zhejiang University City College, Hangzhou 310015,China;2.School of Computer Science and Technology, Zhejiang University, Hangzhou 310015,China)

With the rise of the Internet of Things, data accumulation speed, dimension and volume are also growing, and has become a real big data category. The large variety of sensors deployed in agricultural greenhouses produces a large number of multi-source heterogeneous sensing data, and there are various types of dirty data that need to be cleaned. In this paper, data cleaning, model building and model application are described in detail. Firstly, data cleaning technology and multi-source heterogeneous data fusion technology are introduced. Then, common forecasting model construction methods are listed. Finally, common application fields are introduced. Summarizes and puts forward the existing problems, as well as the prospect of the future.

data mining; greenhouse; data clean; heterogeneous data

2017-04-08;

2017-05-23。

杭州市農業科研主動設計項目(20162012A06);杭州市農業科研自主申報項目(20170432B30);杭州市物聯網技術與應用重點實驗室及杭州市農業科研主動設計項目(20162012A06)。

鄭增威(1969-),男,教授,主要從事數據挖掘、普適計算、物聯網技術等方向的研究。

孫 霖(1979-),男,博士,主要從事數據挖掘、普適計算、物聯網技術等方向的研究。

1671-4598(2017)11-0123-06

10.16526/j.cnki.11-4762/tp.2017.11.032

TP312

A

猜你喜歡
數據挖掘方法模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
一種基于Hadoop的大數據挖掘云服務及應用
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 青青青国产精品国产精品美女| 久久99精品久久久久久不卡| 久久久久久久久亚洲精品| 亚洲色婷婷一区二区| 波多野结衣第一页| 亚洲资源在线视频| 久久久噜噜噜| 国内精品小视频福利网址| 精品综合久久久久久97| 亚欧成人无码AV在线播放| 91在线播放国产| 中文无码精品A∨在线观看不卡| 中文字幕在线观看日本| 久久黄色毛片| 国产日韩精品欧美一区灰| 国产精品真实对白精彩久久| 亚洲人成日本在线观看| 亚洲午夜18| 国产亚洲欧美在线人成aaaa| 亚洲天堂啪啪| 精品久久香蕉国产线看观看gif| 一级毛片视频免费| 丝袜国产一区| 天堂在线www网亚洲| 九色最新网址| 日韩在线永久免费播放| 日本国产精品一区久久久| 国产在线精品人成导航| 网久久综合| 狠狠色噜噜狠狠狠狠奇米777| 国产欧美日韩资源在线观看| 丰满少妇αⅴ无码区| 成人午夜视频免费看欧美| 米奇精品一区二区三区| 国产va在线观看免费| 国产99久久亚洲综合精品西瓜tv| 久视频免费精品6| 亚洲欧美成人影院| 亚洲精品手机在线| 91小视频在线观看免费版高清| 国产又爽又黄无遮挡免费观看| 国产精品亚洲αv天堂无码| 国产一在线| 毛片网站在线看| 国产精品观看视频免费完整版| 亚洲无码免费黄色网址| 五月婷婷精品| 高h视频在线| 亚洲Av综合日韩精品久久久| 久久精品人妻中文系列| 久久永久视频| 999福利激情视频| 久久人午夜亚洲精品无码区| 亚洲天堂.com| 亚洲欧美精品一中文字幕| 国产福利观看| 国产在线97| 国产成人精品一区二区| 亚洲日韩高清在线亚洲专区| 成人在线第一页| 中文字幕人妻av一区二区| 欧美亚洲日韩不卡在线在线观看| 久久五月视频| 国产精品理论片| 国产在线观看第二页| 国产第八页| 日韩无码真实干出血视频| 午夜福利网址| 凹凸精品免费精品视频| 性欧美精品xxxx| 在线精品欧美日韩| 亚洲色图综合在线| 中文字幕无码av专区久久| 久久这里只有精品免费| 日韩二区三区| 亚洲看片网| 一级毛片网| 精品亚洲欧美中文字幕在线看| 波多野结衣一区二区三区四区| 久久永久视频| 成人另类稀缺在线观看| 精品国产黑色丝袜高跟鞋|