999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于貝葉斯網絡數據挖掘的蔬菜質量安全分析

2016-04-29 00:00:00方永美熊俊濤楊振剛廖鑒康
湖北農業科學 2016年23期

摘要:蔬菜是人們日常生活的必須品,也是容易出現質量安全問題的產品。影響蔬菜質量安全的一個重要因素就是農藥殘留問題。以蔬菜農藥殘留檢測數據為對象,利用貝葉斯網絡進行數據挖掘,得到不同品種蔬菜的農藥殘留含量分布,以及同一品種在不同時間的分布趨勢,經過可信度分析,該結論可信。該結果可為蔬菜的生產者、消費者以及監管人員提供一定的決策依據。

關鍵詞:數據挖掘;貝葉斯網絡;農藥殘留;質量

中圖分類號:TS201.6;R857.3 文獻標識碼:A 文章編號:0439-8114(2016)23-6253-05

DOI:10.14088/j.cnki.issn0439-8114.2016.23.063

Abstract: Vegetable is one of the necessities of people’s daily life. It is also prone to occurring quality and safety issues. It is pesticide residue that was one of the important factors which effects on the vegetable quality and safety. Bayesian network of data mining technology is applied to mining the limited assay information of vegetable. It got to pesticide residues distribution for varieties of vegetables, and the same vegetable distribution trends in different months. The results are credible and can offer some decision for producers, consumers and supervisors of vegetable quality and safety.

Key words: data mining;bayesian network;pesticide residue;quality

隨著社會的發展和生活水平的提高,人們對蔬菜產品安全的關注與日俱增,影響蔬菜質量安全的一個重要因素就是農藥殘留問題。以蔬菜農藥殘留監測為基礎的蔬菜安全風險分析作為現代蔬菜安全管理工作的發展方向,正逐步成為各國遵循的準則和行為規范[1]。Li等[2]研究認為,中國食品安全保障體系的標準陳舊且執行不嚴謹。Rudder[3]通過對蔬菜的銷售渠道進行研究發現,農民把蔬菜賣給生產廠商來降低安全責任。

周潔紅等[4]以經濟學為理論基礎,提出了以批發市場為核心實施蔬菜質量安全可追溯體系是現階段建設蔬菜質量安全管理的最有效方法。劉中華[5]認為供貨商對蔬菜質量管理意識的缺乏以及對供貨商的約束力不足導致出現差異。樊紅平等[6]用系統理論分析了農產品檢驗檢測體系構成及其功能。樊孝鳳[7]從信息不對稱理論的角度,著重解釋了中國蔬菜農殘普遍超標的現象。許宇飛[8]認為,對食品安全狀態評價應根據各污染物的限量標準進行逐級評價;秦燕等[9]提出運用控制圖方法來監測食品安全質量是否處于控制狀態。王志剛[10]利用Probit模型對影響消費者農產品質量安全的認知和購買行為的主要影響因素進行了解析。

大部分研究采用傳統方法,難以滿足對蔬菜農藥殘留檢測數據的深度分析需求。國內開展對DMKD(數據挖掘和知識發現)的研究稍晚,沒有形成整體力量[11]。有關蔬菜質量安全方面應用數據挖掘技術的研究鮮見報道[12]。陳晨等[13]采用貝葉斯分類算法,以玉米生長環境和質量數據庫為對象,對新生長環境下玉米的生長質量進行挖掘。劉春玲等[14]認為,在農業領域積累的大量農業數據信息中運用數據挖掘是極具應用前景的方案。本研究以山東省煙臺市的蔬菜檢測數據為對象,運用貝葉斯網絡方法進行數據挖掘,得出蔬菜質量安全的規律以及趨勢,以期為蔬菜農藥殘留檢測數據分析提供參考。

1 數據獲取

數據均來自煙臺蔬菜質量安全信息網,數據的時間覆蓋范圍是從自2006年7月到2013年2月(除2009年9、10月外),共78期抽檢信息。記錄項目包括檢測時間、檢測地點、品種、平均酶抑制率和平均合格率。

平均酶抑制率是決定了蔬菜農藥殘留的量化標準,根據國家頒布的農藥殘留檢測條例,如果檢測得出酶抑制率超過50%則認定為農藥殘留超標,評定結果為不合格。使用Weka3.6[15]作為數據挖掘工具,在對數據進行挖掘前,要對收集的數據進行集中、整合、清理。

對收集的每月原始數據進行集中、整合。把整合后的數據轉換成XLS文件,并由XLS文件轉換成Weka能識別的CSV文件;通過Weka的Explorer運行CSV文件,并將其另存為ARFF文件。圖1是Explorer運行CSV文件后成功讀取數據的結果。從圖1中可以看到,該文件中數據數量為3 768。

2 數據處理

2.1 屬性選擇

通過分析原始實例得到5個屬性值。

1)地點屬性:文化路市場、三環市場、大世界市場、紅利市場、前進路市場、新橋市場、煙大市場、祥和市場、宏達市場、其他地點,共10個可取值,是名詞性屬性,沒有殘缺值。

2)品種屬性:韭菜、黃瓜、生菜、油菜、茼蒿、芹菜、蕓菜、菠菜、其他蔬菜,共9個可選值,是名詞性屬性,沒有殘缺值。

3)時間屬性:2006年7月~2013年2月(除2009年9、10月外),以月為單位,共78個可選值,沒有殘缺值。

4)平均酶抑制率和平均合格率屬性都是數值性屬性,區間在[0,100],單位是百分比。

5)平均酶抑制率是根據抽檢單位抽檢統計而來的直接數據。平均合格率只是平均酶抑制率的另一個反映,因此,平均合格率是冗余屬性,在處理過程中不考慮,通過Weka中的Remove按鈕刪除。處理后,得到4個屬性,分別為品種、地點、時間和平均酶抑制率。

2.2 數據清理

經過檢查,實例集中一共有109個殘缺值,約占2.9%,且其屬性均為平均酶抑制率。黃瓜和蕓豆中的平均酶抑制率的殘缺值最多,并且多集中在煙大市場、文化路市場;其原因是這兩個品種的供應量很少,導致抽檢量也少。平均酶抑制率作為類屬性,其值的缺失使得該實例失去了參考意義。因此,刪除這兩個市場的黃瓜和蕓豆實例,實例數量分布如表1所示。

對于連續抽檢實例集,還需考察各個屬性的實例數量比例情況。表1中所示的品種為菠菜、地點為宏達市場的實例數較少,分別只有23個和8個。這2種實例會給挖掘算法帶來較大的誤差率。通過查初始數據得知,菠菜的抽檢只在2006年7月到2006年10月進行,而宏達市場的抽檢則只在2007年8月進行。在一共78個抽檢月里,這些實例屬于少數,從實例的健壯性考慮,刪除地點是宏達市場和品種是菠菜的實例。

2.3 屬性離散

在進行相關數據挖掘前,對平均酶抑制率進行離散化。由于平均酶抑制率為50%是一個閾值,因此只需進行等區間劃分,使用過濾器Discretize功能實現,結果如表2所示。區間內數值的單位是百分比。平均酶抑制率越小,代表其農藥殘留成分越低。由于平均酶抑制率大于或等于50%的蔬菜不能食用,對區間進行修正。首先,將50以上的三個區間合并成一個區間;其次,要把“-∞”替換成最小值“0”,把“∞”替換成最大值“100”。得到一個四區間的分布。為方便起見,把區間[0,16.666 667)、[16.666 667,

33.333 333)、[33.333 333,50)、[50,100]分別稱為A類、B類、C類、D類。A類代表農藥殘留水平是最低,其次是B類,兩者都是可以放心食用的類別。C類是一個警戒的農藥殘留水平;對于D類,平均酶抑制率超過50%,不能食用。

2.4 數據轉換

通過數據轉換,得到2個一樣的實例集:數值型版本實例集和名詞型版本實例集。除了表現形式,其他方面完全一樣。名詞型版本中,包括品種、地點、年份、月份、平均酶抑制率5個屬性;數值型版本中,共有40個屬性,其中品種有9個、地點有10個、年份有8個、月份有12個以及平均酶抑制率。得到這2個實例集后,將這些實例的順序隨機打亂,將排序的影響降到最小。用Randomize過濾器進行順序隨機化。

3 蔬菜質量安全趨勢的數據挖掘

3.1 運行貝葉斯網絡

貝葉斯網絡是一種基于統計理論,具有較強理論根基,采用圖解方式表達概率分布的方法。貝葉斯網絡畫出的圖形就像是節點網絡圖,每個節點代表一個屬性,節點間用有方向的連線連接著,卻不能形成環,是一個有向無環圖[15]。

在Weka當中,選取貝葉斯網絡分類器(Bayes Net),將初始累計值alpha設置為0.5以避免零頻率;選擇K2算法并將最大父輩節點數量設為1;在useADTree中選擇true,以減少搜索算法重復搜索這個實例集的次數。點擊OK按鈕,算法開始工作。選擇visualize graph,查看到網絡結構,如圖2所示。

分別運行圖2中的平均酶抑制率節點、月份節點、地點節點、品種節點、年份節點,將會出現各屬性的概率密度。點擊平均酶抑制率節點,出現總體實例集在各個區間的分布概率,其在A類(0,16.666 667)的概率是0.268,B類[16.666 667, 33.333 333)的概率是0.586,C類[33.333 333,50)的概率是0.144,D類[50,100]的概率是0.002。實例大部分處于A、B類,說明蔬菜農藥殘留程度總體上不高。

3.2 可信度分析

點擊Summary,得到貝葉斯網絡的基礎評估信息,其相關系數達到84.2%,Kappa統計量是70.1%。從正確的肯定率來看,貝葉斯網絡對A類的正確肯定率為69.3%,其對A類的錯誤肯定率只有4.9%。對B類、C類的正確肯定率則較高,分別達到92.6%和78.6%。ROC Area方面,在A類、B類、C類均達到了91%以上,取得比較好的效果。

3.3 蔬菜質量安全分析

3.3.1 單個屬性分析 運行圖2中的月份節點,得到關于平均酶抑制率在不同月的概率密度,結果如圖3所示。從圖3分析得到,7、8月的總體平均酶抑制率最高,以其為中軸,其他月的情況逐漸好轉。7、8月C類的概率較高;5、6月D類的概率較高。總體來講,從5月到9月,屬于C、D類的概率較大,說明蔬菜的農藥殘留水平超標的風險增加。這是因為這個時間段氣溫轉高、濕度適宜,是害蟲的發育階段,危害最為嚴重,相應地,菜農對蔬菜的用藥量也大幅度提高。處于一年中的年首和年尾的蔬菜農藥殘留較低。

運行圖2中的地點節點,得到關于平均酶抑制率在不同地點的概率密度,結果如圖4所示。從圖4可以看出,對于地點而言,祥和市場蔬菜的總體平均酶抑制率偏低。祥和市場中,A類的概率密度遠遠高于其他市場,其次是煙大市場、新橋市場、大世界市場。高危的是紅利市場、文化路市場,在這些地點平均酶抑制率偏高的概率密度較大。尤其是紅利市場,C類的實例占到了一半以上。D類的5個實例中有2個就屬于紅利市場,2個是文化路市場,1個是新橋市場。

運行圖2中的品種節點,得到關于平均酶抑制率在不同蔬菜品種間的概率密度,結果如圖5所示。從圖5可以看出,平均酶抑制率較低的分別是蕓豆、生菜、茼蒿以及其他蔬菜;平均酶抑制率較高的分別是韭菜、油菜、黃瓜、芹菜。韭菜屬于C類的概率密度超過其他品種。

對于葉菜類蔬菜,如油菜,容易生蟲子,對這類蟲害的處理方法一般是葉面噴灑農藥;因此,葉菜類一般比根莖類蔬菜的農藥殘留多。黃瓜作為瓜果類蔬菜的一種,比較特殊,由于生長的環境濕度較大,容易生病,對其用藥量一般較大。一般認為,像韭菜這類辛辣類蔬菜或者鱗莖類蔬菜具有較好的抗蟲害能力;實際上,韭菜的農藥殘留問題一般比較嚴重。因為韭菜會受到韭蛆的危害,為了消滅地下的蟲害,不得不使用更多劑量的農藥;一些菜農甚至采用大面積、大劑量地使用有毒的有機磷農藥灌地,從而導致農藥殘留的情況比較嚴重。

3.3.2 綜合分析 對品種屬性與地點屬性的關系,以及品種屬性與月份屬性的關系進行分析。設總體實例關于平均酶抑制率的概率為Pr(總體)(表3),不同蔬菜品種在不同地點的概率為Pr(地點/品種),關于品種的概率為Pr(品種),按照條件概率計算并作歸一化處理,分別得到每個市場的各個蔬菜品種的概率。以紅利市場為例,分析結果如表3所示。

在紅利市場上,韭菜、黃瓜在C類(排名分別為1、2)和D類(排名分別為2、1)排名靠前,而在A類(排名分別為8、7)、B類(排名分別為7、7)的排名靠后,說明這些品種的蔬菜農藥殘留水平較高,而生菜、蕓豆、茼蒿等則相反。

韭菜所含的農藥殘留總體水平較高,但并不是所有市場上的韭菜的農藥殘留都高。點擊地點、品種屬性,從其運行結果中摘錄得到韭菜所含農藥殘留水平在不同市場的分布,如圖6所示。從圖6可以看出,韭菜實例在祥和市場上屬于A類的比例最多,其次是煙大市場。而紅利市場最差,其主要屬于C類和D類。這表明,即使是同一品種的蔬菜,其在不同市場的平均酶抑制率水平也不相同。

另外,總體較安全的蔬菜,并不是在任何時期都很安全。相同品種的蔬菜,在不同月農藥殘留水平也不一樣。設Pr(總體)、Pr(月份︳品種)和Pr(品種),進行條件概率運算,然后做歸一化處理。以黃瓜為例,其趨勢如圖7所示。從圖7中可知,黃瓜的平均酶抑制率在A類的概率從一月開始逐漸下降,一直到8月達到最低,之后呈升高趨勢;B類和C類隨著時間的變化呈上升趨勢。說明,黃瓜的安全性越來越低,其原因是夏季蔬菜上市的季節,同時也是蟲害多發季節,菜農使用農藥增多。

4 小結

通過貝葉斯網絡的數據挖掘工具的分析,得出如下結論:①在品種分類問題上一些蔬菜如生菜、蕓豆等的酶抑制率水平相對較低,而韭菜等則處于一個非常警戒的水平;②在以地點作為分類,祥和市場、煙大市場等市場的平均酶抑制率水平比較低,而其他地點、文化路市場、紅利市場等其平均酶抑制率水平則相對較高;③在時間方面,平均酶抑制率呈現出較大的季節性規律,每年的5月平均酶抑制率開始升高,直到9月開始回落;④在品種與地點之間的聯系上,通過分析韭菜在其他地點的平均酶抑制率分布區間的概率密度發現,即使韭菜總體被認為農藥殘留水平較高的蔬菜,在祥和市場還是值得信賴;⑤在品種和時間之間的聯系,通過對蔬菜在各月的平均酶抑制率水平變化情況進行分析,探討其季節規律,以黃瓜為例,分析其在受到季節因素影響的大小;⑥在品種和地點、時間的聯系,以韭菜為例,結合了地點和時間,分析了對韭菜最佳的選取方案。

參考文獻:

[1] 李泰然.中國食源性疾病現狀及管理建議[J].中華流行病學雜志,2003,24(8):651-653.

[2] LI B,MA C L,GONG S L,et al. Food safety assurance systems in China[J].Food Control,2007(18):480-484.

[3] RUDDER A.Food safety and the risk assessment of ethnic minority food retail businesses[J].Food Control,2006(17):189-196.

[4] 周潔紅,張仕都.蔬菜質量安全可追溯體系建設:基于供貨商和相關管理部門的二維視角[J].農業經濟問題,2011(1):32-39.

[5] 劉中華.蔬菜質量安全可追溯體系建設研究[D].青島:中國海洋大學,2012.

[6] 樊紅平,王 敏,王 芳,等.中美農產品質量安全檢驗檢測體系比較研究[J].家畜生態報,2008,29(6):1-5,12.

[7] 樊孝鳳.我國生鮮蔬菜質量安全治理的逆向選擇研究[D].武漢:華中農業大學,2007.

[8] 許宇飛.沈陽市主要農產品污染調查及防治途徑的研究[J].農業環境保護,1996,15(1):32-35.

[9] 秦 燕,李 輝,李 聰.控制圖分析在食品安全預警中的應用[J].中國公共衛生,2004,20(9):1089-1090.

[10] 王志剛.食品安全的認知和消費決定:關于天津市個體消費者的實證分析[J].中國農村經濟,2003(4):41-48.

[11] 陳卓民.數據挖掘技術在國內外的研究和發展現狀[J].青年文學家,2009(16):122-123.

[12] 邢平平,施鵬飛,熊范綸.數據挖掘技術在農業數據中的有效應用[J].計算機工程與應用,2001,37(2):4-6.

[13] 陳 晨,董 倩,吳玉潔.基于貝葉斯分類的農作物產品質量挖掘研究[J].安徽農業科學,2011,39(12):7448-7449.

[14] 劉春玲,崔凌云,賈冬青,等.數據挖掘技術在農業領域的應用[J].農機化研究,2010(7):201-204.

[15] WITTEN I H,FRANK E.數據挖掘實用機器學習技術[M].北京:機械工業出版社,2012.

主站蜘蛛池模板: 五月激情综合网| 亚洲男人天堂2020| 日韩大乳视频中文字幕| 很黄的网站在线观看| 亚洲精品爱草草视频在线| 欧美综合成人| 伊人久久久久久久| 国产精彩视频在线观看| 久久久久久久久18禁秘| 亚洲日韩精品综合在线一区二区 | 欧美一区二区精品久久久| 亚洲黄色成人| 日韩欧美国产精品| 久久久久国产精品免费免费不卡| 亚洲首页在线观看| 免费观看国产小粉嫩喷水 | 一级做a爰片久久毛片毛片| 国产办公室秘书无码精品| 91亚洲免费视频| 亚洲区第一页| 亚洲午夜国产精品无卡| 精品人妻AV区| 草逼视频国产| 国产欧美在线观看视频| 99re66精品视频在线观看 | 欧美视频在线第一页| 亚洲一区网站| 久久激情影院| 中文字幕佐山爱一区二区免费| 国产人人乐人人爱| 久久精品丝袜| 日日拍夜夜嗷嗷叫国产| 亚洲第一页在线观看| 亚洲,国产,日韩,综合一区 | 国产精品尤物在线| 亚洲第一区在线| 毛片视频网址| 福利一区在线| 72种姿势欧美久久久大黄蕉| 亚洲Av综合日韩精品久久久| 国产成人久久综合777777麻豆| 高清色本在线www| 超清无码熟妇人妻AV在线绿巨人| 亚洲人成网站观看在线观看| 午夜a视频| 国产打屁股免费区网站| 综合亚洲网| 精品国产成人三级在线观看| 精品丝袜美腿国产一区| 波多野结衣久久高清免费| 天天色天天综合| 日韩午夜福利在线观看| 成人精品亚洲| 日韩专区第一页| 波多野结衣一区二区三区四区视频| 喷潮白浆直流在线播放| 欧美午夜小视频| 九九热精品视频在线| 天天躁夜夜躁狠狠躁图片| 五月激情婷婷综合| 试看120秒男女啪啪免费| 国产精品国产主播在线观看| 精品无码国产自产野外拍在线| 无码精品一区二区久久久| 四虎精品黑人视频| 伊人久久大香线蕉综合影视| 中文字幕在线永久在线视频2020| 91精品网站| 免费不卡视频| av在线人妻熟妇| 四虎永久免费地址| 亚洲视频免| 免费高清自慰一区二区三区| 狠狠ⅴ日韩v欧美v天堂| 亚洲精品在线影院| 小蝌蚪亚洲精品国产| 99久久精彩视频| 久草视频一区| 少妇精品网站| 久草视频精品| 色综合中文字幕| 97视频在线精品国自产拍|