999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘在食品藥品監(jiān)管中的應(yīng)用

2017-09-29 20:56:25郭承湘韋宇巍張國飛黃星儒莫?dú)g倩
軟件導(dǎo)刊 2017年9期
關(guān)鍵詞:數(shù)據(jù)挖掘

郭承湘 韋宇巍 張國飛 黃星儒 莫?dú)g倩

摘 要:食品藥品監(jiān)管中存在著海量信息。關(guān)聯(lián)規(guī)則挖掘技術(shù)是分析信息系統(tǒng)數(shù)據(jù)關(guān)聯(lián)性的有力工具,將關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用到食品藥品的投訴舉報(bào)系統(tǒng)中,可以充分挖掘出與投訴舉報(bào)相關(guān)的關(guān)聯(lián)信息,并得到其中有用的關(guān)聯(lián)規(guī)則。以廣西壯族自治區(qū)食品藥品監(jiān)管系統(tǒng)為例,通過提取投訴舉報(bào)相關(guān)的數(shù)據(jù)信息,組成食品藥品投訴舉報(bào)信息數(shù)據(jù)庫,為食品藥品監(jiān)管提供決策支持,提高食品藥品監(jiān)管效率。

關(guān)鍵詞:食品藥品監(jiān)管;信息系統(tǒng);關(guān)聯(lián)規(guī)則;數(shù)據(jù)挖掘

DOI:10.11907/rjdk.171472

中圖分類號:TP319 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2017)009-0148-03

Abstract:There are a lot of useful information in the food and drug regulation. By taking example of food and drug regulation system of Guangxi province and extracting data information about complaint reporting, the complaint reporting information system was composed. Association rules mining technology is a useful tool for analyzing the data correlation of information system. We can fully mine the correlation information about complaint reporting and obtain useful association rules when applying association rules mining technology to food and drug regulation system, which can provide decision making for food and drug regulation, but also mprove the efficiency of the food and drug supervision.

Key Words:food and drug supervision; information system; association rules; data mining

0 引言

隨著互聯(lián)網(wǎng)等信息技術(shù)的快速發(fā)展,食品藥品監(jiān)管系統(tǒng)中的數(shù)據(jù)呈現(xiàn)爆炸式增長,如何挖掘出潛藏的大量有用信息對提高食品藥品的監(jiān)管效率具有重要意義。

數(shù)據(jù)挖掘(Data Mining)[1-3]作為數(shù)據(jù)分析的一個(gè)分支,可從大量不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取出隱含在其中事先不知道但又是潛在有用的信息和知識。關(guān)聯(lián)規(guī)則可反映出數(shù)據(jù)中各個(gè)項(xiàng)集之間的聯(lián)系,數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘可以挖掘出大量數(shù)據(jù)項(xiàng)集之間的相關(guān)聯(lián)系。將關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用于食品藥品監(jiān)管研究已取得了一些成果[4-10]。

晁鳳英等[4]提出了一種基于關(guān)聯(lián)規(guī)則的食品安全數(shù)據(jù)挖掘方法。從食品安全檢測數(shù)據(jù)的特點(diǎn)出發(fā),研究了關(guān)聯(lián)規(guī)則在食品安全檢測數(shù)據(jù)分析中的應(yīng)用。文獻(xiàn)[5]從研究食品安全問題入手,描述了關(guān)聯(lián)規(guī)則挖掘、分類與預(yù)測、聚類、復(fù)雜數(shù)據(jù)挖掘幾個(gè)研究方向,對數(shù)據(jù)挖掘應(yīng)用進(jìn)行了探討。文獻(xiàn)[6]在關(guān)聯(lián)規(guī)則挖掘的背景下著重研究了增量式關(guān)聯(lián)規(guī)則更新技術(shù)在食品安全檢測數(shù)據(jù)集上的應(yīng)用。文獻(xiàn)[7]設(shè)計(jì)了一個(gè)以食品安全數(shù)據(jù)分析為基礎(chǔ)的決策系統(tǒng),實(shí)現(xiàn)了數(shù)據(jù)的即時(shí)更新,以及對多個(gè)數(shù)據(jù)庫并行操作,可對不同數(shù)據(jù)之間相互影響關(guān)系進(jìn)行高效挖掘。

本文研究關(guān)聯(lián)規(guī)則挖掘在食品藥品安全監(jiān)管中的應(yīng)用,以某食品藥品投訴舉報(bào)數(shù)據(jù)系統(tǒng)為例,通過對數(shù)據(jù)進(jìn)行預(yù)處理、統(tǒng)計(jì)分析,應(yīng)用關(guān)聯(lián)規(guī)則挖掘技術(shù)對投訴舉報(bào)系統(tǒng)進(jìn)行關(guān)聯(lián)性分析,從而對食品藥品監(jiān)管提供決策支持,提高食品藥品監(jiān)管效率。

1 數(shù)據(jù)挖掘算法

1.1 數(shù)據(jù)挖掘算法分類

數(shù)據(jù)挖掘通常分為兩大類,一類是統(tǒng)計(jì)型,常用的技術(shù)有概率分析、相關(guān)性、聚類分析和判別分析等;另一類是人工智能中的機(jī)器學(xué)習(xí)型,通過訓(xùn)練和學(xué)習(xí)大量的樣品集得出需要的模式或參數(shù)。數(shù)據(jù)挖掘的最終目標(biāo)是發(fā)現(xiàn)有價(jià)值的知識和信息,各種方法有共同的思路和步驟,但也存在很大區(qū)別,表1給出了各種方法詳細(xì)的對比結(jié)果。

1.2 Apriori算法

1.2.1 Apriori介紹

Apriori算法使用頻繁項(xiàng)集的先驗(yàn)知識,使用一種稱作逐層搜索的迭代方法,k項(xiàng)集用于探索(k+1)項(xiàng)集。首先,通過掃描事務(wù)(交易)記錄,找出所有的頻繁1項(xiàng)集,該集合記作L1,然后利用L1找頻繁2項(xiàng)集的集合L2,利用L2找L3,如此下去,直到不能找到任何頻繁k項(xiàng)集。最后在所有的頻繁集中找出強(qiáng)規(guī)則,即產(chǎn)生用戶感興趣的關(guān)聯(lián)規(guī)則。

Apriori算法具有任一頻繁項(xiàng)集的所有非空子集也必須是頻繁的性質(zhì)。假如P(I)(最小支持度閾值),當(dāng)有元素A添加到I中時(shí),結(jié)果項(xiàng)集(A∩I)不可能比I出現(xiàn)的次數(shù)更多,因此A∩I也不是頻繁的。

1.2.2 連接步和剪枝步

在上述關(guān)聯(lián)規(guī)則挖掘的兩個(gè)步驟中,第一步往往是總體性能的瓶頸。Apriori算法采用連接步和剪枝步兩種方式找出所有頻繁項(xiàng)集。

(1)連接步。為找出Lk(所有頻繁k項(xiàng)集的集合),通過將Lk-1(所有頻繁k-1項(xiàng)集的集合)與自身連接產(chǎn)生候選k項(xiàng)集的集合,候選集合記作Ck。設(shè)l1和l2是Lk-1中的成員,記li[j]表示li中的第j項(xiàng)。假設(shè)Apriori算法對事務(wù)或項(xiàng)集中的項(xiàng)按字典次序排序,即對于(k-1)項(xiàng)集li,li[1]

(2)剪枝步。CK是LK的超集,也就是說,CK的成員可能是也可能不是頻繁的。通過掃描所有的事務(wù)(交易),確定CK中每個(gè)候選的計(jì)數(shù),判斷是否小于最小支持度計(jì)數(shù)。如果不是,則認(rèn)為該候選是頻繁的。為了壓縮Ck,可以利用Apriori性質(zhì):任一頻繁項(xiàng)集的所有非空子集也必須是頻繁的。反之,如果某個(gè)候選的非空子集不是頻繁的,那么該候選肯定不是頻繁的,從而可以將其從CK中刪除。

2 數(shù)據(jù)挖掘應(yīng)用

2.1 數(shù)據(jù)來源

收集到廣西省食品藥品投訴舉報(bào)平臺從2013年1月份到2015年12月共3年的數(shù)據(jù)。

2.2 研究工具

通過調(diào)用Orale數(shù)據(jù)庫的關(guān)鍵數(shù)據(jù)進(jìn)行提取,采用Matlab對數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析。數(shù)據(jù)處理流程如圖1所示。

2.3 數(shù)據(jù)預(yù)處理

表2為數(shù)據(jù)庫中按投訴時(shí)間順序排列的投訴表,對這些數(shù)據(jù)進(jìn)行挖掘。

為了使該數(shù)據(jù)適用關(guān)聯(lián)規(guī)則Apriori算法處理,需對其進(jìn)行一些預(yù)處理,由數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)歸約等構(gòu)成。傳統(tǒng)關(guān)系數(shù)據(jù)庫中總存在冗余空缺數(shù)據(jù)、不完整和含噪聲等信息的“臟數(shù)據(jù)”,數(shù)據(jù)預(yù)處理就是在不丟失重要信息的情況下達(dá)到提高數(shù)據(jù)挖掘質(zhì)量的目的。

原始數(shù)據(jù)通過變化規(guī)則表3進(jìn)行變化得到預(yù)處理后的數(shù)據(jù)表4,這些數(shù)據(jù)可以達(dá)到數(shù)據(jù)格式一致、數(shù)據(jù)類型相同、數(shù)據(jù)存儲集中以及數(shù)據(jù)信息精練的要求,為后續(xù)高效進(jìn)行數(shù)據(jù)挖掘提供了良好基礎(chǔ)。

2.4 不同投訴情況統(tǒng)計(jì)分析

本文對3年間不同地區(qū)進(jìn)行投訴量統(tǒng)計(jì),統(tǒng)計(jì)表明:3年間總投訴量為11 460件,涉及到81個(gè)地區(qū),圖2為投訴量排名最大的前15個(gè)地區(qū)。

研究發(fā)現(xiàn):前4個(gè)地區(qū)投訴量之和占總投訴量的68.60%;其中,南食藥4420,柳食藥1 948,桂林食藥791,欽食藥703。說明前4個(gè)地區(qū)的數(shù)據(jù)在數(shù)據(jù)挖掘中起主導(dǎo)作用。為了簡化挖掘數(shù)據(jù)分析,本文選擇4個(gè)關(guān)鍵因素:地區(qū)、年份、投訴舉報(bào)產(chǎn)品分類和投訴舉報(bào)來源作為有價(jià)值的相關(guān)聯(lián)因素,將南食藥、柳食藥、桂林食藥和欽食藥作為選擇的地區(qū)。

圖3為不同地區(qū)隨年份投訴量變化情況 ,發(fā)現(xiàn)area_48,area_37,area_56三個(gè)投訴量是逐年增加,投訴量增加最大的地區(qū)為area_48,area_21地區(qū)的投訴量2013年到2014年增加, 2014年到2015年減少。圖4為不同地區(qū)投訴量舉報(bào)產(chǎn)品分類情況 ,發(fā)現(xiàn)4個(gè)地區(qū)全部是type_6的投訴量最大,且area_48地區(qū)的type_6最大,其它類型的投訴量都不大。圖5為不同地區(qū)投訴舉報(bào)來源情況,發(fā)現(xiàn)4個(gè)地區(qū)全部是way_5的投訴量最大,且area_48地區(qū)的way_5最大,其它類型的投訴量都不大。

2.5 Apriori算法關(guān)聯(lián)分析

通過對原始數(shù)據(jù)進(jìn)行清理、集成、轉(zhuǎn)換等預(yù)處理,達(dá)到數(shù)據(jù)格式一致、數(shù)據(jù)類型相同、數(shù)據(jù)存儲集中以及數(shù)據(jù)信息精練的目的,為以后的高效數(shù)據(jù)挖掘提供良好基礎(chǔ)。

從表5中的挖掘結(jié)果分析可知:type_6和way_5的支持度最大,area_48→way_5的置信度最大,說明政府要加大對藥品食品投訴的整改力度,重點(diǎn)關(guān)注南食藥地區(qū)的投訴情況,增加投訴舉報(bào)來源地工作人員數(shù)量,對食品類投訴記錄加快辦理,弄清食品的分布業(yè)態(tài),增加同類事件違反法律法規(guī)的處理頻次。

3 結(jié)語

數(shù)據(jù)挖掘技術(shù)是近年熱門的研究方向之一,關(guān)聯(lián)規(guī)則挖掘技術(shù)是解決很多日常數(shù)據(jù)挖掘的一種可靠方法。本文利用投訴信息數(shù)據(jù)庫進(jìn)行初步統(tǒng)計(jì)分析,在此基礎(chǔ)上借助關(guān)聯(lián)規(guī)則算法Apriori對投訴舉報(bào)信息進(jìn)行深入挖掘。從地區(qū)、年份、投訴舉報(bào)產(chǎn)品、投訴舉報(bào)來源分類4個(gè)關(guān)鍵因素中挖掘出有用信息,得出政府有關(guān)部門必須重點(diǎn)關(guān)注南食藥地區(qū),及時(shí)解決熱點(diǎn)投訴問題,采取切實(shí)有效措施的結(jié)論。

參考文獻(xiàn):

[1] AGRAWAL R, IMIELINSKI T, SWAMI A N. Mining association rules between sets of items in large databases[C]. In Proceedings of the 1993 ACM SIGMOD International Conference on Managemennt of Data (SIGMOD'93), Washington, D.C. ,1993:207-216.

[2] AGRAWAL R, SRIKANT R. Mining sequential patterns[C]. In Proceedings of the 11th International Conference on Data Engineering (ICDE'96), Taipei,1995:3-14.

[3] HAN J, KAMBER M.數(shù)據(jù)挖掘-概念與技術(shù)[M].北京:高等教育出版社,2001:1-449.

[4] 晁鳳英,杜樹新.基于關(guān)聯(lián)規(guī)則的食品安全數(shù)據(jù)挖掘方法[J].食品與發(fā)酵工業(yè),2007,33(4):107-109.

[5] 晁鳳英.食品安全監(jiān)管中的關(guān)聯(lián)規(guī)則挖掘[D].杭州:浙江大學(xué),2007.

[6] 徐燕偉.增量關(guān)聯(lián)規(guī)則挖掘算法及其在食品安全監(jiān)管中的應(yīng)用[D].杭州:浙江大學(xué),2007.

[7] 彭佳琪,肖毅,聶笑一.食品安全數(shù)據(jù)分析決策系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代計(jì)算機(jī),2013(9):80-83.

[8] 王雅潔,楊冰,羅艷.大數(shù)據(jù)挖掘在食品安全風(fēng)險(xiǎn)預(yù)警領(lǐng)域的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2015,43(8):332-334.

[9] 丁亦岑,杜子平,李楊.基于數(shù)據(jù)挖掘技術(shù)的我國食品安全領(lǐng)域前沿探究[J].食品工業(yè),2013,34(11):184-186.

[10] 邊春娜,趙春青,鄧云嵐.數(shù)據(jù)挖掘方法在食品安全數(shù)據(jù)中的應(yīng)用[J].科學(xué)大眾,2014(7):84-85.

(責(zé)任編輯:杜能鋼)endprint

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 亚洲成人高清在线观看| 亚洲精品桃花岛av在线| 欧美三级视频在线播放| 热热久久狠狠偷偷色男同| a级毛片免费看| 在线中文字幕网| 一区二区三区高清视频国产女人| 国产网站一区二区三区| aa级毛片毛片免费观看久| 欧美中文字幕在线播放| 永久免费av网站可以直接看的| 国产18在线播放| 国产精品亚洲一区二区三区z| 日韩一区二区在线电影| 精品亚洲麻豆1区2区3区| 日韩精品免费一线在线观看| 东京热一区二区三区无码视频| 国产内射一区亚洲| 日韩福利视频导航| 国产素人在线| 内射人妻无套中出无码| 91青青视频| 日韩免费成人| 亚洲精品成人片在线播放| 91在线高清视频| 国产又色又刺激高潮免费看| 日韩黄色大片免费看| 色国产视频| AV熟女乱| 国产成人综合亚洲欧洲色就色| 欧美在线黄| 无码精品一区二区久久久| 日韩av无码精品专区| 午夜天堂视频| 免费在线成人网| 黑色丝袜高跟国产在线91| 欧洲高清无码在线| 中文字幕亚洲乱码熟女1区2区| 亚洲中久无码永久在线观看软件| 亚洲欧美在线综合一区二区三区| 国产菊爆视频在线观看| 在线观看国产精品第一区免费| 亚洲有无码中文网| 久久精品亚洲热综合一区二区| 91精品啪在线观看国产91九色| 少妇精品网站| 欧美区一区| 国产精品成人久久| 91午夜福利在线观看精品| 欧美色视频在线| 日本a∨在线观看| 97se亚洲综合不卡| 欧美中文字幕在线二区| 国产成人综合久久精品尤物| 亚洲狠狠婷婷综合久久久久| 成人午夜免费观看| 九九热视频精品在线| 免费国产在线精品一区| 国产视频资源在线观看| 国产人成乱码视频免费观看| 亚洲色图狠狠干| 国产视频一区二区在线观看| a网站在线观看| 欧美中文字幕无线码视频| 国产国拍精品视频免费看| 亚洲九九视频| 欧美a级在线| 国产91视频免费观看| 成年人国产网站| 国产一区二区福利| 激情综合图区| 搞黄网站免费观看| 国产农村妇女精品一二区| 美女无遮挡免费网站| 人妻21p大胆| 九九热在线视频| 亚洲精品国产首次亮相| 992Tv视频国产精品| 欧美国产三级| 国产www网站| 成人久久精品一区二区三区 | 国产老女人精品免费视频|