999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則挖掘藥物副作用

2020-07-18 03:30:08張志山陳育煌
三門峽職業技術學院學報 2020年2期
關鍵詞:關聯規則數據庫

◎張志山 陳育煌

(1.惠州衛生職業技術學院教育技術與信息中心;2.惠州衛生職業技術學院藥學系,廣東惠州516025)

從技術上而言,數據挖掘就是從大量的已知的數據中,補齊修正不完整的數據,去除噪音數據,從中尋找那些人們往往需要依賴經驗才能體會的潛在知識和信息的過程[1]。由于新藥臨床前諸多因素的制約,對于新藥的副作用的認識非常局限,必須通過藥品的上市后監測(Post Marketing Study,PMS)即IV期臨床試驗,完成對一種新藥的全面評價[2]。另一方面,藥物副作用(ADR)引起的病患占據所有醫院病患的6%,這儼然成為導致醫院死亡的第五大因素[3],可見,藥物副作用帶來的危害越來越大。

目前,對于上市后的藥品安全性評估主要有神經網絡、回歸分析法、數據離散法、函數依賴法等,這些算法往往需要知道各參數之間的關系,訓練時間較長,過程復雜,額外開銷大,很難推廣。影響評估數值的因素很多,各種因素之間存在著復雜的非線性聯系,采用一般的數學統計方法很難準確預測其含量[4]。文獻[5]提出的基因表達式編程(gene expression programming,GEP)是進化計算的新成員,具有遺傳算法(genetic algorithm,GA)和遺傳規劃(genetic programming,GP)的優點,同時克服了GA和GP的缺點,但是GEP算法在進化過程中容易陷入局部最優不能自拔。文獻[6]則提出了一種基于種群密集度的GEP算法挖掘藥物不良反應,對文獻[5]的方法進行改進,提出了種群密集度和新陳代謝等概念,證明了種群密集度的性質等,為進一步加強ADR監測提供一種有效的技術手段[6]。文獻[7]則利用GEP算法建立起對脂肪肝的輔助診斷的新方法。

關聯規則挖掘是數據挖掘中的一種重要應用。它通過對數據集的分析處理,挖掘出數據集中頻繁項之間的有趣聯系[8]。關聯規則挖掘中尤以Apriori算法最為經典。該算法結構簡單、數據要求低,但Apriori算法也存在一些缺點,如要對數據庫多次掃描,內存占用大、候選集項目多,運行效率不高[9]。Apriori算法涉及的主要概念如下:支持度是指項集出現的概率,其公式是Support(A->B)=P(AUB)。置信度是指在總事物集中包含A的同時也包含B的百分比,其公式是Confidence(A->B)=P(A|B)=P(A,B)/P(A)=P(AUB)/P(A)。提升度Lift(A->B)=P(B|A)/P(B)。當提升度為1時,表示A與B相互獨立,即是否有A對于B的出現無影響。當提升度滿足0<Lift(A->B)<1時,表示A與B存在負相關聯系。當提升度滿足Lift(A->B)>1時,表示A與B存在正相關聯系。強規則是指同時滿足最小支持度和最小置信度的關聯規則[8],否則就是弱規則。

1 算法的研究與改進

(1)選擇頻繁項集。關聯規則挖掘并不是每次都要挖掘所有的屬性關聯,對數據庫中無須挖掘的屬性謂詞,算法不予考慮,進行剔除。

(2)基于維數目約束。通常,一個規則的有用與否最終取決于用戶的需要,所以只有用戶才能決定關聯規則的取舍。為此,算法中加入了number參數(用戶想知道的最大的頻繁項集數目)作為維數目約束值,算法根據number值選擇掃描到L[2],L[3]……L[number]個鏈表。

(3)基于事務集的約簡。第一次迭代掃描數據庫D1后,剔除不可能是頻繁1-項集的事務,更新數據庫為D2,第二次迭代掃描數據庫D2后,剔除不可能是2-項集的元素,更新數據庫為D3,以此類推,直到數據庫Dnumber。從而達到降低I/O開銷,減少數據庫和謂詞集存儲,提高挖掘速度的目的。

(4)基于鏈表結構。從第二次掃描數據庫D2開始,將對應的事務數據庫拆解成用戶需要的各類候選2-、3-……K-候選集,并把結果存入對應的鏈表結構中,直至產生所有的候選謂詞集。最后,分別計算各候選集的支持度,滿足最小支持度和最小置信度的即為頻繁k項集。

根據上述改進算法思想得到該算法的偽代碼如下:

輸入:原始數據庫D1,最小支持度support,最小置信度confidence,最大頻繁項集數量number。

輸出:正關聯規則positive rule、負關聯規則negative rule。

//找出候選L1,在LK中加入頻繁1-項謂詞集,在Ck中加入候選1謂詞集。

Dime set=get Multi Dime(t.屬性);//搜索頻繁謂詞集,并計數

2 實驗

根據上述算法設計思想,進行系統的分析和設計。藥物副作用挖掘系統的結構如圖1所示,具體包括三個模塊,從上到下分別是模型可視化分析模塊、關聯規則算法模塊和數據預處理模塊。

每個副作用擁有一個UMLS(Unified Medical Language System)一體化醫學語言系統的概念編號CUI,并由含義相同的一種或者多種副作用名稱構成[10]。具體如表1所示。

圖1 關聯規則挖掘系統架構

表1 UMLS分配

實驗平臺:PC為I5-7200U-2.5GHZ,雙核,8GB的DDR4內存,256GB固態硬盤,widows7旗艦版64位。用戶操作子系統的WEB服務器采用Apache的tomcat7作為容器管理,數據庫采用微軟的SQL Server2008R2存儲用戶操作數據。數據挖掘子系統采用Weka 3.6作為基礎框架做進一步擴展開發。對Apriori算法和本文改進算法進行模擬,得到如圖2所示的執行時間比較。可見,筆者改進算法在各個支持度下都比Apriori算法執行效率高。

應用筆者改進算法,得到如表2、表3和表4所示的,頻繁1-項集、頻繁2-項集和頻繁3-項集出現頻率最高的5個。得出結論,藥物副作用中,皮膚損傷最為常見,當2個副作用同時出現時,皮膚損傷和視覺系統傷害最為常見。當3個副作用同時出現時,皮膚損傷、神經系統損害和重度全身性損害最為常見。

圖2 執行時間比較

實驗結果分析,從表5得到部分關聯規則,第一項表示,當皮膚損害和視覺系統傷害同時發生時,有62%的可能性會同時導致重度全身性傷害,以及有62%的可能性肝膽不受損。最后一項表示,當重度全身性傷害和非呼吸系統損害同時發生時,有54%的可能性會使肝膽傷害,以及有54%的可能性神經系統不受傷害。

表2 頻繁1-項集頻率最高的前5個

表3 頻繁2-項集頻率最高的前5個

表4 頻繁3-項集頻率最高的前5個

表5 部分關聯規則

3 結語

筆者對經典關聯規則算法進行升級改造,提出了基于維數目約束、事務集約簡的關聯規則挖掘算法,給出了改進算法的偽代碼,并將算法思想,應用于藥物副作用挖掘系統。該算法與經典Apriori算法相比,提高了挖掘速度,減少了存儲空間,能夠更加有效地挖掘出有研究價值的藥物副作用關聯規則,為藥物研制和使用提供了科學決策依據,具有重要的意義。

猜你喜歡
關聯規則數據庫
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
數據庫
財經(2017年2期)2017-03-10 14:35:35
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 成人va亚洲va欧美天堂| 久久婷婷色综合老司机| 色妞www精品视频一级下载| 亚洲欧美在线综合图区| 中文无码伦av中文字幕| 九色91在线视频| 国产福利免费在线观看| 欧美一区精品| 欧美成一级| 国产小视频免费观看| 看国产毛片| 久久一色本道亚洲| yjizz国产在线视频网| 亚洲综合精品香蕉久久网| 极品国产一区二区三区| 国产激爽爽爽大片在线观看| av在线无码浏览| 亚洲人成网站18禁动漫无码| 久久a级片| 中文一级毛片| 色综合手机在线| 香蕉在线视频网站| 在线看片免费人成视久网下载| 99色亚洲国产精品11p| 国产经典免费播放视频| 久久香蕉国产线看观看式| 国产色网站| 五月天香蕉视频国产亚| jizz国产视频| 亚洲免费黄色网| 欧美激情,国产精品| 亚洲区视频在线观看| 欧美中文字幕一区| 精品久久久久无码| 99视频在线精品免费观看6| 无码一区二区波多野结衣播放搜索| 97青青青国产在线播放| 欧美自慰一级看片免费| 人妻一区二区三区无码精品一区| 久久亚洲精少妇毛片午夜无码 | AV熟女乱| 大陆精大陆国产国语精品1024| 日本欧美在线观看| 亚洲国产成熟视频在线多多 | 亚洲大学生视频在线播放| 漂亮人妻被中出中文字幕久久| 久久人搡人人玩人妻精品| 亚洲国产日韩在线观看| 91成人在线免费视频| 亚洲一本大道在线| 九色视频一区| 色香蕉网站| 久青草国产高清在线视频| 久久6免费视频| jizz国产视频| 亚洲欧洲日产国产无码AV| 国产日本一线在线观看免费| 福利小视频在线播放| 亚洲中文字幕日产无码2021| 欧美成人免费午夜全| 欧美在线一二区| 久久综合成人| 玖玖精品在线| 免费不卡在线观看av| 日韩无码视频专区| 欧美三级不卡在线观看视频| 国产精品久久久久久久伊一| 亚洲成人黄色在线| 亚欧成人无码AV在线播放| 台湾AV国片精品女同性| 97视频在线精品国自产拍| 国产亚洲日韩av在线| 大学生久久香蕉国产线观看| 国产超碰一区二区三区| 99re这里只有国产中文精品国产精品| 青青草91视频| 四虎综合网| 久操中文在线| 色婷婷电影网| 在线精品欧美日韩| 亚洲精品视频免费| 一级成人a毛片免费播放|