999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于優化關聯規則算法的糖尿病處方規律

2019-11-15 10:23:48邢俊鳳郝秀霞馬寧
電子技術與軟件工程 2019年19期
關鍵詞:數據挖掘關聯規則

文/邢俊鳳 郝秀霞 馬寧

在中醫學上,糖尿病臨床癥狀包括多飲多食,尿量多并有甜味,患者形體消瘦。在西醫臨床角度,糖尿病是一組以高血糖為特征的代謝性疾病。高血糖則是由于胰島素分泌缺陷或其生物作用受損,或兩者兼有引起。糖尿病時長期存在的高血糖,導致各種組織,特別是眼、腎、心臟、血管、神經的慢性損害、功能障礙。在人們經濟和生活條件不斷提高的情況下,飲食結構也在逐漸發生著巨大的變化,糖尿病患者的數量也在不斷增加,而且患者的年齡逐漸年輕化。目前糖尿病已經成為嚴重危害人類健康的三大慢性非傳染性疾病之一,在我國每10人中有1名糖尿病患者。糖尿病的預防和治療工作已經成為需要迫切解決的問題。

中醫對糖尿病的論述早在黃帝內經里就有,糖尿病屬于中醫“消渴癥”的范疇,而且療效比較確定、不良反應較少,能夠對并發癥的發生起到延緩或減少作用。不同中醫流派對糖尿病的認識均存在差異,組方用藥各有千秋。千百年來積攢下來的中醫治療糖尿病的處方具有極強的再次利用價值。隨著計算機科學與技術的高速發展,大數據、數據挖掘、數據倉庫等相關技術的發展驅動了數據挖掘方向的發展,為數據挖掘技術在中醫藥領域中的應用提供了強有力的技術保障。經過對大量的糖尿病中藥處方數據進行研究,挖掘出這些海量數據背后隱藏的諸多有價值的信息是非常有實際應用價值的。

1 主要內容

1.1 數據收集

國家級名老中醫專科專病叢書(中原農民出版社)的糖尿病驗案良方部分記載了大量的中醫藥治療糖尿處方,這些處方是幾十位國家級名老中醫數百則典型驗案中提到的數百首極具療效的經驗良方。本文以該叢書和 CNKI 相關文獻中記載的處方作為研究樣本數據。

1.2 數據預處理

高質量的數據決定高質量的挖掘結果,在進行數據分析之前,首先要對樣本數據做預處理。并且從精確度、一致性和可信度三個維度確定數據的質量。主要針對不一致、不完整和含有噪聲的三種數據進行預處理。處理方式如下:

對于有些感興趣的屬性缺少屬性值等不完整的數據,進行空缺值得填寫。

對于含有噪聲的數據,一般是包含錯誤或者存在孤立點,需要平滑噪聲數據得同時識別和刪除孤立點。

對于在編碼或者命名上存在差異的不一致數據,將數據進行一致性處理。由于中藥藥名存在很多別名,本文主要涉及中藥藥名的統一問題,以《中華人民共和國藥典》中的中藥藥名為標準完成數據一致性處理。部分樣例如表1。

1.3 建立數據庫、集成數據

數據預處理后,將多個數據源中的處方數據整合到一個一致的存儲中,采用SQL Server數據庫作為數據庫平臺。數據集成過程中需要解決的問題是數據冗余。整合多個數據集合的數據時,由于在命名上存在差異導致等價的實體具有不同的名稱,本文主要使用元數據來進行區分。在解決數據冗余的問題時,數值屬性通過皮爾遜積矩ra,b來衡量,它是一個位于[-1,1]之間的數值,大于零時屬性之間呈現正相關,否則為反相關。如果絕對值越大表明兩者之間相關性越強,公式如下:

1.4 數據挖掘方法的研究和確定

常用的數據挖掘方法有關聯規則、決策樹、人工神經網絡、聚類分析、遺傳算法、小波變換、貝葉斯信念網絡等。本文采用的優化關聯規則算法是數據挖掘中的一個重要的研究領域。

關聯規則挖掘算法主要通過特定的搜索算法,發現大量數據中項集之間有趣的關聯或相關聯系,糖尿病處方規律研究恰好是要發現處方中各種中藥之間的關聯。Aprior算法是關聯規則的頻繁項集算法,作為第一個且最經典的關聯規則挖掘算法,它利用逐層搜索的迭代方法找出數據庫中項集的關系,以形成規則,其過程由連接與剪枝組成,本文選取該算法為主要算法,在廣泛收集中醫治療糖尿病處方的基礎上,采用一定程度上優化的關聯規則算法,分析處方中各藥物之間的關聯規則、各藥物的使用頻次以及組方規律等。

2 關鍵技術和創新點

表1

目前,文獻顯示現有的糖尿病處方的數據挖掘應用,主要以使用一些現成軟件中包含的數據挖掘功能完成,使用的算法以傳統的算法為主。本文在廣泛收集中醫治療糖尿病處方的基礎上,通過數據預處理建立處方數據庫,進而采用優化的關聯規則算法,即優化關聯規則Apriori算法,分析處方中藥物的使用頻次、藥物之間的關聯規則、核心組合等,從實現技術角度上提出了一個新的突破。

算法的基本步驟如下:

第一步:分別設定最小支持度 s和最小置信度 c。

第二步:使用候選項集。

第三步:從數據庫讀取所有的記錄,每個項都被看作候選第1項集,得出各項的支持度。

第四步:再次掃描數據庫 ,得出候選第2項集集合,再找出頻繁第2項集,并利用頻繁第2 項集集合來產生候選第3 項集。

第五步:重復以上幾步,與最小支持度比較,產生更高層次的頻繁項集,再從該集合里產生下一級候選項集 ,直到不再產生新的候選項集為止。

3 總結

通過對收集到的中醫藥治療糖尿病處方數據進行關聯規則分析,分析結果可以發現許多組方規律、用藥頻次等有價值的信息,以期為中醫治療糖尿病提供決策支撐。

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 在线精品欧美日韩| 日韩精品亚洲人旧成在线| 成年人午夜免费视频| 成人福利在线免费观看| 国内视频精品| 日韩AV无码一区| 一级香蕉人体视频| 亚洲一区二区在线无码| 亚洲午夜天堂| 五月婷婷综合网| 伊人色在线视频| 精品视频在线观看你懂的一区| 2021国产精品自产拍在线| 久久一级电影| 国产欧美一区二区三区视频在线观看| 成人在线不卡视频| 亚洲精品动漫| 欧美一区二区三区欧美日韩亚洲| 97免费在线观看视频| 欧美国产中文| 亚洲国产亚洲综合在线尤物| 最新精品久久精品| 91年精品国产福利线观看久久 | 国产96在线 | 波多野结衣第一页| 亚洲日韩精品综合在线一区二区 | 在线综合亚洲欧美网站| 在线国产资源| 试看120秒男女啪啪免费| 另类综合视频| 久久这里只有精品66| 二级特黄绝大片免费视频大片| 欧美一区国产| 人妻无码一区二区视频| 熟妇人妻无乱码中文字幕真矢织江 | 亚洲美女高潮久久久久久久| 曰韩免费无码AV一区二区| 国产美女无遮挡免费视频| 精品日韩亚洲欧美高清a| 三上悠亚在线精品二区| 青青国产在线| 四虎成人免费毛片| 成人a免费α片在线视频网站| 蝴蝶伊人久久中文娱乐网| 日韩黄色在线| 区国产精品搜索视频| 国产精品无码AⅤ在线观看播放| 国产国产人免费视频成18| 99re免费视频| 国产乱人视频免费观看| 国产69精品久久久久妇女| 亚洲av日韩av制服丝袜| 国产欧美亚洲精品第3页在线| 无码又爽又刺激的高潮视频| 无码AV动漫| 日韩一区二区三免费高清| 精品久久久久无码| 在线观看免费黄色网址| 波多野吉衣一区二区三区av| 亚洲中文无码h在线观看| 亚洲精品无码高潮喷水A| 伊人无码视屏| 国产高清在线观看| 久久女人网| 亚洲成在人线av品善网好看| 国产亚洲精| 狠狠v日韩v欧美v| 最新国产你懂的在线网址| 国产精品开放后亚洲| 在线看AV天堂| 成人国产精品2021| 精品视频福利| 伊人蕉久影院| 婷婷色中文网| 伊人国产无码高清视频| 欧美五月婷婷| 久爱午夜精品免费视频| 干中文字幕| 狠狠色婷婷丁香综合久久韩国| 日本91在线| 伊人激情综合网| 国产欧美日韩视频一区二区三区|