999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在中醫研究中的運用初探

2009-04-25 09:40:12
長春中醫藥大學學報 2009年1期
關鍵詞:數據挖掘分析方法

(1.遼寧中醫藥大學,遼寧 沈陽 110032;2.遼寧中醫藥大學附屬醫院,遼寧 沈陽 130032)

數據收集和數據存儲技術的快速進步使得各組織機構可以積累海量數據。然而,提取有用的信息已經成為巨大的挑戰。通常,由于數據量太大,無法使用傳統的數據分析工具和技術處理它們。有時,即使數據集相對較小,由于數據本身的非傳統特點,例如像中醫的證候信息,也不能使用傳統的方法處理。在另外一些情況下,需要回答的問題不能使用已有的數據分析技術來解決。因此,就需要開發新的方法。數據挖掘是一種技術,它將傳統的數據分析方法與處理大量數據的復雜算法相結合。數據挖掘為探查和分析新的數據類型以及用新方法分析舊的數據類型提供了令人振奮的機會[1]。中醫學界的研究者正在快速積累大量數據,這些數據對獲得有價值的新發現至關重要。然而,由于這些數據的規模、噪聲和高維性,傳統的方法常常不適合分析這些數據集,需要新的數據分析方法。數據挖掘開發的技術可以幫助中醫研究人員解決這些問題。

1 數據挖掘概念

數據挖掘是在大型數據存儲庫中,自動地發現有用信息的過程。數據挖掘技術用來探查大型數據庫,發現先前未知的有用模式。數據挖掘還具有預測未來貫徹結果的能力,例如,預測一位向心性肥胖的人出現乏力、多飲,但目前測量血糖、血脂、血壓都正常,在未來半年內是否發生2型糖尿病。數據挖掘是數據庫中知識發現(knowledge discovery in database,KDD)不可缺少的一部分,而KDD是將未加工的數據轉換為有用信息的整個過程,如圖1所示[2]。該過程包括一系列轉換步驟,從數據的預處理到數據挖掘結果的后處理。

數據挖掘利用了來自如下一些領域的思想:(1)

圖1 數據庫知識發展(KDD)過程

來自統計學的抽樣、估計和假設檢驗。(2)人工智能、模式識別和機器學習的搜索算法、建模技術和學習理論。數據挖掘也迅速地接納了來自其他領域的思想,這些領域包括最優化、進化計算,信息論、信號處理、可視化和信息檢索[2]。通常,數據挖掘任務分為兩大類:一類是預測任務,這些任務的目標是根據其他屬性的值,預測特定屬性的值;另一類是描述任務,這類任務的目標是導出概括數據中潛在聯系的模式(相關、趨勢、聚類、軌跡和異常)。描述性數據挖掘任務通常是探查性的,并且常常需要后處理技術驗證和解釋結果。

2 在中醫研究中的探索

(1)預測建模,涉及以說明變量函數的方式為目標變量建立模型。有兩類預測建模任務:分類,用于預測離散的目標變量;回歸,用于預測連續的目標變量。預測建模可以用來解決中醫脈診的客觀化指標確定問題。為進行這一任務,我們需要一個數據集(脈名,相對客觀指標1,相對客觀指標2,……)。客觀指標相對化是指因測量者的體質不同而進行的修正,脈名的確定應該有權威的中醫專家確定。由此可以確定不同脈的客觀化指標的范圍,但需要后處理技術檢驗。(2)關聯分析,用來發現描述數據中強關聯特征的模式。關聯分析在中醫中的應用包括找出某一疾病患者出現的各種癥狀和體征之間的聯系,方劑的配伍規則。對中醫古代文獻中復雜的定性描述進行關聯分析,揭示其規律實現標準化[3]。(3)聚類分析,旨在發現緊密相關的觀測值組群,使得與屬于不同簇的觀測值相比,屬于同一簇的觀測值相互之間盡可能類似。中醫標準化診斷和治療是現今研究的熱點,而標準化要解決的第一個問題就是經西醫確診后的疾病的中醫證候分類問題[4]。例如,代謝綜合征到底有哪些證型,要解決這個問題需要的觀測值特別多,而且具有高維性,聚類分析可以進行初步的篩選和分類。(4)異常檢測的任務是識別其特征顯著不同于其他數據的觀測值,目標是發現真正的異常點,而避免錯誤地將正常的對象標注為異常點。換言之,一個好的異常檢測器必須具有高檢測率和低誤報率。異常檢測的應用包括疾病的不尋常模式,藥物的不典型副作用。由此可見,對中醫觀測數據的挖掘應采用多種方法分批、多層次的挖掘,對結果應該綜合分析,并且得到專家的一致共識,才有參照意義。

3 適合中醫的數據挖掘算法的研究設想

以上所論及的挖掘算法都并非專為中醫開發的,它們的適應范圍廣,中醫研究是可以借鑒的[5]。如果根據中醫自身特點而研發的挖掘算法,則可以更好解決中醫研究中遇到的問題。筆者認為在這方面醫圣張仲景已經樹立了榜樣,他的《傷寒論》就應用了數據挖掘技術。他分析的數據就是大量臨床病例,分析數據所使用的方法來源有三,其一是他精通中國古代數學;其二是他鉆研《素問》、《九卷》、《八十一難》、《陰陽大論》、《胎臚藥錄》等典籍,從中得出的術數模型;其三是一些統計學方法。他得出的模式是六經辨證模式,此模式成為中醫臨床最重要的辨證模式。六經辨證模式解決了中醫外感病的分類與治療問題,外感病傳變、轉屬等諸多問題。以上雖有杜撰之嫌,但也的確能給研究者一些啟示。

[1]ZhangHui Tang,著.高 升,譯.數據挖掘原理與應用[M].北京:清華大學出版社,2007:2-4.

[2]Pang-Ning Tan,著.范 明,譯.數據挖掘導論[M].北京:人民郵電出版社,2006:1-4.

[3]秦雪君,施 誠.數據挖掘技術在中醫藥領域的應用[J].醫學信息,2006,19(5):945-947.

[4]張 琴,劉 平,張文彤.數據挖掘技術在中醫證候學研究中的應用[J].上海中醫藥雜志,2006,40(3):3-5.

[5]龔燕冰,倪 青,王永炎.中醫證候研究的現代方法學述評[J].北京中醫藥大學學報,2006,29(12):797-801.

猜你喜歡
數據挖掘分析方法
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
一種基于Hadoop的大數據挖掘云服務及應用
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 国产91视频免费| 99热这里只有免费国产精品| 国产在线一二三区| 亚洲精品麻豆| 亚洲男人在线| 成人国产三级在线播放| 国产视频一区二区在线观看 | 91色综合综合热五月激情| 国产极品美女在线| 92午夜福利影院一区二区三区| 亚洲大学生视频在线播放| 国产手机在线ΑⅤ片无码观看| 亚洲色图另类| 视频国产精品丝袜第一页| 亚洲精品午夜无码电影网| 国产激情无码一区二区免费 | 午夜啪啪网| AⅤ色综合久久天堂AV色综合| 国产午夜福利在线小视频| 日韩精品免费一线在线观看| 免费精品一区二区h| 91久久天天躁狠狠躁夜夜| 国产欧美日韩视频怡春院| 精品国产免费第一区二区三区日韩| 亚洲三级视频在线观看| 日韩免费毛片| 亚洲色图欧美一区| 极品性荡少妇一区二区色欲 | 六月婷婷精品视频在线观看| 久久一日本道色综合久久| 日韩精品一区二区三区免费在线观看| 国产亚洲视频中文字幕视频| 亚洲成人黄色在线| 亚洲精品高清视频| 亚洲国产成人在线| 综合五月天网| 欧美激情视频一区| 91精品网站| 毛片网站在线播放| 国产精品无码制服丝袜| 免费观看国产小粉嫩喷水| 91免费国产高清观看| 亚洲男人的天堂久久香蕉网| 欧美三级视频在线播放| 欧美色伊人| av大片在线无码免费| 国产h视频在线观看视频| 久久成人免费| 四虎永久免费网站| 亚洲欧美自拍视频| 国产丝袜丝视频在线观看| 青青青国产视频| 亚洲有无码中文网| 一级片一区| 国产精品视频白浆免费视频| 小13箩利洗澡无码视频免费网站| 国产青榴视频| 欧美激情第一区| 91久久偷偷做嫩草影院| 国产成人高清精品免费| 手机永久AV在线播放| 亚洲午夜福利在线| 黄色免费在线网址| 亚洲综合专区| 欧美视频二区| 美女被操91视频| 国产一区二区视频在线| 欧美色视频在线| 亚洲一区二区三区香蕉| 波多野结衣一二三| 久久久久亚洲精品无码网站| 色婷婷在线影院| 最新无码专区超级碰碰碰| 欧美成人aⅴ| 日韩黄色大片免费看| 国产超碰一区二区三区| 国产精品美女自慰喷水| 久久精品只有这里有| 亚洲日韩久久综合中文字幕| 亚洲国产成人在线| 成人av手机在线观看| 国产自在自线午夜精品视频|