999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中醫藥數據挖掘現狀分析與創新探索

2022-05-27 05:02:06潘曄婁靜潘玉穎范軍銘侯留法
中國中醫藥信息雜志 2022年5期
關鍵詞:數據挖掘中醫藥分析

潘曄,婁靜,潘玉穎,范軍銘,侯留法

河南省中醫藥研究院附屬醫院,河南 鄭州 450004

近年來,中醫藥數據挖掘相關研究發展迅速,尤其名老中醫傳承、名醫經驗規律方面成果顯著。辨證論治是一個主觀決策的過程,不同醫者對癥候的認識不同,即使同一病癥,其注重的關鍵癥候也不同。名老中醫經驗探索的關鍵在于發掘名老中醫辨證論治獨特的專注點。辨證論治注重整體觀念,兼顧個性化體征,關注每次就診的不同癥候。四診信息所蘊含的數據具有高度的個體性、動態性、多樣性。運用數據挖掘方法將海量知識進行歸納分析,發現能反映疾病本質與辨證施治的關鍵聯系,以及各個信息元之間的內在隱含關系,解決中醫特色研究和發展中的關鍵問題——隱性知識的顯性表達,無論名老中醫傳承、經驗總結、古籍文獻挖掘與數據庫文獻研究,關鍵在于中醫藥隱性知識的挖掘。數據挖掘可為中醫各個特色信息元之間內在隱含關系的挖掘、規律的總結、問題的發現等提供技術和方法學支持。茲就中國知識資源總庫(CNKI)中醫藥數據挖掘文獻進行整理,為相關研究提供參考。

1 資料來源

以“中醫藥”與“數據挖掘”為關鍵詞檢索,文獻類型包括學術期刊與學位論文,起止時間1998-2020年,得到文獻3 844篇,主要分類為醫藥衛生科技、信息科技、基礎科學。鑒于本文側重研究者對中醫藥數據挖掘的應用,所以選定文獻分類目錄為醫藥衛生科技,信息科技與基礎科學相關文獻因側重于相關信息系統構建與算法研究而排除,得到相關文獻3 654篇。將檢索文獻下載并進行篩選及內容梳理,刪除重復文獻,將少數非中醫藥數據挖掘文獻排除,最終得到3 597篇。本文借鑒文獻計量學的共詞分析,但側重辨證論治過程中數據挖掘方法的應用。對處方進行數據挖掘分析,歸為用藥規律類;癥候與證型的對應關系分析,歸為辨證規律類;癥候-證型-用藥均使用數據挖掘分析,歸為辨證用藥規律類;選穴穴位及對應癥候分析,歸為選穴規律類;以某一疾病的公開文獻為數據源進行數據挖掘方法分析,按其主要內容分為用藥規律類或文獻綜述類;將網絡藥理學與數據挖掘方法結合進行中藥研究,按其內容側重歸為用藥規律類或中藥研究類;數據挖掘算法研究及醫藥信息系統構建的文獻,歸為中醫藥信息化類。具體文獻數量與類型見圖1。

圖1 中醫藥數據挖掘類文獻類型數量

從圖1可以看出,關于用藥規律的文獻最多,且逐年增加。用藥規律的數據來源廣泛,包括病歷收集、名家醫案、古籍資料等,其研究目的在于了解治療某一疾病的用藥規律,特別是角藥和對藥的應用,從而發現名家或古籍的用藥獨特之處。用藥規律的類型越來越豐富,不限于對某一病癥的用藥分析,近年來單味飲片用藥規律、配伍用藥規律、名方用藥規律、成藥用藥規律的研究越來越多。用藥規律通常與檢驗指標、中藥研究的動物實驗、網絡藥理學、基因分析、分子機制等共同分析,為中藥研發提供理論支持與量化指標。

文獻綜述類數量次之,近年來通常采用的方法是對中醫藥某一方面進行關鍵詞搜索,對得到的文獻結果進行整理與分析,博取各家之長,探索不同派系辨證論治的共性與特性。辨證規律類文獻采用收集名家病歷,分析某一疾病不同證型的癥候規律、證素規律,通過主成分分析法、決策樹方法等以明確證型的主要對應癥候。辨證用藥規律類文獻將證型、癥候、用藥綜合分析,對辨證論治的全過程進行數據挖掘分析得到綜合分析結果,是通過數據驗證對某方向、某派別中醫學術思想的總結。選穴規律類通過總結某一病癥針灸腧穴記錄,采用關聯分析找到關鍵穴位。中醫藥信息化類文獻雖然在醫藥衛生領域并不多,但內容新穎,是中醫藥與蓬勃發展的信息化技術充分融合。中醫藥信息化文獻包含中醫藥數據挖掘常用模型算法研究與比較、中醫藥隱性知識發現、中醫藥本體知識構建、中醫藥信息化系統設計與構建、中醫藥知識可視化等。特別是將中醫藥大數據分析系統嵌入醫院信息系統(HIS)方向的研究,代表了中醫藥人工智能的發展趨勢。

2 中醫藥數據挖掘系統與算法

數據挖掘軟件與平臺是中醫藥數據挖掘研究的一大利器。隨著中醫藥數據挖掘類研究的興起,各種中醫藥數據挖掘平臺與軟件隨之出現。經典的數據挖掘過程一般包含數據準備、數據變換、建模、結果解釋和展示4個步驟。由于每種模型要求輸入變量的類型與屬性不同,且有特定格式,所以需要進行數據準備與變換。而數據挖掘建模得到的結果如何與中醫藥專業知識結合進行解釋與展示,對操作者的統計知識有一定要求,經典數據挖掘對中醫藥研究者過于抽象。早期進行中醫藥數據挖掘,統計軟件是主要工具,但統計軟件存在專業性強、數據處理難度大等缺點,所以,專業的中醫藥數據挖掘軟件應運而生。

專業的中醫藥數據挖掘軟件,輸入數據均為中醫藥研究者熟悉的病歷數據、處方數據,不需要進行數據的準備與類型轉換,對結果的展示也進行了注釋,便于理解。專業的中醫藥數據挖掘軟件背后依托專業團隊,版本更新快速且專業,不少中醫藥研究者借此取得良好研究成果。現有的主流中醫藥數據挖掘軟件有“中醫傳承輔助平臺”與“古今醫案云平臺”,以及許多文本挖掘平臺與軟件,如沈陽教授的ROST CM系統、Weka軟件等。

2.1 中醫藥數據挖掘工具

文獻中出現最多的3種數據挖掘工具是SPSS、中醫傳承輔助平臺、古今醫案云平臺。SPSS Modeler將數據挖掘過程簡化為節點,相對于SPSS Statistics的數據界面更易操作。以用藥規律分析為例,數據準備時需根據藥典或其他標準進行藥品名稱標準化,繁瑣且易出錯。標準化后的數據需添加類型節點,轉化為名義變量,才能進行網絡圖分析與關聯規則分析。中醫傳承輔助平臺的數據錄入只能采用人工錄入醫案。古今醫案云平臺可按照相應格式導入數據,提高效率,擴大數據量,該平臺包含數據標準化模塊,自動進行標準化,只需人工審核糾錯即可。藥品屬性分析方面,若不采用專業數據挖掘軟件,需對照藥典進行藥物性味、歸經及功效的對應關系分析,上述兩平臺在此方面比較便捷,可自動得到相應的雷達圖。算法方面,SPSS Modeler建模節點無論關聯還是分類模型,均包含多種算法。數據挖掘平臺的算法已預設好,調整參數即可,有利有弊。優點是操作比較簡單,缺點是無法調整模型得到更優結論。

中醫藥數據挖掘平臺進行用藥分析時,藥物頻次、屬性、配伍、新方發現比較便捷,故用藥規律文獻較多,也是內容模式化的原因之一。中醫傳承輔助平臺與古今醫案云平臺均有癥候分析與方證分析功能,但使用者較少,將數據挖掘更多地應用于方證分析是創新的方向之一。數據挖掘工具也越來越多樣,不僅僅指中醫藥數據挖掘的平臺與軟件,隨著HIS普及,數據挖掘系統與工具正與HIS系統整合,可在臨床工作時進行科研分析。

2.2 中醫藥數據挖掘算法

目前用藥規律和辨證規律常用的數據挖掘算法為關聯規則、聚類分析、主成分分析、因子分析,復雜網絡分析并非經典數據挖掘方法,但應用廣泛。用藥規律通過同時出現判斷角藥和對藥,辨證規律確定證型對應癥候,在文獻計量學中的應用為共詞分析,中藥研究通過多個對象推出另一對象,將多藥物之間關聯展現。聚類分析將研究對象相似或相近的加以歸類,將一組數據按照本身的內在規律分為幾類。分類原則為組間差距大,組內差距小,把相似的事物聚集在一起,進而嘗試發現核心要素如核心處方、辨證核心要素,以及固定搭配如藥癥關系、新處方的發掘等。主成分分析與因子分析均為通過降維技術把多個變量化為少數主成分或因子的統計分析方法,這些主成分或主因子能反映原始變量的絕大部分信息,通常被用于癥候與證型對應分析。復雜網絡指通過將復雜系統內部元素抽象為節點,元素間關系抽象為邊,從而構建具有復雜關聯關系的網絡。通過這種抽象,復雜網絡僅保留系統內部組織結構及關聯關系,過濾了其他復雜信息,從而使研究者可專注復雜系統內部特征及性質。復雜網絡被用于建立中藥藥性、功效、方劑網絡,也用于發現穴位或藥物配伍規律。

算法應用方面,如果只是生硬采用經典數據挖掘方法進行中醫藥數據挖掘而不作相應改進,那么得到的僅為相關性的大小,而非癥候-證型-方劑蘊含的因果關系,其結論僅是中醫基礎理論的驗證,或無法解釋被認為規避的異常結論。

數據挖掘的分類模型與預測模型被用于解決臨床實際問題,并取得很好效果。崔偉峰等將隨機森林用于原發性高血壓心血管風險預后模型,并證實有效;宮文浩等用決策樹和人工神經網絡建立小兒肺炎痰熱閉肺證診斷模型,探索小兒肺炎痰熱閉肺證的決定要素,促進中醫標準化;夏庭偉使用支持向量機、決策樹、多項式樸素貝葉斯等多種機器學習算法,構建標準化的證型、舌圖像獲取途徑,再與臨床綜合數據特征融合,構建2型糖尿病并發腎病混合深度神經網絡診斷預測模型,并以此評估探索中醫證候與舌圖像對疾病風險預測的實際意義。

3 問題與對策

3.1 中醫藥數據現存問題與解決方法

①數據的標準化程度不一致,導致數據質量偏低、處理費時費力。如不同醫院的診斷代碼標準不同,中醫醫院采用中醫證編碼(TCD)而西醫醫院采用國際疾病分類(ICD)、醫保診斷代碼與院內代碼不同、藥品名稱存在地域性差異等。解決此類問題,需標準化處理,中醫藥數據挖掘軟件已對此開發了標準化模塊。②病歷的規范程度。醫院院內質控一般針對住院病歷,而門診病歷的質量則難以保證,除醫院硬性規定,門診病歷內容難免缺失,用詞不規范。由于實際門診就診患者較多,為保證效率,醫生難免以最簡單方式完成門診病歷,導致中醫寶貴的四診數據、既往史數據不詳細,以致可挖掘內容較少。而辨證論治的思維及重要信息都包含在門診病歷中。對此,已有學者從系統層面進行改進。潘玉穎等不僅創立了老中醫經驗搜索平臺,且建立與HIS連接的病歷診斷評價系統,自動對門診病歷進行質量評分,為可挖掘病歷數據提供來源,有利于門診病歷質量標準的建立,以及取得高質量門診病歷作為數據源。

3.2 中醫藥數據特性及模型適用性

中醫病歷數據的主觀性較強,導致中醫藥數據整合與平臺建立難度較大。在商業數據挖掘與互聯網數據挖掘方向,數據來源為真實產生的記錄,收集方向不受人工干預,分析一般以全面為主。現有中醫藥數據挖掘多源自經過人工挑選的數據,中醫對癥候的描述多為主觀感受記錄。對數據進行處理與整合及結構化數據是針對上述問題的解決方法。從本研究收集到文獻的分析樣本量看,均為小樣本數據,尤其細分到具體證型時,樣本量更少。中醫數據如證型、四診癥候、方劑藥品屬性、功效、藥品組合等維度較廣,但由于樣本數量太少,采用經典的數據挖掘算法所得到的結論不如大樣本數據有價值。因此,建立中醫藥結構化數據庫,廣泛收集有效病歷數據,提取處理為目標數據,累積到一定數據量后再進行分析,可作為解決方法。此思路與從CNKI、萬方等數據庫收集數據的綜述類文獻想法不謀而合。

3.3 中醫處方療效評價

目前中藥處方有效性的療效評價方法難以確定,缺乏權威系統的評價方法。如果無效的方劑數據較多,則挖掘結果的質量存在瑕疵。處方有效性判斷是中醫藥數據挖掘問題的立題之本。中醫療效通常通過口碑傳播,目前眾多名老中醫經驗探究與數據挖掘研究預設了名老中醫治療某方面疾病的經驗是有效的,但缺乏客觀指標。若有檢查、檢驗指標可驗證療效的疾病,則可通過指標值對比進行療效判定。無法通過指標值進行療效評價的疾病,還需學者在療效評價方面進行探索,如評價量表及完整的患者療效評價體系。目前一些醫院在患者就診后根據診斷特性進行短信或微信回訪也是較為可行的方法。

4 中醫藥數據挖掘發展方向

4.1 智能化

隨著人工智能技術不斷應用,中醫藥數據挖掘乃至整個中醫藥臨床與科研的發展方向均為信息化、智能化,中醫藥數據挖掘與HIS深度融合是大勢所趨。中醫藥數據挖掘文獻發表量逐年增加,臨床工作者對其應用程度也不斷加深,并更加貼近臨床工作。在系統中嵌入中醫藥數據挖掘平臺,通過將HIS數據進行抽取并進行標準化處理,解決了中醫藥數據挖掘中的數據處理難題。在日常開具處方過程中,出現類似知識庫的提示,將名老中醫的經驗直接展示推薦,將有益于日常臨床處方、學習及病歷書寫標準化。可穿戴設備技術越來越成熟,中醫癥候與四診信息的自動化采集越來越可行。通過分析舌診與面診數據,可以得到標準化高質量的四診數據與癥候數據。可見,主觀化的問診數據通過變成可量化的機器采集,能保證癥候數據的客觀性與標準化,推動數據挖掘在辨證規律上的應用。

4.2 數據結構化與平臺化

中醫藥數據的結構化整合與展現越來越普遍。醫院大量臨床數據及管理數據的出現,刺激著數據挖掘技術的深層次開發應用,并反向作用于醫院的進一步發展。近年來,關于中醫臨床知識的本體構建逐漸增多,知識本體能更好傳播中醫治療方法與名家經驗,并與數據挖掘研究相互驗證。蔡云對周仲瑛教授治療肺癌的知識本體進行了構建及數據挖掘研究。知識本體科學系統地處理中醫數據,有利于中醫學術思想的總結與分享,有助于形成結構化的中醫藥數據庫。來源于結構化數據庫的中醫藥數據挖掘研究可克服主觀化及小樣本缺點,實現真正的中醫藥大數據。

中醫藥數據的可視化也在不斷發展,有利于中醫藥知識的展現與分享。本研究所收集的文獻中,近年出現的知識圖譜與可視化軟件有Gephi、Bibexcel、NetDraw、CiteSpace及VOSviewer等。這些軟件可快速全面從公開文獻中挖掘中醫隱性知識,有利于中醫數據的結構化。

4.3 臨床科研一體化

臨床科研一體化與多維度數據整合也是發展中醫藥數據挖掘的方法。針對中醫療效難以判斷的問題,可建立療效評價與量表系統。整合的數據不僅包含辨證論治過程,還包含療效評價與患者個人信息。療效評價系統是針對疾病開發療效評價方法,即將指標、量表、短信微信回訪相結合,患者達到特定病程后自動評價療效。程小恩等通過采集四川省80多家中醫醫院30多萬條電子病歷,利用大數據分析和數據挖掘技術,構建中醫特色的“三名樹網”可視化模型展示名醫、名科、名院數據,從而科學評估醫生、科室、醫院的業務水平,輔助管理層合理利用醫療資源。隨著信息化程度加深與大數據戰略全面開展,此類綜合系統將越來越普遍;包含客觀療效評價、整合多維度多地區數據的科研大數據平臺將越來越多。

5 結語

本研究通過收集梳理CNKI文獻,對中醫藥數據挖掘的應用現狀進行整理分析,發現中醫藥數據挖掘研究雖處于蓬勃發展階段,但存在應用方式單一模式化問題。中醫藥數據挖掘依托醫院信息化推進與數據挖掘算法的推廣,發展現狀與兩者密切相關。中醫藥數據挖掘與辨證論治思想相契合,有利于探究中醫藥隱性知識。如何在保留中醫藥特色的基礎上進行研究,充分將兩者融合是難點,筆者認為更全面智能的信息化、平臺化是解決問題關鍵,值得今后重點關注。

猜你喜歡
數據挖掘中醫藥分析
中醫藥在惡性腫瘤防治中的應用
中醫藥在治療惡性腫瘤骨轉移中的應用
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
從《中醫藥法》看直銷
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
中醫藥立法:不是“管”而是“促”
中國衛生(2016年11期)2016-11-12 13:29:24
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 欧美日韩高清在线| 手机精品福利在线观看| 成人福利在线观看| 欧美三级自拍| 三上悠亚在线精品二区| 久久9966精品国产免费| 久久综合九九亚洲一区| 亚洲色婷婷一区二区| 久久中文字幕av不卡一区二区| 国内精品视频区在线2021| 成人午夜在线播放| 蜜桃臀无码内射一区二区三区| 亚洲天堂网在线播放| 色婷婷狠狠干| 免费高清毛片| 久久视精品| 久久婷婷人人澡人人爱91| аⅴ资源中文在线天堂| 国产在线视频二区| 亚洲色图欧美视频| 91在线播放免费不卡无毒| 国产精品密蕾丝视频| 黄片一区二区三区| 欧亚日韩Av| 国产无码精品在线播放| 国产无码网站在线观看| 日韩区欧美国产区在线观看| 久久精品丝袜高跟鞋| 91精品国产91久久久久久三级| 在线中文字幕网| 亚洲精品va| 中字无码精油按摩中出视频| 久久男人资源站| 国产成人精品无码一区二 | 国产乱子伦一区二区=| 亚洲精品国产精品乱码不卞| 天天爽免费视频| 色婷婷亚洲十月十月色天| AV在线天堂进入| 国产精品女同一区三区五区| 精品伊人久久久久7777人| 乱人伦99久久| 国产91麻豆视频| 成人免费黄色小视频| 丁香五月婷婷激情基地| 亚洲高清中文字幕在线看不卡| 欧美亚洲综合免费精品高清在线观看 | 玖玖精品在线| 伊人婷婷色香五月综合缴缴情| 无码av免费不卡在线观看| 911亚洲精品| 久久黄色免费电影| a天堂视频在线| 亚洲日韩久久综合中文字幕| 在线观看国产网址你懂的| 亚洲成人播放| 一本无码在线观看| 国产丝袜精品| 片在线无码观看| 国内a级毛片| 日本妇乱子伦视频| 亚洲人成人伊人成综合网无码| 国产剧情国内精品原创| 国产又粗又爽视频| 日本在线视频免费| 国产男女XX00免费观看| 国产H片无码不卡在线视频| 午夜福利在线观看成人| 国产理论一区| 亚洲美女视频一区| 成人福利免费在线观看| 三上悠亚在线精品二区| 久久一级电影| 精品亚洲麻豆1区2区3区| 在线免费亚洲无码视频| 国产91九色在线播放| 亚洲视频影院| 亚洲一区二区在线无码| 国产人免费人成免费视频| 中文字幕久久波多野结衣| 亚洲午夜福利在线| 亚洲三级a|