999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Cite Space的中醫糖尿病數據挖掘可視化分析*

2020-04-19 07:12:38胡遠樟溫川飆程小恩
世界科學技術-中醫藥現代化 2020年7期
關鍵詞:數據挖掘糖尿病分析

胡遠樟,溫川飆,程小恩

(成都中醫藥大學醫學信息工程學院 成都 611137)

中醫藥信息本質上是一種知識密集型數據,具有整體性、混雜性、相關性的特點[1]。糖尿病屬于中醫“消渴病”范疇,中醫藥對于糖尿病有著獨特的防治與診療效果。隨著數據挖掘技術在中醫藥領域的應用發展,如何更好的使用數據挖掘技術在海量醫療信息中挖掘出糖尿病中醫診療隱性知識、為臨床決策提供指導成了研究者關注的重點。

1 數據來源與研究方法

以中國知網(CNKI)期刊庫為文獻統計來源,以“糖尿病”AND“中醫數據挖掘”為主題詞檢索字段對所有學科領域進行精確檢索,共檢索出相關主題文獻393 篇,通過人工排除糖尿病并發癥文獻、會議通知、簡訊、報道和不符合要求的文獻后,最終納入文獻195篇,文獻檢索時間截止到2019 年5 月。本文利用文獻計量工具CiteSpace 對相關文獻進行統計并繪制可視化圖譜[2],以期探究國內中醫糖尿病數據挖掘研究現狀與趨勢,為后續研究提供參考。

2 文獻數據計量分析

2.1 發文趨勢分析

為考察文獻數量隨時間變化的情況,本文將與糖尿病中醫數據挖掘相關的文獻進行統計(圖1)。由圖可以看出,該研究領域相關的文獻量雖波動較大,但總體趨勢仍呈由少到多逐年增加的態勢,其增長模式大致符合線性增長模型:y = 3.5529x - 7118.4,R2 =0.8754(一般認為R2>0.8 時該模型的擬合優度較高),表明該模型能較好反映該領域文獻增長趨勢,同時也說明應用數據挖掘方法在中醫糖尿病研究中的關注度正逐步上升。

2.2 基于關鍵詞的研究概況分析

圖1 相關文獻變化曲線圖

表1 高頻關鍵詞分類

關鍵詞詞頻數統計結果(表1)及關鍵詞可視化圖譜(圖2)顯示,中醫糖尿病數據挖掘領域研究主要采用常用的挖掘算法包括關聯規則、聚類、神經網絡、決策樹、時間序列、因子分析、遺傳算法、邏輯回歸分析、頻數描述統計、雙聚類分析、Samma 算法等。其中研究者利用關聯規則、聚類、神經網絡算法頻次最高。

關聯規則其實質是從大量數據中發現項集之間的關聯關系、因果結構以及項集間的頻繁模式[3]。通過關聯規則可以挖掘出數據中潛在的隱性知識,利用這些知識可以對未知作出推測,如通過關聯規則挖掘名老中醫診療糖尿病過程中藥物與藥物之間的藥物配伍關系。

聚類分析是根據“物以類聚”的原理,在沒有模式參考和先驗知識的情況下,對數據信息進行分類,常用的聚類分析算法主要有基于劃分、層次、密度、網格和模型等進行聚類[4]。在糖尿病中醫研究中,聚類方法常用于糖尿病中醫證候研究、中醫基礎研究以及方劑分析研究3 個方面,其可以按照中醫糖尿病數據本身的內在規律來使得中醫數據分析結果更具客觀性,有利于中醫藥研究的客觀化、定量化與標準化[5]。但作為一種工具和方法,需要更加關注對糖尿病中醫聚類結果的解釋,只有將分析結果與中醫藥本體知識理論結合起來才能為下一步的研究工作打好基礎。

2.3 基于“用藥規律”、“知識發現”、“針灸”的突現詞分析

突現詞為某一時間段內突然大量出現的詞,較單獨研究關鍵詞出現頻次而言,突現詞能夠有效反映研究領域的前沿主題[6]。本文利用CiteSpace 的膨脹詞探測技術及算法進行突現詞探測(表2)。

(1)用藥規律強度最強在出現的突現詞中,用藥規律強度最強(11.2995),時間開始于2015 年,結束于2017 年。研究總結糖尿病的中醫組方用藥規律,是傳承和發展中醫防治糖尿病方法和手段的核心內容。中醫糖尿病用藥規律研究經歷了口傳心授、經驗總結、收集方藥、手工統計以及應用統計方法分析等發展歷程[7],目前隨著計算機技術的快速發展以及中醫信息化水平的提高,數據挖掘方法正逐步應用于用藥規律挖掘研究,目前糖尿病中醫用藥規律研究主要用于名醫用藥經驗挖掘[8]。

圖2 關鍵詞圖譜

表2 糖尿病中醫數據挖掘突現詞

名老中醫專家經驗是中醫學術思想的精華,是中醫藥創新發展的思想源泉,有著顯著的疾病診療優勢,數據挖掘是名老中醫臨床用藥規律發現的重要現代化手段與方法。李宏紅[9]運用數據挖掘技術挖掘魏子孝教授治療糖尿病的臨證經驗,得出魏子孝教授治療糖尿病不套用三消分治,而是以主證素診斷,結合患者體質、疾病本身特點的辨證論治的方法。李修洋[10]利用關聯規則對仝小林教授運用經方辨治糖尿病的用藥特點與劑量進行歸納,總結出仝教授巧用藥對、方小力宏的用藥特點。黃利兵[11]運用關聯規則探究王暉教授治療糖尿病的處方用藥規律,結果提示藥物以王暉教授自擬的“降濁合劑”和“寧心舒情湯”為主,多用養陰清熱、調暢氣機之品,為名老中醫用藥經驗的繼承和發揚提供了借鑒。

(2)知識發現時間跨度最長時間跨度最長的關鍵詞為知識發現(2003-2008 年)。知識發現是一個從數據中提取出有效的、新穎的、潛在有用的并能最終被人理解的模式的非平凡過程,數據挖掘被認為是知識發現過程中的一個關鍵步驟,因此兩術語可交換使用[12]。其集成了諸如統計學、數據庫技術、可視化、人工智能、機器學習、模式識別等多學科概念與技術方法,流程主要包括確定目的、數據準備、數據預處理、確定挖掘平臺與算法、數據挖掘、結果分析、知識應用等。

(3)針灸出現時間最晚針灸出現時間較晚(2016—2019 年)。近年來,中國糖尿病發病率不斷增高,西醫主要以口服降糖藥物或皮下注射胰島素治療為主,同時結合飲食、運動療法,但其發病機制尚不明確,目前尚無法根治[13]。

針灸作為一種古老的自然療法,具有操作方便、安全有效、無藥物副作用的特點,在糖尿病針灸診療過程中,常從多個角度進行辨證論治。其穴位常選十四經穴、耳穴及經外奇穴等,在毫針刺法上常根據不同時期的證候特點,選用調神針法、時間針灸、溫針灸療法以及穴位埋線和刺血療法等針灸特色療法[14]。其不僅能有效改善糖尿病患者臨床癥狀,更可以調節血脂、血糖等生化指標。采用數據挖掘相關信息化方法探究針灸診療糖尿病規律與隱性知識或是接下來糖尿病中醫數據挖掘領域研究的前沿之一。

2.4 糖尿病中醫數據挖掘流程分析

通過文獻計量分析糖尿病數據挖掘流程(圖3)發現,90%研究者采用的流程可分為確定挖掘目的、確定病例數據納入標準、病例納入、確定數據處理平臺與算法、數據挖掘、中醫臨床實踐及療效驗證等過程。較多的研究者常用 SPSS,Weka,Rapidminer,Python、Java 等國外商用平臺實現數據挖掘過程,但自2012 年始,國內研發的中醫傳承輔助平臺受到廣泛關注,已經成為糖尿病中醫數據挖掘的重要工具。

3 討論

本文借助文獻計量學方法和CiteSpace 可視化工具,對2003-2019年CNKI數據庫中收錄的、以“糖尿病中醫數據挖掘”為主題的研究文獻進行分析。通過對發文量和關鍵詞進行分析可知,糖尿病作為中醫優勢病種之一,運用數據挖掘技術探究其潛在規律正逐步受到中醫研究者的廣泛關注。研究應用最多的為一些經典的數據挖掘算法,如關聯規則與聚類,且應用對象并不單一,除了現代電子病歷以外,也用于挖掘記載有糖尿病的歷史醫學文獻。對具有轉折意義的關鍵詞(突現詞)分析發現,該領域的研究焦點一直集中在配伍規律的挖掘中,但內容逐步細化,從方藥配伍規律逐步發展到針灸穴位配伍。近年來,學者們對糖尿病數據挖掘的探討亦有了新的思路,偏重于血糖規律及用藥機制的探索,如金百翰等[15]采用動態的觀察檢測方法,連續監測患者72 h 血糖及相關癥狀并分析,孫鼎等[16]基于動態血糖Hurst 指數與氣血流注規律,探討血糖變化特點;白明等[17]挖掘治療糖尿病高頻藥物,并通過網絡藥理學探討高頻藥物黃芪治療糖尿病的作用機制等。

圖3 數據挖掘流程

通過對納入的相關文獻回溯發現,該領域在數據挖掘流程方面,遵循基本的數據采集-預處理-挖掘基本流程。其構造的診斷模型主要根據中醫理論,通過納入癥狀-證型構建辨證模型,其中尤以人工神經網絡為主要的模型構建方法。其原因可能是因為該領域本來就屬于計算機和中醫學的一個交叉學科,所采用的方法技術來源于計算機領域,以方法學結合中醫理論的應用研究為主有關;同時,人工神經網絡能夠自動在海量數據中尋找模式和規律,歸納隱含在信息單元之間的關聯規則的特性與中醫證候非線性、多維多階、可以無限組合的特點相契合,也是其在該領域廣泛應用的原因之一。但在其模型和挖掘結果評估方面,由于臨床數據具有特殊性,其模型及挖掘結果評價不能僅僅依靠測試集來確定準確率,更需要嵌套到網絡應用中,在真實臨床場景下供醫生使用,以實際療效來評估其效果。

隨著大數據時代的來臨和數據挖掘技術的應用,科學發現的模式已由傳統的實驗設計、理論科學和計算科學發展到了第四科學范式,即知識密集型科學發現模式。在該模式下,由于中醫臨床信息化水平的提高,數據的采集、存儲、傳輸和處理成本大大降低,效率得到了極大的提高,使得糖尿病中醫研究不再單純追求數據之間的因果關系,而是相關關系,讓“數據說話”,探究真實臨床問題的數據規律成為可能。然而當前的數據挖掘趨勢已經由原來的單維度靜態信息挖掘發展到了動態的、多維度高層次挖掘,即數據來源信息是動態連續、多個角度的,在該研究領域中即可體現為對糖尿病患者動態血糖及不同病程下的證型、用藥規律的挖掘和中醫癥狀與西醫臨床指標的關聯挖掘研究。隨著新的數據挖掘方法的出現,計算能力的提高以及糖尿病臨床數據的積累,該領域正處于不斷發展的朝陽時期,后期可結合更多新的數據挖掘技術方法,探討在中醫糖尿病研究領域的應用。

4 結語

在當前的數據挖掘中醫糖尿病研究領域中,其研究現狀未見十分明確的總結,而傳統的總結方式又過于繁瑣,難以形象直觀展現結果。本文采用CiteSpace軟件通過分析關鍵詞得到可視化圖譜,并通過文獻回溯的方式分析出該領域的研究熱點,對挖掘流程作了一個梳理。但由于數據庫格式限制,不能對多個數據庫同時進行分析,所以只選用了CNKI 數據庫作為數據來源,同時剔除了糖尿病相關并發癥文獻,因此,有些研究主題由于文獻數據所限,并未在本文中體現。在下一步的研究工作中,作者將嘗試擴展數據來源,針對糖尿病的相關并發癥,從更多角度對該領域進行分析。

猜你喜歡
數據挖掘糖尿病分析
糖尿病知識問答
中老年保健(2022年5期)2022-08-24 02:35:42
糖尿病知識問答
中老年保健(2022年1期)2022-08-17 06:14:56
糖尿病知識問答
中老年保健(2021年5期)2021-08-24 07:07:20
糖尿病知識問答
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 国产精品va| 天堂av综合网| 免费午夜无码18禁无码影院| 激情无码字幕综合| 中日无码在线观看| 高清不卡一区二区三区香蕉| 国产成人无码综合亚洲日韩不卡| 毛片视频网址| 黄色网在线免费观看| 国产欧美精品专区一区二区| 不卡午夜视频| 成年人午夜免费视频| 国产xxxxx免费视频| 国产女人18水真多毛片18精品| 日韩欧美国产另类| 亚洲人成在线精品| 成人综合网址| 激情综合图区| 一级香蕉人体视频| 91国内视频在线观看| 亚洲国产日韩在线观看| 影音先锋亚洲无码| 亚洲国产日韩欧美在线| 亚洲国产精品不卡在线| 久青草免费在线视频| 婷婷丁香在线观看| 久久99精品久久久大学生| 午夜啪啪网| 美女被操91视频| 国产午夜一级淫片| 无码日韩人妻精品久久蜜桃| 久久精品丝袜| 香蕉精品在线| 茄子视频毛片免费观看| 暴力调教一区二区三区| 久久久受www免费人成| 欧美综合成人| 一级看片免费视频| 亚洲av无码成人专区| 亚洲系列中文字幕一区二区| 亚洲视屏在线观看| AV熟女乱| 日本午夜网站| 99热亚洲精品6码| 露脸一二三区国语对白| 精品成人一区二区| 东京热高清无码精品| 黑色丝袜高跟国产在线91| 中文字幕资源站| 国产精品视频3p| 狠狠躁天天躁夜夜躁婷婷| 久久人搡人人玩人妻精品| 精品人妻AV区| 国内精品久久久久鸭| 亚洲AV无码乱码在线观看裸奔 | 永久免费av网站可以直接看的 | 久久美女精品| 欧美特黄一级大黄录像| 亚洲精品人成网线在线| 毛片在线看网站| 精品国产欧美精品v| 亚洲精品视频免费观看| 天天色天天综合网| 国产精品尤物铁牛tv| 亚洲首页在线观看| 国产第八页| 国产黄网站在线观看| 在线免费观看a视频| 亚洲91精品视频| 欧美成在线视频| 久久青青草原亚洲av无码| 一级毛片基地| 日本一区二区三区精品视频| 日本欧美成人免费| 久久婷婷五月综合色一区二区| 国产精品一区二区不卡的视频| 国内精品久久久久鸭| 日韩在线视频网| 日本欧美一二三区色视频| 欧美性爱精品一区二区三区| 成人免费一区二区三区| 久青草国产高清在线视频|