999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文獻(xiàn)計量分析的數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域的應(yīng)用研究*

2021-02-24 02:21:30夏淑潔楊朝陽林雪娟李書楠王洋李燦東
天津中醫(yī)藥 2021年2期
關(guān)鍵詞:數(shù)據(jù)挖掘研究

夏淑潔 ,楊朝陽 ,林雪娟 ,李書楠 ,王洋 ,李燦東

(1.福建中醫(yī)藥大學(xué)中醫(yī)證研究基地,福州 350122;2.福建省中醫(yī)健康狀態(tài)辨識重點實驗,福州 350122;3.湖南中醫(yī)藥大學(xué)中醫(yī)學(xué)院,長沙 410208)

中醫(yī)診斷[1]立足于整體觀念,分別從望、聞、問、切4個不同方面收集疾病相關(guān)信息,通過綜合分析以判斷當(dāng)前疾病的內(nèi)在機制給出相應(yīng)的辨證,從而指導(dǎo)臨床用藥,這個過程體現(xiàn)了中醫(yī)最大的特點,即辨證論治。然而,傳統(tǒng)辨證診斷方法也存在一定的局限性。首先,繁雜性。同一證候表現(xiàn)常有不同的辨證方法,面對繁多分類,往往給學(xué)習(xí)者帶來困惑。其次,主觀性。中醫(yī)辨證主要憑借人體感官所獲取的病例信息,其主觀性較大。再者,模糊性。中醫(yī)中許多概念都是以定性或半定量為主,診斷相關(guān)的癥狀如頻率、嚴(yán)重程度、證候的輕重、轉(zhuǎn)歸等都是相對模糊的概念,因此傳統(tǒng)中醫(yī)診斷過程中的規(guī)范、客觀、量化一直成為近半個世紀(jì)以來中醫(yī)研究領(lǐng)域中亟待解決的關(guān)鍵問題[2]。

自20世紀(jì)70年代開始,受計算機新技術(shù)的影響,中醫(yī)學(xué)者開始尋求借助計算機技術(shù)以解決中醫(yī)復(fù)雜、靈活的辨證問題,這也為后面的數(shù)據(jù)挖掘技術(shù)與中醫(yī)辨證診斷結(jié)合奠定了基礎(chǔ),并促進(jìn)了中醫(yī)的現(xiàn)代化發(fā)展。數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的數(shù)據(jù)中通過挖掘隱藏于其中有用信息的過程,它由計算機科學(xué)、統(tǒng)計學(xué)、機器學(xué)習(xí)、專家系統(tǒng)和模式識別等諸多方法多個領(lǐng)域相融合而形成的一個交叉學(xué)科[3]。可見,數(shù)據(jù)挖掘技術(shù)可充分考慮到真實世界中中醫(yī)數(shù)據(jù)繁雜、模糊、非線性的特點,從復(fù)雜的臨床數(shù)據(jù)中挖掘繁雜的證、癥關(guān)系,尋找大數(shù)據(jù)下的隱藏中醫(yī)知識和規(guī)律[4],這無疑成為中醫(yī)診斷客觀化進(jìn)程中有力的催化劑。

雖然有不少文獻(xiàn)對近年來常用數(shù)據(jù)挖掘方法在中醫(yī)診斷領(lǐng)域進(jìn)行總結(jié)梳理,但參考文獻(xiàn)有限,且缺乏基于整體學(xué)科發(fā)展趨勢的科學(xué)計量研究。因此,研究運用科學(xué)計量方法,通過繪制可視化知識圖譜,概括國內(nèi)數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用文章的發(fā)表情況、主要研究主題、研究熱點及未來的發(fā)展趨勢等,以期對中國中醫(yī)診斷與數(shù)據(jù)挖掘交叉領(lǐng)域研究提供有益參考。

1 研究方法

1.1 文獻(xiàn)來源 文獻(xiàn)資源以國內(nèi)科技文獻(xiàn)中最全的中國知網(wǎng)(CNKI)數(shù)據(jù)庫為檢索來源,為保證文獻(xiàn)質(zhì)量,進(jìn)一步選擇中國知網(wǎng)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫,采用高級檢索功能,依次對“中醫(yī)”“診斷”“數(shù)據(jù)挖掘”及其同義詞進(jìn)行主題檢索,并選擇在結(jié)果中檢索,時間范圍設(shè)置為1915—2019年,文獻(xiàn)類型選擇“期刊”,排除會議摘要、雜志通知、廣告、信件等內(nèi)容后,將所選文獻(xiàn)以“Refworks”文件格式導(dǎo)出以進(jìn)行可視化分析,同時保存至Endnote軟件以進(jìn)行文獻(xiàn)整理和查重。

1.2 數(shù)據(jù)處理 利用CNKI數(shù)據(jù)庫文獻(xiàn)分析功能進(jìn)行描述性分析,利用Endnote對收錄文章進(jìn)行查重處理,并提取相關(guān)題錄信息進(jìn)行頻數(shù)統(tǒng)計分析。利用信息可視化軟件CiteSpace(V5.5.R2)和VOSviewer(V1.6.14)進(jìn)行本研究領(lǐng)域知識圖譜繪制。前者是由美國德雷塞爾大學(xué)陳超美博士所開發(fā),其特點是能夠展示一個學(xué)科或知識域在一定時期發(fā)展的趨勢與動態(tài),并形成若干研究前沿領(lǐng)域的演進(jìn)歷程[5];后者是由荷蘭萊頓大學(xué)的Nees Jan van Eck和Ludo Waltman所共同開發(fā)[6],其主要特點是可以對學(xué)科主題之間的關(guān)系進(jìn)行清晰的呈現(xiàn)。文章結(jié)合兩款科學(xué)計量軟件的優(yōu)勢,通過對發(fā)文作者與機構(gòu)合作網(wǎng)絡(luò)、關(guān)鍵詞共現(xiàn)與時間演變、突現(xiàn)詞等進(jìn)行分析,以進(jìn)一步探討數(shù)據(jù)挖掘技術(shù)在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用研究中的主題分布與熱點演進(jìn)情況。

2 研究結(jié)果

2.1 總體分布特征

2.1.1 年度發(fā)文量 通過對CNKI所有文獻(xiàn)資料檢索初步獲得1 797篇文獻(xiàn),進(jìn)一步將文獻(xiàn)類型設(shè)為“期刊”,獲得期刊文獻(xiàn)共計693篇文獻(xiàn),并將不符合研究內(nèi)容的文獻(xiàn)如會議摘要、期刊通知等刪除,并去除重復(fù)文獻(xiàn),最后共得662篇符合研究標(biāo)準(zhǔn)的目標(biāo)文獻(xiàn),時間跨度從1979—2019年。期刊文獻(xiàn)為科研思路和成果的重要載體,發(fā)文量可以一定程度上反應(yīng)科研產(chǎn)出情況。數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用的發(fā)文量隨時間分布見圖1,從發(fā)文量來看,數(shù)據(jù)挖掘與中醫(yī)診斷相關(guān)的期刊文獻(xiàn)出現(xiàn)5個較明顯的發(fā)展階段。

圖1 數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用的年度發(fā)文情況Fig.1 Annual publication of data mining applications in the field of traditional Chinese medicine diagnostics

1)1979—1987年為交叉學(xué)科的起源階段,中醫(yī)學(xué)界開始紛紛探索用科學(xué)計算機、統(tǒng)計手段解決中醫(yī)診斷存在的問題以尋求實現(xiàn)現(xiàn)代化的方法,發(fā)文量開始遞增,該階段每年平均發(fā)文量9篇。2)1988—2002年為緩慢的科學(xué)探索階段,該時期每年發(fā)文量波動不大并維持在相對較低水平,主要基于前期的研究工作進(jìn)行探索與驗證,每年平均發(fā)文量6篇。3)2003—2008年期間為發(fā)展階段,該時期在數(shù)據(jù)挖掘與中醫(yī)診斷學(xué)領(lǐng)域中有較多的新方法和新理論產(chǎn)出,發(fā)文量開始呈較快上升速度,2005年論文增長率為92%,2008年發(fā)表論文達(dá)40篇,該階段平均每年發(fā)文量為23篇。4)在2009—2015年為發(fā)展平臺期,自2009年相關(guān)論文發(fā)表量回落后,論文發(fā)表保持在相對穩(wěn)定的水平,曾出現(xiàn)短暫的回落但又快速恢復(fù),平均年度發(fā)文量為27篇。5)2016年至今為新的發(fā)展階段,論文發(fā)表量至2019年達(dá)到歷史最高的53篇,平均每年發(fā)文量為42篇。可見,目前數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用研究有著很好的發(fā)展前景,但如何更好實現(xiàn)中醫(yī)診斷現(xiàn)代化還需要更多的學(xué)者予以關(guān)注。

2.1.2 學(xué)科和期刊分布 在CNKI數(shù)據(jù)庫中顯示本研究領(lǐng)域發(fā)表的文獻(xiàn)所屬學(xué)科集中在醫(yī)藥衛(wèi)生科技,約占64.5%;其次,是信息科技,約占28.7%。此外還涉及工程科技、社會科學(xué)及基礎(chǔ)科學(xué)等領(lǐng)域,有些文獻(xiàn)內(nèi)容涉及不同學(xué)科的交叉,故也會出現(xiàn)同一篇文獻(xiàn)歸于幾個不同學(xué)科的現(xiàn)象,這也體現(xiàn)了學(xué)科的交叉是科學(xué)發(fā)展的原始動力之一。1979—2019年間中醫(yī)診斷與數(shù)據(jù)挖掘交叉領(lǐng)域研究的文獻(xiàn)共計在國內(nèi)243個期刊發(fā)表,發(fā)文量前20名的期刊情況如圖2所示,發(fā)表在《中華中醫(yī)藥雜志》《遼寧中醫(yī)藥雜志》《中國中醫(yī)藥信息雜志》上的數(shù)量最多,分別為 34篇(6.25%)、25篇(5.77%)、21篇(4.81%),這些期刊主要為中醫(yī)領(lǐng)域的核心期刊,說明國內(nèi)將數(shù)據(jù)挖掘與中醫(yī)診斷學(xué)交叉領(lǐng)域已有被學(xué)術(shù)界認(rèn)可的學(xué)術(shù)成果。

圖2 數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用文獻(xiàn)主要出版來源Fig.2 The main publication sources of data mining in the field of traditional Chinese medicine diagnostics

2.2 研究主體

2.2.1 主要作者分布 本次納入研究的662篇文獻(xiàn)共包含1 749位作者,其中核心作者是活躍在這一研究領(lǐng)域的代表性學(xué)者。依據(jù)普賴斯定律的計算公式:m=0.749(1)式中nmax為所統(tǒng)計年限中發(fā)表論文最多的作者的發(fā)文數(shù),而發(fā)表論文數(shù)在m篇以上的作者即被認(rèn)為是高產(chǎn)作者。統(tǒng)計發(fā)現(xiàn)高產(chǎn)作者發(fā)文量最多為13篇,故m=2.7,按照取整原則,高產(chǎn)作者發(fā)文量大于或等于3篇。通過數(shù)據(jù)統(tǒng)計與分析,發(fā)文量3篇及以上的作者有35位,其中發(fā)文量為前20位作者如表1所示,高產(chǎn)論文學(xué)者主要有周小青、李建生、林求誠、胡金亮、朱文峰、晏峻峰、王憶勤、王永炎、袁肇凱、李燦東、王階等。通過VOSviewer對近20年(1999—2019年)作者主要合作網(wǎng)絡(luò)進(jìn)行可視化分析,如圖3所示,不同節(jié)點顏色代表不同的年份,顏色越接近藍(lán)色,說明該作者發(fā)文時間越久,是該研究領(lǐng)域的早期開拓者;節(jié)點顏色越接近黃色,說明該作者發(fā)文時間越近,是該研究領(lǐng)域的新近活躍者。圖中清楚地展現(xiàn)了近20年全國數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)科領(lǐng)域應(yīng)用研究的主要團隊的合作與發(fā)展脈絡(luò),并且發(fā)文量較多的作者呈現(xiàn)出明顯的網(wǎng)絡(luò)特征,說明中國該領(lǐng)域已形成多個產(chǎn)量較高的作者群。

2.2.2 研究機構(gòu)分布 本領(lǐng)域的發(fā)文機構(gòu)主要集中在中醫(yī)藥大學(xué)及附屬醫(yī)院,高產(chǎn)研究機構(gòu)有上海中醫(yī)藥大學(xué)(43)、北京中醫(yī)藥大學(xué)(42)、湖南中醫(yī)藥大學(xué)(40)等,圖4中列出了排名前18位的機構(gòu)。進(jìn)一步利用CiteSpace軟件對近20年本領(lǐng)域的主要研究機構(gòu)繪制共現(xiàn)圖譜,切片長度(Slice Length)設(shè)置為 2,篩選原則(Selection Criteria)為 T50,修剪方法選尋徑法(Pathfinder),并將節(jié)點閾值(Threshold)設(shè)為2次,如圖5所示。圖中共出現(xiàn)64個節(jié)點和40個鏈接,密度值為0.019 8,從圖中知中國該領(lǐng)域的合作多以省內(nèi)合作為多,跨省合作對象主要是各中醫(yī)藥大學(xué)之間,值得注意的是少部分理工類機構(gòu)也加入其中,主要有廈門大學(xué)智能科學(xué)與技術(shù)系、廣東工業(yè)大學(xué)自動化學(xué)院、河南大學(xué)數(shù)據(jù)與知識工程研究等。從合作發(fā)文時間來看,早期以湖南中醫(yī)藥大學(xué)、北京中醫(yī)藥大學(xué)發(fā)文為主,而后上海中醫(yī)藥大學(xué)、廣州中醫(yī)藥大學(xué)發(fā)展起來,近幾年福建中醫(yī)藥大學(xué)、山東中醫(yī)藥大學(xué)及成都中醫(yī)藥大學(xué)也成為后起之秀。

表1 數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用研究的高產(chǎn)作者Tab.1 Highly productive authors of data mining application research in the field of traditional Chinese medicine diagnostics

2.3 研究主題與發(fā)展趨勢

圖3 數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用研究的主要作者合作網(wǎng)絡(luò)Fig.3 Main author’s cooperation network of data mining in the field of traditional Chinese medicine diagnostics

圖4 數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用研究的主要機構(gòu)分布Fig.4 Distribution of the main institutions of data mining in the field of traditional Chinese medicine diagnostics

2.3.1 關(guān)鍵詞共現(xiàn)分析 研究的主題的分布及演化過程能夠體現(xiàn)不同時序內(nèi)的熱點領(lǐng)域、分析視角、研究方法等的變化。而關(guān)鍵詞作為學(xué)術(shù)論文研究主題的精煉表達(dá),其在一定程度上可以揭示學(xué)科領(lǐng)域中知識的內(nèi)在聯(lián)系。文章對1979—2019年出現(xiàn)的關(guān)鍵詞進(jìn)行同義詞合并,其中出現(xiàn)頻數(shù)排前28位的關(guān)鍵詞分布見于表2。運用VOSviewer軟件對中醫(yī)診斷與數(shù)據(jù)挖掘交叉領(lǐng)域的文獻(xiàn)中作者所給出的關(guān)鍵詞進(jìn)行共現(xiàn)分析,取閾值3后繪制圖6。關(guān)鍵詞字體越大、結(jié)點越大說明該關(guān)鍵詞在網(wǎng)絡(luò)中越重要,不同顏色代表其不同的聚類,從圖中可以看出,本交叉學(xué)科研究領(lǐng)域圍繞“數(shù)據(jù)挖掘”核心技術(shù)主要形成4大關(guān)鍵詞類簇,形成4個主題:計算機與中醫(yī)辨證論治(紅色部分),數(shù)據(jù)挖掘與疾病用藥規(guī)律(綠色部分),中醫(yī)計量診斷(藍(lán)色部分),人工智能與中醫(yī)四診(黃色部分)。從圖中可知這4種聚類之間存在一定的混合部分,如紅色區(qū)域中的“辨證論治”與藍(lán)色部分“中醫(yī)辨證”、綠色部分的“數(shù)據(jù)挖掘”與黃色部分的“人工智能”等存在著有包含和重疊的部分,說明各研究主題之間存在相互交叉、滲透的關(guān)系,這也是學(xué)術(shù)研究中普遍存在的現(xiàn)象,有助于中醫(yī)診斷與數(shù)據(jù)挖掘交叉領(lǐng)域研究的深入發(fā)展。

2.3.2 主題演變路徑 分析重要關(guān)鍵詞出現(xiàn)的時間演進(jìn)情況可進(jìn)一步勾勒本領(lǐng)域研究主題及其發(fā)展動向,通過CiteSpace繪制出國內(nèi)中醫(yī)診斷與數(shù)據(jù)挖掘交叉領(lǐng)域文獻(xiàn)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的時區(qū)圖(Timezoneview),時間跨度設(shè)置為1979—2019年,將切片長度設(shè)置為2,一共得到162個關(guān)鍵詞節(jié)點和462條連線,見圖7。在時區(qū)圖上,不同時間段首次出現(xiàn)的關(guān)鍵詞節(jié)點放置在不同的時區(qū)中,其所放位置的高度將隨著時間的延長依次增加,這樣就得到了一個自下而上、從左到右的知識演進(jìn)圖。早期的關(guān)鍵詞經(jīng)過數(shù)年的積累,其詞頻通常要顯著高于后面時區(qū)的關(guān)鍵詞,這體現(xiàn)了應(yīng)用數(shù)據(jù)挖掘方法解決中醫(yī)診斷問題的最早和經(jīng)典應(yīng)用場景。例如,由圖5得到“計量診斷”及“計算機輔助診斷”是將數(shù)據(jù)挖掘方法應(yīng)用在中醫(yī)診斷的早期和典型場景,但隨著科學(xué)技術(shù)的發(fā)展,研究主題也在更新,并在不同時期又呈現(xiàn)出不同特點。

圖5 數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用研究的主要機構(gòu)共現(xiàn)網(wǎng)絡(luò)Fig5 Co-occurrence network of major institutions for the application of data mining in the field of traditional Chinese medicine diagnostics

表2 數(shù)據(jù)挖掘在中醫(yī)診斷領(lǐng)域應(yīng)用研究的高頻關(guān)鍵詞Tab.2 High-frequency keywords of data mining in the field of traditional Chinese medicine diagnosis

1)1979—1987年為該研究領(lǐng)域的起源階段,本時期在中醫(yī)的研究領(lǐng)域產(chǎn)生了大量影響深遠(yuǎn)的關(guān)鍵詞,基于中醫(yī)的基礎(chǔ)理論,采用計量診斷、專家系統(tǒng)、計算機輔助診斷、數(shù)學(xué)模型、人工智能等方法研究中醫(yī)辨證診斷成為經(jīng)典主題。當(dāng)時受計算新技術(shù)的影響,中醫(yī)界也開始尋求現(xiàn)代化發(fā)展方法,將控制論觀點與數(shù)學(xué)模型結(jié)合,以計算機為手段,研究中醫(yī)的辨證論治的規(guī)律成為熱點[7]。朱文鋒教授研制的第一臺中醫(yī)數(shù)字辨證機,建立了“加權(quán)求和浮動閾值運算”以期實現(xiàn)中醫(yī)辨證定量[8],這在中醫(yī)幾千年的歷史發(fā)展進(jìn)程中具有革命性的意義,在一定程度上解決了中醫(yī)學(xué)領(lǐng)域中辨證論治這個最關(guān)鍵的問題,它把靈活復(fù)雜、富于經(jīng)驗的中醫(yī)學(xué)與標(biāo)志現(xiàn)代科學(xué)技術(shù)發(fā)展水平的計算機科學(xué)結(jié)合起來,為后期中醫(yī)診斷客觀、量化研究奠定了基礎(chǔ)。

2)1988—2002年為本領(lǐng)域的緩慢探索期,主要在上時期的理論與研究基礎(chǔ)上進(jìn)行驗證與方法改良,故該時期文獻(xiàn)量較少,也未出現(xiàn)新的高頻關(guān)鍵詞。從文獻(xiàn)發(fā)表內(nèi)容來看,該時期的研究主題多為探索計算機輔助辨證和中醫(yī)專家系統(tǒng)在臨床的應(yīng)用情況及中醫(yī)計量診斷的理論與方法研究。如研究者借助電子計算機應(yīng)用多元分析等數(shù)理統(tǒng)計方法對血瘀證宏觀的癥狀、體征組合規(guī)律進(jìn)行探索,以期更好進(jìn)行臨床辨證[9]。有學(xué)者對探索胃癌、哮喘、肝病等的中醫(yī)診斷建立相應(yīng)的數(shù)學(xué)統(tǒng)計模型,以進(jìn)行疾病辨證量化研究[10-12]。

圖6 數(shù)據(jù)挖掘在中醫(yī)診斷領(lǐng)域應(yīng)用研究的高頻關(guān)鍵詞Fig.6 Co-occurrence of high-frequency keywords in the application research of data mining in the field of traditional Chinese medicine diagnosis

圖7 數(shù)據(jù)挖掘在中醫(yī)診斷領(lǐng)域應(yīng)用研究的時區(qū)圖Fig.7 Time zone diagram of data mining application research in the field of traditional Chinese medicine diagnosis

3)2003—2008年為本領(lǐng)域的發(fā)展期,隨著數(shù)據(jù)挖掘技術(shù)的興起,有更多的新方法開始引進(jìn)到中醫(yī)辨證診斷領(lǐng)域,如“神經(jīng)網(wǎng)絡(luò)”“貝葉斯網(wǎng)絡(luò)”“決策樹”“支持向量機”等。2003年龔德平首次在文中以“數(shù)據(jù)挖掘”作為關(guān)鍵詞,介紹了新的數(shù)據(jù)挖掘技術(shù)貝葉斯網(wǎng)絡(luò)、決策樹在中醫(yī)診斷系統(tǒng)的運用[13]。朱文峰等[14]提出了“證素”及“證素辨證”,將中醫(yī)辨證過程概括為“根據(jù)證候,辨別證素,組成證名”,并研制出“雙層頻權(quán)剪叉”算法以解決證素辨證研究中診斷權(quán)值的問題。王階等[15]將中醫(yī)診斷方法與復(fù)雜算法結(jié)合,采用信息熵的關(guān)聯(lián)度和多元對應(yīng)分析對中醫(yī)證候中的血瘀證及亞型進(jìn)行研究。此外,該時期的研究主題還涉及關(guān)聯(lián)規(guī)則、證候診斷標(biāo)準(zhǔn)、辨證分型、中醫(yī)診斷學(xué)及相關(guān)計算機技術(shù)等方面,疾病主要涉及到冠心病、糖尿病等。

4)2009—2015年為本領(lǐng)域發(fā)展的平臺期,該時期在前期大量的研究基礎(chǔ)上,產(chǎn)出較多文獻(xiàn)研究與理論探討的文章,如李燦東等[16]在總結(jié)分析了“中醫(yī)專家系統(tǒng)”和原有辨證模型利弊的基礎(chǔ)上,強調(diào)模型算法在求解表征參數(shù)對狀態(tài)要素貢獻(xiàn)度的基礎(chǔ)上,還必須遵循中醫(yī)理論體系和思維規(guī)律,并提出了基于中醫(yī)辨證思維的中醫(yī)健康狀態(tài)辨識模型算法研究的基本框架。該時期的研究主題仍然集中在數(shù)據(jù)挖掘技術(shù)在中醫(yī)領(lǐng)域的應(yīng)用,具體還涉及用藥規(guī)律、模糊數(shù)學(xué)、聚類算法、分類算法等。如朱小虎等[17]運用模糊數(shù)學(xué)方法對膝骨關(guān)節(jié)炎(KOA)的中醫(yī)證候進(jìn)行客觀量化,初步建立起該病證識別的模糊數(shù)學(xué)模型;基于方證對應(yīng)研究,田茸等[18]采用熵聚類與apriori算法對脾虛型泄瀉方劑組方用藥規(guī)律進(jìn)行探索總結(jié)等。

5)2016年至今為本領(lǐng)域的新的發(fā)展時期,隨著“互聯(lián)網(wǎng)+”與大數(shù)據(jù)時代到來,數(shù)據(jù)挖掘尤其是人工智能的發(fā)展得到有力支撐,“健康中國”政策更加有力推動醫(yī)療領(lǐng)域的數(shù)字化進(jìn)程不斷向縱深方向推進(jìn)。該時期研究主題主要在中醫(yī)大數(shù)據(jù)、狀態(tài)辨識、名老中醫(yī)學(xué)術(shù)經(jīng)驗傳承、轉(zhuǎn)化醫(yī)學(xué)及機器學(xué)習(xí)等方面,尤其是“狀態(tài)辨識”作為新的理論提出[19],使中醫(yī)診斷富有了新的內(nèi)涵,它將傳統(tǒng)中醫(yī)對疾病的診斷擴大到對生命過程全周期健康狀態(tài)的把握[20]。李燦東等[21]將中醫(yī)狀態(tài)運用到中醫(yī)健康管理中,利用“融合多源異構(gòu)數(shù)據(jù)”和“多標(biāo)記框架的深度學(xué)習(xí)”兩種人工智能算法有效構(gòu)建中醫(yī)健康狀態(tài)辨識算法模型,以此推動智慧中醫(yī)的發(fā)展。此外,中醫(yī)的發(fā)展前提的有效地繼承,故對名老中醫(yī)學(xué)術(shù)經(jīng)驗的挖掘也是近年來的主題,如陸施婷等[22]通過“中醫(yī)傳承輔助平臺管理系統(tǒng)”分析“疾病-證候-治法-中藥”之間的關(guān)系,總結(jié)名醫(yī)丁學(xué)屏教授診治糖尿病合并高血壓的臨證經(jīng)驗等。

2.3.3 前沿趨勢預(yù)測 2002年Kleinberg提出了突發(fā)檢測算法,這種算法可以高效地探測學(xué)術(shù)研究中的“爆發(fā)點”,即檢測出短時間內(nèi)頻率急劇上升的突變詞,由此來確定某個領(lǐng)域的熱點問題和新興趨勢[23]。文章利用Citespace軟件的Kleinberg突發(fā)檢測算法(Burst Detection)對中醫(yī)診斷與數(shù)據(jù)挖掘交叉研究領(lǐng)域突變詞進(jìn)行檢測,并且以突發(fā)詞成為熱點的開始時間作升序排列,共檢測到28個熱點突發(fā)詞,如表4所示。“強度”表示關(guān)鍵詞的突發(fā)強度,強度越高意味著短時間內(nèi)該詞出現(xiàn)次數(shù)越多,“起始年”為該詞成為熱點的時間,“結(jié)束年”為該詞不再成為熱點的時間,時間段下方紅色的粗線為熱點所延續(xù)的時間。由表4可得,計算機、中醫(yī)學(xué)、數(shù)學(xué)模型、計算機輔助診斷及中醫(yī)證型在早期的較長時間成為研究關(guān)注熱點,其中“計算機”為突現(xiàn)強度最大的關(guān)鍵詞,說明將計算機技術(shù)應(yīng)用于中醫(yī)診斷領(lǐng)域成為研究的主要趨勢。近10年來,本領(lǐng)域突現(xiàn)的關(guān)鍵詞主要有:數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則、決策樹、中醫(yī)藥、模糊數(shù)學(xué)、用藥規(guī)律、聚類算法、大數(shù)據(jù)、名老中醫(yī)等。這也指明了現(xiàn)今中醫(yī)診斷與數(shù)據(jù)挖掘交叉領(lǐng)域的熱點問題:第一,數(shù)據(jù)挖掘方法技術(shù)如關(guān)聯(lián)規(guī)則、決策樹、聚類算法等在中醫(yī)診斷領(lǐng)域中的應(yīng)用值得進(jìn)一步關(guān)注。第二,注重方證對應(yīng)關(guān)系,名醫(yī)經(jīng)驗傳承與用藥規(guī)律分析也成為研究熱點。第三,在如今互聯(lián)網(wǎng)+及“健康中國”時代,中醫(yī)診斷也賦予了新的內(nèi)涵,基于真實世界的健康大數(shù)據(jù)分析成為新興熱點,如何借助現(xiàn)代科學(xué)手段,充分發(fā)揮中醫(yī)藥治未病優(yōu)勢與傳承名醫(yī)經(jīng)驗,從海量的大數(shù)據(jù)中發(fā)掘中醫(yī)診治中所隱藏的規(guī)律成為關(guān)鍵問題。

3 結(jié)論

本研究以CNKI中國期刊數(shù)據(jù)庫為數(shù)據(jù)源,收集自建庫以來中醫(yī)診斷與數(shù)據(jù)挖掘交叉領(lǐng)域研究文獻(xiàn)662篇,充分整合Citepace和VOSviewer 2種科學(xué)計量可視化軟件的優(yōu)勢,對1979—2019年間數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用文獻(xiàn)進(jìn)行了可視化分析。首先,從年度文獻(xiàn)發(fā)表量、期刊及學(xué)科分布、作者及機構(gòu)共現(xiàn)的不同維度,對本領(lǐng)域研究情況進(jìn)行的匯總分析。其次,基于關(guān)鍵詞出現(xiàn)頻次和首次出現(xiàn)時間,分別繪制關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)和時區(qū)圖,以展現(xiàn)本領(lǐng)域主要研究主題發(fā)展與演變情況。再者,根據(jù)關(guān)鍵詞突現(xiàn)分析,發(fā)掘近年來的數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域研究的熱點及未來發(fā)展趨勢,旨在為本交叉研究領(lǐng)域提供參考和依據(jù)。通過對數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用的文獻(xiàn)計量學(xué)分析,得到以下結(jié)論:

表4 數(shù)據(jù)挖掘在中醫(yī)診斷領(lǐng)域應(yīng)用的突發(fā)詞表Tab.4 Emergent vocabulary used by data mining in the field of traditional Chinese medicine diagnosis

1)從科研產(chǎn)出來看,1979—2019年,數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)領(lǐng)域應(yīng)用研究經(jīng)歷5個較明顯階段,依次是起源階段、探索階段、發(fā)展階段、平臺階段及新的發(fā)展階段。發(fā)文量雖然出現(xiàn)短暫的回落現(xiàn)象,但總體上呈現(xiàn)出上升趨勢,2019年為該領(lǐng)域年度發(fā)表論文數(shù)最多年份。

本領(lǐng)域研究主要學(xué)科集中在醫(yī)藥衛(wèi)生科技、信息科技方面,體現(xiàn)了學(xué)科交叉的特點。發(fā)文期刊主要為中醫(yī)領(lǐng)域內(nèi)的核心期刊,以《中華中醫(yī)藥雜志》《遼寧中醫(yī)藥雜志》《中國中醫(yī)藥信息雜志》上的數(shù)量最多,說明國內(nèi)中醫(yī)診斷與數(shù)據(jù)挖掘交叉研究領(lǐng)域已有被學(xué)術(shù)界認(rèn)可的學(xué)術(shù)成果。

2)從研究主體分布來看,高產(chǎn)論文學(xué)者主要有周小青、李建生、林求誠、胡金亮、朱文峰、晏峻峰、王憶勤、王永炎、袁肇凱、李燦東、王階等,并且發(fā)文量較多的作者呈現(xiàn)出較明顯的網(wǎng)絡(luò)特征發(fā),說明我國該領(lǐng)域已形成多個產(chǎn)量較高的作者群。本領(lǐng)域的發(fā)文機構(gòu)主要集中在中醫(yī)藥大學(xué)及附屬醫(yī)院,高產(chǎn)研究機構(gòu)以上海中醫(yī)藥大學(xué)、北京中醫(yī)藥大學(xué)、湖南中醫(yī)藥大學(xué)科研產(chǎn)出最多,近年來福建中醫(yī)藥大學(xué)、山東中醫(yī)藥大學(xué)及成都中醫(yī)藥大學(xué)也成為后起之秀。該領(lǐng)域的合作多以省內(nèi)合作為多,跨省合作對象主要是各中醫(yī)藥大學(xué)之間,此外也有部分理工類機構(gòu)也加入其中。

3)從研究主題及演變路徑來看,數(shù)據(jù)挖掘在中醫(yī)診斷學(xué)應(yīng)用文獻(xiàn)中各研究主題之間存在相互交叉、滲透的現(xiàn)象,總體形成4大類聚類主題:計算機與中醫(yī)辨證論治,數(shù)據(jù)挖掘與疾病用藥規(guī)律,中醫(yī)計量診斷,人工智能與中醫(yī)四診。1979—1987年間,研究主題主要為與中醫(yī)診斷相關(guān)的計量診斷、專家系統(tǒng)、計算機輔助診斷、數(shù)學(xué)模型等;1988—2002年間,主要基于對前期研究的驗證與改良,未出現(xiàn)高頻的關(guān)鍵詞和新的研究主題;2003—2008年間,主要研究主題為數(shù)據(jù)挖掘技術(shù)如神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、決策樹、支持向量機等在與中醫(yī)診斷的應(yīng)用及證素與證素辨證的理論與實踐研究。2009—2015年間,研究主題主要涉及數(shù)據(jù)挖掘技術(shù)、模糊數(shù)學(xué)、文獻(xiàn)研究、聚類算法、分類算法等在中醫(yī)辨證診斷方面的應(yīng)用及用藥規(guī)律探索。2016年至今,研究主題主要在中醫(yī)大數(shù)據(jù)、狀態(tài)辨識、名老中醫(yī)學(xué)術(shù)經(jīng)驗傳承、轉(zhuǎn)化醫(yī)學(xué)及機器學(xué)習(xí)等方面。

4)從熱點突發(fā)詞分析來看,計算機、中醫(yī)學(xué)、數(shù)學(xué)模型、計算機輔助診斷及中醫(yī)證型在早期的較長時間一直成為研究關(guān)注熱點,并且將計算機技術(shù)應(yīng)用于中醫(yī)診斷領(lǐng)域成為研究的主要趨勢。近10年來,本領(lǐng)域突發(fā)的關(guān)鍵詞主要有:數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則、決策樹、中醫(yī)藥、模糊數(shù)學(xué)、用藥規(guī)律、聚類算法、大數(shù)據(jù)、名老中醫(yī)等。尤其,在現(xiàn)今互聯(lián)網(wǎng)+及“健康中國”時代背景下,基于真實世界的大數(shù)據(jù)分析成為新興熱點,如何更好傳承名醫(yī)經(jīng)驗,并借助現(xiàn)代科學(xué)手段,從海量的大數(shù)據(jù)中探求中醫(yī)臨床診療中所隱藏的規(guī)律成為重要關(guān)鍵問題。

猜你喜歡
數(shù)據(jù)挖掘研究
FMS與YBT相關(guān)性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 国产精品亚欧美一区二区三区| 亚洲人成网站日本片| 亚洲国产欧洲精品路线久久| 在线播放国产99re| 国产屁屁影院| 国产精品久久久久鬼色| 秘书高跟黑色丝袜国产91在线| 国产成人久视频免费| 欧美日韩亚洲国产主播第一区| 亚洲丝袜第一页| 国产美女自慰在线观看| 国产黄网站在线观看| 激情午夜婷婷| 久久久波多野结衣av一区二区| 一级成人a做片免费| 国产99免费视频| 国产女人18水真多毛片18精品| 免费毛片视频| 99中文字幕亚洲一区二区| 欧美啪啪网| 亚洲无码久久久久| 亚洲第一成年免费网站| 欧美yw精品日本国产精品| 亚洲综合狠狠| 国产自视频| 男人天堂亚洲天堂| 99精品热视频这里只有精品7| 久久这里只有精品8| 国产成人免费观看在线视频| 精品国产自在现线看久久| 国产一级裸网站| 久无码久无码av无码| 青青草综合网| 美女无遮挡免费视频网站| 午夜成人在线视频| 黄色网址手机国内免费在线观看| 国产精品美人久久久久久AV| 欧美日韩午夜视频在线观看| 综合色亚洲| 成人无码区免费视频网站蜜臀| 91高清在线视频| 色婷婷在线影院| 91在线播放免费不卡无毒| 亚洲精品你懂的| 欧美黄网在线| 国产真实二区一区在线亚洲| 日韩乱码免费一区二区三区| 福利在线不卡| 国产人妖视频一区在线观看| 91福利国产成人精品导航| 国产在线拍偷自揄观看视频网站| 日韩精品成人在线| 在线看AV天堂| 美美女高清毛片视频免费观看| 免费看黄片一区二区三区| 久久96热在精品国产高清| 国产精品性| 久久久久无码精品| 国产日韩欧美视频| 欧美成人一级| 久久夜色撩人精品国产| 高潮爽到爆的喷水女主播视频| 丰满的少妇人妻无码区| 欧美激情第一区| 一级毛片不卡片免费观看| 久久久久久久97| 无码在线激情片| 亚洲女人在线| 欧美a在线| 国产精品美女免费视频大全| 欧美精品在线免费| 免费看a级毛片| 手机永久AV在线播放| 91久久国产综合精品女同我| 第一页亚洲| 国产肉感大码AV无码| 在线日韩日本国产亚洲| 国产一区二区精品福利| 国产91蝌蚪窝| 欧美国产另类| 蜜桃视频一区二区| 人妻一区二区三区无码精品一区|