榮光 謝晴宇 孟慶剛



摘要:目的 探討中醫結構化電子病歷國內研究的新興趨勢和創新性。方法 計算機檢索中國知識資源總庫(CNKI)2000年1月-2015年12月中醫電子病歷研究領域相關文獻,對該領域研究者、研究機構、關鍵詞等進行文獻計量分析,采用可視化軟件CiteSpace構建共現網絡。結果 發文量前3位的研究者為劉保延(13篇)、張潤順(8篇)、謝琪(7篇)和周雪忠(7篇);合作緊密的研究機構有中國中醫科學院、湖北中醫藥大學信息工程學院、河南中醫學院第一附屬醫院等;關鍵詞主要聚類有中醫診斷(#0)、中國中醫藥信息(#1)、人工智能(#2)、病歷管理(#3)、醫技科室(#4)等;主要關鍵詞有電子病歷、中醫醫院、數據挖掘、遠程醫療、人工智能等。結論 目前,中醫電子病歷領域的研究者、研究機構間合作不夠緊密,未形成研究熱點,創新性不顯著,原因可能與我國中醫藥信息化建設的整體水平密切相關。
關鍵詞:電子病歷;關鍵詞聚類;研究者合作;研究機構合作;知識圖譜
DOI:10.3969/j.issn.1005-5304.2017.01.024
中圖分類號:R2-05 文獻標識碼:A 文章編號:1005-5304(2017)01-0099-06
Electronic Medical Record in TCM Field—An Analysis Based on Scientific Knowledge Visualization RONG Guang1, XIE Qing-yu2, MENG Qing-gang1 (1. Beijing University of Chinese Medicine, Beijing 100029, China; 2. Institute of Basic Research in Clinical Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China)
Abstract: Objective To assess Chinas newly evolved hot spots and novelty of structural electronic medical record in TCM field. Methods Articles about electronic medical record in TCM field were retrieved from CNKI from January 2000 to December 2015, focusing on researchers, research institutes, and key words for bibliometric analysis. Then visualization software CiteSpace was used to establish co-occurrence network. Results The top 3 productive authors were LIU Bao-yan (13 articles), ZHANG Run-shun (8 articles), XIE Qi (7 articles), and ZHOU Xue-zhong (7 articles). Institutes highly cooperated with others included China Academy of Chinese Medical Sciences, Information Engineering College of Hubei University of Chinese Medicine and The First Affiliated Hospital of Henan University of Chinese Medicine. The major clusters were TCM diagnosis (#0), Chinas TCM information (#1), artificial intelligence (#2), medical record management (#3), and medical laboratory department (#4). The representative keywords involved electronic medical record, TCM hospital, data mining, telemedicine, and artificial intelligence. Conclusion In the field of TCM electronic medical record, cooperation is not sufficiently facilitated among researchers and institutes. Research hot spots are not formed and novelty is not obvious, which is probably because of the overall status quo for Chinas TCM information construction.
Key words: TCM electronic medical record; keyword cluster; co-author; co-institute; knowledge graph
2015年12月,烏鎮互聯網醫院正式運營,連接全國范圍內的醫院、醫生、患者、藥品和醫保體系,建立起一個新型的智慧健康醫療服務平臺,是“互聯網+醫療”模式的突破性探索。該示范模式預示著,
基金項目:國家科技支撐計劃(2013BAI02B10);國家自然科學基金面上項目(81473800、81273876)
通訊作者:孟慶剛,E-mail:mqgangzy@126.com
將不同醫療機構產生和積累的醫療數據共享,遠程訪問,是互聯網醫療領域發展的重要需求。其中,中醫電子病歷數據作為患者醫療數據的重要載體,是醫療數字化的重要組成部分,也是醫療機構間開展臨床診療、科研所必須的臨床信息資源。中醫電子病歷研究歷時15年之久,領域論文數量逐年遞增,繪制科學知識圖譜,能從文獻計量學角度詮釋該領域研究現狀,為今后互聯網醫療數據的集成提供依據。
科學知識圖譜是以知識域(knowledge domain)為對象,顯示科學知識的發展進程和結構關系的圖像[1],具有“圖”和“譜”的雙重特性:既是可視化知識圖形,又是序列化的知識譜系。顯示了知識單元或知識群之間網絡、結構、互動、交叉、演化或衍生等諸多隱含的復雜關系,而這些復雜的知識關系正孕育著新的知識。CiteSpace是應用Java語言開發的一款信息可視化軟件,基于共引分析理論和尋徑網絡算法等,對特定領域文獻(聚合)進行計算,以探尋出學科領域演化的關鍵路徑和知識節點,并通過一系列可視化圖譜的繪制來形成對學科演化潛在動力機制的分析和學科發展前言的探測[2]。這種多元、分時、動態的文獻分析可視化技術所繪制的知識圖譜,能夠將一個知識領域的來龍去脈的演進歷程集中體現在一幅網絡圖譜上。鑒于科學知識圖譜方法學研究的優勢,本研究運用CiteSpace軟件繪制中醫電子病歷科學知識圖譜,探討該領域的研究者、研究機構合作情況、研究熱點及創新性。
1 資料與方法
1.1 數據來源
計算機檢索中國知識資源總庫(CNKI)2000年1月-2015年12月中醫電子病歷研究領域相關文獻。檢索式:SU=‘中醫電子病歷。檢索日期:2016年3月23日。閱讀文獻題目和摘要,對檢索結果進行初篩,排除明顯不相關者。
1.2 納入與排除標準
納入標準:中醫藥領域電子病歷的期刊論文。排除標準:①未將中醫藥作為主要探討對象者;②未將電子病歷做為主要探討對象者;③研究設計存在缺陷,結果不可信者;④學位論文、會議論文等非標準文獻格式者。采用雙人交叉閱讀文獻全文的方式進行納入排除。意見不一致時討論解決,不能達成一致者由第3名研究者決定。
1.3 數據轉換
采用CiteSpace數據轉換功能,對所下載數據進行格式轉換,以供分析。轉換的字段包括關鍵詞、作者、發表年份等。
1.4 圖譜生成與評價指標
科學知識圖譜包括:作者合作網絡、機構合作網絡和關鍵詞網絡。度量指標包括:節點頻次、節點中心度、節點突變性、sigma值、模塊度、輪廓值、3種代表性類標簽提取算法(tf*idf、LLR、MI)。其中“節點頻次”“節點中心度”得到的結果各是一組有權重次序的關鍵詞,用以梳理領域發展脈絡,綜合2種測度方法結果進行分析;“節點突變性”得到的結果是一組有權重次序的關鍵詞,用以發現領域熱點,參考前人研究[3-5],本文設定節點突變性>10為有意義涌現;“sigma值”用以評估領域創新性,sigma值高的節點落在某一類的數量越多,代表這一類具有創新性;“模塊度”“輪廓值”得到的結果分別是0~1和-1~1的數值,用以評價聚類效果,前者越接近1說明聚類效果越好,后者越接近1說明對聚類結論越有把握。當模塊度>0.3、輪廓值>0.6時,認為聚類效果較好且有把握[6];“類標簽提取算法”得到的結果是各聚類的代表性標簽,用以分析類別特征。3種算法的前提假設不同,會提供3組不同的類標簽,結合3組結果分析效果較好。3位作者按照各圖譜及度量指標的指向與約束,對中醫電子病歷領域文獻進行評估、探討,最后做出總結意見。
2 結果與分析
2.1 檢索結果
初檢獲文獻248篇,人工閱讀標題和摘要信息,排除明顯不相關文獻92篇,雙人交叉排除42篇,最終納入114篇。
2.2 研究者、研究機構合作情況
構建的研究者合作網絡由219個節點、443條連線組成,輪廓值=0.769 1,模塊度=0.595 5,模塊結構顯著,聚類結果可信,見圖1。聚類圖共包含研究者219名,研究者間合作不夠緊密,合作規模局限于同一單位內部。其中,發文量前3位的研究者為劉保延(13篇)、張潤順(8篇)、謝琪(7篇)和周雪忠(7篇)。
構建的研究機構合作網絡由95個節點、32條連線組成,輪廓值=0.887 2,模塊度=0.301 5,模塊結構顯著,聚類結果可信,見圖2。其中,發文量由高到低的研究機構依次為中國中醫科學院(9篇)、中國中醫科學院中醫臨床基礎醫學研究所(5篇)、中國中醫科學院廣安門醫院(5篇)、中國中醫科學院中醫藥信息研究所(4篇)、湖北中醫藥大學信息工程學院(4篇)、河南中醫學院第一附屬醫院(3篇)、江西中醫學院附屬醫院(3篇)、山東中醫藥大學(3篇)。另外,圖2也體現出不同研究機構之間的合作緊密度與發文量成正比。
2.3 關鍵詞節點聚類、圖譜與相關指標
聚類后,得到13類(#0~#12),見圖3。整體聚類效果好,可信度較高(模塊度=0.625 2>0.3;平均輪廓值=0.621 3>0.6)。各類中,輪廓值>0.6者5個。詳見表1。
最大的聚類(#0)形成于2008年,包含44個關鍵詞,代表性文獻為《名老中醫電子病歷中病史動態結構化數據錄入規范》[7]。中醫電子病歷除具有一般電子病歷的特征外,還包括了中醫四診、辨病辨證、中醫處方、中醫診斷等體現中醫診療特色內容。結構化電子病歷,是基于信息和數據挖掘技術研究老中醫經驗的基礎,其核心在于病史的結構化,國內外常用的結構化方法有固定表單錄入、開放式結構化錄入以及通過語義分析自動結構化。3種方法的智能程度依次增高,中醫電子病歷領域常用的是開放式結構錄入,將《中醫臨床術語集》映射到術語字典,再將術語字典與病歷模板器銜接,形成以術語字典為支撐的結構化模板[8]。隨著語義分析自動結構化方法的不斷進步,數據自動結構化程度也在不斷加強。
第二大聚類(#1)類成員有27個,輪廓值=0.654 0,表明該類成員內部的同質性較低,構成該類的文獻主題不夠集中。最具影響力的事件是2014年首屆中醫藥信息大會的召開,發布的統計數據顯示,自國家中醫藥管理局將信息化建設作為中醫藥事業發展的重要內容以來,全國已有82%以上中醫院建立了醫院信息系統,53%以上建立了電子病歷,近95%建立了藥品管理信息系統[9]。電子病歷系統的實際應用中,科研方式的質量控制功能尚在探索和逐漸完善過程中。
第三大聚類(#2)類標簽為“人工智能”,代表性文獻為《運用可擴展標記語言彈性結構電子病歷的中醫科研數據分析統計方法探索研究》[10],該研究采用決策樹方法分析中藥使用情況及其與證候的相關關系,同時還用統計圖表顯示多因素關系圖。此外,有研究者從復雜網絡的角度出發,對名老中醫處方網絡結構進行分析,發現體現其處方思維和臨床特點的核心處方配伍結構[11]。
第四大聚類(#3)類標簽是“病歷管理”,代表性文獻為《試論中醫病歷電子化的作用和意義》[12],從3個方面歸納了中醫病歷電子化的意義,即提高中醫臨床工作的效率、推進中醫診斷的現代化和繼承名家經驗。該研究發表時間較早(2001年),具有時代局限性,隨著信息化程度的提高,未來中醫電子病歷還會出現更多的應用領域和價值空間。
第五大聚類(#4)的代表性文獻為《電子病歷中醫技科室檢查數據的獲取和應用》[13],關注的焦點是院內醫學信息資源的共享。其中,基于電子病歷系統開展臨床路徑的優勢在于:執行過程可控,效果評估便捷,節約經濟衛生成本。
2.4 節點權重測度結果與圖譜
節點頻次和中心度測度結果分別見圖4、圖5。得到節點中心度>0.1的節點10個,節點頻次>5的節點10個,有突現性的節點數量為0,見表2(均為術語有效聚類者)。
詞頻和中介中心性最高的是“電子病歷”(節點頻次=68,節點中心度=1.37),屬于主題類關鍵詞;排在第二位的是“中醫醫院”(節點頻次=11,節點中心度=0.14),體現了電子病歷的應用機構;“數據挖掘”(節點頻次=7,節點中心度=0.07)屬于方法類關鍵詞,包括挖掘疾病診斷和治療規律,常用的電子病歷數據挖掘方法有基于關聯規則的數據挖掘,基于粗糙集的數據挖掘和可視化技術3類。針對中醫電子病歷領域,基于關聯規則的數據挖掘方法更常見,可與聚類分析聯用,挖掘專家經驗[14],體現“癥狀-證候-治法-藥物”之間的關聯關系。粗糙集理論對不完備信息知識挖掘有一定的優勢,有學者提出了基于形式概念分析的不完備電子病歷系統粗糙挖掘算法[15],設計出中醫病歷方劑配伍規則挖掘專家系統,用于識別脾胃方中醫方劑之間“方、藥、癥、因”之間的關系和方劑間的配伍規律。中醫電子病歷的可視化技術方面,目前國內期刊還未出現以此為專題的報道,國外電子病歷研究領域有研究開發SPHERE[16],對診斷指標進行可視化,加強患者和醫生之間的交流,輔助臨床決策。
2012年5月,衛生部頒布的《衛生信息共享文檔規范》在HL7 CDA R2基礎上,對中國衛生數據元、基本數據集標準進行本地化約束,形成文檔格式模板,對中醫電子病歷的要求是:結合HL7 CDA文檔架構和國家相關中醫藥臨床標準及規范,對中醫電子病歷的文檔結構和語義進行標準化和CDA本地化定義,以實現異構系統之間的數據共享。同一時間內,中醫電子病歷信息標準體系框架的構建、評估中醫電子病歷的信息標準是否得到有效應用類型開始出現。定量化的體現是,表2中“聯網計算機”“遠程醫療”中介中心性數值較高,提示中醫電子病歷信息標準的推廣力度在逐步加強,異構系統的數據共享是主要推動力。“人工智能”,體現了以電子病歷為基礎的臨床決策支持系統的研究內涵,是智能化數字醫院建設的重要組成部分。借助人工智能技術,對知識自動析取與管理將是未來發展方向以及研究的重點,并將呈現多樣性和豐富性。此外,“信息系統”“數字化醫院”等關鍵詞都是反映醫院信息系統建設類詞匯。
3 討論
3.1 研究局限性
由于CiteSpace軟件在中文科學文獻數據的采集方面僅支持CNKI數據庫文獻記錄的下載和格式轉換,這也是本研究的局限性所在。為了探索這一局限帶來的影響,本課題組在前期研究中預檢索了CNKI、中文科技期刊數據庫(重慶維普)及中國學術期刊數據庫(萬方數據)收錄的中醫電子病歷相關文獻,并使用同一方法納入文獻,結果發現CNKI未涵蓋的文獻僅為1篇,因此認為相對于144條總納入文獻量,其對結論的影響較小。
3.2 創新性評估
突發性檢測結果顯示,關鍵詞共現網絡沒有節點具有突發性,提示該領域關鍵詞沒有出現統計學意義的頻次波動,即中醫電子病歷領域目前還未出現研究活躍的學術分支。sigma值結合了中介中心性和突發性指標來定義,是衡量創新性的重要指標。中醫電子病歷關鍵詞共現網絡中sigma值均為1,提示該領域創新性不顯著。
總體分析,中醫電子病歷應用領域,學者和機構間的合作不夠緊密,關注點集中在專家經驗的挖掘,但尚未形成研究熱點、創新性不顯著,其原因與我國醫療信息化整體水平密切相關。目前,中國醫療信息化發展屬于第二階段初期,部分醫院處于領先優勢,電子病歷記錄正在累積,可直接應用于數據挖掘的樣本量尚未達到大數據規模,期刊論文探討的主題集中在系統架構和部署實施,因此,“信息系統”“信息化”“數字醫院”等描述宏觀建設的詞匯才成為該領域探討的高頻詞。與此同時,國際上醫療信息化發展迅速,電子病歷人口覆蓋率高,國際期刊論文探討的主題主要為電子病歷與基因組學數據聯合應用,前沿熱點研究領域有糖尿病發病風險預測、不良反應安全性信號的識別及流感爆發的預測等。值得注意的是,目前中醫電子病歷人口覆蓋率較低,對其再利用得出的結論存在選擇性偏倚,單一中心采集的表型數據可能出現分類錯誤問題,多中心數據聯合應用能減少偏倚,提高準確度。
參考文獻:
[1] 陳悅,陳超美,劉則淵,等.CiteSpace知識圖譜的方法論功能[J].科學學研究,2015,33(2):242-253.
[2] CHEN C. CiteSpace Ⅱ:Detecting and visualizing emerging trends and transient patterns in scientific literature[J]. Journal of the American Society for Information Science and Technology, 2006,57(3):359-377.
[3] 宋艷輝,楊思洛.國際視野下的圖書館學、情報學與檔案學研究進展——基于CiteSpace的信息可視化分析[J].圖書館論壇,2014,6(3):1-13.
[4] FANG Y. Visualizing the structure and the evolving of digital medicine:a scientometrics review[J]. Scientometrics,2015, 105(1):5-21.
[5] 趙蓉英,王敏.國際視野下中醫研究的可視化分析[J].醫學信息學雜志,2011,32(2):36-41.
[6] CHEN C M, CHEN Y, HOROWITZ M. Towards an explanatory and computational theory of scientific discovery[J]. Journal of Informetrics,2009,3(3):191-209.
[7] 張潤順,王映輝,姚乃禮,等.名老中醫電子病歷中病史動態結構化數據錄入規范[J].中國中醫藥信息雜志,2007,14(3):100-101.
[8] 劉保延,尹愛寧,張潤順,等.中醫規范術語在結構化電子病歷中應用體系的研究[J].中國數字醫學,2012,7(8):41-44.
[9] 中醫數字醫療網.我國超半數中醫醫院已建立電子病歷[J].醫學信息學雜志,2014,35(11):94.
[10] 梁志偉,蔡立民,阮永隊,等.運用可擴展標記語言彈性結構電子病歷的中醫科研數據分析統計方法探索研究[J].世界科學技術-中醫藥現代化,2010,12(1):28-32.
[11] 周雪忠,劉保延,王映輝,等.復方藥物配伍的復雜網絡方法研究[J].中國中醫藥信息雜志,2008,15(11):98-100.
[12] 葉建紅.試論中醫病歷電子化的作用和意義[J].時珍國醫國藥, 2001,12(11):1007.
[13] 沈崇德.基于電子病歷的數字化臨床路徑管理[J].中國衛生信息管理,2012,9(3):18-20.
[14] 孫明月,高蕊.魏子孝治療甲狀腺疾病醫案挖掘分析[J].中國中醫藥信息雜志,2012,19(2):25-27.
[15] 丁衛平,顧春華,石振國,等.基于形式概念分析的不完備電子病歷系統粗糙集挖掘研究[J].計算機科學,2009,36(10):230-233.
[16] FORAKER R E, KITE B, KELLEY M. EHR-based visualization tool:Adoption rates, satisfaction, and patient outcomes[J]. EGEMS (Wash DC),2015,3(2):1159.
(收稿日期:2016-03-02)
(修回日期:2016-04-24;編輯:向宇雁)