, ,,
醫學信息學(Medical Informatics)是以信息學、信息管理和信息技術為依托,研究醫學領域中的信息現象和信息規律,用于醫學決策和管理的一門交叉學科[1],于20世紀70年代作為一門正式學科被提出。隨著各國醫療行業信息化技術的不斷提高,計算機技術、網絡技術、軟件技術的不斷革新,云計算、大數據、物聯網、移動應用、智慧醫療的興起,醫學信息學在過去的40多年,尤其是在近10年,研究熱點不斷涌現,新的有價值的研究成果層出不窮。醫學信息學作為一門學科日趨繁榮,學科的地位和價值也不斷提高。
2016年6月24日,國務院辦公廳印發了《國務院辦公廳關于促進和規范健康醫療大數據應用發展的指導意見》,明確指出要強化醫學信息學學科建設和著力培育高層次、復合型的研發人才及科研團隊[2]。隨著新醫改的深入開展,醫學信息學愈加顯示出其在實現建立高效統一、系統整合、互聯互通以及信息數據共享中的支撐作用。全面了解世界各國醫學信息學的發展概況,對于促進我國醫學信息學的進一步發展具有重要的意義。
在Web of Science核心集中,被收錄的文獻都被賦予了至少一個學科類別,每一條記錄都有一個“Web of Science類別”字段,因此使用該字段進行檢索可以較為完整地檢索到某一學科被SCI收錄的文獻。本文以Web of Science核心集數據來源,檢索方式為“Medical Informatics”學科分類檢索,檢索時間跨度為2005-2016年,得到36 873篇文獻。數據下載日期是2016年4月3日。借助CiteSpace軟件分析得到的文獻全紀錄(包括關鍵詞、作者、國別、參考文獻等),繪制出醫學信息學領域的國際發展現狀的科學知識圖譜,并結合這些圖譜對國際醫學信息學的發展現狀和研究熱點進行了分析。
2.1.1 文獻統計量分析
統計2005年-2016年每年的累計發文量(表1),并分析文獻增長規律(圖1)。

表1 全球醫學信息學年累計發表文件量

圖1 2005-2015年醫學信息學領域SCI文獻增長趨勢
從文獻增長趨勢分析可知,在2005-2015年之間醫學信息學領域的文獻符合線性增長模型,F(t)=3448.4t+400(以2005年為初始時刻:t0=0,Multiple R=0.994742,R Square=0.989512)。線性增長模型表明醫學信息學處于一個平穩增長的時期,學科不斷發展壯大,成果不斷涌現(2016年的文獻數據尚不完整,故文獻增長模型不包含2016年)。
2.1.2 機構和國家研究實力分析
將下載的數據導入CiteSpace軟件中,選擇合適的參數,分別把節點類型設定為國家(Country)和機構(Institution),運行CiteSpace軟件后得到國家之間和機構之間合作網絡圖譜(圖2、圖3)。表2和表3分別展示了排名靠前的國家和機構研究實力的具體數據。

圖2 國家合作網絡

圖3 機構合作網絡
圖2顯示,國家合作網絡中78個節點代表不同的國家,每個節點以同心圓環表示,圓環的大小與所代表的國家的研究成果數量正相關,每一個同心圓環厚度代與不同年代的發文量正相關;節點之間的連線代表國與國之間的合作關系,連線越粗則表示合作的強度越大。圖2中的節點間的連線有496條,呈現出世界范圍內的合作態勢 。

表2 各國醫學信息學發表文獻量
從圖2和表2中可知,在國家合作網絡中,美國和英國以其0.24和0.21的中心度,形成了兩個合作中心。美、英兩國中心地位明顯,尤其是美國科研實力雄厚,成為了世界各國爭相合作的對象。另外,從表2還可看出,澳大利亞、德國以及法國的中心度大致相等(平均在0.12),形成了以美、英為首的大合作網絡下的3個小合作網絡。從圖2還可看出,國家合作網絡中,中國雖然在論文絕對數量上居于第二位,但在網絡中的中心度卻僅有0.01,在國際上還缺乏影響力,所以該領域內的研究實力還有待提高。
圖3顯示,機構合作網絡圖中共有117節點,代表了來自全世界的117家研究機構,節點之間的連線有148條。在發文量前10位的機構中(表3),美國哈佛大學居于首位,并與另外的7所大學(包括哥倫比亞大學、華盛頓大學、范德堡大學等)形成了醫學信息學領域的科研集群優勢,奠定了美國在此領域內的優勢地位。加拿大的多倫多大學和荷蘭的阿姆斯特丹大學分別位居第4位和第6位,具有不俗的科研能力。網絡中僅有美國的華盛頓大學、哈佛大學、哥倫比亞大學及杜克大學的中心度大于0.1,而且圖3中117個機構之間的合作關系僅有148個,說明在世界范圍內機構間的合作非常有限,存在著一定的學術壁壘問題。

表3 醫學信息學領域機構分布
2.1.3 學科分布分析
借助CiteSpace軟件,選擇合適的參數,以學科(Category)為節點類型,運行后可得醫學信息學學科分布圖譜(圖4)。從圖4可看出,該學科分布的科學知識圖譜中有節點31個,分別代表31個學科類型,節點之間的連線72條。

圖4 醫學信息學領域學科分布的科學知識圖譜
結合醫學信息學領域學科分布(表4),除醫學信息學(Medical Informatics)外,發文量處于前3位的學科分別是計算機科學(Computer Science )、保健科學(Health Care Sciences & Services)、工程學(Engineering)。
根據社會網絡分析理論,中心度在一定程度上代表了各個節點之間的聯系,并顯示了該節點在整個網絡中的地位,同時它衡量了網絡中的某一個節點對經過該節點并彼此互相連接的其他兩個節點的控制能力[3]。CiteSpace軟件中同樣用中心性(Centrality)指標衡量所得的科學知識圖譜中的節點在網絡中的重要性。因此中心度的大小在一定程度上代表了各學科之間聯系的緊密程度。結合圖4和表4,與醫學信息學密切相關的學科中,計算機科學(Computer Science )、放射學(Radiology)、數學與計算生物學(Mathematical & Computational Biology )、醫學(Medicine)、保健科學(Health Care Sciences & Services)、通訊(Telecommunications)、工程學(Engineering)、數學(Mathematics)、統計與概率(Statistics & Probability學科的中心度分別為0.31、0.30、0.27、0.16、0.14、0.12、0.11、0.11、0.11。這些學科構成了醫學信息學領域學科之間相互交流合作的紐帶和橋梁,同時也體現出醫學信息學多學科交叉的學科特征。

表4 醫學信息學領域學科分布
2.1.4 關鍵節點文獻分析
將文獻數據導入到CiteSpace軟件中,選擇合適的參數,把節點分析類型設置為文獻共被引(Cited
Reference),得到文獻共被引網絡圖譜(圖5)。
文獻共被引網絡中共有176個節點,節點之間有509條連線,節點的大小與文獻被引用的頻次正相關。選取被引頻次≥10的文獻為高被引文獻,節點的中心度顯示出節點在網絡中的重要性程度。在圖5中,節點標簽按照中心度來進行標注,其中中心度>0.01的節點有6個,它們代表的關鍵節點文獻均為高被引文獻。在這些關鍵節點文獻中,Basit C等人在2006年的研究中系統回顧了健康信息技術對醫療保健質量、效率以及醫療費用的影響,證實健康信息技術在提高醫療保健的質量和效率方面的有效性[4]。在2007年,Kuperman G J等研究發現臨床決策支持(CDS)可提高患者的安全性和降低藥物相關的費用[5]。美國學者Blumenthal D和Tavenner M探討了電子病歷的合理有效利用[6],Dolin RH等和Black A D等分別在HL7標準的發展和臨床運用方面和eHealth技術的開發和使用方面取得了有價值的研究成果[7-8]。在2010年發表的名為“Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications”的文章中,Savova G K等人建立和評估了一個可以從電子病歷中提取可用信息的開源自然語言處理系統[9]。這些文獻構成了醫學信息學領域的基礎文獻或奠基性文獻,受到了研究者的普遍認可和關注。

圖5 文獻共被引網絡
爆發詞(Bursts Word)具有在短時間內迅速增長或者使用頻次突然增高的特點,因此,我們通過借助爆發詞可以對科學研究趨勢和熱點進行預測和挖掘[10]。CiteSpace軟件提供的Bursts檢測功能可以直觀展示某個研究領域的研究熱點,同時也可以在時間維度上展示出研究熱點的變化。圖6是醫學信息學領域的借助關鍵詞顯示出的領域內研究熱點的變化情況。
對圖6進一步解讀發現,在2005年,“系統”、“電子健康檔案”、“模型”、“臨床試驗”、“保健”、“肺癌”等成為爆發詞,說明疾病模型的建立、信息系統和電子健康檔案成為研究者關注對象;到了2006年,爆發詞進一步發展為“臨床實踐”和“信息技術”,表明醫學信息學領域內的研究逐步關注臨床實踐和對信息技術的研究;2007年,爆發詞變為“系統”和“分級”,說明此時對信息系統的分級評估成為了一個新的研究熱點;2008-2009年,“管理”和“衛生技術評估”成為爆發詞,說明2007年的研究熱點有了進一步的發展;在2010年-2014年的5年間,爆發詞分別為“初級保健”、“質量”、“患者安全”及“健康”,說明在這段時間內患者以及人群的初級保健成為了研究的熱點。值得關注的是,繼2005年研究者對電子健康檔案開始關注以來,“電子健康檔案”在2015年成為了爆發詞,說明隨著醫療行業信息化的不斷提高以及信息技術的不斷提高,電子健康檔案的重要性再一次被研究者認識和關注并成為新的研究熱點。進入2016年,“模型”、“疾病”、“設計”及“實施”成為了爆發詞,結合2015年的電子健康檔案,說明疾病模型的設計與實施以及對電子健康檔案的研究將成為今年研究熱點及未來幾年的發展趨勢。

圖6 醫學信息學領域關鍵詞時間分布
本文通過檢索近12年Web of Science數據庫中“Medical Informatics”學科類別的文獻數據,借助可視化的科學計量學的研究工具CiteSpace從多個角度對其進行了深入分析,得出以下結論。
一是通過對文獻隨時間的積累變化可知在這12年中醫學信息學領域的文獻增長呈現出線性增長特點,說明了醫學信息學是一門高速發展、成長中的、具有活力的學科。
二是醫學信息學的研究在地域上呈現出以美國和英國為大中心,澳大利亞、德國以及法國為小中心的世界合作態勢。我國在醫學信息學領域的研究內的研究成果數量眾多,但是在世界范圍內的影響力較弱。美國以其醫學信息學領域內高等學府聚集的優勢奠定了其優勢地位。在機構合作的研究中發現世界范圍內的研究機構之間的合作非常有限,存在著學術壁壘。
三是通過文獻共被引分析,展示出了醫學信息學產生、發展過程中的經典文獻。跟蹤受到學者們普遍認可和關注的經典文獻有助于了解學科的發展脈絡和領域內的最新動態。
四是從學科分析中可直觀顯現出醫學信息學以醫學(Medicine )、放射學(Radiology)、計算機科學(Computer Science )、數學與計算生物學(Mathematical & Computational Biology )、數學(Mathematics)、統計與概率(Statistics & Probability)等多學科交叉為特征的學科特性。
五是借助bursts檢測發現研究者的關注點:2005年的疾病模型的建立、對信息系統和電子健康檔案的研究,2006年對臨床實踐以及信息技術的關注;2007-2009年對信息系統分級管理和衛生技術評估的研究,隨后的5年患者的安全和初級保健逐漸受到關注。2015年電子健康檔案再一次被重視,并結合進入2016年以來疾病模型的設計與實施成為新的研究熱點,說明疾病模型的設計與實施以及對電子健康檔案的研究將成為今年研究熱點及未來幾年的發展趨勢。