張 雪 陳秀娟 張志強*
(1.中國科學院成都文獻情報中心,四川 成都 610041;2.中國科學院大學經濟與管理學院圖書情報與檔案管理系,北京 100190)
醫學信息學是一門交叉學科,是伴隨著計算機技術在生物醫學領域的應用而產生和發展起來的。20世紀70年代初期,在國際信息處理協會(International Federation for Information Processing,IFIP)上第一次出現“醫學信息學”一詞,20世紀70年代末,第三次國際醫學信息學大會(Medical and Health Informatics,MedInfo)上首次規范了醫學信息學學科名稱[1],1978年成立了國際醫學信息學學會(International Medical Informatics Association,IMIA),是國際醫學信息學領域公認的領導[2]。多年來國內外不同學者從不同角度對醫學信息學的定義進行了概括,如美國學者Allan于1977年提出:醫學信息學的研究范圍包括“處理與醫療衛生服務過程中的信息及其獲取、分析和傳播有關的問題”[3];德國學者Reichertz等在1983年提出醫學信息學的應用領域是以“信息的獲取、檢索、評價、儲存以及流程控制和人機對話”為特色的[4];Wyatt等在2002年提出:“醫學信息學是通過對信息規律的研究來改善對患者數據、醫學知識、人口數據以及其他與患者護理相關信息和社區衛生的管理”[5]。總的來說,醫學信息學就是將信息學的理論、方法、技術應用在醫學領域,促進醫學信息的有序化,醫療工作的高效化。近年來精準醫學、智慧醫療以及健康管理等領域迅速發展,為醫學信息學帶來了很大挑戰,與大數據的無縫融合、智能分析挖掘、安全與隱私保護等問題成為醫學信息學研究的新的前沿方向[6]。
作為一門交叉學科,醫學信息學發展迅速,為深入開展醫學信息學的研究,與國際科研熱點接軌,需要了解和掌握國際上開展本學科研究先進國家的科研方向和內容,對學科發展軌跡和趨勢進行梳理[7]。目前,我國也有多位學者對國內外醫學信息學的發展進行了研究,常見的是以某個數據庫一定年限內的文獻為數據源。如呂艷華等[8]以中國知網和萬方數據庫為數據源,分析1984-2011年中國醫學信息學主要研究領域和熱點分布,得出我國醫學信息學學科發展迅速,但理論研究薄弱,研究熱點不明顯,研究體系不完善,合著范圍狹窄等問題;袁曉園等[9]以WOS為數據源,檢索1970-2012年我國醫學信息學領域國際發文,總結出我國醫學信息學研究集中于核醫學圖像數據庫存儲研究,計算機自然語言處理和文本挖掘在中國傳統醫學診斷中的運用等六大研究主題;王燕鵬[10]以WOS核心合集為數據源,檢索2005-2014年中國及美國醫學信息學學術文獻,對比發現計算機技術在兩國醫院管理和臨床診療中的應用均十分廣泛,但美國在醫學信息學教育體系等方面的建設水平更高。還有部分學者以特定高影響力期刊為數據源,如崔雷等[7]對1900-2006年國際上重要的4種醫學信息學期刊的高被引論文進行同被引聚類分析,得出國外醫學信息學科學研究的重點為醫學信息學/計算機在臨床實踐中應用效果的評價分析、計算機系統內知識表達和運算、自然語言處理、電子病案、分類與編碼表、概念表達的基礎與應用研究;許丹等[11]對數據庫收錄的年份起至2010年SCI收錄的醫學信息學7種核心期刊論文進行可視化引文分析,總結出醫學信息學領域的研究熱點內容可以分為醫學術語標準化的內容、計算機化醫囑錄入系統在醫學實踐中的應用、醫療決策支持系統、醫學信息學計算機化應用;秦方等[12]對2010版JCR中Medical Informatics目錄下22種期刊2007-2011年論文為研究對象,認為信息技術應用與衛生信息分析方法是醫學信息學的兩大研究維度,今后的發展趨勢可能是以服務衛生保健為目標,開發新的功能。
縱觀以上文獻,它們雖反映了醫學信息學學科發展軌跡和規律,但存在研究時間相對較早、側重于引文、側重于國別對比分析、研究范圍集中于熱點分析等不足。本文以2016版《期刊引證報告》(Journal Citation Reports,JCR)收錄的10種醫學信息學高影響力外文期刊近十年的論文為研究對象,結合文獻計量學方法,對醫學信息學發文量、國家、機構分布、作者合著以及研究熱點及趨勢進行分析總結。與之前研究相比,本文以高影響力期刊近十年文獻為數據源,既保證了文獻的新穎性,又保證了文獻的質量,同時研究范圍較廣,在熱點分析的基礎上,分析了文獻量、國家、機構、核心作者等指標,以期追蹤該學科發展的核心國家、機構、核心作者以及前沿、熱點問題,為科研人員查找閱讀前沿文獻提供方向,課題選擇提供相關文獻信息,促進我國醫學信息學科研工作的發展和進步。
JCR由美國科學信息研究所(Institute for Scientific Information,ISI)編輯出版,它是在多年積累的SCI數據庫的基礎上,專門對期刊的引證與被引證關系進行系統歸類、整理、分析,并通過計算機自動處理編輯而成,是國際上公認的權威期刊評價工具[13]。在JCR 2016年版中限定學科為Medical Informatics,共檢索到24種醫學信息學相關期刊,其影響因子的平均值為2.29,通過閱讀期刊簡介和相關文獻,剔除相關度較低的期刊(如偏向于統計學、數學、藥物等學科的期刊)及影響因子低于平均值的期刊共14種,保留10種核心期刊(見表1)作為本研究的文獻數據集來源。在Web of Science核心合集中,以以上10種期刊刊名為檢索詞,10個檢索字段之間的關系為“OR”,時間限定為2008-2017年,文獻類型為Article、Proceedings Papers、Review 3種,共檢索得到11 823篇文獻,下文將以這些期刊文獻為研究樣本,利用文獻計量的方法進行分析以展示國際醫學信息學的發展趨勢與研究熱點。

表1 醫學信息學10種高影響力期刊
1.2.1 文獻計量分析法
文獻計量學是將數學、統計學等確定性計量方法運用于圖書及其他交流介質,對這些文獻的計量特征進行統計分析,進而揭示和研究文獻情報分布規律,文獻情報科學管理以及學科發展趨勢的一門學科。本文采用BICOMB,TDA(Thomson Data Analyzer)對文獻量、國家、機構、作者、關鍵詞進行數據清洗、詞頻統計分析,并生成高頻作者、機構、關鍵詞共現矩陣,采用洛特卡定律、普萊斯定律確定高產作者。
1.2.2 社會網絡分析法
社會網絡是社會行動者及其關系的集合,社會網絡分析方法(Social Network Analysis,SNA)是對社會網絡的關系結構及其屬性加以分析的一套規范和方法[14]。本文在高頻機構、核心作者共詞矩陣的基礎上,運用UCINET進行點度中心度、接近中心度、中介中心性及凝聚子群統計分析,并用NetDraw繪制高頻機構及核心作者可視化圖譜,以期發現高頻機構、核心作者網絡整體結構特性及合作情況。
1.2.3 共詞分析法
共詞分析是由Callon等提出的概念[15]。共詞分析是以文獻中共現的詞語作為研究對象,研究詞間關聯度,建立起對知識網絡結構的描述,從而揭示學科領域的結構和研究前沿[16],如果兩篇文章有兩個以上的相同關鍵詞,則認為這兩篇文章在研究主題的概念、理論或方法上是相關的,內容是相似的,共詞文章數量越多,表明這類關鍵詞“距離”就越近,用于分析學科結構和探究學科范式的多元統計方法因子分析、多維尺度分析、聚類分析可以按這種“距離”將一個學科內的重要關鍵詞加以分類,從而分析出該學科領域的研究現狀與內容[17]。因子分析主要因子的個數為下一步多維尺度分析、聚類分析具體劃分為幾類提供了參考,多維尺度分析、聚類分析均保留了全部變量的信息,但是聚類分析對數據及數據分布要求更為苛刻,二者可以互為補充,分析變量之間的相關性。本文采用SPSS對關鍵詞進行因子分析,多維尺度分析,系統聚類分析,得出醫學信息學研究熱點。
文獻是信息的主要載體,文獻量的時間演化規律與學科發展速度、科研活動有著密切關系。圖1顯示了近十年醫學信息學文獻量變化趨勢,增長趨勢近似直線(Y=146.75X-294143,R2=0.954)。由圖可看出,除2017年文獻量較前年稍有下降,文獻量整體逐年增多且2017年的文獻量為1 742篇,是2007年的3倍,說明醫學信息學受到人們的持續關注。2009年美國政府提出希望到2014年有一半以上的醫療機構使用電子健康檔案,并提供了大筆補助金,同年12月,美國衛生及公共服務部官員Kathleen Sebelius和醫療信息化建設國家協調員David Blumenthal提出名為Beacon Community的信息化項目來改造美國社區衛生信息系統;新加坡在2009年開始著手建立私營診所的電子病歷系統;加拿大計劃在2009年為50%的人口建立電子健康檔案;而對于我國來說,2009年更是醫療衛生事業不尋常的一年,國務院頒布深化醫療衛生體制改革的若干意見,各地積極探索建立區域醫療衛生信息平臺,故從2009年以后,國際上對醫學信息學的研究進入新的高峰,相關的文獻大量增多。2015年1月20日,美國總統奧巴馬在國情咨文中提出“精準醫學計劃”,希望精準醫學可以引領一個醫學新時代,2015年4月21日在“2015年首屆清華精準醫學論壇”上,中國也提出了大力推進精準醫療方式,從2015年開始文獻量出現了大幅增加,研究工作進入另一個新的高潮。

圖1 2008-2017年醫學信息學文獻的分布情況
通過對11 823篇醫學信息學文獻的發文國家進行統計發現醫學信息學受到了全球126個國家(地區)的關注,說明該研究是一個備受全世界關注的話題。其中發文量最多的是美國(n=4798,40.58%),其次是英國(n=1086,9.19%),中國(n=779,6.59%),澳大利亞(n=720,6.09%),加拿大(n=719,6.08%),荷蘭(n=631,5.34%),西班牙(n=578,4.89%),中國臺灣地區(n=500,4.23%),德國(n=479,4.05%),意大利(n=335,2.83%)等,如圖2所示為發文前十的國家(地區)及各國(地區)發文年度分布情況。

圖2 2008-2017醫學信息學TOP10發文國家(地區)及各國(地區)發文年度分布
通過分析醫學信息學文獻TOP10國家(地區)分布情況可知,美國在該方面的研究處于絕對領導地位,對于醫學信息學的研究產出遠遠高于其他國家,對比閱讀美國醫學信息學研究人員的發文,可在一定程度上快速了解該領域的研究現狀與熱點。此外,英國、加拿大等國家先后投入巨資開展了國家和地方級以電子健康檔案和電子病歷數據共享為核心的衛生信息化建設[18],這些國家在醫學信息學方面的研究成果也頗多。從圖2中可看出,我國是醫學信息學的第三大科研產出國,僅次于美國和英國。醫學信息學相關文獻2011年、2014年較上年均有較大的增長。2010年底,中國提出了“十二五”期間衛生信息化建設總體框架,簡稱“3521工程”(即建設國家級、省級和地市級3級衛生信息平臺,加強公共衛生、醫療服務、新農合、基本藥物制度、綜合管理5項業務應用,建設健康檔案和電子病歷2個基礎數據庫和1個專用網絡建設);2014年衛生信息技術交流大會上又提出了“46312工程”,較之前增加了縣級人口健康區域信息平臺,計劃生育業務,全員人口個案數據庫,在這些政策的推動下,我國醫療衛生事業數字化、信息化受到越來越多的關注和研究。但需指出,所統計分析的11 823篇文獻中中國作者文獻總量雖排第三,但發文總量不及美國的1/6,說明我國在醫學信息學領域研究仍有較大發展空間,仍需參考和借鑒美英等先進國家在該領域的先進理念與技術,為我國醫療衛生信息化建設提供新的方向和思路。
研究機構的發文量從一定程度上反映了該科研機構的科研競爭力,從事于某領域的研究者在日常研究中可能更傾向于關注在該領域產生重要學術影響的主要學術研究機構的情況,主題領域的發文機構分布研究也是文獻空間維度分布的重要且十分有意義的研究內容之一[19]。對2008-2017年間11 823篇文獻的發文機構進行統計,發文量前300的機構有247所(82.33%)屬于高校,說明大學是發展醫學信息學的重要研究力量,該領域的研究者可多加關注大學在該方面的科研成果。發文量排名前十的機構依次是哈佛大學(n=389,3.30%),哥倫比亞大學(n=251,2.12%),范德比爾特大學(n=219,1.85%),華盛頓大學(n=214,1.81%),布列根和婦女醫院(n=213,1.80%),斯坦福大學(n=193,1.63%),密歇根大學(n=186,1.57%),多倫多大學(n=173,1.46%),猶他大學(n=165,1.40%),梅奧醫療集團(n=155,1.31%),除多倫多大學外,其余機構均位于美國,這也與前文分析結果美國在醫學信息學研究中處于絕對領導地位一致。在Top10機構中有兩個機構屬于附屬醫院,其中布列根和婦女醫院是第二大教學附屬機構,在臨床決策支持系統研究中更加考慮患者安全,醫療事故相關因素;梅奧醫療集團是世界著名的私立非營利性醫療機構,在內窺鏡檢查相關軟件系統開發中有較多的投入。以上均說明醫院工作人員也越來越重視醫學信息學在醫學實踐中的應用與發展。
科研機構合作網絡是指為了研究某一學術領域的發展變化,高校以及科研院之間所構造的一個通過文獻相互聯系的網絡[20]。經計算,醫學信息學機構合作網的平均距離為1.978,即任意兩個機構間平均通過2個機構就可以建立聯系,說明該領域機構合作存在“小世界效應”。本文使用中心性對機構合作網絡進行進一步分析。中心性描述的是個人或組織在其所處的社會網絡中的地位及其重要性,分為點度中心度,接近中心度及中介中心度[21]。表2分別列舉了點度中心度,接近中心度及中介中心度排名前十的機構,同時運用可視化工具NetDraw生成發文量大于25共196個機構共現矩陣的網絡圖(設定共現頻次閾值為9,刪除不符合條件的節點),如圖3所示,節點代表不同機構,連線代表合作關系,節點越大,說明機構之間合作程度越大,點的顏色代表不同大小的合作次數,線的粗細反映了機構之間共現頻次大小。結合表2及圖3可看出,哈佛大學、國立臺灣大學、印第安納大學分別形成了不同大小的合作團體,有助于團體內部成員快速交流,加快醫學信息學科研成果的產出,其中哈佛大學在網絡中處于絕對核心地位,與26個機構保持緊密聯系,而且三度均排第一,說明哈佛大學在醫學信息學的學術交流與傳播過程中占據信息流通的關鍵位置,掌握較多的研究資源。同時我們可看出哈佛大學、布列根和婦女醫院、美國聯盟醫療體系共現次數非常多,在網絡中形成明顯的三角結構,這是因為美國聯盟醫療體系是由哈佛大學醫學院兩家最大的附屬醫院麻省總醫院和布列根和婦女醫院聯合成立,主要為病人提供高品質醫療服務。

表2 醫學信息學機構中心性統計分析

圖3 基于醫學信息學主題文獻的機構發文頻次的知識圖譜
核心作者群體的狀況集中地體現了學科科研實踐的狀態趨向,是某一學科領域的科研活動的縮影之一,對于核心作者的研究可以把握學科科研活動的廣度和深度,對于科研活動的管理、組織、協調和引導都有積極的意義[22]。經統計,本論文涉及的11 823篇醫學信息學論文共出現38 939位不同作者。根據洛特卡定律可知,某一學科領域內寫1篇論文的作者數大約占作者總數的比為c,理論上得出的常數c為60%,而本研究中寫1篇論文的作者為30 349人,占所有作者的77.94%,高于理論值,說明該研究領域作者隊伍有待向更穩定的方向發展。
普賴斯指出[23],某一領域全部科學家總人數開平方,所得到的人數撰寫了全部科學論文的50%,根據普賴斯定律,本論文涉及醫學信息學領域38 939位作者,故前197位作者應該為高產作者,發表的論文大約為11篇左右,本文選定發文在11篇以上的作者共200位進行分析。表3分別列舉了點度中心度、接近中心度及中介中心度排名前十的作者,圖4是200位作者的共現網絡圖譜(設定共現頻次閾值為3,刪除不符合條件的節點)。由表3可知,Hripcsak、Bates、Chute的3個中心度均較高,說明他們的人脈圈,學術圈比較廣,與他們合作的人較多,但是在網絡圖譜中并未發現Hripcsak,經過實證研究發現,Hripcsak是哥倫比亞大學醫學中心生物醫學信息學主席,他的合作圈大且廣,沒有形成固定的合作人群,他的所有文章最高被引頻次為136,提出了對利用電子病歷信息中隱含的有價值信息的展望和挑戰。

表3 醫學信息學高頻核心作者中心性統計分析

圖4 基于醫學信息學主題文獻的高頻核心作者發文頻次的知識圖譜
子群是網絡中的一部分,它是由那些互動頻繁,有相似觀念和愿景的人組成的小群體。從圖4可看出,網絡中的子群數量較多但比較疏松,大部分作者只和1~2個作者有穩定合作關系,能夠將不同合著團體聯系起來的作者較少,但是網絡中還是形成了3個較為明顯的小團體。其中最大的團體是Bates、Wright等10人形成的團體,他們合著的文章“臨床決策支持研究的重大挑戰”被引頻次高達199次,從臨床醫生,患者和消費者出發,提出了臨床決策支持中面臨的十大挑戰,為臨床決策支持系統的有效開發提供參考借鑒。其次是Pathak、Denny等9人形成的團隊,他們主要研究電子健康記錄驅動的表型算法編寫與執行,目的是加強電子健康記錄的標準化,通用化。最后是Iqbal、Nguyen等6人形成的團體,兩兩之間合作密切,他們均來自臺灣醫科大學,研究內容聚焦于移動醫療技術在艾滋病,心律失常等疾病中的用途以此推廣移動醫療技術的發展。
文獻的關鍵詞或主題詞是文章核心內容的濃縮和提煉,因此,如果某一關鍵詞或主題詞在其所在領域的文獻中反復出現,則可反映該關鍵詞或主題詞所表征的研究主題是該領域的研究熱點[24]。選定頻次≥46的關鍵詞79個,利用BICOMB生成79×79的共現矩陣,用Ochiia系數將共詞矩陣轉換為相關矩陣,見表4,相關矩陣中數值的大小表明兩個關鍵詞之間距離的遠近,數值越大表明關鍵詞之間的距離越近,相關程度越大;數值越小則表明關鍵詞之間的距離越遠,相關程度越小[25]。因相關矩陣中0值過多,容易產生誤差,故用1減去相關矩陣中的數據得到相異矩陣,見表5。

表4 醫學信息學文獻高頻關鍵詞相關矩陣(部分)

表5 醫學信息學文獻高頻關鍵詞相異矩陣(部分)
首先將相關矩陣導入SPSS進行因子分析,見表6。根據“特征值>1的因子保留,特征值<1的因子舍棄”的原則,且“提取的因子累計百分比應達到60%以上”[26],有15個主成分被提取。從載荷因子分布情況來看,因子分析結果中的關鍵詞分布比較離散,若嚴格按照載荷因子大于1的條件分類,則類別多達15個,不利于分析討論,因此結合其他高頻關鍵詞的特點,選取因子載荷大于1.3的主成分進行分類[27],可將79個關鍵詞歸為11類。多維尺度分析將變量間的相似或不相似程度在低維空間中用點與點之間的距離表示出來[28],距離越近,相似度越高,本文將相關矩陣導入SPSS,利用多維尺度分析將關鍵詞親疏關系在平面內展現出來,得到如圖5所示結果,即可根據關鍵詞之間距離將醫學信息學的研究熱點劃分為4大領域。聚類分析是一種建立分類的多元統計分析方法,它能夠將一批變量根據其諸多特征,按照性質上的親疏程度在沒有先驗知識的情況下自動分類,產生多個分類結果[29],本文以關鍵詞之間相關程度作為聚類依據,將關鍵詞相異矩陣導入SPSS,利用系統聚類,離差平方和法將關聯密切的關鍵詞聚集在一起形成不同的類,得到的樹狀圖如圖6所示。綜合因子分析,多維尺度分析,聚類分析的結果,將醫學信息學領域研究熱點分為4大類,11小類,具體內容如下:
第一類:衛生信息系統的開發與管理(關鍵詞9、70、68、74、14、25、79、22、71、1、7、69、23、10、5、41、60、24、56、34),該類別下又分為4個小類。
①電子健康檔案(Electronic Health Record,EHR),電子病歷(Electronic Medical Record,EMR)在臨床中的廣泛應用。電子病歷、電子健康檔案彌補了紙質記錄的缺陷,有利于信息的交換與管理,但是目前由于缺乏統一的規范標準,缺乏法律法規等使得電子病歷、電子健康檔案的覆蓋率不高,資源交互共享達不到要求。針對于此,Hayrinen等對電子健康檔案內容研究進行了系統的綜述,提出電子健康檔案發展所面臨的挑戰[30];Kazley等分析了醫院采用電子病歷系統的影響因素,以此提供服務和激勵措施,促使醫院對EMR的使用[31]等。
②臨床決策支持系統的意義與價值。20世紀70年代初,美國學者Scott Morton第一次明確提出了決策支持系統的概念[18],臨床決策支持平臺可以整合患者的電子病例、電子健康檔案、組學檢測數據等與患者健康相關的數據,綜合為醫生提供臨床決策支持服務,是精準醫學知識庫的延伸與臨床應用,是生物醫學信息學成果系統化應用的平臺與手段[32]。醫生認為借助臨床決策支持系統是一種高成效的方式,而大醫院要想通過醫療信息與管理系統學會電子病歷應用模型的評級標準,臨床決策支持系統更是不可逾越的一環,故很多研究者對臨床決策支持系統的意義進行實證研究。如Scott等對24名初級醫生進行隨機研究,讓每位醫生執行30個模擬處方任務,研究結果發現臨床決策支持系統的高效應用可以大大降低處方錯誤率[33];Graham等檢驗了臨床決策支持系統在獲得性肺炎和中性粒細胞減少引起發熱兩大疾病中的應用,表明臨床決策支持系統可以降低藥物劑量、抗生素選擇、患者處置等方面出現醫療錯誤的可能性[34]等。
③衛生信息系統的運用與評估。衛生信息系統可以改善就醫環境,滿足人民生活質量日益提高的需求,隨著其大規模使用,研究者更加注重衛生信息系統的效果評價,通過定量,定性方法對系統功能進行評價,可以作為系統建設和改進的標尺。研究內容如Blaser等的研究表明將IT技術整合到臨床工作中是提高臨床醫師表現的核心前提,但是此過程中用戶接受度和可用性起著至關重要的作用,因此必須將用戶對決策支持系統的評估考慮在內[35];Duarte等對醫院門診實施電子健康檔案前后患者和醫生滿意度進行評估,研究表明患者沒有注意到使用EHR進行咨詢質量差別很大,在進行3輪評估之后,住院醫師才更多使用EHR,故應該提高醫師對使用EHR的依從性[36]等。
④信息檢索技術對于提高醫院信息系統效率的深遠意義。信息超載,信息垃圾是大數據時代的負面產物,而如何從大量信息中找到有用信息是臨床工作者所要面對的問題,一些研究者就信息檢索技術的提高對臨床決策效率的影響進行了相關探討。如Wrighe等提出了臨床決策支持系統發展過程中面臨的主要挑戰即數據檢索效率相關問題[37];Del等對信息檢索工具Infobuttons在電子病歷中的應用進行實驗研究,發現基于Infobutton的使用可以更好滿足醫生的信息需求[38]等。
第二類:衛生信息分析方法的對象與實際應用(關鍵詞13、66、15、61、17、59、31、32、64、44、53、57),該類別下又分為2個小類。
①樣本對象的特殊性與多樣性。隨著互聯網的發展,人們更加注重網絡在初級衛生保健中扮演的角色,以期證明社交網絡的參與是否可以提高公共健康水平。研究內容如Bianca等運用Meta分析,系統分析對2000-2015年間網絡干預對心理健康素養的影響進行評估,表明互聯網是改善心理健康的可行方法[39];基于手機在戒煙,健康飲食,體育鍛煉及癌癥篩查的作用,Coughlin等運用Meta分析對PubMed和CIAHL數據庫中的相關研究文獻進行分析,表明手機可能是預防癌癥的有用且低成本的措施之一[40]等。
②定量綜合分析方法在循證醫學中的應用。在衛生領域,類似于“一種新的治療方法是否優于傳統療法”的問題層出不窮,評估性分析就是要解決這類問題[12],其主要方法有系統綜述、Meta分析、傳統綜述。研究內容如Or等使用薈萃分析和系統性評價綜合方法評估使用消費者健康信息技術是否改善糖尿病患者自我管理[41];Verthoeven等通過系統性文獻綜述闡述遠程會診和視頻會議對糖尿病護理的貢獻[42]等。
第三類:人工智能、數據挖掘技術在臨床診療中的應用與挑戰(關鍵詞37、51、8、39、77、12、16、40、65、75、50、26、58、21、63、19、54、42、78、33、62),該類別下又分為3個小類。
①文本信息、醫療報告中隱性疾病影響因素的挖掘。醫療大數據是未來醫療領域的必然趨勢,在疾病預防、診斷、治療中均扮演了不可或缺的作用,各國在該領域均投資大量資金,有望帶來整個醫療模式的轉變。研究內容如Nikfarjam通過自然語言處理,深度學習技術從社交媒體高度非正式的文本中提取藥物不良反應,用于公共健康檢測[43];Khan等對61名受試者腰椎磁共振圖像中不同年齡階段腰椎變化信息的數據挖掘和分析得出脊柱特征變化相關性的有用信息[44]等。
②數據挖掘算法的不斷優化。醫療數據作為一種重要的信息來源,其價值越來越被人們注意到,面對診療數據復雜化的大趨勢,新的算法層出不窮,以期適應不同類型數據要求,提高醫療效率。研究內容如Naghibi將新的訓練算法HFNN和FGPNN應用于乳腺癌數據庫,提高其診斷的可解釋性[45];Wang等提出了將人工神經網絡新方法運用于微陣列圖像的分割,不僅優于現有技術,還可縮短運行時間[46]等。
③大數據安全與隱私管理。人工智能技術的發展為精準醫療、智慧醫療帶來了機遇和發展,但個人信息也遭受著惡意刪除,修改或泄露的風險,隨著信息泄露案件的增多,人們更加關注隱私保護,研究者也采用各種方法提高信息安全,如Kong等為了利用北大教學醫院的海量醫學數據進行研究,提出使用對稱分組密碼,非對稱密碼和加密哈希算法來保護病人的隱私信息[47];Liu等指出利用先進的數據挖掘技術可以幫助臨床醫生做出正確決策,但是也產生信息安全及隱私問題,因此設計了一種新的密碼工具,能夠以隱私保護的方式高效準確地計算患者的疾病風險[48]等。
第四類:醫學信息學新技術的應用與發展(關鍵詞29、46、52、76、2、27、48、20、35、36、67、55、73、30、47、28、43、3、11、6、38、49、72、4、18、45),該類別下又分為2個小類。
①移動醫療、遠程醫療的應用。移動醫療、遠程醫療打破了傳統時間、空間的限制給人們生活帶來諸多便利,由于其發展火熱,部分研究者對這些醫學信息學新技術進行了系統研究,如Fiordelli對手機在醫療保健方面的影響進行了系統的文獻回顧,確定了移動技術在醫療服務中可能產生影響的主要領域[49];Martinez-Perez等研究發現目前8種最普遍的健康狀況移動設備所聚焦的疾病有缺鐵性貧血、聽力偏頭痛、低視力、哮喘[50]等。
②醫學信息學新技術發展的影響因素。雖然移動醫療、遠程醫療技術發展迅猛,但是新技術普及度及人們接受度參差不齊,一些學者對當下現狀也進行了相應研究。研究內容如Willcox等采用定性研究方法對孕婦及衛生專業人員進行深入訪談,了解人們對移動醫療在產前保健干預中作用的相關看法,研究表明婦女對移動醫療有積極看法,衛生專業人員認為移動醫療存在風險和障礙[51];Cox等運用定性研究方法系統評估了遠程保健干預對癌癥患者的影響,研究表明遠程干預可以減輕患者治療負擔,但是患者參與度仍然是未來需要解決的問題等[52]。

表6 近十年醫學信息學文獻相關矩陣的因子分析

表6(續)
本論文在BICOMB、TDA、UCINET及SPSS定量分析工具的基礎上,結合定性思考對10種醫學信息學領域核心期刊近十年的文獻進行各項網絡指標統計及可視化分析,得出以下結論:
①2008-2017年醫學信息學相關文獻持續增長,其中2008-2009年文獻量波動不大,2009-2012年進入快速增長時期,2012-2015年緩慢增長,2016年較之前有新的突破,2017年又有些回落,整體來看研究人員對醫學信息學的研究和關注度呈上升趨勢。
②從醫學信息學相關文獻的國家(地區)分布來看,美國在該方面的研究處于領導地位,刊載的文獻在所有國家中占40.58%,我國相關文獻總量雖排第三,但與美國相比,仍有較大差距,科研工作者可參考借鑒美國相關熱點文章,促進我國醫學信息學發展與進步。
③從醫學信息學核心機構來看,大學是發展醫學信息學的重要研究力量,哈佛大學在該領域的研究中處于主導地位,是聯系其他機構的紐帶和橋梁,同時哈佛大學、臺北醫科大學、印第安納大學等均形成自己的研究團體,有利于高質量科研成果的穩定產出。
④從醫學信息學核心作者來看,Hripcsak、Bates、Chute等學者3個中心度均靠前,在醫學信息學的研究中表現活躍,推動了學科的發展,也在一定程度上引領了未來醫學信息學研究的方向,以Bates、Pathak、Iqbal為核心的小團體形成有利于問題的及時溝通和解決,提高科研效率。
⑤從醫學信息學研究熱點來看,國際上對于計算機技術在醫院管理和臨床診療中的應用以及對醫學信息和數據進行深度挖掘,促進臨床決策方面關注度較高,這是伴隨著大數據,人工智能的發展,醫院不斷提高信息化水平,重視質量服務的必然選擇。此外,遠程醫療、移動醫療這些前沿技術的應用和發展也將更加成熟,智慧醫療、精準醫療在未來的發展中將引領新一輪的浪潮。
學科信息學作為學科二元發展的一個分支學科,將成為并且已經成為學科發展的重要且不可分割的分支組成部分[53]。作為其重要組成部分之一的醫學信息學勢必會影響健康和衛生保健類產品和服務的發展,同時,醫學信息學還將影響醫療衛生機構和衛生信息通信技術產業的發展[54]。基于以上對國際醫學信息學發展的分析與思考,對我國醫學信息學未來發展也提供了一定的啟發。首先,我們要加強培養具有醫學和信息學雙重背景的復合型專業人才,2002年底,經教育部批準,中南大學將“信息管理和信息系統(醫學方向)”專業更名為“醫學信息學”,中國醫學信息學專業正式起步,醫學信息學教育在我國逐漸發展起來[8]。目前開設醫學信息學專業的院校有52所,均是依托于醫科院校,除老4所(中南大學、華中科技大學、中國醫科大學、吉林大學)課程設置相對較合理外,其他院校均處于實踐摸索階段,因此對衛生信息學人才的培養是當務之急;其次,鼓勵定量信息分析方法的應用與學習。著名情報學家布魯克斯曾提出:“情報學如果不實現定量化,它將是一堆支離破碎的技藝,而不會成為科學”,通過對國際上醫學信息學熱點分析,我們發現,Meta分析、系統分析等方法應用廣泛,故我國在醫學教育及科研工作者實際工作中應大力提倡信息分析方法在疾病影響因素,信息系統功能評價等方面的學習及應用;再者,我國科研工作者應著重閱讀該領域高產國家、核心作者、核心機構的發文,迅速把握最新研究熱點,積極參與國際合作,促進醫學信息學的發展;第四,進一步提高計算機科學與醫學信息學相結合,通過前文分析發現國際上非常注重臨床決策支持系統、人工智能等方面的研究,我國人口龐大,海量的醫療健康數據既是機遇又是挑戰,如何用好這些數據為患者提供精準服務更是關鍵,因此醫學必須與計算技術結合,科研工作者要有意識培養自己計算能力,在開發更個性化的信息系統方面,挖掘海量數據方面發揮優勢與特長;最后,基于醫學信息學新技術移動醫療、遠程醫療等的火熱發展,我國應該抓住機遇,借鑒其他國家在該方面的優勢,結合我國實際情況,提供個性化、智能化的衛生信息服務,并不斷完善電子健康檔案、電子病歷等信息共享問題。

圖6 近十年醫學信息學文獻高頻關鍵詞聚類分析樹狀圖