籍文雪
(南方醫科大學深圳醫院,廣東 深圳 518100)
人工智能作為一門學科起源于1956年的達特茅斯夏季會議[1],經過60余年的發展,業界對人工智能的認知也在不斷變化,但是目前尚缺乏一個精確的、被普遍接受的定義。在此我們采用NilsJ.Nilsson提出的定義:“人工智能就是一種致力于使機器能夠智能化運作的活動,而智能是一種可以使一個實體能在其所處環境中合理并有遠見地發揮其功能的能力”[2]。
人工智能的發展日新月異,其在醫療領域的應用也越來越廣泛,從輔助手術和護理的自動化設備、使用復雜算法從醫療大數據中提取關鍵信息輔助臨床實踐、患者監測和指導到通過從患者大數據中提取有用信息實現健康風險警報和健康結果預測[2-5]。本文以CNKI數據庫1998-2018年人工智能在醫療領域應用相關文獻數據為研究內容,通過可視化分析軟件CiteSpace繪制知識圖譜了解目前研究主題,同時結合突變詞檢測和時區圖繪制,探究人工智能在醫療領域應用的整體進展情況。
本研究使用的數據來源于CNKI數據庫。選擇期刊、碩士及博士數據庫為主要檢索源,在高級檢索框中以主題字段檢索人工智能并含“醫學”或“醫療”,時間范圍為1998年1月1日-2018年4月30日,數據獲取時間為2018年5月26日。經過重復和無效文獻篩選處理共得到484篇文獻。
本研究主要采用陳超美博士開發基于JAVA應用程序的可視化分析軟件CiteSpace為分析工具,一款基于科學文獻,可識別某一學科領域發展新趨勢和新動態的軟件[6]。
發文數量反映了一定時間段科學研究的絕對產出,是衡量科研活動的一個重要指標。由圖1可知,人工智能在醫療領域的應用發文數量雖時有起伏但總體呈上升趨勢,說明該領域一直受到學者的關注,直到2015-2017年這一階段發文量增長迅速,可以看出此領域已成為研究重點,此階段發文量的增長可能與國家政策相關,2015年7月,“人工智能”被寫入《國務院關于積極推進“互聯網+”行動的指導意見》,將其列為了互聯網+戰略的一部分,2016年出臺的《“互聯網+”人工智能三年行動實施方案》、《“十三五”國家科技創新規劃》和《“十三五”國家戰略性新興產業發展規劃》,2017年國務院印發《新一代人工智能展規劃的通知》,一系列文件的出臺表明我國對人工智能的重視不斷提高,同時提出了對醫療領域人工智能的要求。

圖1 1998-2018年人工智能在醫療領域研究論文的數量
關鍵詞是對文獻主題的高度概括和集中描述,出現頻次較高的關鍵詞可以用于確定學科領域的研究熱點。筆者基于1998年到2018年間發表的論文選取每年出現頻次最高的前50個關鍵詞,生成此時間段人工智能在醫療領域研究熱點圖譜(見圖2)。

圖2 關鍵詞共現圖譜
圖中每一個節點代表一個關鍵詞,節點圓圈大小表示關鍵詞出現的頻次,外周為紫色圈的節點代表著高中心性,表明此主題為研究領域的關鍵節點(轉折點);節點之間的連線表示兩個關鍵詞有共現關系,而連線的粗細代表共現關系的強度[7-8]。筆者按照頻次高低截取了前十個高頻詞,具體如表1所示。

表1 人工智能在醫療領域研究熱點
由圖2和表1可知,知識圖譜共生成100條節點數量,215條連線,網絡密度為0.05,整體網絡相對松散,密度不夠高,表明集中的研究主題相對較少。結合高頻關鍵詞及節點圓圈我們可以初步判斷人工智能在醫療領域的“機器人”、“專家系統”、人工智能在“醫學影像”及“中醫藥”的應用、人工智能算法“語義網絡”及“神經網絡”為研究熱點。同時結合年輪外周顏色,剔除標識性不強的“醫療”及“醫學”關鍵詞,可以看出人工智能在“機器人”、“醫療健康”及“中醫藥”方面的應用為關鍵節點,表明這三個領域為比較重要的新主題。
對關鍵詞進行自然聚類后得到關鍵詞聚類,同時選擇含10個成員以上的聚類,同時對聚類主題添加標簽,得到關鍵詞聚類圖譜。聚類分析可以更好地展示該學科的主要研究領域,聚類的區塊顏色表示該聚類第一次發生的年份,藍色的區塊要比綠色的區塊早,黃色的區塊要比綠色的區塊晚等[8]。如圖3所示。
由圖3可知,共形成了6個區塊,即6個聚類主題。圖中并未出現藍色區塊,表明早期的研究并未形成聚類。相對較早的綠色區塊為“專家系統”,說明人工智能在醫療領域專家系統方面的應用較早形成了聚類;出現較晚的聚類為橙色區塊的分級診療,表明人工智能在分級診療方面的應用近期出現了部分研究,并形成了主題聚類。結合表2,主要研究領域如下:

圖3 關鍵詞聚類
(1)機器人領域:研究內容側重于機器人在脊柱微創手術及影像診斷中的應用、三叉神經痛的治療,同時探討機器人在輔助手術中所起到的護士助手角色作用。
(2)專家系統領域:研究內容側重于醫學專家系統設計的實現,方法的應用等方面。
(3)應用領域:研究內容側重于人工智能在醫療診斷、中醫、病理學等方面的應用,同時探討人工智能結合醫療大數據、精準醫學方面的應用。
(4)AI領域(方法):AI即人工智能,此聚類表明人工智能的機器學習方法,特別是深度學習也已經在醫療領域開始探討其應用。
(5)分級診療領域:研究內容側重于討論人工智能技術在醫聯體分級診療中可能的應用及起到的作用。
(6)語義網絡領域:研究內容側重于醫學語言系統的建立及在中醫藥領域的應用。
使用突現主題術語比使用出現頻次最高的主題詞更適合探測學科發展的新興趨勢和突然變化[9]。CiteSpace提供的膨脹詞探測技術和算法,將其中頻次變化率高的詞,即突現詞,可以揭示學科領域的研究前沿。基于突現詞探測結合時區圖譜分析人工智能在醫療領域的研究前沿。

表2 聚類主題中的主要術語
由圖4和圖5可知,“專家系統”從2001年開始到2013年一直是研究前沿的熱點詞匯,我國醫學專家系統的開發研究始于20世紀80年代初,起步雖較發達國家玩,但發展速度迅猛[10]。“機器人”這一熱點詞匯在2010年到2016年間變化頻率較高,結合檢索得到的數據也可以得出在此時間段關于機器人在醫療領域的應用研究成果增長飛速,是此時間段學者關注的熱點。“中醫”和“中醫藥”我們將其視為一個研究前沿,說明近年來人工智能在中醫藥領域的應用探討也悄然升起。另一方面,隨著人工智能技術的不斷創新,語義網絡、神經網絡及機器學習等也成為人工智能在醫療領域的研究熱點。
通過人工智能在醫療領域應用文獻發文數量分析及基于CiteSpace可視化知識圖譜的繪制,可以得到以下結論:

圖4 5個變化頻率最高的突現詞

圖5 關鍵詞時區圖譜
(1)從發文趨勢來看,結合目前國內人工智能+醫療大熱的形勢,可以預測人工智能在醫療領域相關應用的研究成果在未來幾年還會有大幅增長。
(2)從研究熱點來看,主要有三個,一是人工智能機器人在醫療領域的應用,主要應用在手術、康復、護理、救援與轉運等方面[11],其中機器人在手術及康復中的應用在國內得到了學者們的廣泛關注。二是人工智能在醫療健康方面的應用,通過利用人工智能技術挖掘醫療大數據來輔助診斷和治療,實現風險預測和醫療保健,這在很大程度上拓展了人工智能在醫療領域的應用潛力,但是數據的收集和安全性保障是很大一個挑戰。三是人工智能在中醫藥領域的應用,近年來國家對于中醫藥行業的政策紅利及“互聯網+”時代的機遇[12],人工智能在中醫藥領域應用方面的研究成果也逐漸增多,同時2014年ISO首發的中醫藥信息標準的發布促使在2014年后關于中醫藥學語言系統及語義網絡、技術規范方面的應用成為研究熱點。
(3)從研究前沿來看,主要有四個,一是人工智能在醫療專家系統方面的應用,經過20多年的發展,專家系統的應用層出不窮,從影像專家系統、骨腫瘤輔助診斷系統、口腔頜面部創傷診治專家系統到康復訓練專家系統及肝癌智能專家系統等等[13-17]。二是人工智能機器人在醫療領域的應用。三是人工智能在中醫藥領域的應用。四是人工智能在醫療領域實現的程序和算法,如語義網絡、神經網絡、機器學習等,正是這些算法和技術的不斷成熟推動著人工智能在醫療領域的應用。