鄒陸曦,孫 玲
(1.徐州醫科大學管理學院,江蘇徐州 221000;2.徐州市中心醫院,徐州醫科大學徐州臨床學院,江蘇徐州 221006)
人工智能已經助力醫學發展多年,近年來包括計算能力的指數級增長、大數據處理技術、使用電子健康記錄訪問大型臨床數據集以及機器學習等技術的突破,提高了人工智能改革醫學各個領域診斷和治療的精確度和能力[1]。
人工智能能夠提高醫療服務提供者的工作效率,使用人工智能的計算機系統有助于評估醫學影像和醫療大數據,更新的機器學習技術促進了自動診斷系統的發展[2]。人工智能由于能夠解釋更詳細和更全面的數據,有可能進一步提高患者的健康水平,因此,在醫學各個領域受到歡迎[3]。在不斷發展的現代醫學數字世界中,醫生需要人工智能的支持,訓練有素的醫生不應該擔心自己會被人工智能取代。隨著越來越多的學者加入,有關醫療人工智能研究的文獻也越來越多。那么,有關醫療人工智能研究的現狀和研究分布如何?研究問題主要涉及哪些方面?哪些是當前研究的趨勢和熱點?探討這些問題對于進一步揭示醫療人工智能的研究主題、現狀和研究趨勢具有重要意義。
可視化分析技術便于挖掘數據中的隱藏規律,是利用相關軟件將知識、數據和信息轉換為可視化圖集的過程。本研究利用Web of Science(WOS)數據庫核心集收集的數據對醫學人工智能研究的機構、期刊、作者、參考文獻、當前研究熱點和趨勢進行分析和處理,利用可視化的網絡圖對WOS數據庫核心集數據進行可視化分析,期望為我國的醫學人工智能研究提供參考。
以“artificial intelligence”“medicine”為檢索詞,檢索2001年1月1日至2020年12月31日在WOS數據庫核心集公開發表的文獻資料,檢索日期為2021年4月3日,檢索方式為“主題”(精確)。
根據納入、排除標準篩選檢索出的文獻資料。
納入標準:發表時間為2001年1月1日至2020年12月31日;以英文語言發表的;已發表的原創性和綜述類期刊文章;研究內容與人工智能醫療相關。排除標準:與研究不相關文獻;非英文形式發表的資料;會議通知、征稿啟事、圖書、報紙及學位論文等其他形式的資料。通過分析整理,根據納入及排除標準選擇出符合條件的1 450篇文章,每篇文章包含以下信息:標題、作者、機構、關鍵詞和引用文獻。
VOSviewer是荷蘭萊頓大學科技研究中心的Van Eck和Waltman開發的一款基于JAVA的知識圖譜可視化軟件,它能有效地構建科學計量圖實現科技文獻計量的可視化,在易于解釋的共引用和共作者分析方法中具有強大的功能[4]。本研究采用VOSviewer 1.6對研究所合著、期刊共被引、作者共被引和參考文獻共被引進行分析,利用關鍵詞疊加可視化圖來分析研究的熱點和趨勢。
在發文機構方面,很多機構都發表了有關醫學人工智能研究的文獻。機構共現網絡(institution coauthorship)分析反映了研究領域中各機構之間的影響和溝通[5]。本文根據機構發表的文章數量對機構進行排名,醫學人工智能研究的機構共現網絡圖如圖1所示。斯坦福大學(Stanford University)排名第一(37篇),其次是哈佛大學醫學院(Harvard Medical School)(36篇)和多倫多大學(University of Toronto)(30篇),這3個機構在醫學人工智能相關出版物中的發文數量最多,是在醫學人工智能方面最具影響力的3個研究機構。

圖1 發文機構共現網絡圖
本研究使用VOSviewer繪制期刊共被引網絡。共被引意味著2個項目(如期刊、作者和參考資料)被引用在1個參考文獻中。共被引分析反映出2個共引用項目之間的頻率和關系[6]。期刊共被引分析可以研究學術期刊網絡的總體結構和特點[7]。
具有50個節點的期刊共被引網絡圖如圖2所示。閾值是期刊的最低引用次數,超過170次。圖中節點的大小代表收錄醫學人工智能期刊的活躍程度,即該期刊發表醫學人工智能文章的引用次數。通過節點之間的距離可反映節點之間的鏈路強度,較短的距離意味著節點之間擁有更強的關聯性和更高的引用頻率。

圖2 期刊共被引網絡圖
VOSviewer使用算法將網絡中的節點分配給聚類。該聚類技術是一種基于參數化和加權的模塊化的聚類變體[8]。聚類是一組密切相關的節點,具體計算方法參見文獻[4]。相同顏色的節點表示同一個聚類。
通過聚類分析,最大的3個集群分別是綠色、紅色和藍色。以大小排名靠前的每個聚類中節點(期刊)為例,綠色聚類包含Nature(1 368篇引用)和Science(691篇引用),代表自然科學類的綜合性期刊。紅色聚類包含New England Journal of Medicine(1 056篇引用)和Journal of the American Medical Association(JAMA,982篇引用),主要是醫學類期刊和以醫學為主的綜合類期刊。藍色聚類包含Radiology(833篇引用)和Medical Physics(420篇引用),代表核醫學等具體的學科應用方面的期刊。如果節點引用越高,節點就越大,即如果出版物被引用的次數越多,對醫學人工智能研究的影響就越大。
本文根據納入的1 450篇醫學人工智能研究文獻的作者所發表文章的引用次數來排名。作者共被引(co-citation cited author)網絡圖中顯示了前50名高被引的作者,如圖3所示。最大的節點是作者Lecun,Y(215篇引用),揭示了他在醫學人工智能研究中的重要貢獻。2個節點(作者)之間較短的距離表明節點代表的作者之間有更高、更強的共被引用關系。具有相同顏色的圓圈表明這些作者發表的文章之間有類似的主題。其他研究人員與這些主要研究人員有直接或間接的聯系。

圖3 作者共被引分析網絡圖
當2篇論文在1篇論文中同時被引用時,它們就建立了參考文獻共被引分析(reference co-citation analysis)[6]。本文根據引用文獻的數量進行排名,構建了一個包含100個節點的共被引關系圖(前100個共被引文獻),如圖4所示。節點的大小不僅揭示了其引文的數量,還揭示了它們與醫學人工智能研究的關系。例如,最大的節點,即Esteva等發表的題為Dermatologist-level classification of skin cancer with deep neural networks的文章,于2017年在Nature雜志上見刊[9]。該文章被本文納入的1 450篇醫學人工智能研究文獻引用179次,在WOS數據庫核心集中被引用3 135次。

圖4 參考文獻共被引分析圖
為了更好地展現2.1~2.4章節的分析結果,表1列出了發文機構、發文期刊、作者共被引、參考文獻共被引前10名及具體的數量。

表1 發文機構、發文期刊、作者共被引、參考文獻共被引前十名及數量
關鍵詞對研究熱點、新興趨勢和研究前沿進行了合理的描述,它可以表示一個科學文獻的主要研究內容,文字的頻率反映了研究的熱點。本文利用關鍵詞的疊加可視化圖來描述醫學人工智能研究的趨勢,如圖5所示,時間由遠及近從藍紫色變為黃色,節點文字越大,說明出現的次數越多。從圖5可以看出,醫學人工智能研究的主題(關鍵詞出現次數)從主要關注“神經網絡(neural networks)”(61次)、“診斷(diagnosis)”(131次)和各類“系統(system)”(75次),發展到關注“分類(classification)”(189次)、“預測(prediction)”(149次)和“生物標記物(biomarkers)”(27次)。最近的醫學人工智能研究熱點則集中在“機器學習(machine learning)”(345次)、“深度學習(deep learning)”(176次)、“大數據(big data)”(136次)等大數據和人工智能醫療領域。而“癌癥(cancer)”(117次)、“精準醫療(precision medicine)”(110次)、“放射學(radiology)”(30次)等是人工智能在醫學方面近幾年的主要研究方向。

圖5 關鍵詞疊加可視化圖
近年來,人工智能在計算機輔助診斷、疾病預后和醫療決策支持領域、重塑醫學成像和放療實踐方面取得了顯著成效[19]。精準醫學有利于治療不太常見的疾病或幫助有特殊醫療需求的患者。未來,人工智能和精準醫療的融合將徹底改變醫療健康領域[20]。人工智能使系統能夠推理和學習,并通過增強智力來幫助臨床醫生決策。這種融合有助于解決精準醫學面臨的問題,也有助于個性化診斷和預后。通過人工智能和醫學的融合,可為每個患者提供更好、更精確的醫療護理,同時減輕患者家庭和整個社會的經濟負擔。
本文運用VOSviewer軟件對2001至2020年間醫學人工智能研究的1 450篇文獻進行了梳理和挖掘,斯坦福大學、哈佛大學醫學院和多倫多大學是該領域的主要研究機構;與國外著名的研究機構相比,我國的研究機構在醫學人工智能方面的研究還需加強,國際影響力還有待提高。在發文期刊方面,Nature、JAMA和New England Journal of Medicine等雜志在醫學人工智能領域有著較高的影響力。在參考文獻共被引方面,Esteva,A等于2017年發表在Nature雜志上面的文章獲得了最多的被引用數量。在作者共被引方面,作者Lecun,Y獲得了最多的被引用數量,揭示了他在醫學人工智能研究中的重要貢獻。從研究中發現,我國學者在該領域發表文章和引用情況還未進入前列,還需要更多的研究投入。利用關鍵詞疊加可視化圖分析發現,大數據、深度學習和精準醫療等方面仍是目前醫學人工智能領域研究的熱點。
通過對以上分析圖中的關鍵節點的文獻研究,以及仔細研讀參考文獻共被引分析中排名靠前的文章,發現自2001年以來,人工智能及其在醫學上的應用已經取得重大進展。通過對醫學人工智能文獻的可視化分析,可在一定程度上揭示近年來醫學人工智能的研究基礎。通過研究熱點與趨勢分析,近年來的醫學人工智能研究在深度學習方面發展迅速。深度學習是基于特定計算模型人工智能的一個子集,如深度卷積神經網絡和遞歸神經網絡,在圖像和信號處理方面表現出卓越的性能。例如,在著名醫學雜志JAMA上的一篇研究提出了一種在視網膜眼底照片中檢測糖尿病視網膜病變的深度學習算法。深度學習在CT、MRI和核醫學方面預測肌肉骨骼疾病的臨床應用日益增多,在藥物發現和基因組學方面應用得更加深入。
人工智能正在越來越多地被應用于藥物發現中。不僅為相關的科學家,而且為生物制藥行業和開發新藥過程帶來新的挑戰。已有研究總結了一組國際專家對利用人工智能發現小分子藥物的“重大挑戰”的看法,包括獲得適當的數據集,生成新的假設,以多目標方式進行優化減少藥物研發、生產周期時間和改變研究文化[21]。神經網絡等人工智能技術正在出乎意料地發展,并不斷被應用于藥物制劑的開發與制造[22],醫學人工智能正幫助廣大用戶、醫生、醫藥公司、醫療監管機構和保險公司做出明智的決策。
人工智能和精準醫療的融合正改變著傳統醫療。大數據時代,精準醫療方法可以識別不太常見的患者的表型[23]。Topol(2019)提出高性能醫學:人類智能和人工智能融合的觀點[12]。人工智能利用復雜的計算和推理,使系統能夠推理和學習,并通過增強智力來幫助臨床醫生決策。最近的文獻表明,這些醫學人工智能方面的探索研究將有助于解決精準醫療面臨的困難和問題,結合來自患者癥狀、臨床史和生活方式的信息,有助于促進個性化診斷[20]。
醫學人工智能在具體的疾病預測方面也改變著傳統醫療。例如,人工智能在胃腸病學中進行內鏡分析病變、檢測癌癥,并促進在無線膠囊內窺鏡期間對炎癥性病變或胃腸道出血的分析速度。人工智能還被用來測試和評估肝纖維化,并區分胰腺癌患者和胰腺炎患者[24]。在醫學影像學領域,龔尚瑾等[25](2020)以乳腺癌和腦部疾病為例分析了深度學習在國內的應用情況。2020年全球暴發新型冠狀病毒肺炎,該疾病開始蔓延到世界各地,成為一個國際公共衛生問題。已有研究認為利用潛在技術(包括人工智能)可以控制疫病大流行,有助于控制病毒的傳播[26]。
本研究存在一定的局限性,僅選取WOS數據庫核心集的文獻作為研究的文獻數據來源,而沒有納入其他外文數據庫,數據來源不夠豐富,具有一定的局限性和主觀性。其次,分析軟件僅采用VOSviewer分析數據,多軟件協同分析可以使文章的內容更加豐富多樣。未來的研究可以進一步豐富數據來源,采用多軟件協同分析,可以結合國內外的文獻作進一步的分析與對比。
本研究分析了醫學人工智能研究的科學成果,探索了該領域2001—2020年的研究現狀和熱點?;赪OS數據庫核心集,利用可視化技術分析了醫學人工智能研究出版物的期刊、機構、作者、參考文獻和關鍵詞。通過可視化分析,揭示了醫學人工智能領域研究的“圖譜”,為研究者了解醫學人工智能的研究領域提供了指引。