陳 娟,張 婷,盧 巖,嚴 舒,徐東紫,歐陽昭連
(中國醫學科學院醫學信息研究所,北京 100020)
以人工智能為核心的信息技術革命正成為傳統行業轉型升級的重要驅動力。在醫療領域,人工智能技術有助于解決醫療資源短缺、分配不均、醫患關系緊張等問題[1-2]。近年來,將人工智能用于醫學影像學的研究迅速增多,并已針對部分疾病實現臨床應用。本研究將基于科技論文分析主要國家在推動將人工智能技術用于醫學影像學的基礎研究態勢。
于Web of Science數據庫中檢索人工智能應用于醫學影像學的相關文獻,檢索策略為文章題目、摘要或關鍵詞中包括人工智能和醫學影像學研究,人工智能相關檢索詞包括人工智能、機器學習、深度學習、神經網絡、算法、數據挖掘、知識發現、特征提取和自然語言處理等人工智能所涉關鍵技術及其變體,檢索時間為2020年1月9日,文獻類型限定為Article或Proceeding paper,未納入會議摘要,文獻語言限定為英語。
以2009年1月1日—2020年1月9日發表的論文為分析集進行分析,具體分析內容包括:①歷年論文數量變化情況;②統計論文數量、總被引頻次和篇均被引頻次;③基于國家字段的合作者分析展示國際合作情況;④基于高頻詞聚類分析展示全球研究熱點。

圖1 人工智能用于醫學影像學研究相關論文的年度分布 注:檢索日期為2020年1月9日,含合作發文;由于數據庫收錄存在延遲,2019年數據不全

表1 發表人工智能用于醫學影像學研究論文數量排名前10位國家
共檢出將人工智能用于醫學影像學的相關論文26 449篇,其中2009年1月1日—2020年1月9日文獻19 886篇,占75.19%;20世紀80年代共計發表4篇,90年代中后期開始文章發表數量逐漸增多,近十年增長明顯,復合增長率11.43%,見圖1。
3.1 發文數量 2009年1月1日—2020年1月9日,發表人工智能用于醫學影像學研究論文數量排名前5位的國家依次為美國(5 038篇)、中國(4 237篇)、印度(2 702篇)、德國(1 125篇)和英國(1 110篇),見表1。
3.2 發文影響力 總被引頻次排名前5位的國家依次是美國(78 231次)、中國(25 997次)、英國(16 145次)、德國(15 026次)和印度(11 088次);前5位篇均被引頻次以美國(15.53次)最高,英國(14.55次)和德國(13.36次)次之,中國(6.14次)和印度(4.10次)較低。
4.1 發文數量 41家機構發表人工智能用于醫學影像學研究論文總量超過100篇,其中美國18家、中國6家、德國4家,其他國家均少于3家。發文量排名靠前的機構包括加州大學、哈佛大學、中國科學院等高校和科研院為主,還包括美國通用電氣公司、德國西門子公司和荷蘭飛利浦公司三大醫療器械公司等,見表2。
4.2 發文影響力 總被引頻次排名前5位的機構依次是美國哈佛大學(9 944次)和加州大學(8 274次)、英國倫敦大學(5 799次)、美國斯坦福大學(5 325次)和法國中央國家科學研究中心(4 342次)??偙灰l次排名前10位機構中,美國占7家,英國、法國及德國機構各1家,無中國機構。美國18家機構總被引頻次均值 3 608次,篇均被引頻次19.28次/篇。中國6家機構總被引頻次均值1 133次,篇均被引頻次為6.72次/篇。
在將人工智能用于醫學影像學研究的國際合作方面,美國與其他國家合作最頻繁,共計合作2 791次,中國、英國、德國和印度分別與其他國家合作1 480次、1 145次915次和488次。其中,美國與中國合作最多(698次),與德國、加拿大、英國、印度、法國、意大利等國家合作次數均超過100次。中國與美國合作最多(698次),與其他國家合作均不足100次。與中國類似,印度與美國合作密切(103次),與其他國家合作較少。除與美國合作,德國及英國亦與歐洲其他國家合作密切(圖2)。
將人工智能應于醫學影像學的研究熱點主要包括兩方面,其一為腫瘤及腦部疾病診斷及預測模型構建,代表性關鍵詞包括阿爾茨海默病、前列腺癌、肺癌、預測、X線斷層攝影、MRI、CT、配準、重建、降維、噪音及追蹤等;另一方面則為基于上述模型的技術實現研究,代表性關鍵詞包括深度學習、特征提取、支持向量機、卷積神經網絡、分類器和過濾等(圖3)。

表2 發表人工智能用于醫學影像學研究論文數量超過100篇的機構
過去數十年,X線、CT、MRI、PET及超聲等醫學成像技術廣泛用于診斷疾病,但大多依賴影像科醫師人工解讀圖像。隨著圖像分割、圖像配準、圖像融合、病變標記等技術的不斷進步,深度學習算法逐漸成熟,大批量可供機器學習的醫學圖像逐漸積累,影像學診斷將在人工智能輔助下變得更為準確,未來人工智能輔助預測疾病風險、評估治療效果及預后亦逐漸用于臨床[3-4]。在醫學影像學領域應用人工智能技術將有助于解決醫療人力資源短缺和分布不均的問題,但機器失誤帶來的倫理問題、醫療行業人員對該技術的支持程度及數據資源的隱私性將可能是該領域所面臨的挑戰[5]。
美國于2016年陸續發布了《為未來人工智能做好準備》、《國家人工智能研發戰略計劃》及《人工智能、自動化及經濟》等文件,于國家層面對人工智能技術進行戰略布局[6-7]。美國有多所世界名校,在醫學基礎研究、IT基礎研究和應用研究方面均走在世界前列,其相對完善的健康醫療信息登記系統提供了豐富的數據資源,使其在將人工智能用于醫學影像學研究方面,無論是規模還是成果影響力均處于領先地位。美國食品藥品監督管理局已批準QuantX乳腺癌診斷系統、ContaCT腦卒中輔助檢測系統、IDx-DR視網膜照相篩查系統、OSteoDetect骨折檢測系統等十余個產品[8],以推動人工智能技術用于臨床。
我國在醫療人工智能布局與頂層設計方面也行動較快,2016年發布的《“十三五”國家科技創新規劃》和《“十三五”衛生與健康科技創新專項規劃》將人工智能列為前沿領域,2017年國務院頒發了《新一代人工智能發展規劃》。目前我國在研究規模方面與美國接近,但研究成果的影響力偏弱;開展相關研究的機構眾多,但成果分散,缺乏影響力突出機構。我國對人工智能在醫學影像學中的應用寄予厚望,并因擁有大量數據資源而呈現出蓬勃發展態勢,但在核心技術、技術框架、計算環境等方面還存在差距[9]。為推動人工智能技術應用于臨床,我國現已建成審評所需眼底影像和肺部影像數據庫,人工智能骨齡測評系統、肺結節輔助診斷系統等均處于研究中[10-12]。

圖2 將人工智能用于醫學影像學研究的全球國際合作情況 注:圓球體積代表論文數量,弧線直徑代表合作次數

圖3 全球人工智能用于醫學影像學研究熱點 注:系針對詞頻≥80且相關系數排前60%的106個關鍵詞行聚類分析的結果;tomography:斷層掃描;reconstruction:重建;disease:疾??;registration:配準;alzheimer:阿爾茨海默病;reduction:降維;resolution:分辨率;radiotherapy:放療;tracking:追蹤;noise:噪音;angiography:血管造影;prediction:預測;deep learning:深度學習;feature extraction:特征提??;features:特征;medical image:醫學圖像;pattern:模式;filter:過濾器;diabetic retinopathy:糖尿病性視網膜病變
歐洲各國在推動人工智能應用于醫學影像學方面落后于美國和中國,表現最強的德國和英國均與美國及中國差距較大。歐洲在該領域研究布局行動較晚,對于人工智能技術用于醫療領域可能帶來的倫理挑戰和數據安全問題更為關注[13]。隨著人工智能技術的應用潛力逐漸受到認可,近年歐洲各國也開始在宏觀層面進行產業布局,如在“地平線2020”計劃中設立人工智能項目、計劃建設歐洲人工智能平臺等[14]。
此外,德國西門子、荷蘭飛利浦和美國通用電氣公司三大醫療設備巨頭在將人工智能用于醫學影像學基礎研究規模方面躋身全球前列,主要得益于其在醫學影像學領域的先天優勢,同時也反映出在推動新興技術為傳統行業賦能方面,傳統行業巨頭發揮著不可替代的作用。
近十年人工智能用于醫學影像學基礎研究活躍,超過70%的成果出現于此階段。美國在此領域引領全球發展,且領先優勢明顯,其他國家相比之下研究規模尚小。我國基礎研究規模大但成果影響力相對較弱,改進核心技術、提高研究成果影響力應作為今后我國相關領域重點努力方向。