董娜,崔婷,王露露,師榮慧,馮潔,黃曉俊*
1.730000 甘肅省蘭州市,蘭州大學第二臨床醫學院
2.730000 甘肅省蘭州市,蘭州大學第二醫院消化科
胃癌是全球第五大常見惡性腫瘤和癌癥相關死亡的第四大原因,全球每年新增胃癌患者約109 萬例,因胃癌死亡患者約77 萬例[1]。我國是胃癌高發國家,胃癌發病率和死亡率分別位居惡性腫瘤第2、3 位[2]。據報道,早期胃癌5 年生存率>90.0%[3],而進展期胃癌5 年生存率<10.0%[4]。由于胃癌早期缺乏特異性癥狀和體征,大多數胃癌被診斷時病程已進展到晚期,導致胃癌患者整體預后較差[5]。因此胃癌的早期診斷和合理治療對于改善患者預后至關重要。然而胃癌的診斷準確性與醫師的臨床經驗和專業知識儲備密切相關,存在被誤診和漏診的可能性。隨著人工智能(AI)在醫學領域的快速發展,機器學習技術特別是深度學習和神經網絡在胃癌診斷、治療和預后預測方面展示出良好應用前景[6]。有學者嘗試采用支持向量機算法識別可用于早期診斷胃癌的生物標志物[7];有學者利用深度學習技術對內鏡圖像、計算機斷層掃描圖像、病理圖像進行診斷分析,實現了對胃癌的診斷/分期和預后預測[8]。近年來將AI 應用于胃癌診治的研究日益增多,但尚未得到系統分析。本研究采用VOSviewer、CiteSpace 軟件對2003—2022 年AI 應用于胃癌診治的研究進行文獻計量學分析,旨在闡明該領域研究的概況和發展趨勢,為該領域研究者提供參考。
于2022-11-06,計算機檢索Web of Science(WOS)核心合集數據庫,獲取將AI 應用于胃癌診治的相關研究。采用的檢索式為(((((TS=(Stomach Neoplasm*))OR TS=(Gastric Neoplasm*))OR TS=(Cancer of Stomach))OR TS=(Stomach Cancer))OR TS=(Gastric Cancer))AND((((((((((((((((((((((((TS=(artificial intelligence))OR TS=("computational intelligence"))OR TS=("deep learning"))OR TS=("computer aided"))OR TS=("machine learning"))OR TS=("support vector machine"))OR TS=("data learning"))OR TS=("artificial neural network"))OR TS=("digital image"))OR TS=("convolutional neural network"))OR TS=("evolutionary algorithms"))OR TS=("feature learning"))OR TS=("reinforcement learning"))OR TS=("big data"))OR TS=("image segmentation"))OR TS=("image segmentation"))OR TS=("hybrid intelligent system"))OR TS=("recurrent neural network"))OR TS=("natural language processing"))OR TS=("bayesian network"))OR TS=("bayesian learning"))OR TS=("random forest"))OR TS=("evolutionary algorithms"))OR TS=("multiagent system")),將文獻語言限定為“English”,將文獻類型限定為“article”和“review”,檢索時間跨度為2003—2022 年。排除標準:(1)會議論文、述評;(2)文獻主題與本研究的研究內容無關;(3)重復發表的文獻。最終納入文獻703 篇,導出完整記錄和參考文獻,將其以“download_txt”格式保存。
采用VOSviewer 1.6.18 和CiteSpace 5.7.R5 軟件進行文獻計量學和可視化分析,數據分析前使用CiteSpace 5.7.R5軟件對從WOS 導出的數據進行去重,去重后仍為703 篇文獻。采用VOSviewer 1.6.18 軟件對國家(地區)間、機構間、作者間的合作情況、共被引作者情況、關鍵詞共現與疊加情況進行可視化分析,采用CiteSpace 5.7.R5 軟件進行機構中介中心性分析、期刊雙圖疊加分析、近6年共被引文獻聚類分析、共被引文獻聚類時間線圖分析及參考文獻突現分析。其中關鍵詞共現分析旨在通過主題共現發現研究熱點的結構分布;關鍵詞疊加分析旨在通過將時間因素疊加到關鍵詞共現網絡中,顯示出研究趨勢的演變;期刊雙圖疊加分析旨在通過對施引和被引文獻所屬期刊進行聚類和疊加分析,顯示學科論文的分布及引文軌跡等信息;共被引文獻聚類分析旨在通過分析文獻同時被其他文獻引用的頻次判斷在所研究領域中產生過重大影響的文獻并對其進行聚類,可以反映研究的發展和演進動態;共被引文獻聚類時間線圖分析旨在通過分析聚類之間的關系和某個聚類中文獻的引用情況,顯示某個研究主題研究基礎的時間跨度;參考文獻突現分析旨在通過分析參考文獻的時間分布,顯示出頻次變化率高、增長速度快的突現參考文獻,進而分析學科的研究前沿和發展趨勢。此外,采用Excel 2019 軟件繪制發文量條形圖及國家(地區)、機構、期刊、作者、共被引作者、引用參考文獻和關鍵詞的描述性分析表格。
703 篇文獻中,596 篇(84.8%)為論著、107 篇(15.2%)為綜述。2016 年以前年發文量少且增長緩慢,年發文量最多的一年為2013 年(12 篇);2017 年開始年發文量快速增長,2022 年達195 篇(截至2022-11-06),約為2016 年的20 倍(圖1)。近6 年發文量占總發文量的90.3%(635/703),多項式擬合結果顯示,R2=0.933 6,提示發表年份與年發文量之間存在相關性,未來該領域的文獻會持續增加。
該領域發表文獻共來自52 個國家(地區),發文量>100 篇的國家(地區)只有中國,發文量≥5 篇的國家(地區)有25 個。表1 總結了近20 年發文量排在前10 的國家(地區)的發文情況,中國發文量位列第1(366 篇),美國(93 篇)、韓國(86 篇)、日本(79篇)和德國(47 篇)發文量分別位列第2、3、4、5 位;總被引用次數排在前5 的國家(地區)依次是中國(4 371 次)、美國(2 704 次)、日本(2 232 次)、德國(1 189 次)和韓國(890 次);雖然來自中國的文獻總被引用次數最多,但來自荷蘭、美國、英國、日本、德國和意大利的文獻的平均被引用次數均高于來自中國的文獻。基于VOSviewer 軟件分析國家(地區)間的合作情況(圖2),節點之間的線條表示存在合作關系,線條越粗表示關系越緊密,即總鏈接強度(TLS)越強,TLS 排在前5 的國家為中國、日本、美國、德國和韓國。

表1 發文量排在前10 的國家(地區)的發文情況(截至2022-11-06)Table 1 Top 10 countries(regions)in term of publication volume

圖2 國家(地區)間的合作網絡圖譜Figure 2 Mapping of collaborative networks among countries(regions)
共1 162 家機構參與將AI 應用于胃癌診治的相關研究,其中發文量≥5 篇的機構有74 家。發文量排在前3 的機構依次為中國科學院、中山大學和上海交通大學,分別發表文獻32、25、25 篇(表2)。基于VOSviewer 軟件,針對發文量≥5 篇的機構繪制機構間的合作網絡圖譜(圖3),TLS 排在前3 的機構為多田智廣消化內科和直腸科研究所(416)、中國科學院(392)和東京大學(360)。中介中心性是節點中心性的度量指標,可反映節點在網絡中的重要性,在CiteSpace 生成的圖譜中,有紫色外圈的節點為具有高中介中心性的節點。CiteSpace 生成的圖譜顯示,中國科學院(0.19)、成均館大學(0.17)、武漢大學(0.16)、哈佛大學(0.12)、中山大學(0.11)和中國醫科大學(0.11)等中介中心性較高的機構在該領域的研究中發揮著重要作用(受限于篇幅,未呈現CiteSpace 生成的圖譜)。

表2 發文量排在前10 的機構的發文情況(截至2022-11-06)Table 2 Top 10 institutions in term of publication volume
703 篇文獻刊載于330 種期刊,其中26 種期刊發文量≥5 篇。發文量排在前10 的期刊共發文156 篇,占總發文量的22.2%;Frontiers in Oncology 發文量最多(32 篇);Gastric Cancer 被引用次數最多(519 次);Gastrointestinal Endoscopy 2022 年影響因子最高(10.396);5 種期刊2022 年Journal Citation Reports(JCR)分區為Q1,其余5 種期刊為Q2 區,見表3。共被引次數最多的期刊是Gastrointestinal Endoscopy(1 004次),其次為Gastric Cancer(702次)和Endoscopy(631 次),見表4。期刊雙圖疊加分析結果顯示,引用路徑主要有4 條;施引期刊的所屬領域集中在“Medicine,Medical,Clinical”(“藥物,醫學,臨床”)、“Molecular,Biology,Immunology”(“分子,生物學,免疫學”)領域;被引期刊的所屬領域集中在“Molecular,Biology,Genetics”(“分子,生物學,遺傳學”)、“Health,Nursing,Medicine”(“健康,護理,藥物”)領域(圖4)。

表3 發文量排在前10 的期刊的發文情況及2022 年評價指標情況(截至2022-11-06)Table 3 Publications and evaluation metrics in 2022 of top 10 journals in term of publication volume

圖4 基于施引期刊與被引期刊的雙圖疊加分析Figure 4 Double graph overlay analysis of citing and cited journals
該領域研究涉及4 088 名作者和16 338 名共被引作者。表5 顯示了發文量和共被引次數排前10 作者的發文情況,TADA TOMOHIRO 發文量最多(16 篇),其次為TIAN JIA(11 篇)和YU HONGGANG(10 篇);共被引次數最多的作者為BRAY FREDDIE(186 次),其次為HIRASAWA TOSHIAKI(122 次)和JIANG YUMING(111次)。作者間合作網絡見圖5,作者共被引圖譜見圖6。

表5 發文量和共被引次數排在前10 的作者的發文情況(截至2022-11-06)Table 5 Publication of top 10 authors in terms of pulication volume and total number of citations

圖5 作者間的合作網絡圖譜Figure 5 Mapping of collaborative networks among authors

圖6 作者共被引圖譜Figure 6 Mapping of co-citation of authors
共有參考文獻22 273 條,其中76 條參考文獻共被引次數≥20 次。共被引次數排在前10 的參考文獻的具體信息見表6。共被引次數排在首位的參考文獻為Global cancer statistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries(183 次),其次為Application of artificial intelligence using a convolutional neural network for detecting gastric cancer in endoscopic images(113 次) 和Application of convolutional neural network in the diagnosis of the invasion depth of gastric cancer based on conventional endoscopy(78 次)。鑒于納入的703 篇文獻中多數文獻發表在2017—2022 年,對近6 年共被引文獻進行聚類分析,可以更好地確定研究前沿。近6 年共被引文獻共被分為10 個集群,其中endoscopy(內鏡)、digital pathology(數字病理學)、radiomics(影像組學)、image classification(圖像分類)、system biology(系統生物學)與胃癌的診斷和分期有關(圖7)。共被引文獻聚類時間線圖顯示,endoscopy(內鏡)、digital pathology(數字病理學)、radiomics(影像組學)、image classification(圖像分類)是當前的研究熱點,system biology(系統生物學)是最早出現的研究熱點(圖8)。圖9 顯示了突現力排在前15 的參考文獻,該領域的引文數量極速增加始于2016 年,大量參考文獻仍然被頻繁引用,表明AI在胃癌診治領域的應用仍是未來幾年的研究熱點。

圖8 共被引文獻聚類時間線圖Figure 8 Co-cited literature clustering timeline

圖9 突現力排在前15 的參考文獻突現信息Figure 9 Top 15 reference with the strongest citation bursts
共有關鍵詞2 609 個,總出現頻次為4 977 次,95 個關鍵出現頻次≥10 次。表7 顯示了出現頻次排在前10 的關鍵詞的基本情況。出現頻次>100 次的關鍵詞有gastric cancer(胃癌)、deep learning(深度學習)、artificial intelligence(人工智能)、classification(分型)、cancer(癌癥)和diagnosis(診斷)。使用VOSviewer 生成關鍵詞共現網絡圖譜(圖10),每種顏色代表一個聚類,將所有關鍵詞聚為4 類,紅色聚類:AI 輔助胃癌的生物學研究,涉及的關鍵詞包括gene(基因)、expression(表達)、gene-expression(基因表達)、biomarkers(生物標志物)等。藍色聚類:AI 輔助胃癌的內鏡診斷,涉及的關鍵詞包括gastrointestinal endoscopy(胃腸道內鏡)、capsule endoscopy(膠囊內鏡)、upper-gastrointestinal endoscopy(上消化道內鏡)等。黃色聚類:AI 輔助胃癌的病理診斷,涉及的關鍵詞包括pathology(病理學)、digital pathology(數字病理學)、histology(組織學)等。綠色聚類:AI 輔助胃癌的非內鏡治療及預后預測,涉及的關鍵詞包括chemotherapy(化療)、immunotherapy(免疫治療)、surgery(外科手術)、outcome(預后)。圖11 為關鍵詞疊加網絡圖譜,顯示了關鍵詞隨時間變化的趨勢,黃色節點代表新興關鍵詞,提示這些關鍵詞可能為當前研究熱點。由圖可見,deep learning(深度學習)、convolutional neural network(卷積神經網絡)、radiomics(影像組學)、gastrointestinal endoscopy(胃腸道內鏡)、pathology(病理學)和immunotherapy(免疫治療)是近2 年頻繁出現的關鍵詞,可能成為未來的研究熱點。

表7 出現頻次排在前10 的關鍵詞的基本信息(截至2022-11-06)Table 7 Basic information about the top 10 keywords in term of frequency

圖10 關鍵詞共現圖譜Figure 10 Co-occurrence mapping of keywords

圖11 關鍵詞疊加圖譜Figure 11 Mapping of keywords overlay
本研究使用兩種常用的文獻計量學分析軟件VOSviewer 和CiteSpace 對過去20 年將AI 應用于胃癌診治的相關研究進行可視化分析,客觀闡述了將AI 應用于胃癌診治相關研究現狀、發展趨勢和未來的研究熱點,可為研究者更好地把握研究現狀和發展趨勢提供參考。
根據發文量統計結果,近6 年發文量占總發文量的90.3%,預計發文量將持續增加,可見AI 近年來在胃癌診治領域得到了長足發展。中國在該領域發文量遠超其他國家(地區),但來自中國的文獻平均被引用次數遠低于來自荷蘭、美國、英國、日本、德國的文獻,這可能與我國對將AI 應用于胃癌診治的研究起步較晚,導致研究成果的學術影響力較低有關,因此我國學者應注重提升研究的質量及影響力。美國在發文量及文獻平均被引用次數上均位列第2,可見美國學者在該研究領域占有重要地位。根據TLS,中國、美國和日本與其他國家(地區)的合作較多。發文量排在前10 的機構中,來自中國的機構有7 所,其中中國科學院不僅發文量最高、TLS 較強,還具有最高的中介中心性,提示其在該領域具有很高的影響力,同時與其他機構有較多合作。
發文量排在前5 的期刊為Frontiers in Oncology(2022年影響因子為5.738,JCR 分區為Q2)、Scientific Reports(2022年影響因子為4.996,JCR分區為Q2)、Cancers(2022年影響因子為6.575,JCR 分區為Q1)、Gastrointestinal Endoscopy(2022 年影響因子為10.396,JCR 分區為Q1)和World Journal of Gastroenterology(2022 年影響因子為5.374,JCR 分區為Q2),其中Gastrointestinal Endoscopy為影響因子最高且共被引次數最多的期刊,在該領域具有較高的學術影響力。施引期刊的所屬領域集中在2 個領域;被引期刊的所屬領域也集中在2 個領域,這意味著將AI 應用于胃癌診治的過程中需要跨學科合作。
共被引次數排在前10 的文獻反映了將AI 應用于胃癌診治相關研究的熱點方向,其中大多數文獻內容涉及胃癌或早期胃癌的內鏡診斷。Global cancer statistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries 一文的共被引次數最多,為基于全球185 個國家36 種癌癥發病率和死亡率的綜述[9]。共被引次數排在第2 位的為發表于Gastric Cancer 的文獻Application of artificial intelligence using a convolutional neural network for detecting gastric cancer in endoscopic images,該文主要介紹了由研究團隊開發的一種根據內窺鏡圖像自動檢測胃癌的卷積神經網絡系統,該系統具有高度敏感性,可以作為內鏡醫師診斷胃癌時的輔助工具[10]。共被引文獻聚類時間線圖可顯示研究前沿的變化趨勢,胃癌的生物學特征[7,11]是早期研究熱點,隨后研究熱點轉變為胃癌的數字病理學診斷[12-13]和影像組學分析[14-17]。
所有關鍵詞可聚類為4 類,分別為AI 輔助胃癌的生物學研究,AI 輔助胃癌的內鏡診斷,AI 輔助胃癌的病理診斷和AI 輔助胃癌的非內鏡治療及預后預測。根據發文量統計結果,從2 個時期出發對關鍵詞聚類分析結果進行分析。第1 個時期是2003—2016 年,在該時期年發文量緩慢增長,領域研究主要關注胃癌分類和診斷,包括胃癌的生物標志物檢測[18]、內鏡診斷[19]和淋巴結轉移狀況預測。但使用的分析技術有限,且采用的數據集數量級較小。前列腺癌等其他癌癥領域AI 研究聚焦在癌癥篩查和手術治療[20]。第2 個時期是2017—2022 年,該時期年發文量快速增長,計算機輔助診斷成為主要應用方向。深度學習因其穩定而卓越的性能成為出現頻次最高的AI 方法,現已被用于胃癌的內鏡診斷[21]、病理學診斷[22]、分期[23-24]、療效和預后預測[16,25],與關鍵詞疊加圖譜顯示的研究熱點基本一致。
與內鏡醫師相比,基于深度學習的計算機輔助診斷系統在診斷疾病時不受限于內鏡醫師的臨床經驗,有助于提高不同經驗水平內鏡醫師的診斷準確性,減少誤/漏診,有更高的診斷性能[26]。借助圖像增強內鏡很難識別發生于非腫瘤性上皮和上皮下的病變[27],而拉曼光譜與內鏡、AI 技術的結合應用有望彌補內鏡檢查技術中存在的不足。此外,支持對病理圖像進行分割的深度學習模型的運用不僅有助于消除病理醫師在病理標本檢查過程中主觀偏見造成的不利影響,還有助于解決注釋良好的病理圖像數據不足的難題[28]。由抗程序性死亡蛋白1(PD-1)/程序性死亡受體-配體1(PD-L1)和細胞毒性T 淋巴細胞相關蛋白4(CTLA-4)等免疫檢查點介導的共抑制信號通路在腫瘤誘導的免疫抑制中發揮重要作用[29]。微衛星不穩定和人類皰疹病毒(EBV)陽性是胃癌患者長期預后較好的生物標志物,兩種亞型(微衛星不穩定型、EBV 陽性型)胃癌對免疫抑制劑具有潛在易感性。而深度學習模型可以從經蘇木精-伊紅染色的胃癌組織切片中檢測微衛星不穩定和EBV 陽性狀態,可作為后續需要接受分子檢測人群的篩選工具,并預測患者對免疫治療的反應性[25]。基于計算機斷層掃描圖像的深度學習模型的運用有助于放射科醫師評估胃癌淋巴結轉移[30]、漿膜浸潤[31]和腹膜轉移[32]情況,指導胃癌患者術前治療,避免不必要的手術和并發癥的發生。內鏡檢查、影像識別和生物標志物篩查技術與AI 的結合為胃癌檢測、治療和監測工作的開展提供了更多可能性。
本研究結果表明,AI 已被廣泛應用于胃癌診治領域,未來該領域研究年發文量將持續增長。美國在本領域占據主導地位,中國學者應當加強與其他國家(地區)學者的交流、合作,致力于提升我國研究成果的學術影響力。深度學習、卷積神經網絡及影像組學等AI 技術輔助胃癌的內鏡診斷、病理診斷和免疫治療是當前研究熱點與前沿方向,而開發出可支持實時內鏡診斷、病理診斷,以及結合基因組學和蛋白質組學進行胃癌綜合診斷的AI 系統可能是未來研究的重點。因AI 具備高效的學習能力和計算能力,未來將會得到進一步的推廣應用。但AI 在未來的臨床實踐中不會完全取代醫師,將人工服務與AI 相結合可彌補部分國家(地區)和醫療機構醫療資源、專業內鏡與病理醫師缺乏的不足,助力AI在胃癌診治領域實現新突破。本文局限性:由于文獻的被引用次數受其發表時間的影響,因此于2022 年發表的高質量文獻的被引用次數可能還沒達到理想的水平,這可能導致研究前沿的探索結果出現時間上的延遲;此外,本文僅將WOS 核心合集數據庫中的英文文獻納入分析范疇,可能導致其他語種文獻被遺漏。
作者貢獻:董娜進行文章撰寫和修改;崔婷負責確定研究內容及數據檢索;王露露、師榮慧使用VOSviewer 和CiteSpace 軟件繪制圖譜;馮潔指導數據分析;黃曉俊負責文章質量控制,對文章整體負責。
本文無利益沖突。