王鐘銳,胡躍梅,葉曉影,莊金滿,黃玉秀,何斐
(福建醫科大學 1.公共衛生學院預防醫學系,福州 350122;2.公共衛生學院流行病與衛生統計學系,福州 350122;3.附屬第一醫院婦產科,福州 350001)
子宮內膜癌(endometrial carcinoma,EC)是女性生殖系統常見的腫瘤之一,全球年齡標準化發生率和死亡率分別為8.4%和1.8%[1]。盡管EC的診療技術迅速發展,但仍有5%~15%的EC患者存在復發風險[2],病死率較高,生存率較差,在發展中國家EC患者的病死率約為34%,5年生存率為67%[3]。現有研究[4-7]證實EC預后與肌層浸潤深度、腹膜細胞學陽性、國際婦產科聯盟標準分期(International Federation of Gynecology and Obstetrics,FIGO)、病理分級、癌抗原125(cancer antigen 125,CA125)、雌孕激素受體、原癌基因HER-2、腫瘤增殖抗原Ki-67、p53基因異常表達等因素相關。
CiteSpace由美國德雷賽爾大學的陳超美教授研發,用于分析前沿領域及其知識基礎,識別科學文獻發展趨勢[8]。目前尚無使用CiteSpace對EC預后進行文獻計量學分析的研究。因此,本文運用CiteSpace軟件對國內外EC預后的文獻進行定量考察和可視化分析,分析對比國內外研究進程和研究熱點,以期為EC的預后研究提供參考。
本研究的數據來源于Web of Science(WOS)數據庫核心集和中國知網(China National Knowledge Infrastructure,CNKI)數據庫。基于WOS數據庫核心集的檢索策略如下:TS=((“endometrial carcinoma”OR“endometrial cancer$” OR “carcinoma of endometrium”OR “endometrial neoplasm$” OR “endometrial adenocarcinoma” OR “endometrium cancer” OR“endometrium carcinoma” OR “adenocarcinoma of endometrium”)NEAR(prognosis OR Prognostic OR outcome$))。基于CNKI數據庫的檢索策略如下:主題字段搜索“子宮內膜癌”、“預后”,文獻語言為中文。檢索完成后按如下標準納入:(1)文獻類型為article;(2)研究主題和EC預后相關;(3)文獻發表時間為建庫至2020年2月13日。WOS數據庫和CNKI數據庫分別獲取有效文獻1 409篇和579篇。
本研究使用CiteSpace5.5.R2分別對國家、機構、作者、文獻及關鍵詞的數據進行分析。CiteSpace軟件設置:時間限定為1958年至2020年,時間切片設置為1年,取前10%的分析數據成圖,其余參數均為默認值。在關鍵詞時間線分析中,使用python 3.7.0分離WOS數據庫中來源于中國的文獻,分別對WOS數據庫中的國際文獻及WOS中的國內文獻/CNKI的文獻繪制時區圖。為方便讀圖,此處將時間范圍限制在1990年至2020年,并將CNKI的中文關鍵詞人工翻譯為英文。
1958年至1978年EC預后研究未受重視,全球少有發文,年發文量自1987年開始緩慢增長,在2009年后開始出現大幅度增長,說明近年來EC的預后受到越來越多科研工作者的關注,預后研究逐年增多。CNKI年發文量與WOS數據庫呈現的趨勢大體一致,說明我國科研方向緊跟國際前沿,并為前沿研究貢獻力量。1958年至2020年WOS和CNKI數據庫論文發表的數量和趨勢見圖1。中、日、美為研究的核心國家,發文量分別是美國321篇、日本204篇、中國194篇,見圖2。
WOS中EC預后研究的科研機構主要以高校為主。在國內從事EC預后研究的機構相對集中,上海交通大學、哈爾濱醫科大學等高校(及其附屬醫院)發文總量較大,同時國內研究機構極少與國外機構合作。國際上,卑爾根大學和霍基蘭大學醫院發文量較高,且與其他機構建立了密集的合作網絡,可能在本領域的研究中占據相對核心的位置。見圖3、表1。

圖1 1958年至2020年EC預后發文數量分布情況Fig.1 Bibliographic records related to EC prognosis in the CNKI and WOS core collection,published from 1958 to 2020

圖2 WOS中EC預后國家合作網絡圖Fig.2 Map of the country co-authorship network of EC prognosis related articles based on the WOS database
CNKI數據庫的機構合作圖譜提示,國內EC預后研究的主要力量是各大高校的附屬醫院,且傾向于獨立完成研究,較少開展科研合作,尚未形成有規模的合作網絡。見表1。

圖3 WOS中EC預后機構合作圖譜Fig.3 Map of the institute co-authorship network of EC prognosis related articles based on the WOS database

表1 在WOS和CNKI中發文前五的機構作者Tab.1 Institutes producing the highest number of EC prognosis related articles based on the CNKI and WOS databases
WOS數據庫作者合作網絡呈現出部分集中、整體分散的現象(圖4)。發文超過10篇的4位高產作者領導了圖中的核心科研網絡,且近年均相對活躍,分別是Jone TROVIK(Haukeland University Hospital,n=13)、David E COHN(The Ohio State University,n=13)、Helga B SALVESEN(University of Bergen,n=12)、Camilla KRAKSTAD(University of Bergen,n=12)。除核心網絡外,其他網絡少有連接且相對獨立,可能多以小組為單位進行。
CNKI分析結果與WOS相似,即科研研究多以小組的方式進行,缺乏組間合作。主要有2個高產作者領導的核心科研團隊:第一是由魏麗慧、王建六領導,但近幾年相對沉寂;其次是薛鳳霞領導的團隊,該團隊近年來仍有成員在進行EC預后的研究。發文量居前五位的作者有魏麗惠(北京大學人民醫院,n=14)、王建六(北京大學人民醫院,n=11)、彭芝蘭(四川大學華西第二醫院,n=7)、李美艷(邯鄲市中心醫院,n=6)和薛鳳霞(天津醫科大學總醫院婦科,n=6)。

圖4 WOS中子宮內膜癌預后作者合作圖譜Fig.4 Map of the author co-authorship network of EC prognosis related articles based on the WOS database
通過對Web of Science數據庫共被引文獻進行聚類分析并以時間線排布,可以清晰了解EC預后研究知識基礎的演變過程[8]。共得到16個主要聚類,目前仍在活躍的聚類有:#1,淋巴結切除術(lymphadenectomy);#3,分子生物標志物(molecular biomarker);#4,L1-細胞黏附分子(L1 cell adhesion molecule,L1cam);#6,長鏈非編碼RNA(long non-coding RNA,lncRNA)等,其中L1cam聚類近期發文量迅速增長,高引用量的文章中有2篇包含在該聚類中,可能是目前的前沿研究領域。文獻共被引時間軸圖見圖5,參考文獻被引次數最多的10篇文獻見表2。

表2 EC預后參考文獻中被引次數最多的10篇文獻Tab.2 Top 10 most cited documents in EC prognosis related articles
隨著時間的發展,EC預后研究的關鍵詞也不斷變化,由國外EC研究關鍵詞時區圖可以看出(圖6),早期的EC研究領域集中于表達(expression)、診斷(prognosis)和生存(survival)等,隨后從這些領域中衍生出了大量的細分研究,近期研究較多的關鍵詞是淋巴結轉移(lymph node metastasis);2010年至2019年共檢測到19個突現關鍵詞(圖7),突現詞的生命周期普遍不長,說明研究熱點的換代速度極快,國外至今仍在進行的研究熱點有診斷(diagnosis)、擴散(proliferation)和子宮切除術(hysterectomy)。

圖6 國外EC研究關鍵詞時區圖Fig.6 Time zone view of the keywords co-citation network of EC prognosis related articles based on the WOS database

圖7 2010年至2020年國外EC突現關鍵詞Fig.7 Top 19 keywords with the strongest citation burst on the WOS database
國內研究關鍵詞時區圖顯示(圖8),國內研究主題較為集中,每一階段都有相對主導的研究關鍵詞,近期研究較多的關鍵詞有長鏈非編碼RNA、通路(pathway)、擴散(proliferation)、和臨床病理特征(clinicopathological feature)。國內研究關鍵詞突現見圖9,2010年至2019年共檢測到14個突現關鍵詞,國內仍在進行的研究熱點有通路(pathway)、細胞凋亡(apoptosis)和擴散(proliferation)。

圖8 國內EC研究關鍵詞時區圖Fig.8 Time zone view of the keywords co-citation network of EC prognosis related articles based on the WOS database

圖9 2010年至2020年國內EC突現關鍵詞Fig.9 Top 14 keywords with the strongest citation burst on the CNKI database
全球EC預后研究共經歷了1987年和2009年2個明顯增長點。研究的國家以中美日3國為主,國際合作方面以卑爾根大學和霍基蘭大學醫院為首構建了密集合作網絡;國內以上海交通大學和哈爾濱醫科大學的研究團隊為主,研究起步較晚但發展較快。歐美科研人員及機構注重各團隊間的合作,在科研發展中更具優勢;國內的機構和科研人員傾向國內科研合作或獨立進行研究,較少開展國際間的科研合作和交流,尤其是各大院校的附屬醫院主要依托自身的臨床資源,獨立開展科研工作,較少與其他機構合作,可能存在“數據孤島”乃至“科研孤島”的現象。
EC預后的研究領域較為分散,主要集中在2個主要的研究方向:(1)基于臨床治療的預后研究(循證醫學)。這方面的研究從早期的基于FIGO分級,到腹膜細胞學檢查,再發展到近期子宮腺肌癥的相關性研究,這一方向相對發展緩慢。腹膜細胞學陽性與EC預后不良顯著相關,陽性患者相對于陰性患者5年復發率較高(46.9% vs 18.4%)[9]。子宮腺肌癥合并EC往往預后較好,在Kaplan-Meier分析中,5年總生存率為100%[10]。(2)基于生物標記物和基因的EC預后研究。從1984年發現p53基因有抑癌活性之后,這一領域研究迅速發展,研究主要涉及p53基因/p53蛋白、環氧化酶2(cyclooxygenase-2,COX-2)、CA125、lncRNA、胸苷磷酸化酶、E-脂肪結合蛋白(E-fatty acid-binding protein,e-fabp)、葡萄糖調節蛋白78(glucose-regulated protein 78)、L1cam等8個聚類,這些都是EC病程發展的主要標記物,如COX-2和分化程度、肌層浸潤有關[11]。CA125高含量和L1cam的高表達都預示著更高的淋巴結轉移可能性[12-13],導致EC預后差。lncRNA AFAP1-AS1的高表達也預示更低的生存率[14]。
本研究首次分析了國內外EC預后研究的差異情況,結果顯示,國內外主要的研究關鍵詞基本一致,但總體的研究熱點存在差異,且存在一定的時間差。國外EC預后的研究自1990年開始興起,相較于國內領先1年。在主要的研究節點上,國內研究晚于國外,如p53基因/p53蛋白的研究反應在圖中的時間差是8年,免疫組化的應用時間比國外晚5年,針對腫瘤擴散的研究比國外晚1年。且目前國內細分研究仍然較少。
本研究首次從EC預后的年發文量、國家、機構、期刊、作者、參考文獻等方面分析了EC預后的研究前沿及其知識基礎的變化過程,并實現了嚴格的國內外關鍵詞研究時間線對照和WOS與CNKI的混合分析。本研究仍然存在一定局限性:(1)在清理無關文獻時未排除存在人工誤差的可能性;(2)部分數據庫(如 PubMed、Scopus、維普、萬方等)未進行分析;(3)文獻計量分析是使用網絡學的指標進行分析,結果與實際研究情況可能存在微小差異。
綜上所述,美日等國家在EC的研究上仍然處于領先地位,但中國與國際先進水平的差距逐漸縮小。在分子和基因水平方面,EC及其預后的研究仍然有較廣闊的前景。