(莆田學院藥學與醫學技術學院 醫學檢驗系,福建 莆田 351100)
由于臨床發現的食管癌大多為晚期,有效治療方式缺乏,生存期往往較短。因此,針對食管癌高危人群進行定期篩查是發現早期食管癌、提高食管癌生存率的有效方法。近年來針對食管癌易感基因的研究很多,為了更好的了解食管癌易感性基因的研究動態和發展趨勢,并發現其中的關鍵基因,本研究運用文獻計量學方法和生物信息學方法對相關基因的研究文獻及所涉及的相關基因進行系統分析。
從中國知網(CNKI)、NCBI Pubmed數據庫中檢索2005年1月至2016年12月食管癌易感性相關基因研究的文獻。中國知網檢索式:A:主題=食管癌 and 主題=易感性 and 主題=基因(模糊匹配)。Pubmed檢索式:gene AND risk AND esophageal neoplasms。
納入全部與食管癌易感性相關基因及基因產物相關的臨床研究。納入與排除標準:文獻形式包括論著、會議論文及會議摘要,排除綜述、個案報道、回信書籍及社論等;納入文獻需包括能提供足夠信息的摘要,或可以獲取全文資料,排除無法獲取摘要的文獻;排除與患食管癌風險相關的非基因研究;納入臨床研究文獻,排除針對基因的結構、機制等研究文獻;物種限定為人類,排除細胞株體外研究及動物體內實驗;排除針對基因統計、Meta分析;排除重復文獻,不同數據庫來源,作者、題目及出版年相同的文獻按1篇統計;檢索時間限定為2005/01/01-2016/12/31,文獻語種為中文和英文;排除其他與研究目的不符的文獻。
利用Endnote X6軟件對最終納入食管癌易感性相關基因文獻進行管理,并借助Excel 2003軟件分別從出版年、作者、研究機構、發表期刊等角度進行計量學分析。
對納入文獻所研究的基因或基因產物進行統計,通過HUGO數據庫查詢相應的基因標準名稱,未能識別的基因通過NCBI Gene數據庫進行手工逐一檢索標準名稱。
利用HUGO對相關基因進行名稱標準化,用在線軟件STRING對食管癌易感性相關基因表達產物構建蛋白質相互作用網絡。將STRING軟件構建的食管癌易感性相關基因相互作用網絡圖導入Cytoscape軟件可視化,用其插件CentiScape計算網絡及各個節點的拓撲特性,設置度值和Betweenness值篩選出關鍵基因和瓶頸基因。
從CNKI數據庫中檢出文獻434篇,從Pubmed數據庫中檢出文獻1041篇,2個數據庫共檢出文獻1475篇,根據研究內容確定符合要求的文獻共324篇。
結果顯示,食管癌易感性相關基因的研究文獻在12年間總體呈間歇性波動趨勢,發文量最高的年份為2011年與2014年。見圖1。

圖1 2005-2016年食管癌易感性相關基因相關文獻出版年分布
324篇論文發表在145種生物醫學期刊上,平均每刊發文2.23篇,其中Carcinogenesis刊文10篇居首位。發文量5篇或以上的期刊為Dis Esophagus 9篇,World J Gastroenterol 7篇,Tumor Biol 7篇,PLoS One 7篇,Asian Pac J Prev 6篇,Mol Biol Rep 6篇,中華腫瘤防治雜志6篇,中國公共衛生6篇,中華流行病學雜志 6篇,Biomakers 5篇,腫瘤 5篇。
中國的Li Y(河北醫科大學第四醫院)為發文量最多的的作者,發表相關文獻19篇,12年間在食管癌易感性相關基因方面作者發文量超過10篇的作者還有3位,分別為Wang N(河北醫科大學第四醫院),Mittal B(桑杰·甘地醫學研究所遺傳學系)和Guo W(河北醫科大學第四醫院)。
為避免重復統計,以第一作者所在機構作為統計對象,共有176個研究機構進行食管癌易感性相關基因方面研究,其中印度的桑杰·甘地醫學研究所遺傳學系發表文獻最多,達到10篇,其次4個研究機構分別為河北醫科大學第四醫院、東南大學公共衛生學院,克什米爾大學,江蘇大學附屬人民醫院,發文量分別為8、5、4、4篇。
324篇文獻中共涉及132個基因,經HUGO進行基因名稱標準化后上傳至在線軟件STRING9.1,對食管癌易感性相關基因表達的蛋白質進行網絡構建。121個基因參與網絡構建,網絡外圍有9個基因產物與其他蛋白或主網絡無聯系,分別為ALDH7A1、CRNN、SPINK7、CCL26、CD1A、CMC2、PLCL1、INTS7和 ADAMTS9,提示上述節點對整個網絡無影響。

圖2 食管癌易感性相關基因表達產物構建蛋白質相互作用網絡圖
將STRING軟件構建的食管癌易感性相關基因相互作用網絡圖導入Cytoscape軟件可視化,剔除網絡外圍的基因,用其插件CentiScape計算網絡及各個節點的拓撲特性,見圖3。網絡是由個112節點2587條邊組成。度數為節點連接的邊的總數目,最大度值為131,最小為2,平均度值為22.47。本研究規定度數≥均數的蛋白所對應的基因為關鍵基因(Hub基因),共有42個。Betweenness為網絡中所以最短途徑中經過該節點的數量比例,最大2350.54,最小為0,平均為138.66,本研究規定Betweenness≥均數的蛋白所對應的基因為瓶頸基因(Bottleneck基因),共有39個。同時為Hub基因和Bottleneck基因的對相互作用網絡非常重要,分別為 VEGFR、MMP9、IL6、RAD51、CCND1、CD44、MDM2、PTGS2、TP53、EGFR、ATM、BRCA2、TNF,見圖4。

圖3 食管癌易感性相關基因相互作用網絡圖

圖4 食管癌易感性相關的關鍵基因與瓶頸基因
食管癌的發病是由多個基因交互作用引起的,也與環境因素有關聯。亞硝酸胺、霉菌、煙草及飲食過燙均會促進食管癌的發生。研究顯示,盡管在相近的環境條件下,罹患食管癌的人也并非占多數,所以個體的遺傳因素可能對食管癌的發生有較大的影響[1]。對食管癌相關基因的研究文獻進行計量學分析,顯示2005-2016年間該領域研究總體發展相對平緩,近5年中以2014年的突破較大。目前食管癌的發病率逐年上升,研究食管癌易感性相關基因,對臨床通過基因診斷的方法有效預測食管癌的發生有指導意義。
通過對所選研究文獻涉及的132個基因進行生物學信息分析,構建蛋白質相互作用網絡,有多個基因處于網絡核心位置,這些基因表達產物相互之間有密切的功能性的關聯,VEGFR、MMP9、IL6、RAD51、CCND1、CD44、MDM2、PTGS2、TP53、EGFR、ATM、BRCA2、TNF等基因對食管癌基因診斷領域的研究有重要意義。基因對食管癌的主要涉及表觀遺傳學、過表達和突變等方面。BCL2抗凋亡基因ala43ala基因型和BCL-2 rs2279115多態性均能顯著增加食管癌的發病風險[2-4]。RAD51-G135C位點多態性改變、PTGS2基因的失調也是食管癌的關鍵易感因素[5-6]。MDM2 SNP309多態性和SNP309G-del1518 +單體型[7-9]腫瘤。EGFR 497Arg> Lys和EGF + 61A> G多態性的基因相互作用協同增強食管癌的風險[10]。腫瘤壞死因子對食管癌的發生過程有較大影響,其中TNF-βNcoI A / A基因型最為常見[11]。在國外的報道中,BRCA2基因與食管鱗癌的家族聚集性存在關聯性[12]。在針對食管癌發病機制的研究中發現,TP53的基因多態性可以增加對食管癌的敏感性[13]。在STRING構建的蛋白質網絡作用圖中,TP53處于網絡的核心位置。但近年來我國學者在TP53與食管癌易感性相關的研究較少,TP53在早期食管癌的診斷應用值得關注,有望發掘潛在的食管癌分子標記物。
精準醫學是未來腫瘤研究的方向,對患者進行基因測序,利用個人基因組信息、疾病體細胞突變信息等,進行的疾病精準診斷和依賴靶向藥物等的精準治療技術[14-15]。分子生物學的發展為腫瘤的靶向治療提供了新的手段[16]。應用生物信息學方法對食管癌易感性相關基因進行研究,預測食管癌的發生發展,仍為未來食管癌研究的熱門方向。