楊夢霞 郭宵飛 朱世杰 蘆殿榮 王寧軍
小細胞肺癌(small cell lung cancer,SCLC)在支氣管癌中占比15%,是一種神經內分泌癌,呈高度低分化,死亡率高達所有肺癌死亡率的25%[1,2]。盡管免疫療法在近幾年治療SCLC中取得了較好的療效,但仍存在許多挑戰,如療效適中且僅限于一小部分患者[3,4]。此外,由于SCLC缺乏特異性癥狀和腫瘤生長快速,其早期檢測具有一定挑戰性,這使目前的篩查方法在疾病早期診斷中無明顯效果[3],故我們需要探索一種新的生物標志物來協助SCLC的早期診療。在本次研究中,從基因表達綜合數據庫(gene expression omnibus,GEO)下載SCLC患者的基因表達譜芯片,并使用GEO2R軟件將SCLC組織與正常肺組織進行比較,以獲得差異表達基因(differentially expressed gene,DEG),并進一步分析其生物功能、相關通路和臨床預后價值,旨在為深入研究SCLC發生機制及早期診療和預后判斷提供新的理論依據。
1.1 基因芯片數據來源 GEO(https://www.ncbi.nlm.nih.gov/geo/)是最大的國際公共芯片儲存數據庫,收錄并整理了多種形式的高通量基因組數據,如微陣列芯片和二代測序等。在該數據庫中,以“small cell lung cancer”、“normal”為檢索詞,條目類型和物種分別為“series”、“Homo sapiens”,篩選出數據集GSE149507(由GPL23270 平臺提供[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array),包含正常肺組織標本和小細胞肺癌組織標本各18例,患者平均年齡56歲。
1.2 DEG篩選 GEO2R(http://www.ncbi.nlm.nih.gov/geo/geO2r)是GEO數據庫提供的在線工具,可用于2組或多組樣本的比較,以獲得差異性表達基因。在該數據庫中,以“adj.P.Val<0.05”、“|log FC|>2(Fold Change,FC)”為條件,篩選DEG。
1.3 富集分析 DAVID(http://david.ncifcrf.gov)是一個關于生物信息學的數據庫,為大規模基因或蛋白列表提供系統綜合的生物功能注釋信息,目前主要用于差異基因的功能和通路富集分析。在該數據庫中,上傳DEG列表,選擇物種為“Homo sapiens”,進行生物功能和通路富集分析。
1.4 PPI構建與模塊分析 STRING數據庫 (http://string-db.org) 收集、評估和集成了所有公開可用的蛋白-蛋白相互作用信息,并通過計算預測補充這些信息,構建了蛋白-蛋白互作網絡(protein-protein interaction,PPI);Cytoscape是一個提供了分子網絡展示、布局、查詢等基本功能的軟件,可用于蛋白-蛋白、蛋白-DNA等相互作用的分析。本次研究,在STRING數據庫中上傳DEG列表,并以Interaction score=0.9為條件,分析PPI網絡,然后將其結果導入Cytoscape軟件中進行可視化分析,以“Degree cutoff=2”、 “Node score cutoff=0.2”、 “K-core=2”、“Max depth=100”為條件,運用MCODE插件篩選出重要模塊基因。
1.5 關鍵基因篩選和預后分析 根據節點連接度(Degree),篩選出Degree≥40的關鍵基因,并使用Cytoscape中BiNGO插件對BP富集結果可視化。Kaplan-Meier Plotter(https://kmplot.com/analysis/)是一個腫瘤在線生存分析數據庫,能夠針對54 000多個基因、21種癌癥展開研究。在本研究中,使用該數據庫對關鍵基因進行預后分析,并繪制生存曲線圖。
2.1 篩選出614個DEG 在GEO中篩選出GSE149507,包含36個合格樣本(正常肺組織和小細胞肺癌組織標本各18例)。GEO2R分析后,得到上調和下調基因分別有328個、286個,見圖1。

圖1 DEG聚類熱圖(A)和火山圖(B)
2.2 富集分析結果 在DAVID中,以P<0.05為條件,對DEG進行生物功能和通路富集分析。GO生物富集得到BP 22項、CC 6項、MF 13項,篩選出涉及BP、MF的前10條及CC的6條富集結果進行分析。在BP方面,包含微管運動、DNA修復及合成和DNA雙鏈展開等;在CC方面包含驅動蛋白復合物、微管和細胞器膜等;在MF方面包括微管結合、ATP酶活性和趨化因子活性等。通路富集分析得到40條通路,選擇前30條做富集分析,相關通路主要有細胞循環、DNA修復和酪氨酸代謝等。見圖2。

圖2 DEG生物功能(A)和通路(B)富集分析
2.3 PPI網絡及重要模塊篩選 使用STRING和Cytoscape構建PPI網絡并將其可視化,包含275個節點,1 999條邊;后運用MCODE插件篩選出重要模塊,得分為35.098,包含50個節點,895條邊。見圖3。

圖3 DEG(A)和重要模塊(B)的PPI網絡圖
2.4 篩選出關鍵基因及預后分析 在重要模塊基因中,篩選出Degree≥40的關鍵基因,分別是KIF2C、CDK1、BUB1、CDC20、CCNB2、CCNB1和BUB1B,Degree均為49;AURKB、 CDCA8和NDC80,Degree均為48;CENPF和 BIRC5,Degree均為47;KIF20A,Degree為40。通過Kaplan-Meier Plotter數據庫對關鍵基因進行預后OS分析,發現在肺癌基因芯片中未檢索到CDK1。結果顯示,上述關鍵基因的高表達水平與不良預后相關,表明關鍵基因在小細胞肺癌整體生存時間上可能發揮一定作用。見圖4、5。

圖4 SCLC關鍵基因的BP可視化網絡圖

圖5 關鍵基因對肺癌患者的預后影響分析
在過去十年中,肺癌患者的五年生存率雖略有提高,但仍保持在10%的低水平[5],其中SCLC仍是主要的全球癌癥死亡原因之一。雖然SCLC治療取得了很大突破,但其發病機制仍不清楚[6],因此我們需要深入探討 SCLC相關生物標志物、信號通路和分子發生機制,以期能夠在SCLC診療方面提供新的參考依據,改善患者預后。在本研究中,我們不僅發現了在既往研究中已被證實與SCLC發病機制相關的KIF2C、CDC20、BUB1B和NDC80基因[7],還發現CDK1、BUB1和CCNB2等與SCLC發病機制也有關,為后續SCLC的深入研究提供了更多潛在靶點。
CDK1是細胞周期中G1/S和G2/M轉化所必需的重要驅動因子[8],其表達水平異常不僅會導致腫瘤快速生長,還會導致癌細胞增殖[9]。有研究表明指出,抑制CDK1活性可以抑制結直腸癌細胞在體內/外增殖,且CDK1高表達水平可刺激結直腸癌細胞的增殖和遷移,最終導致患者較差生存期[10]。BUB1可通過磷酸化形成BUB1-BUB3復合物以調控其他重要的紡錘體檢查點蛋白,改變細胞周期進程[11]。研究認為BUB1在非子宮內膜樣癌中表達水平更高,但癌組織中低BUB1陽性表達率,會出現低分化子宮內膜癌和不良預后[12]。在本研究中,BUB1高表達水平與短OS密切相關,這與上述研究中的結果一致,表明該基因在腫瘤的發生發展過程中有重要作用;但尚未查到有關CDK1表達水平對腫瘤患者預后影響,且由于目前關于CDK1表達水平對臨床預后的相關臨床報道較少,故其預后價值仍有待進一步研究。
CCNB1、CCNB2和AURKB是有絲分裂中的監測蛋白,在G2/M轉化中起關鍵作用。研究表明CCNB1在非小細胞肺癌等多種癌癥中過表達,與不良預后密切相關[13]。此外,也有研究指出,CCNB1的mRNA水平和蛋白質下調可減少細胞增殖[14]。而CCNB2在肝癌中表達水平較高,與不良預后相關[15];當CCNB2表達水平降低時,可使膀胱癌細胞的浸潤和轉移受抑[16]。AURKB能夠通過介導CCND1基因啟動子處的H3S10ph來激活CCND1的表達,而CCND1是細胞周期中同源細胞周期蛋白依賴性激酶4/6(CDK4/6)的關鍵變構激活劑,對于啟動DNA復制至關重要[17],而高表達的AURKB和CCND1可促進胃癌細胞的增殖,進而導致較短的OS[18]。本次研究結果也表明,CCNB1、CCNB2和AURKB高表達水平也可致SCLC患者較差的預后,與上述研究結果一致。
CDCA8是有絲分裂的重要調節劑,在大多數癌癥中都可出現高表達,而在正常組織中表達水平較低[19]。體外實驗證明,敲除CDCA8表達可以導致膀胱癌細胞在S和G2/M期停滯,進而使細胞增殖受抑和細胞凋亡加速[20]。CENPF是一種與細胞周期相關的核抗原,在G0/G1細胞中低水平表達,并在S期積累在核基質中,在G2/M細胞中表達最高,且經體外實驗證明,CENPF可激活PI3K-AKT-mTORC1信號轉導途徑,進而使PTHrP分泌增加,修飾骨環境以促進破骨細胞形成和骨定植,為乳腺癌細胞向骨骼的轉移創造了有利環境,最終導致不良預后[21]。BIRC5也稱為Survivin,可通過影響細胞分裂和增殖以及抑制細胞凋亡在癌變過程中發揮重要作用[22]。大量研究表明,在大多數惡性腫瘤中,BIRC5表達水平均較高,且高BIRC5表達可導致乳腺癌患者更差的總生存期及轉移復發風險增加[23]。KIF20A也稱為MKLP2和RAB6KIFL,位于染色體5q31.2上,主要聚集在有絲分裂細胞紡錘體的中央區域,可參與有絲分裂過程[24]。大量研究表明,KIF20A在膀胱癌和胃癌等多種癌癥中都出現過表達,且高KIF20A表達水平可促進膀胱癌細胞的增殖和轉移,導致較差預后;低表達時可誘導胃癌細胞的有絲分裂(G2/M期)停滯,增強化療藥物的敏感性[25,26]。在本次研究結果中,CDCA8、CENPF、BIRC5和 KIF20A表達水平對SCLC患者預后影響與上述報道結果一致。
綜上所述,本研究從生物信息學角度分析SCLC發生發展的關鍵基因及差異表達基因,并進一步探討其生物學功能和預后價值,猜測SCLC關鍵基因CDK1、BUB1和CCNB2等可能通過微管運動、DNA修復、驅動蛋白復合物及微管結合等多個生物學過程、細胞組分及分子功能,并調節細胞循環、DNA修復和酪氨酸代謝等多個通路,進而影響影響腫瘤的發生發展,故可能成為潛在的預后生物標志物。但目前有關這些關鍵基因在SCLC發生發展過程中作用的研究相對不足,故仍需后續研究進一步驗證。