張鑫利,李 毅
山西省運城市中心醫院,山西 運城 043100
小細胞肺癌(Small Cell Lung Cancer)是肺癌的一種特殊類型,在所有肺癌亞型中惡性程度最高,分化程度最低。在全球范圍內,小細胞肺癌占所有肺癌的15%,是全球男性癌癥死亡的主要原因,也是女性癌癥死亡的第二大原因[1]。令人遺憾的是,超過一半的小細胞肺癌患者在最初診斷時即顯示出局部或遠處轉移,患者確診后5年的生存率僅有7%[2]。引起小細胞肺癌的危險因素主要是吸煙[3],煙草致癌物誘導的小細胞肺癌有大量體細胞突變[4]。
由于小細胞肺癌對放化療高度敏感,常采用全身化療,并結合放療和手術治療。這種治療可以降低小細胞肺癌患者的局部復發率,約25%的患者能夠獲得長期生存率和改善預后[4]。與非小細胞肺癌的治療方法相比,小細胞肺癌的治療選擇在過去的40年中并沒有明顯的改善,也沒有靶向治療被批準。因此,闡明小細胞肺癌發病機制的進展可能是小細胞肺癌治療方法發展的基礎。探討關鍵信號通路相關基因及其介導信號通路的發病機制是分析小細胞肺癌發生發展的重要過程,這可能有利于早期診斷及發現靶向治療的分子標志物,也可能為治療提供分子基礎。
近年來,隨著高通量測序的發展,生物信息學分析在生命醫學領域得到了廣泛的應用,已被廣泛用于預測各種疾病的發生機制及潛在治療靶點[5]。本研究借助基因表達綜合(Gene Expression Omnibus,GEO)數據庫,通過生物信息學分析進一步探究小細胞肺癌與正常組織之間的差異表達基因及相關的信號通路,蛋白互作(Protein-protein interaction,PPI)分析,以期從分子水平預測可能在小細胞肺癌疾病進展中發揮重要作用的相關基因,利用藥物數據庫篩選相關靶向藥物,為小細胞肺癌發作的預防及靶向治療提供新思路。
進入GEO 數據庫(https://www.ncbi.nlm.nih.gov/geo/),在搜索欄輸入檢索詞“Small Cell Lung Cancer”,搜索后獲得符合研究需求的基因表達芯片數據集GSE149507,由Ling Cai 等[6]于2020 年12 月上傳至GEO 數據庫的公共芯片數據集。GSE149507 以GPL23270 Affymetrix Human Genome U133 Plus 2.0 Array 為平臺,通過全轉錄本微陣列芯片Microarray 將收集的肺組織樣本進行基因表達分析,其中包含18對小細胞肺癌及配對癌旁組織樣本。
將原始數據分Normal 組和Tumor 組,使用GEO2R 在線工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/)對原始數據進行基因差異表達分析。差異基因以校正P<0.01,以|log2FC|>3 為上、下調基因的篩選標準。使用ggplot2繪制差異表達基因的火山圖和熱圖。
提取上述篩選的差異表達基因,運用DAVID在線數據庫[7](https://david.ncifcrf.gov/)進行背景為Homo sapiens的基因本體論(Geno ontology,GO)功能富集分析,其中包括生物過程(biological process,BP)、細胞組分(cellular component,CC)、分子功能(molecular function,MF);KEGG(kyoto encyclopedia of genes andgenomes)信號通路富集分析篩選相關的生物學通路,調整后以P<0.05 為閾值篩查差異基因的主要富集功能和通路。
在STRING(version 11.0)數據庫[8](https://string-db.org/)的檢索工具中上傳上述篩選的差異表達基因,設置綜合交互得分0.7 為顯著性閾值。下載PPI 數據,使用Cytoscape對PPI網絡進行可視化和關聯性分析。采用MCODE插件對PPI 網絡中的子模塊進行分析,篩選出關鍵的蛋白表達分子。
以“CDK1”為關鍵詞在Drugbank 數據庫(https://www.drugbank.ca/) 和Herb 數 據 庫[9](http://herb.ac.cn/)“Target name”項下,檢索與CDK1相互作用的小分子化合物、中藥及其單體化合物,作為小細胞肺癌的潛在治療化合物。
在GEO2R 平臺內對小細胞肺癌組(n=18)及其癌旁對照組(n=18)基因芯片數據進行分析,共獲得10 676個差異基因,火山圖如圖1所示。以|log2FC|>3、P<0.01為篩選標準對所有基因進行篩選,最終獲得153 個符合上述條件的基因,其中上調基因共104 個,下調基因共49個,見表1。排名前10的上調基因和下調基因,見圖2。

圖1 小細胞肺癌組與其癌旁對照組差異表達基因火山圖

圖2 差異表達最明顯的前20位基因

表1 小細胞肺癌組與其癌旁對照組之間的差異表達基因
運用DAVID在線數據庫對篩選得到的共同差異表達基因進行背景為Homo sapiens 的GO 富集分析和KEGG 信號通路富集分析。結果顯示,差異基因富集到的BP 主要包括細胞分裂、有絲分裂姐妹染色單體分離和有絲核分裂等過程,見圖3。在CC 方面,差異基因主要富集在紡錘體、染色體著絲粒和中間體等區域,見圖4。而MF方面,則提示差異基因主要與微管結合、染色質結合等生物大分子的結合相關,見圖5。在KEGG 信號通路富集分析中顯示,差異基因的KEGG 通路主要涉及細胞周期通路和P53 信號通路等,見圖6。

圖3 差異表達基因GO生物學過程分析

圖4 差異表達基因GO細胞組分分析

圖5 差異表達基因GO分子功能分析

圖6 差異表達基因KEGG信號通路富集分析
用STRING 對差異表達基因進行蛋白互作網絡構建。并將得到的結果導入Cytoscape 軟件對PPI 網絡進行可視化分析與篩選。所得的PPI 網絡如圖7 所示。并利用Cytoscape 的MCODE 插件精確構建PPI 網絡中關鍵基因模塊,結果顯示,共篩選出1 個關鍵基因模塊,見圖8。這表明了該模塊內基因均與小細胞肺癌關系較為密切。進一步采用CentiScaPe 插件在該模塊中篩選出與小細胞肺癌相關性最大的基因是CDK1。

圖7 差異表達基因的PPI網絡分析

圖8 PPI網絡中最顯著的基因模塊
以CDK1 為靶點在數據庫中篩選潛在藥物。Herb 數據庫中一共有4個中藥及9個中藥單體作用于CDK1受體,包括草莓車軸草、大蒜和火炭母草等中藥,還有葫蘆素E、阿片堿和去氧地膽草素等中藥單體。DrugBank數據庫一共有9 個化學藥物作用于CDK1 受體,包括Alsterpaullone、Alvocidib、 Hymenialdisine、 Indirubin-3'-monoxime、 Olomoucine、SU9516、AT-7519、Seliciclib和Fostamatinib。
本研究通過生物信息學分析,篩選出小細胞肺癌發生、發展過程中表達顯著變化的153 個基因,對差異基因的GO 富集分析主要集中在細胞分裂、有絲分裂姐妹染色單體分離和有絲核分裂等過程,主要富集在紡錘體、染色體著絲粒和中間體等區域,提示差異基因主要與微管結合、染色質結合等生物大分子的結合相關。本研究通過KEGG 信號通路富集分析,發現與小細胞肺癌的發生發展相關的信號通路:細胞周期和P53 信號通路。細胞周期失調是腫瘤的關鍵特征之一。研究表明,在沒有細胞周期阻滯時,DNA 損傷將無法修復,細胞將帶著受損的DNA 進入有絲分裂,從而導致癌細胞死亡。腫瘤細胞必須突破控制細胞分裂的細胞周期阻滯。細胞周期調控相關基因在多種人類腫瘤中均有高表達,表明細胞周期在腫瘤發生、發展過程中發揮著重要作用。腫瘤抑制基因P53 是正常細胞中關鍵的細胞周期調節因子,在G1 和G2/M 期觀察到P53在監測細胞周期中的調節作用。P53 基因在所有被發現的基因中與人類癌癥病例的相關性排名第一,研究[10-11]發現50%的惡性腫瘤顯示出P53 基因的突變,P53 異常表達可以導致腫瘤形成或細胞轉化,而且是小細胞肺癌中最常見的基因突變。
研究通過STRING 進行蛋白互作網絡分析,得到了最可能與小細胞肺癌的發生發展相關的基因CDK1。該蛋白屬于Ser/Thr蛋白激酶家族的成員,在真核細胞周期控制中發揮重要的調節作用[12]。CDK1 是多效性最強的細胞周期調節蛋白,CDK1 在整個細胞周期中與9 種不同的細胞周期蛋白相互作用。這些與細胞周期蛋白的相互作用對于激活其激酶活性,以及下游蛋白的招募和選擇都很重要[13]。因此,選擇性抑制CCNB1 或CDKs 可以限制細胞周期的進展和/或誘導細胞凋亡。已有多項研究表明,P53 的下游分子包括CDK1,通過腫瘤細胞中的p53/Bax凋亡通路,抑制CCNB1 或CDK1 的表達可抑制腫瘤的發生發展[4,14]。因此,CDK1可能是抗腫瘤治療的治療靶點。
近年來,相對于非小細胞肺癌靶向藥物發展迅速,小細胞肺癌靶向藥物研究進展緩慢,難點在于尚未找到直接的治療靶點[15]。因此,研究小細胞肺癌的治療方案具有重要意義。基于網絡藥理學的分析為篩選和發現多靶點藥物提供了一種新的方法[16]。研究通過網絡藥理學數據庫發現,可以抑制CDK1 表達的潛在藥物有:草莓車軸草、大蒜、火炭母草等中藥,葫蘆素E、阿片堿、去氧地膽草素等中藥單體,Alsterpaullone、Alvocidib、Hymenialdisine等化學藥物。有研究[17]報道,來源于火炭母草的酚類化合物抑制宮頸癌SiHa細胞生長和誘導其凋亡。多篇研究發現大蒜素可抑制肺癌細胞侵襲轉移、增殖及誘導其凋亡[18-19]。同時,有研究[20]發現葫蘆素E 通過靶向EGFR/MAPK信號通路對A549細胞具有抗增殖作用。在小鼠模型中,葫蘆素E 可抑制Yes 相關蛋白信號通路并抑制人類非小細胞肺癌腦轉移[21]。
綜上所述,本研究通過對GEO 小細胞肺癌芯片數據GSE149507 進行生物信息學分析,發現P53 和細胞周期可能參與小細胞肺癌發生發展過程,這可能有助于了解小細胞肺癌發生的潛在機制。構建差異表達基因的PPI 網絡,并鑒定了關鍵基因CDK1,并以此為靶點篩選治療小細胞肺癌的潛在藥物,為小細胞肺癌的治療提供新的思路。