李 燕,董經茹,魏媛媛,張金艷
(河北醫科大學第四醫院,河北 石家莊 050011)
宮頸癌(cervical cancer,CC)在全球女性惡性腫瘤中發病率及死亡率均居第4位,是我國女性常見的癌癥之一[1],但目前缺乏高度特異性和敏感性的生物標志物用于CC的診斷和預后監測。近年來,大量研究利用微陣列生物信息學技術分析CC發生發展中的差異表達基因(differentially expressed genes,DEGs)及其分子機制[2],為CC的早期診斷、療效觀察、預后監測及基因治療提供了重要依據。通過人類宮頸癌組織的全基因組表達譜芯片比較CC組織與正常宮頸組織中的DEGs,運用多種生物信息學分析工具分析,極光激酶A(aurora kinase A,AURKA)在CC組織中高表達,隨著腫瘤分期的進展AURKA的表達水平升高。AURKA是一種絲氨酸/蘇氨酸激酶,對調節細胞有絲分裂進程,維持基因組穩定性至關重要[3]。有研究發現AURKA在多種腫瘤中普遍存在基因擴增和過表達,并且與腫瘤的發生發展及預后存在密切聯系[4]。宮頸鱗狀細胞癌(cervical squamous cell carcinoma,CSCC)是最常見的宮頸癌組織學類型,且幾乎均發生在已婚多產的婦女。本研究以CSCC、宮頸上皮內瘤變(cervical intraepithelial neoplasia,CIN)和女性健康體檢者為研究對象,分別采用實時熒光定量PCR(quantitative real-time PCR,qPCR)和酶聯免疫吸附試驗(enzyme-linked immunosorbent assay,ELISA)方法定量檢測CSCC血清中AURKA mRNA及蛋白的表達,并分析其對CSCC的診斷價值及臨床意義,探尋以血清AURKA mRNA及蛋白作為無創分子標志物來預測宮頸癌的發生發展的可能性。
2021年6—10月在河北醫科大學第四醫院就診的96例患者,年齡25~79歲。其中宮頸鱗狀細胞癌患者48例,宮頸上皮內瘤變患者28例,健康體檢者20例。所有患者治療前清晨空腹采集靜脈血5 mL于無抗凝劑的真空采血管。本研究已獲得河北醫科大學第四醫院倫理委員會批準(2021KS038),所有患者均知情同意并簽署知情同意書。
納入標準:①患者均為首次就診,經陰道鏡或手術活組織病理檢查確診,入院前未接受過手術及放射治療、化學治療等相關抗腫瘤治療措施;②無其他器官疾病或功能障礙;③患者各項臨床資料完整。健康體檢者性別為女性,超聲及血清腫瘤標志物等均未見異常。
排除標準:①合并有其他惡性腫瘤;②入院前接受過手術或放療、化療等其他抗腫瘤治療;③合并有其他器官功能障礙或自身免疫性疾病。
1.2.1 試劑BIOG游離RNA提取試劑,購于常州百代生物科技股份有限公司;PrimeScriptTMRT Reagent Kit和TB Green?Premix Ex TaqTMII購于日本TaKaRa公司;人AURKA ELISA試劑盒購于河南百奧維克生物科技有限公司;DEPC水購于北京蘭杰柯科技有限公司。
1.2.2 儀器QunantStudioDx型PCR儀購于美國Applied Biosystems公司;NanoDrop型微量核酸蛋白濃度測定儀購于美國Thermo公司;PHOMO型酶標儀購于鄭州安圖生物工程有限公司。
1.2.3 引物設計AURKA為目的基因,GAPDH作為內參基因,由上海生工生物工程股份有限公司合成。引物序列為:AURKA基因,上游5′-GGAATATGCAC CACTTGGAACA-3′,下 游5′-TAAGACAGGGCATTT GCCAAT-3′;GAPDH基因,上游5′-AGAAGGCTGG GGCTCATTTG-3′,下游5′-AGGGGCCATCCACAGTC TTC-3′。
1.3.1 篩選差異表達基因GEO2R是基因表達綜合(Gene Expression Omnibus,GEO)數據庫自帶的基于R語言的在線分析工具,允許用戶對GEO數據進行轉換和復雜分析,以幫助識別和可視化差異基因表達[5]。通 過GEO2R對GSE63514、GSE52903、GSE39001、GSE27678和GSE9750共5個微陣列數據集中癌組織和癌旁正常組織樣本進行分組,以調整后的P<0.05和|log2(FC)|>1為標準,篩選兩組樣本的DEGs。FC(fold change)為基因表達的差異倍數變化,log2(FC)>1的基因定義為上調基因,log2(FC)<-1的基因定義為下調基因。通過在線分析網站繪制Venn圖,獲得5個GEO數據芯片上調基因的交集與下調基因的交集。
1.3.2 功能富集分析在DAVID數據庫中選擇“Functional Annotation”分析工具,批量輸入通過Venn圖獲得的DEGs,“Select species”輸入“Homo sapiens”,提交數據后進行基因本體(gene ontology,GO)功能注釋分析和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。以P<0.05為標準篩選重要的功能注釋及通路富集結果。
1.3.3 蛋白互作網絡構建與分析利用STRING在線數據庫構建DEGs介導的蛋白質-蛋白質相互作用(protein-protein interaction,PPI)網絡,以揭示它們之間的復雜相互作用。設置最低關聯度為0.7,并隱藏網絡中孤立的和部分連接的節點。將分析結果導入Cytoscape[3]軟件進行可視化,應用Cytohubba[6]插件進行關聯度分析,取關聯度排名前10的差異表達基因節點作為關鍵基因。
1.3.4 生存預后分析Kaplan-Meier plotter是常用的檢測基因與腫瘤患者預后相關性的在線分析網站[7],對10個關鍵基因進行生存分析,篩選出與宮頸癌預后相關的分子標志物。選擇“RNA-seq Start KM plotter for pan-cancer”,將篩選出的樞紐基因輸入,限定條件為總體生存期(OS),生存時間統計最長為120個月。腫瘤樣本為304例宮頸癌患者,腫瘤病理類型、分期及其病人性別等其他條件不做限制,進行Kaplan-Meier生存分析。以P<0.05作為條件篩選出與宮頸癌預后相關的關鍵基因。
1.3.5 關鍵基因mRNA水平的表達基因表達譜交互式分析(gene expression profiling interactive analysis,GEPIA)可對基于癌癥基因組圖譜(the cancer genome atlas,TCGA)和基因型-組織表達(the genotype-tissue expression,GTEx)數據庫的腫瘤和正常組織進行基因表達分析[8]。在GEPIA2表達分析模塊選擇Box Plot,數據來源選擇CC,得到關鍵基因在宮頸癌及正常宮頸組織中的表達情況,選擇Stage Plot分析關鍵基因與腫瘤病理分期的關系。P<0.05為差異具有統計學意義。
1.3.6 關鍵基因蛋白水平的表達人類蛋白質圖譜(the human protein atlas,HPA)可對編碼的蛋白質進行免疫組織化學染色研究。利用HPA數據庫進一步驗證與宮頸癌患者生存相關的4個關鍵基因在組織中蛋白水平的表達情況。組織圖譜模塊獲得關鍵基因在正常宮頸組織的免疫組織化學染色,病理圖譜模塊獲得其在宮頸癌組織的免疫組織化學染色,比較這些關鍵基因的抗體在宮頸癌組織和正常組織中免疫組織化學染色的差異。
1.3.7 血清游離AURKA mRNA及蛋白檢測血液離體后立即分離血清,提取血清循環游離RNA,使用微量核酸蛋白濃度測定儀檢測血清RNA的濃度和純度,以DEPC水作為空白對照,吸取2μL提取的RNA溶液進行檢測。血清RNA濃度為40~160 ng/μL,260 nm和280 nm波長下的吸光度之比在1.8~2.1之間,提示RNA濃度和純度符合后續實驗要求,利用qPCR檢測血清AURKA mRNA的表達,反應結束后確認qPCR的擴增曲線和熔解曲線,利用2-ΔΔCT計算樣本目的基因的相對表達量,即ΔCT=CT,目的基因-CT,對照基因,ΔΔCT=ΔCT,實驗組-ΔCT,對照組。ΔΔCT值越高,表示基因表達水平越低。采用ELISA檢測血清AURKA蛋白水平的表達,以標準品濃度為橫坐標,對應吸光度值為縱坐標,繪制標準品線性回歸曲線,根據曲線方程計算各樣本中AURKA的濃度。
采用SPSS 26.0和GraphPad Prism 9.0軟件對數據進行統計分析,以α=0.05為檢驗水準。計量資料進行Shapiro-Wilk正態性檢驗和Levene方差齊性檢驗,正態分布資料以±s表示,偏態分布以M(Q)表示。正態分布且方差齊時多組比較采用方差分析,否則采用Kruskal-WallisH檢驗。采用Spearman秩檢驗分析血清AURKA mRNA及蛋白的相關性。利用受試者工作特征曲線(receiver operating characteristic curve,ROC)及曲線下面積(area under curve,AUC)評估血清AURKA對CC的診斷價值。采用χ2檢驗分析血清AURKA mRNA表達與CC患者臨床病理特征間的關系。
通過GEO2R在線分析5個微陣列數據集中187例宮頸癌組織和80例正常宮頸組織基因測序結果。火山圖顯示了每個數據集中DEGs分布(見圖1)。Venn圖對數據取交集得到60個共同的差異表達基因(見表1),包括41個上調和19個下調基因(見圖2)。

圖1 5個數據集差異基因的火山圖

表1 60個共表達的差異表達基因

圖2 Venn圖顯示5個數據集共有差異表達基因的交集
GO富集分析結果顯示,差異表達基因主要參與的生物過程(biological process,BP)為細胞分裂、DNA復制、有絲分裂的G1/S期轉換、有絲核分裂、細胞增殖轉錄的負調控、p53類介體對信號轉導的調控、有絲分裂的G2/M期轉換、DNA修復、細胞周期等;主要參與的細胞成分(cell component,CC)為核質、細胞質、膜、主軸、微管、中心體、蛋白質復合物、著絲粒、染色體、MCM復合體等;主要參與的分子功能(molecular function,MF)為蛋白質結合、ATP結合、DNA結合、酶結合、蛋白質同源二聚化活性、蛋白激酶結合、染色質結合、微管結合、蛋白質絲氨酸/蘇氨酸激酶活性、DNA解旋酶活性等(見圖3A)。KEGG通路富集結果顯示,差異表達基因主要富集在DNA復制、細胞周期、p53信號通路、錯配修復、嘧啶代謝、卵母細胞減數分裂、鉑耐藥、泛素介導的蛋白質水解、病毒致癌等信號通路(見圖3B)。

圖3 差異表達基因功能富集可視化結果
通過STRING在線分析構建DEGs的PPI網絡,該網絡中總共包含60個節點和660個邊(見圖4A)。通過Cytoscape軟件對PPI網絡進行可視化處理,利用Cytohubba插件計算出關聯度前10的節點基因作為宮頸癌的重要關鍵基因,分別為CDK1、NCAPG、TOP2A、AURKA、UBE2C、RRM2、TTK、CDC20、MCM2、RFC4(見圖4B)。

圖4 差異表達基因的PPI網絡和樞紐基因
Kaplan-Meier生存分析結果顯示,10個關鍵基因中篩選出4個基因與TCGA數據庫中宮頸癌患者生存相關,且4個關鍵基因均為表達上調基因,分別為AURKA、CDK1、MCM2、RFC4。其中AURKA基因的表達水平與宮頸癌患者10年總體生存率呈負相關,即AURKA基因高表達的宮頸癌患者生存時間更短(見圖5)。

圖5 宮頸癌患者的生存曲線
2.5.1 AURKA基因轉錄水平的差異GEPIA2表達分析模塊分析結果顯示與正常組織相比,AURKA mRNA在宮頸癌組織中高表達(P<0.05),且與GEO數據集的分析結果一致(見圖6)。進一步分析關鍵基因與宮頸癌分期的關系,結果顯示AURKA mRNA在宮頸癌不同階段的表達水平存在顯著差異(P<0.05),隨著腫瘤分期的進展AURKA mRNA的表達升高(見圖7)。

圖6 GEPIA2在線工具分析結果

圖7 AURKA mRNA在宮頸癌不同分期的表達
2.5.2 AURKA蛋白水平差異HPA數據庫的免疫組織化學分析結果顯示,與正常宮頸組織相比,宮頸癌組織中AURKA的抗體特異性著色程度均加深,即在宮頸癌組織中表達較高。
AURKA mRNA擴增曲線為平滑的S型曲線,閾值循環數(CT)值在20~30之間,提示擴增結果可靠。熔解曲線為單一峰,沒有引物二聚體的產生,表示特異性較好(見圖8)。CSCC和CIN患者血清AURKA mRNA的相對表達水平明顯高于健康體檢者,差異有統計學意義(P<0.05)。CSCC與CIN患者血清AURKA mRNA的相對表達水平無顯著差異。CSCC患者血清AURKA蛋白的表達水平明顯高于CIN及健康體檢者(P<0.05),與血清AURKA mRNA相對表達不同的是,CIN患者與健康體檢者血清AURKA蛋白表達水平無顯著差異(見圖9)。經Spearman相關性分析,血清AURKA mRNA與蛋白表達水平呈正相關關系,但關聯性較弱(r=0.237,P=0.020)。

圖8 AURKA mRNA擴增曲線及熔解曲線

圖9 宮頸鱗狀細胞癌患者血清AURKA mRNA及蛋白的表達
根據ROC曲線,血清AURKA mRNA和蛋白預測CSCC最佳截斷值分別為2.028和3.239,此時曲線下面積(AUC)分別為0.869(敏感度75%,特異度90%)和0.699(敏感度85.4%,特異度60%)(見圖10)。根據ROC曲線的截斷值,將AURKA mRNA表達水平分為高表達組和低表達組。經χ2檢驗發現,血清中高表達與低表達AURKA mRNA的CSCC患者年齡、分化程度均無明顯差異(P>0.05),而患者FIGO分期、是否有淋巴結轉移、腫瘤大小及肌層浸潤深度差異明顯(P<0.05)。血清中高表達AURKA mRNA的CSCC患者往往臨床分期較晚、瘤組織較大、肌層浸潤更深、更易發生淋巴結轉移(見表2)。

表2 血清AURKA mRNA表達與宮頸鱗狀細胞癌患者臨床病理特征的關系

圖10 AURKA mRNA及蛋白預測宮頸鱗狀細胞癌患者的ROC曲線
本研究比較了5個微陣列數據集中宮頸癌組織與正常宮頸組織的mRNA表達譜,篩選出共同的DEGs,并通過多種生物信息學工具綜合分析它們的潛在功能。GO功能注釋結果顯示,DGEs在細胞有絲分裂、核質、染色體和DNA解旋酶活性中顯著富集,表明其中一些DEGs可能定位于細胞核中,通過增強宮頸癌中的DNA解旋酶活性參與細胞分裂周期過程以促進細胞增殖。KEGG富集分析發現,DEGs在DNA復制、細胞周期、p53信號通路、卵母細胞減數分裂和病毒致癌等信號通路中顯著富集。Mine等[9]研究發現,基因染色體畸變直接或間接驅動細胞周期失調和抗病毒基因活性,導致宮頸癌發生發展。構建共同DEGs的蛋白質-蛋白質相互作用網絡,確定了關聯度較高的10個重要關鍵基因。通過Kaplan-Meier分析樞紐基因的表達與TCGA數據庫中宮頸癌患者生存預后之間的相關性,發現與CC預后相關的4個關鍵基因,即AURKA、CDK1、MCM2和RFC4。
為進一步探究4個關鍵基因與宮頸癌發生的關系及相關的分子機制,將其導入STRING在線分析網站,結果顯示關鍵基因主要富集在細胞有絲分裂過程中,包括DNA復制、細胞分裂周期相變。Espinosa等[10]研究發現,有絲分裂是宮頸癌篩查、生存和治療靶標的潛在標志物來源,而抑制有絲分裂是重要的抗癌策略。由此推斷,4個關鍵基因作為促癌基因可能通過加速細胞周期轉換,促進腫瘤細胞增殖分化,從而導致人類宮頸癌的發生和發展。PPI網絡和生存分析結果顯示AURKA基因是和CC分期及預后相關的潛在生物標志物。
本研究基于生物信息學分析結果顯示,與正常宮頸組織相比,CC組織中AURKA mRNA及蛋白表達較高。通過qPCR及ELISA技術檢測CSCC患者血清AURKA mRNA及蛋白的表達,結果顯示CSCC和CIN患者血清AURKA mRNA的表達明顯高于健康體檢者,CSCC血清AURKA蛋白的表達明顯高于CIN及健康體檢者。CSCC血清AURKA mRNA高表達組患者FIGO分期、淋巴結轉移、腫瘤大小及肌層浸潤深度均分別高于AURKA mRNA低表達組(P<0.05),這提示血清中高表達AURKA mRNA可能具有預測CSCC患者臨床進展和預后的作用。本研究結果及文獻報道相似,Twu等[11]通過免疫組織化學染色檢測正常宮頸、CIN和浸潤性宮頸癌(鱗癌和腺癌)組織中AURKA的表達,結果顯示其在浸潤性宮頸癌和CIN組織中的表達顯著高于正常宮頸組織。與腺癌相比,鱗癌中AURKA的表達更高。Zhang等[7]采用qPCR檢測宮頸癌細胞系及74例宮頸癌患者配對癌組織和相應非癌組織中AURKA mRNA的表達,通過蛋白質印跡和免疫組織化學測定細胞懸液和組織中AURKA蛋白的表達,結果顯示AURKA mRNA和蛋白在宮頸癌細胞系和組織中的表達顯著高于正常宮頸上皮細胞和非癌組織,AURKA mRNA表達與FIGO分期、腫瘤分化、宮旁浸潤、淋巴結或血行轉移相關,高表達患者的OS和無病生存率更差,提示其可能在原發腫瘤的進展和侵襲中發揮重要促癌作用,并有潛力成為宮頸癌早期診斷和預后監測的指標。有學者提出AURKA表達可能預測宮頸癌患者的結局,但其在宮頸癌發病機制中的確切功能和分子機制尚不明確[12]。AURKA是細胞周期調節激酶,對維持基因組穩定性至關重要[3]。先前的一項研究發現,抑制AURKA可作為HPV E7癌基因的合成致死靶點,用小分子抑制劑Alisertib抑制AURKA可選擇性地靶向體內表達HPV E7的細胞,AURKA的過度表達對HPV轉化的宮頸癌細胞的存活至關重要[13]。研究發現AURKA過表達可增強G1/S細胞周期過渡,促進細胞增殖,并保護細胞免受凋亡,產生抗腫瘤藥的化學耐受性[14]。
綜上所述,本研究發現CC患者血清中AURKA mRNA及蛋白的表達水平升高且與CSCC患者臨床進展有關,二者聯合檢測對于CSCC診斷及監測預后具有一定意義。