余長云,張倩倩,薛彬彬,張彩,張晨,李金映,曹華,吉倩婧
(鄭州大學第一附屬醫院 耳鼻咽喉頭頸外科,河南 鄭州 450052)
口底鱗狀細胞癌(簡稱口底鱗癌)系原發于口底黏膜的癌癥,是口腔頜面部腫瘤中較為常見的惡性腫瘤之一,具有易發生局部浸潤和頸淋巴結轉移的特點[1-2]。目前,口底鱗癌的治療方式是以手術切除為主,并輔以放療、化療、基因治療的綜合治療。近年來,盡管診斷及治療手段不斷更新改進,口底鱗癌患者的生存率及生存質量并未得到顯著提高,其中重要原因就是腫瘤的早期轉移及復發[3-5]。研究表明,大部分患者就診時已出現局部或遠處轉移,這部分患者容易復發,預后相對較差[6-7]。因此,探索新的對腫瘤預后有價值的檢測指標,對提高口底鱗癌患者的生存率及生存質量將具有重要意義。
長鏈非編碼 RNA(long non-coding RNA,lncRNA)是一類轉錄本長度超過200 nt、不編碼蛋白的RNA,參與發育、分化、代謝等多方面的調控[8-9]。研究表明,lncRNA 在多種惡性腫瘤中異常表達,與腫瘤細胞生長、分化、上皮-間質轉化、干細胞特性、轉移等多種生物學行為相關[10-12]。近期,越來越多的證據表明,lncRNA可作為包括乳腺癌、肺癌、胃癌等多種惡性腫瘤診斷或預后標志物[13-15]。然而,目前lncRNA與口底鱗癌患者預后的關系并不十分清楚。在本研究中,以癌癥基因組圖譜(the cancer genome atlas,TCGA)數據庫為基礎,采用Cox回歸分析構建新的具有預測價值的lncRNA風險模型,以期為口底鱗癌患者的生存預測提供新的思路。
1.1 資料下載本研究從TCGA數據庫下載原始研究數據集(https://cancergenome.nih.gov/),并從中提取lncRNA表達矩陣。納入標準:口底鱗癌患者;完整的lncRNA表達轉錄組數據和臨床信息;完整的隨訪資料。本研究共納入54例口底鱗癌樣本及3例對應癌旁組織樣本。
1.2 lncRNA差異表達譜分析將下載的原始口底鱗癌轉錄組數據(count)進行ID轉換,并添加基因屬性,提取lncRNA表達矩陣。在R語言軟件中,采用edgeR包對下載的數據進行處理,先對表達量(count)進行校正,并計算變異數;然后根據篩選標準(P≤0.001,倍數變化≥2)篩選在口底鱗癌組織和對應癌旁組織樣本中差異表達的lncRNA。
1.3 lncRNA風險預測模型的構建采用單變量Cox回歸分析篩選與患者總生存率相關的差異表達lncRNA,將P<0.01的lncRNA納入隨后的多變量Cox回歸分析中,并刪除信息量重疊的lncRNA,建立lncRNA口底鱗癌預后模型。根據模型中lncRNA的表達量及表達系數計算口底鱗癌患者的風險評分(risk score,RS)。采用如下公式計算風險評分[16]:
S=ΣβiXi。
式中S為風險評分,βi為lncRNA的表達系數,Xi為lncRNA在口底鱗癌患者中的表達水平。
1.4 檢測風險評分與口底鱗癌患者預后的相關性根據風險評分公式計算每例口底鱗患者的風險評分,按照中位風險值將口底鱗癌患者分為高風險組和低風險組(風險評分高于或等于中位風險值的患者為高風險組,風險評分低于中位風險值的患者為低風險組),繪制風險評分曲線、生存狀態散點圖及lncRNA的表達熱圖。Kaplan-Meier法繪制高、低風險組患者的生存曲線。繪制受試者工作特征(receiver operator characteristic,ROC)曲線以評估口底鱗癌患者風險評分對生存評估的靈敏度和特異度,曲線下面積(the area under curve,AUC)越接近1表明預測性能越好。
1.5 統計分析本研究中所有統計分析均在R軟件(版本3.5.1)中進行。采用edgeR包篩選差異lncRNA;Survival包進行單變量和多變量Cox風險回歸分析,并建立基于多個lncRNA的風險預測模型;Survival ROC包繪制ROC曲線,并計算AUC。所有檢驗均為雙側檢驗,P<0.05為差異有統計學意義。
2.1 差異表達lncRNA在口底鱗癌組織與對應癌旁組織中共識別出138個差異lncRNA,其中40個上調lncRNA和98個下調lncRNA,圖1中熱圖和火山圖顯示上調和下調的差異lncRNA。根據倍數變化(fold change,FC)值排序前10位差異表達lncRNA,表1中顯示前5位上調和下調的lncRNA。

A為熱圖;B為火山圖。圖1 138個差異表達lncRNA的熱圖和火山圖

表1 前5位下調和上調的lncRNA
2.2 口底鱗癌患者lncRNA風險預測模型的建立對篩選出的40個上調lncRNA和98個下調lncRNA進行單變量Cox回歸分析,確定與口底鱗癌患者總生存相關的lncRNA。根據篩選標準(P<0.01),納入5個與總生存期相關的lncRNA(MIR1-1HG、HOXC13-AS、RAMP2-AS1、LINC02454、LINC00702),進一步使用多變量Cox回歸對5個lncRNA與生存的關系進行分析,并刪除信息量重疊的lncRNA,最終建立包含MIR1-1HG、HOXC13-AS、RAMP2-AS1的3個lncRNA的口底鱗癌患者風險預測模型,一致性系數(concordance index,CI)為0.77(表2,圖3)。S=0.291X1+0.280X2-0.433X3,S為風險評分,X1為MIR1-1HG的表達水平,X2為HOXC13-AS的表達水平,X3為RAMP2-AS1的表達水平。風險系數顯示MIR1-1HG、HOXC13-AS為危險因素(β>0),RAMP2-AS1為保護因素(β<0)(表2)。Kaplan-Meier生存曲線顯示MIR1-1HG、HOXC13-AS高表達組患者生存率低于低表達組患者,RAMP2-AS1高表達組患者生存率高于低表達組患者(圖2)。

表2 多變量Cox回歸分析結果

圖2 口底鱗癌患者預后相關lncRNA的Kaplan-Meier生存曲線

圖3 多變量Cox回歸模型中3個lncRNA森林圖
2.3 lncRNA預測模型的評估風險評分曲線(圖4)、生存狀態散點圖(圖4)顯示,隨著風險評分的增高,患者死亡率也增高。風險基因表達熱圖(圖4)顯示,MIR1-1HG、HOXC13-AS在高風險口底鱗癌患者中表達相對較高,而RAMP2-AS1在低風險口底鱗癌患者中表達相對較高。Kaplan-Meier生存分析結果顯示,高風險口底鱗癌患者的總生存率低于低風險口底鱗癌患者(P<0.001)(圖5)。ROC曲線顯示口底鱗癌預后相關lncRNA AUC為0.895,模型具有較好的靈敏度和特異度(圖6)。

A為風險評分點圖;B為生存時間點圖;C為lncRNA表達熱圖。圖4 風險評分與生存時間點圖及相關lncRNA表達熱圖

圖5 高、低風險組口底鱗癌患者的Kaplan-Meier生存分析

圖6 多變量Cox分析模型ROC曲線
口底區域解剖結構復雜,有豐富的淋巴管,相對口腔其他部位,該部位腫瘤更易淋巴結轉移[17],預后較口腔其他部位腫瘤差,患者生存質量及生存率均較低[18-19]。因此,口底鱗癌的早期篩查及早期干預至關重要。目前,TNM分期系統常用于臨床確定治療方案、評估治療效果及預后。然而,TNM分期僅考慮腫瘤的臨床特點,并未考慮腫瘤的分子特點,并不能精確反映腫瘤特征,尤其是早期腫瘤[20]。同一分期的腫瘤具有不同的進展正說明了這一點[4]。因此,急需尋找新的、有效的預后指標用于口底鱗癌患者預后評估及治療方案的指導。
隨著生物信息技術的發展,越來越多的研究人員開始關注lncRNA對腫瘤患者預后的意義。一些lncRNA具有組織特異性,在疾病發展過程中起著至關重要的作用。Zhang等[21]觀察到在胃癌中,lncRNA AOC4P可通過上皮-間質轉化促進腫瘤的發生和發展,進而促進胃癌不良預后。Bo等[22]的研究表明,lncRNA AFAP1-AS1在宮頸癌發生發展中發揮重要作用。Beltrán-Anaya等[23]的研究也證實lncRNA KLHDC7B的低表達與乳腺癌患者預后不良相關。
在本研究中,共篩選出138個差異lncRNA,其中40個上調lncRNA和98個下調lncRNA。通過單變量和多變量Cox回歸分析,構建了一個基于3-lncRNA的風險模型預測口底鱗癌患者的預后,該模型的一致性系數為0.77。風險分層及ROC曲線分析結果顯示,高風險組患者生存率及生存時間低于低風險組患者,ROC曲線下面積為0.895。這些表明,基于這3個lncRNA的風險預測模型具有很好的靈敏度和特異度,能為口底鱗癌患者提供一個很好的預測工具。
模型中3個lncRNA中僅HOXC13-AS、RAMP2-AS1在口底鱗癌及其他腫瘤中被研究過。Li等[24]研究表明,HOXC13-AS在乳腺癌中高表達,并通過miR-497-5p/PTEN通路促乳腺癌細胞增殖。一項鼻咽癌的研究表明,HOXC13-AS在鼻咽癌組織中高表達,并通過miR-383-3p/HMGA2通路促進鼻咽癌細胞增殖和侵襲[25]。在口腔鱗癌中,HOXC13-AS呈高表達,可作為競爭性內源RNA,通過miR-378g/HOXC13軸促進口腔鱗癌細胞增殖、侵襲及上皮-間質轉化形成[26]。本研究中HOXC13-AS風險系數大于0,且高表達HOXC13-AS組患者生存率低于低表達組患者,這些提示HOXC13-AS在口底鱗癌發生發展中起促進作用。在舌鱗狀細胞癌中,檢測舌鱗狀細胞癌中lncRNA表達,發現HOXC13-AS與患者預后呈負相關[27]。本研究中RAMP2-AS1風險系數小于0,且高表達RAMP2-AS1組患者生存率低于低表達組患者,提示RAMP2-AS1可抑制喉鱗癌發生發展。以上這些表明,本研究篩選出的lncRNA將為口底鱗癌研究提供新的生物指標。
本研究經過TCGA口底鱗癌表達譜數據庫的挖掘,篩選出差異表達lncRNA,并成功構建一個基于3個lncRNA的新的口底鱗癌風險預測模型,為口底鱗癌風險分層及臨床預后判斷提供幫助,并為基礎研究提供更多可供選擇的生物標志物。該模型僅包含3個lncRNA,在臨床應用中可操作性強。然而,一方面本研究納入患者相對較少,模型的預測能力仍需大量臨床試驗證據證實;另一方面,納入模型的lncRNA在口底鱗癌細胞及生物體內的功能尚不明確,其在口底鱗癌發生發展中起的作用尚缺乏實驗證據的支持,仍需進一步的功能實驗研究。