白雪,賀平
結腸直腸癌(carcinoma of colon and rectum,CRC)是肛腸外科常見的惡性腫瘤,發病率居惡性腫瘤的第3位,死亡率排名第2[1-2]。CRC的發生、發展涉及癌基因激活、腫瘤抑制基因表達缺失和甲基化等遺傳改變[3]。鼠類肉瘤病毒癌基因RAS突變腫瘤占人類所有惡性腫瘤的30%,其中K-RAS作為RAS基因家族中的主要亞型,在CRC中起著重要作用[4]。長鏈非編碼RNA(long non-coding RNA,LncRNA)是指長度>200 個核苷酸的轉錄本,不含蛋白質編碼序列,以往被認為是“垃圾基因”[5]。基因間長鏈非編碼RNA(intergenic long non-coding RNA,lincRNA)是最大類的LncRNA 分子。許多研究報道lincRNA具有抑制或促進腫瘤的作用[6]。近年來隨著基因芯片和測序技術的應用,公共數據庫中存儲了大量的測序數據。整合分析這些數據可以為新研究提供有價值的線索。本研究通過分析癌癥基因組圖譜(the cancer genome atlas,TCGA)中有關CRC 的RNA-Seq公共數據和臨床數據,鑒定K-RAS突變相關的CRC中與生存率相關的關鍵lincRNA,旨在為K-RAS突變CRC提供新的預后標志物。
1.1 數據來源 從TCGA 網站(http://www.tcga.org)下載有關CRC 的RNA-Seq 測序數據,包括每千堿基百萬個片段(fragments per kilobase million,FPKM)、拷貝數變異(copy number variation,CNV)和臨床數據[7]。RNA-Seq 數據包括585 個CRC 和51 個正常組織樣本。所有腫瘤樣本均為人源實體瘤。
1.2 CRC 差異表達lincRNA 篩選 提取腫瘤和正常組織樣本中lincRNA 的表達水平數據,導入R3.6.1 軟件后篩選CRC和正常組織樣本間差異表達的lincRNA。CRC和正常組織相比,lincRNA 對數轉換倍數變化|log2(FC)|≥1 且錯誤發現率(false discovery rate,FDR)≤0.05 定義為差異表達lincRNA。CRC 樣本中每百萬reads 中來自于某基因FPKM≥1 表示為lincRNA上調,<1表示為lincRNA下調[8]。
1.3K-RAS突變CRC 患者關鍵lincRNA 的篩選 為了檢查篩選出的lincRNA 是否與K-RAS突變CRC 患者的生存率相關,分析TCGA 數據集中585 例CRC 患者的10 年和5 年總生存期(overall survival,OS)數據。將其中466 個10 年OS 數據與RNA-Seq 樣本進行了匹配,將432個5年OS數據與RNASeq 樣本進行匹配。采用受試者工作特征(receiver operating characteristic,ROC)曲線分析lincRNA 表達水平對K-RAS野生型或突變型5 年和10 年生存率的預測價值。其中曲線下面積(AUC)值大于0.6,且P<0.05 認定為有預測價值的lincRNA[9]。
1.4K-RAS突變相關lincRNAs對CRC患者生存率的影響分析 利用篩選到的關鍵lincRNA 和預后結果繪制生存曲線。通過GraphPad Prism 8 軟件進行Kaplan-Meier 生存曲線和對數秩檢驗評估關鍵lincRNA表達對患者生存率的影響。
1.5 關鍵lincRNA 表達與臨床特征的關系 收集CRC 患者的性別、年齡、臨床分期、原發腫瘤(T)分期、區域淋巴結(N)分期和遠處轉移(M)分期等臨床資料,比較不同臨床特征患者關鍵lincRNA的表達差異。
1.6 統計學方法 用R3.6.1 軟件進行差異lincRNA 基因的篩選。符合正態分布的計量資料采用均數±標準差()表示,多組間比較采用方差分析,2 組間比較采用t檢驗。P<0.05表示差異有統計學意義。
2.1 在CRC中鑒定出顯著失調的lincRNAs 585個癌組織和51 個正常組織樣品的RNA-Seq 數據中共獲得6 452個lincRNA,比較后發現125個差異表達,其中85 個表達上調,40 個表達下調(圖1)。上調表達和下調表達前10個lincRNA的具體信息見表1。

Fig.1 Disordered lincRNA scatter plot in cancerous tissue圖1 癌組織中差異表達的lincRNA散點圖
2.2K-RAS突變CRC 生存率相關lincRNA 的篩選結果 通過ROC曲線分析,共篩選出12個在K-RAS突變CRC 患者中差異表達的lincRNA,但在K-RAS野生型中差異無統計學意義(P>0.05),見圖2。其中lincRNAAL390719.2表達水平預測5 年生存率的AUC=0.627,10 年生存率的AUC=0.634,預測價值最高,故選其作為關鍵lincRNA。
2.3K-RAS突 變/野 生 型 中lincRNAAL390719.2表達與CRC 患者生存率的關系 生存分析結果顯示,在K-RAS突變型中lincRNAAL390719.2表達與患者10 年 生 存 率(Log-rankχ2=10.740,HR=3.255,P=0.002)和5 年 生 存 率(Log-rankχ2=11.720,HR=3.142,P=0.001)有關,在K-RAS野生型中lincRNAAL390719.2表達與患者生存率無關(10年:Log-rankχ2=1.400,HR=0.822,P=0.221;5 年:Log-rankχ2=1.997,HR=0.774,P=0.086)。見圖3。

Tab.1 Top 10 lincRNA messages for up-and downregulated expressions表1 上調表達和下調表達的前10個lincRNA信息
2.4 lincRNAAL390719.2表達與CRC患者臨床特征的關系 lincRNAAL390719.2在不同臨床分期、N分期和M分期中的表達差異有統計學意義(P<0.05),高表達lincRNAAL390719.2的患者臨床分期較晚,容易出現淋巴結轉移和遠處轉移;在不同年齡、性別和T分期中表達差異無統計學意義。見表2。
近年來,對CRC 形成、發展原因和潛在機制的研究越來越多,但腫瘤的發生發展是一個多因素、多階段及多基因調控的過程,徹底了解遺傳因素在CRC 發生發展中的作用,需要大規模的研究。目前大多數研究都來自單個隊列研究,尚未發現CRC 的可靠生物標志物。綜合生物信息學分析方法解決了這些局限,測序深度和閱讀長度的快速增加大大提高了轉錄物重建的準確性[7,10]。
目前已有多個研究評估了K-RAS突變對CRC患者預后的影響,但結果仍存爭議。Rui 等[11]的一項Meta 分析認為K-RAS基因與腫瘤分化程度和部位等無關。而另有研究認為K-RAS基因的突變與CRC 高分化程度、黏液化成分及低淋巴結轉移率相關[12-13]。近年來,轉錄組重建技術的進步使得從短讀取RNA-Seq 數據中鑒定和表征數千種新的lincRNA 成為可能[14-15]。已有證據表明lincRNA 在染色體結構、染色質調節和表觀遺傳修飾、轉錄、RNA成熟剪接和翻譯等過程中發揮作用[16-17]。與其他類型的非編碼RNA(noncoding RNA,ncRNA)相反,lincRNA 定位于細胞質和細胞核中,這進一步表明它們在表觀遺傳修飾和基因調控中的重要作用。

Fig.2 Prognostic-related key lincRNA screening in K-RAS mutant and wild-type CRC圖2 K-RAS突變型和野生型CRC中與生存率相關的關鍵lincRNA篩選

Fig.3 Correlation between expression of lincRNA AL390719.2 and mutant/wild CRC圖3 lincRNA AL390719.2的表達與K-RAS突變/野生型CRC生存率相關性分析
本研究鑒定出12 個在K-RAS突變CRC 患者中差異表達的lincRNA。這些lincRNA 在原發性CRC腫瘤中均過表達,此外,這12 個lincRNA 是K-RAS突變體中的獨立預后標志物。本研究使用穩態生存模型從12個lincRNA中鑒定出1個關鍵的lincRNA:AL390719.2。目前有關lincRNAAL390719.2的報道較少。本研究表明lincRNAAL390719.2在CRC中高表達。此外,lincRNAAL390719.2表達與K-RAS突變的CRC 的5年和10年生存有關,但是在野生型中其表達與生存率無關。因此,lincRNAAL390719.2可能作為K-RAS突變CRC的關鍵預后lincRNA。
Tab.2 The relationship between the lincRNA AL390719.2 expression and clinical features in CRC patients表2 CRC患者臨床特征與lincRNA AL390719.2的表達關系

Tab.2 The relationship between the lincRNA AL390719.2 expression and clinical features in CRC patients表2 CRC患者臨床特征與lincRNA AL390719.2的表達關系
*P<0.05,**P<0.01
臨床特征年齡(歲)≤40 40~60>60性別n lincRNA AL390719.2表達F或t 43 105 437 2.05±1.17 2.26±1.42 2.45±1.32 2.355男女287 298 2.27±1.25 2.32±1.36 0.463臨床分期Ⅰ/Ⅱ期Ⅲ/Ⅳ期T分期T1/T2 T3/T4 N分期N0 N1/N2 M分期M0 M1 325 260 2.02±1.28 2.40±1.55 3.245**124 461 2.09±1.35 2.24±1.44 0.998 335 250 2.07±1.32 2.39±1.53 2.831*448 137 2.10±1.35 2.49±1.64 2.367*
綜上所述,本研究發現K-RAS突變的CRC中12個lincRNAs 表達上調,其中lincRNAAL390719.2可能是K-RAS突變CRC 患者的預后標志物和治療靶點。