劉璇,龔培賢,劉金瑋,孫濤,范正軍
(鄭州大學第一附屬醫院 肝膽外科,河南 鄭州 450052)
肝細胞癌(hepatocellular carcinoma,HCC)是原發性肝癌的最常見的病理類型,病死率居全球第2位,居我國第3位。HCC的致病原因較多,但肝炎病毒,尤其是乙型肝炎病毒(hepatitis B,HBV)與HCC的發生發展密切相關。我國HBV的流行率為18%,HCC確診病例中,約85%的患者合并HBV。
隨著影像技術的發展,肝癌的早期發現、早期診斷和早期治療情況有所改善,加之肝癌的病程、診斷和治療概念得以更新,肝癌外科手術切除率提高、死亡率下降,術后1、3、5 a生存率分別為88.1%、71.9%和60.0%。但我國肝癌患者多合并慢性肝炎和肝硬化,肝功能代償能力差,術后復發率約50%,預后較差。另外,HCC起病隱匿,早期無明顯臨床表現,多數患者確診時已為中晚期,錯過了最佳治療時機,只能接受姑息性綜合治療以緩解癥狀、提高生活質量,總體預后極差。因此,尋找新的肝癌生物標志物對提高HCC早期診斷率和促進預后十分重要。
RNA結合蛋白(RNA-binding protein,RBP)是一類伴隨RNA調控與代謝過程的與RNA相結合的蛋白質總稱,其在基因的轉錄后調控中起著關鍵作用。通過全基因組篩選,已在人類基因組中鑒定出1 500多個RBP基因,幾乎所有的RBP直接或間接地參與人體內蛋白質的生物合成。RBP通過各種途徑來維持細胞生理的穩態,特別是在發育和應激反應中。傳統RBS的功能取決于它們與靶RNA的結合和核糖核蛋白復合物的形成,而這些復合物和RNA的合成、加工和翻譯等生物學行為相關。許多研究已經明確RBP參與人類惡性腫瘤的發生和發展[1],并與患者預后密切相關[2]。但RBP在HCC中的研究并不成熟,為了探究RBP在HCC發生發展中的作用,從癌癥基因組圖譜數據庫(the Cancer Genome Atlas,TCGA)下載HCCRNA序列數據,通過生物信息學分析,借助相關軟件篩選獨立影響HCC患者預后的RBP,并構建預后模型,以期為肝癌的診療及預后評估提供新的觀點。
1.1 資料通過TCGA數據庫,下載50例正常肝組織和374例HCC肝組織的RNA測序數據集以及相應的臨床數據。
1.2 方法借助R軟件處理數據,利用LIMMA軟件包找出正常肝組織和HCC組織中差異表達的RBP相關基因,通過STRING數據庫構建差異RBP蛋白質互作網絡。
1.3 統計學方法采用Strawberry Perl語言和R語言處理數據,應用Wilcox秩檢驗篩選差異表達RBP,單因素分析應用檢驗分析得出結果,應用logistic回歸模型分析所得到的HCC預后相關RBP,進而得出獨立影響HCC預后的RBP,利用R軟件在多因素聯合的基礎上構建預后模型,應用Kaplan-Meier法和Log-rank檢驗進行生存分析。P<0.05表示差異有統計學意義。
2.1 HCC患者正常組織和腫瘤組織中差異表達的RBP識別借助R軟件,得出正常肝臟組織和HCC組織中差異表達的1 317個RBP,其中325個RBP滿足篩查標準,上調RBP 203個,下調RBP 122個。
2.2 蛋白質互作網絡構建通過STRING數據庫,基于2.1得到的325個RBP構建蛋白質互作網絡,刪除孤立RBP,得到305個相互聯系RBP。
2.3 預后相關RBP的篩選及預后模型的構建基于2.2中得到的305個差異表達RBP,進行單因素Cox回歸分析,共篩選出46個與HCC預后顯著相關的RBP(圖1A)。所有樣本隨機分為建模組和驗證組。針對建模組,將46個RBP進行多因素Cox回歸分析,最終得到EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1 5個HCC獨立預后RBP(圖1B,表1)。基于不同樣本中這5個RBP的表達量,計算所有樣本風險分數,計算公式為:
S=(-0.713 21×φEIF2AK4)+(0.808 75×φPRKDC)+(-0.210 47×φDHX37)+(-0.379 71×φINTS8)+(0.426 27×φEEF1E1)。
式中:S為風險分數;φ為蛋白表達量。

A.單因素分析;B.多因素分析

表1 多因素Cox回歸分析
2.4 模型預后評估能力分析根據所有樣本風險值的中位值,將建模組樣本和驗證組樣本分為高風險和低風險兩組。生存分析結果顯示,無論是建模組還是驗證組,高風險組患者預后均差于低風險組患者(圖2A、C),另外,受試者工作曲線(圖2B、D)顯示,建模組中曲線下面積為0.710,驗證組中曲線下面積為0.660。
2.5 模型獨立預后分析將模型風險分數和臨床相關因素匯總進行單因素Cox回歸分析,只有風險分數和T分期差異具有統計學意義(圖3A),將分級、T、N、M分期和風險分數一并納入多因素Cox回歸分析之中,風險分數和T分期是HCC患者獨立預后因素(圖3B)。

A、B.建模組;C、D.驗證組

A.單因素;B.多因素
2.6 模型相關列線圖的繪制根據預后模型中每個RBP回歸系數大小,繪制列線圖(圖4),能準確預估患者1、3、5 a的生存率。

圖4 模型相關列線圖
正常細胞發揮作用是通過一套完整的、較復雜的調控機制來完成的,包括表觀遺傳修飾、RNA轉錄后修飾和蛋白質組的轉錄后修飾。越來越多證據表明RNA轉錄后修飾和腫瘤的發生密切相關。RBP是一類能夠結合單鏈或雙鏈RNA并參與形成核糖核蛋白復合物的蛋白質。這些蛋白質影響RNA的結構和相互作用,并在其生物發生、穩定性、功能、轉運和細胞定位中發揮關鍵作用。當RBP基因表達上調或者下調時,可導致正常細胞轉錄組和蛋白質表達組的全基因組改變,進而影響細胞的生長、增殖、侵襲和死亡。
為了研究RBP在HCC發生發展中的作用,從TCGA數據庫下載50例正常肝臟組織樣本和374例HCC組織樣本的RNA測序數據集以及相應的臨床數據,提取所有樣本的RBP表達量。借助R軟件,最終得到305個在正常肝臟組織和HCC組織差異表達的RBP相關基因。經過篩選,得到EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1為獨立影響HCC預后的RBP。PRKDC是DNA依賴性蛋白激酶的一個亞基,它參與DNA雙鏈斷裂的修復過程[3-4],屬于磷脂酰肌醇-3-激酶家族成員。當DNA發生斷裂時,PRKDC被激活,并且形成具有DNA結合作用的DNAPK復合物,觸發非同源末端連接DNA修復行為[5]。DHX37是一種高度保守的RNA解旋酶,參與核糖體的生物合成,同時也是CD8 T細胞的功能調節劑[6],可能是腫瘤免疫治療的潛在靶標。INTS8是整合體復合物家族成員,參與腫瘤的發生和發展。Tong等[7]研究發現,在HCC中,INTS8通過上調TGF-β信號通路來加速EMT[8]過程,并且證明INTS8在腫瘤組織中高表達,而且和腫瘤的侵襲轉移以及預后有關。EEF1E1屬于真核生物延伸因子復合物家族,參與基因表達的翻譯過程,Kim等[9]研究發現,在胃癌和大腸癌中,EEF1E1表達下調,并且可能是胃癌和大腸癌的抑癌基因。EIF2AK4屬于真核翻譯起始因子2α激酶家族,當細胞缺乏必需氨基酸時,EIF2AK4被激活,抑制翻譯過程[10],從而避免出現異常翻譯。前文已有所述,RBP通過表達上調或下調,影響細胞的生長、增殖、侵襲和死亡,未來可以通過靶向調節RBP的表達來實現HCC的診斷和治療。
通過5個具有獨立預后能力的RBP,構建的預后模型,無論是在建模組還是驗證組,風險分數均和預后相關,而且高風險組預后明顯差于低風險組,說明模型具有一定的預測預后能力。在單因素Cox回歸分析中,只有風險分數和T分期差異具有統計學意義,結合臨床實際,將分級、T、N、M分期和風險分數一并納入多因素Cox回歸分析之中,發現風險分數和T分期是獨立影響HCC患者預后的因素,說明所建模型能實現獨立預后分析。在受試者工作曲線中,建模組曲線下面積為0.71,驗證組曲線下面積為0.66,說明模型具有良好的診斷與預后能力。另外,通過列線圖較準確的預估患者1、3、5 a的存活率,可輔助臨床醫生對HCC患者進行個體化治療。但此項研究仍有不足,首先,基于TCGA數據庫構建的預后模型,雖然在TCGA數據庫內部驗證中取得了較理想的結果,但未在其他數據庫中進行驗證;其次,本項研究是在回顧性分析的基礎上設計和進行的,未來需要進行前瞻性研究進一步來驗證結果的準確性。
綜上所述,本研究通過生物信息學方法,較系統地探討了RBP在HCC表達及預后中的價值,篩選出EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1具有獨立預后能力的RBP,并構建了預后模型。該模型具有良好的HCC鑒別與診斷能力。本研究有助于揭示HCC的發病機制,為開發新的治療靶點和分子標志物提供參考。