池宏波 楊英梅
結直腸癌是全球第三大常見的惡性腫瘤,是癌癥相關性死亡的第二大主要原因,嚴重威脅人類的生命健康[1-2]。由于缺乏有效的早期診斷標志物,大多數患者在診斷時已處于中晚期,臨床預后差[3]。因此,迫切需要了解結直腸癌的發病機制,尋找新的早期診斷標志物和治療靶點。外泌體作為穩定的介導細胞間物質交換及細胞通訊的重要媒介,在癌癥中的作用越來越被關注[4]。研究表明,腫瘤來源的外泌體在腫瘤細胞間發揮信息傳導的作用,可通過轉運和交換其包裹的眾多異常表達的生物活性物質,如長鏈非編碼RNA(long non-coding RNA,lncRNA)、環狀 RNA(circular RNA,circRNA)、微小 RNA(micro RNA,miRNA)、信使 RNA(messenger RNA,mRNA)、脂質和蛋白質等,影響腫瘤細胞的生物學功能,從而促進包括結直腸癌在內的多種腫瘤的發生、發展[5-7]。本研究擬通過生物信息學方法對結直腸癌患者和正常對照者血液外泌體中的差異表達非編碼RNAs(non-coding RNAs,ncRNAs)和mRNAs進行篩選,構建差異表達基因的競爭性內源RNA(competing endogenous RNA,ceRNA)網絡,并對差異表達mRNAs進行生物學功能和癌相關信號通路分析,探索結直腸癌的發生、發展機制,為結直腸癌的診斷和治療提供理論依據。
1.1 材料 從exoRBase數據庫(http://www.exorbase.org/)中下載結直腸癌患者和正常對照者血液外泌體的RNA-seq數據。該數據庫包括12例結直腸癌患者和32例正常對照者的血液樣本。
1.2 篩選血液外泌體差異表達mRNAs和ncRNAs 應用R軟件的Limma包篩選結直腸癌患者和正常對照者血液外泌體中的差異表達lncRNAs、circRNAs和mRNAs。以P<0.05為篩選標準。利用R軟件的pheatmap包繪制熱圖,對差異基因進行可視化。
1.3 構建 ceRNA網絡 應用 miRcode(http://www.mircode.org/index.php)預測lncRNA結合的 miRNA;應用starBase(http://starbase.sysu.edu.cn/)數據庫預測 circRNA結合的miRNA;應用TargetScan(http://www.targetscan.org/)和 miRanda(http://www.microrna.org/nicrorna/home.do)預測mRNA結合的共同miRNA。lncRNA或circRNA結合的miRNA與mRNA結合的miRNA取交集,以miRNA為中心構建ceRNA網絡,應用cytoscape3.8.0軟件進行可視化構圖。
1.4 差異mRNAs的富集分析 應用R軟件的clusterProfiler包和enrichplot包對ceRNA網絡中的差異表達mRNAs進行基因本體論(gene ontology,GO)功能富集和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。
2.1 外泌體差異表達mRNAs和ncRNAs篩選 通過對結直腸癌患者和正常對照者血液外泌體的差異表達基因進行篩選,共篩選出125個差異表達mRNAs,其中上調表達117個,下調表達8個,見圖1a(插頁);52個差異表達lncRNAs,均為上調表達,見圖1b(插頁);81個差異表達circRNAs,其中上調表達47個,下調表達34個,見圖1c(插頁)。

圖1 結直腸癌患者與正常對照血液外泌體差異表達基因篩選(a:外泌體差異表達mRNAs;b:外泌體差異表達lncRNAs;c:外泌體差異表達circRNAs)
2.2 ceRNA網絡構建 TargetScan和miRanda預測的mRNA結合的 miRNAs有 121個,miRcode預測的lncRNA結合的miRNAs有193個,starBase數據庫預測circRNA結合的miRNAs有266個。lncRNA或circRNA結合的miRNAs與mRNA結合的miRNAs取交集,構建結直腸癌相關的ceRNA網絡。該ceRNA網絡包含 16個 lncRNAs、13個 circRNAs、62個 miRNAs和 25個 mRNAs,見圖 2(插頁)。

圖2 結直腸癌相關的ceRNA調控網絡
2.3 差異mRNAs的生物學功能及信號通路富集分析 對ceRNA調控網絡中25個差異表達mRNAs進行GO功能富集分析和KEGG通路富集分析。GO富集分析顯示,差異mRNAs主要富集于順面高爾基網,高爾基扁平囊和高爾基膜囊等細胞成分(CC)上,參與Ran GTP酶結合的分子功能(MF),涉及高爾基體合成等生物過程(BP)(見圖3a,插頁)。KEGG通路富集分析顯示:差異mRNAs顯著富集于絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號通路、胰高血糖素信號通路、Fcγ受體介導的吞噬作用等(見圖 3b,插頁)。

圖3 差異表達mRNAs的功能及通路富集分析(a:GO;b:KEGG)
外泌體是一群直徑在30~100 nm之間的雙層膜結構的囊性小泡,可作為穩定的細胞間信息通訊的載體[8]。研究表明,腫瘤釋放的外泌體通過近分泌,膜融合、配體-受體結合,吞噬等方式進入受體細胞,轉移和交換其包裹的致癌分子,包括lncRNA、circRNA、miRNA和mRNA等,在腫瘤細胞間的通訊中發揮關鍵作用,從而參與腫瘤的發生、增殖、轉移、血管生成、免疫逃逸和耐藥性[9-11]。隨著高通量測序技術及生物信息學技術的發展,外泌體內ncRNA的表達譜被廣泛研究。然而,其在結直腸癌中的具體表達模式及具體的分子機制仍需進一步的探索。
本研究主要通過生物信息學方法對exoRBase數據庫中12例結直腸癌患者和32例正常對照血液外泌體的RNA-seq數據進行分析,共篩選出125個差異表達mRNAs,上調表達117個,下調表達8個;52個差異表達lncRNAs,均為上調表達52個;81個差異表達circRNAs,上調表達47個,下調表達34個。本研究表明,結直腸癌患者和正常對照者的血液外泌體ncRNAs顯示出不同的基因表達模式。這些差異表達的ncRNAs在結腸癌患者血液外泌體中富集且性質穩定,有望于成為結直腸癌患者早期無創診斷和預后標志物。此外,外泌體為基礎的液體活檢是未來腫瘤分子診斷的發展方向。
近年來,ceRNA假說引起人們的關注,已成為研究RNA相互作用的熱點之一。mRNA、miRNA、lncRNA或circRNA間的調控機制極其復雜,具有重要的生物學意義。lncRNA或circRNA可與mRNA競爭結合miRNA,從而形成復雜的lncRNA-miRNA-mRNA網絡或circRNA-miRNA-mRNA網絡,而ceRNA調控網絡的失衡可導致腫瘤的發生、發展[12]。Shang等[13]研究發現,腫瘤來源的外泌體circPACRGL作為miR-142-3p/miR-506-3p的海綿分子,促進TGF-β1的表達,從而促進結腸癌細胞的增殖、遷移、侵襲及N1向N2中性粒細胞的分化。Wu等[14]研究表明,LNC473-miR574/miR15b-APAF1 IRES信號軸可調控結直腸癌細胞的增殖和凋亡,進而影響結直腸癌的發生、發展。本研究通過生物信息學構建了一個以miRNAs為中心的ceRNA調控網絡,包含16個lncRNAs、13個 circRNAs、62個miRNAs和25個mRNAs,顯示了結直腸癌潛在的lncRNA-miRNA-mRNA和circRNA-miRNA-mRNA調控機制,為進一步探索結腸癌的發病機制指明方向。此外,ceRNA網絡中的差異表達mRNAs進行GO功能及KEGG通路富集分析顯示,差異mRNAs顯著富集于MAPK信號通路。MAPK信號通路主要參與細胞的增殖、分化和凋亡等多種生物學過程,MAPK信號通路的異常活化與腫瘤的增殖、凋亡、侵襲、轉移及血管生成密切相關[15]。此外,差異mRNAs亦涉及Fcγ受體介導的吞噬作用、胰高血糖素信號通路等,提示其還可能與炎癥反應及血糖調控等有關。基于此,筆者可以初步闡明結直腸癌發生、發展的分子機制,為結直腸癌的早期診斷和預后提供潛在生物標志物,為結直腸癌的精準治療提供新的潛在靶點。
綜上所述,本研究采用生物信息學方法篩選結腸癌組和正常對照組血液外泌體差異表達基因,構建以miRNA為中心的ceRNA網絡,同時探索其分子生物學功能,初步闡明結直腸癌發生、發展及預后復發的作用機制。后續筆者將進一步通過體內、體外實驗及臨床研究從細胞、整體及分子水平全面闡明結直腸癌的具體發病機制,以期為結直腸癌的早期診斷提供新型無創的分子標志物,為結直腸癌的治療提供新的靶點,改善患者預后。