陳雪萍,劉 航,張陽麗,彭 健,吳 江,張玉洪,府偉靈
1.重慶醫科大學附屬第一醫院臨床分子醫學檢測中心,重慶 400042;2.重慶醫科大學生命科學院,重慶 400042;3.陸軍軍醫大學第一附屬醫院檢驗科,重慶 400038
胰腺癌被稱為癌中之王,放眼全球,胰腺癌都是最致命的癌癥之一[1-2]。 然而大多數胰腺癌患者在早期并沒有任何特殊的臨床癥狀,因此大多數胰腺癌患者都錯過了最佳的治療時期。在過去的40年中并沒有發現可以顯著提升胰腺癌患者生存率的方法。胰腺癌患者的5年生存率為5%~15%,總體生存率約為6%,且僅有20%患者可以進行手術切除[3]。因而早期診斷在胰腺癌防治過程中扮演著重要的角色。
目前胰腺癌的主要篩查診斷方法有超聲檢查、CT以及核磁共振,各自有優缺點。超聲檢查很難區分出惡性組織和非惡性組織;CT 和核磁共振也是診斷胰腺癌的輔助手段,目前也無法滿足胰腺癌早期篩查的臨床需求。除此之外,許多的腫瘤抗原也被用作胰腺癌診斷的相關指標。其中最有效和臨床應用最廣的生物標志物是CA19-9。然而CA19-9在機體具有其他炎癥的狀態下水平也會升高,特異性較低,這也限制了其作為胰腺癌術后檢測指標的應用發展[4-5]。目前還沒有有效且準確的生物標志物用于胰腺癌早期篩查和診斷。
miRNA是一類大小約為22 bp的非編碼單鏈RNA分子,它們在細胞增殖、蛋白質代謝和腫瘤形成等生理、病理過程中扮演著重要的功能。有研究報道miRNA參與實體瘤的發生、發展。在胰腺癌中,miRNA的上調或下調均與胰腺癌的進展過程密切相關[6]。
既往有研究表明,miR-21及其下游靶標在胰腺癌的細胞增殖、凋亡和細胞周期中起關鍵作用,miR-21可能是診斷胰腺癌的有潛力的生物標志物[7]。研究表明miR-25對早期胰腺癌的診斷靈敏度和特異度分別達到76%和93%[8]。miR-25有助于鑒別慢性胰腺炎與胰腺癌,這也大大增加miRNA在胰腺癌中的應用潛力,目前關于miR-25的臨床診斷效能評估也還在進行中。這些報告表明,miRNA有作為胰腺癌早期篩查指標的應用前景。然而,迄今為止,這些基于miRNA的研究均未進入臨床實踐,還需要更多的研究驗證。因此,篩選胰腺癌的血漿腫瘤標志物,對進一步分析其作用的靶基因與胰腺癌發生、發展的關系具有重要的臨床意義。
1.1一般資料 以“胰腺癌、miRNA、血漿”為關鍵詞檢索文獻,然后在NCBI數據庫GEO中進行檢索,按包含胰腺癌標本、其他腫瘤標本、良性胰腺疾病、膽道疾病標本及相應正常胰腺標本的基因芯片為標準,經過篩選,最終研究團隊使用了編號為GSE124158和GSE59856的基因芯片數據。
1.2方法
1.2.1顯著差異miRNA的篩選 首先,采用GEO數據庫所提供的基于R語言的在線分析軟件GEO2R,將編號為GSE59856的基因芯片數據分為胰腺癌與健康對照組、胰腺癌與良性疾病對照組、胰腺癌與其他癌癥對照組3個對照組進行初步篩選。然后,篩選標準|log2FC|≥1,經過初步的分析篩選,分別得出3個對照組胰腺癌組織差異表達的miRNA。接著,通過同樣的處理步驟將編號為GSE124158中的數據也分為同樣的3個對照組進行處理,設置相同的參數進行篩選,分別得到相應的胰腺癌組織差異表達的miRNA。進一步使用Venn diagram webtool分析,分別得到每個對照組中初步分析所得到的差異表達的miRNA的重疊部分,取每個重疊部分的交集,最后得到的重疊部分為顯著差異表達的miRNA。
1.2.2靶基因預測 將上一步分析所得到的顯著差異miRNA運用在線分析軟件DIANA tools進行靶基因的預測[9]。
1.2.3關鍵基因的GO功能及KEGG通路富集分析 采用DAVID和KOBAS3.0對預測獲得的靶基因開展GO/KEGG通路富集分析,以進一步分析靶基因對胰腺癌患者的作用部位及途徑。
1.2.4靶基因的蛋白質相互作用網絡的構建 通過STRING數據庫對上述預測得到的靶基因進行關鍵蛋白之間的相互作用關系分析,得到PPI相互作用圖,然后通過查詢相關的文獻,最后篩選出關鍵基因[10]。
1.2.5關鍵基因的TCGA驗證分析 將上述篩選分析得出的關鍵基因導入在線分析網站GEPIA、cBioPortal進行TCGA表達譜的分析,再通過查找相關的文獻驗證所篩選的關鍵基因與胰腺癌患者預后的相關性,進一步分析其在胰腺癌發生、進展及預后中的作用。
2.1差異表達miRNA篩選 本次研究篩選了兩個基因芯片(GSE59856、GSE124158)(表1)進行差異分析。在GSE59856中,得到胰腺癌與健康對照組內差異表達miRNA 21個,胰腺癌與其他癌癥對照組內差異表達miRNA 91個,胰腺癌與良性疾病對照組內差異表達miRNA 60個。在GSE124158中,胰腺癌與健康對照組中差異表達miRNA 1 877個,胰腺癌與其他癌癥對照組中差異表達miRNA 43個,胰腺癌與良性疾病對照組中差異表達miRNA 47個。再用GSE124158 的數據分別對GSE59856每個對照組的數據進行驗證,作VEEN圖,每個對照組分別得到13、9、6個差異表達miRNA(圖 1),最后取3個對照組數據的交集,最終得到miR-122-5p為顯著差異表達的miRNA。

表1 GEO數據庫胰腺癌基因芯片樣本(n)

圖1 VEEN分析
2.2差異表達miRNA的靶基因預測 為了闡明差異表達miRNA的生物學功能及其具體的作用機制及通路,將上一步分析所得到的差異表達miRNA運用在線數據庫DIANA tools和ENCORI預測miR-122-5p的靶基因,最終得到517個預測靶基因。
2.3差異表達miRNA的靶基因的GO富集和KEGG途徑分析 使用DAVID在線數據庫對517個靶基因的功能和通路進行富集分析。GO功能富集分析結果表明,靶基因在生物過程中主要參與膠原蛋白分解代謝、GTP酶活性的調節、細胞間黏附、RNA聚合酶Ⅱ啟動子轉錄的正調控、轉錄的正調控。細胞成分主要是聚集在細胞薄膜、細胞內區、細胞間黏附連接、細胞頂端質膜、細胞質膜、細胞表面。而分子功能主要與RNA聚合酶Ⅱ核心啟動子近端區序列特異性DNA結合、泛素連接酶E3結合域、金屬肽酶活性、鋅離子結合、金屬內肽酶活性、GTP酶活性有關。見表2。

表2 GO功能富集分析
KEGG的結果(圖 2)顯示,靶基因富集于抗原處理和呈遞、囊泡轉運中的相互作用、黏蛋白型O-聚糖生物合成、甲狀腺激素合成、自然殺傷細胞介導的細胞毒性、移植物抗宿主病、多巴胺能突觸、胰島素分泌、膽堿能突觸、糖基磷脂酰肌醇(GPI)-錨定物、心肌細胞腎上腺素能信號傳導、幽門螺桿菌的上皮細胞信號轉導、1型糖尿病的介導、AMPK信號通路、MAPK信號通路、黏著連接、心肌收縮、HIF-1信號通路、內吞作用等。

續表2 GO功能富集分析

圖2 KEGG通路富集分析
2.4從PPI網絡中篩選關鍵基因 通過將所預測的靶基因利用在線數據庫STRING進行數據挖掘及繪制,得到了蛋白質之間的互相作用關系圖。進一步通過相關文獻的查詢與篩查,篩選得出UBA52、ADAM10、CBL、VAMP3 這4個關鍵基因。然后將得到的結果導入到Cytoscape中,作出4個關鍵基因的互作圖 (圖3)。

圖3 關鍵基因互作圖
2.5TCGA驗證分析 將篩選所得的4個關鍵基因使用在線分析網站GEPIA、cBioPortal分析發現,與健康對照相比,胰腺癌患者體內UBA52、CBL、VAMP3、ADAM10的表達均遠遠高于健康人。然后在GEPIA、cBioPortal網站中分析得出胰腺癌患者的生存曲線(圖 4),發現與高表達VAMP3和ADAM10的胰腺癌患者相比,這2個基因低表達的患者總生存率更高(P<0.05)。UBA52和CBL的調節對胰腺癌患者的生存沒有影響(P>0.05)。

注:A和B分別為UBA52和CBL基因,兩基因與胰腺癌患者的總生存率無相關性;C和D分別為 VAMP3和ADAM10基因,兩基因與胰腺癌患者總生存率有關。
胰腺癌的臨床表現隱蔽,大多數胰腺癌患者在確診時已經處于晚期,因為癌細胞已經擴散并無法通過手術切除治療,晚期胰腺癌患者5年生存率低于5%,因此胰腺癌是惡性腫瘤中病死率最高的腫瘤之一。然而胰腺癌的早期診斷仍面臨巨大的挑戰。在本次研究中,筆者團隊通過NCBI的在線分析軟件GEO2R及VEEN對GSE59856的數據按照胰腺癌與健康對照組、胰腺癌與其他癌癥對照組、胰腺癌與良性疾病對照組進行在線分析,然后再用GSE124158的數據進行驗證,最后得出miR-122-5p這一明顯差異表達的miRNA,miR-122-5p在胰腺癌患者體內表達下降。此前有研究將健康人群、慢性胰腺炎患者與胰腺癌患者相比較,發現miR-122-5p在胰腺癌患者體內表達下降。這與既往的研究結果相符[11]。另外miR-122-5p可作為評估胰腺癌預后的標志物,即miR-122-5p血漿水平升高與胰腺癌患者預后較差之間具有一定的關聯性[12]。另有研究報道miR-122-5p通過直接靶向細胞周期蛋白1抑制了胰腺癌細胞的生長、侵襲和轉移[13]。因此,miR-122-5p可能是胰腺導管腺癌的治療靶標。
為繼續探索miR-122-5p在調節人胰腺癌進展過程中的作用機制,使用DIANA tools對miR-122-5p進行靶基因預測,得到517個靶基因。對關鍵基因的功能富集分析顯示,它們主要參與膠原蛋白分解代謝、GTP酶活性的調節、轉錄的調控等過程。以往有研究和證據表明,本文篩選出的靶基因的GO、KEGG富集通路在胰腺癌的進展過程中可能具有重要的功能。再運用結合 DAVID、STRING等生物信息數據庫以及查詢文獻進行篩選,最后得到UBA52、ADAM10、CBL、VAMP3這4個關鍵基因。這些關鍵基因在癌組織中的表達水平與正常胰腺組織相比顯著上調或下降。
對篩選到的這4個關鍵基因進行TCGA驗證分析,胰腺癌患者體內UBA52、ADAM10、CBL、VAMP3的表達均遠遠高于健康人。再驗證4個基因的預后價值,與高表達VAMP3、ADAM10的胰腺癌患者相比,這2個基因低表達的患者總體生存率更高(P<0.05)。而UBA52、CBL上調對胰腺癌患者生存無明顯影響(P>0.05)。有研究表明,VAMP3在胰腺癌細胞的外泌體分泌中發揮積極作用,其中VAMP3對于PVT1介導的外泌體分泌至關重要[14]。而胰腺癌組織中ADAM10表達比正常組織中更高。ADAM10沉默會顯著降低癌細胞的遷徙與轉移能力,但對正常細胞卻沒有影響[15]。然而目前這些關鍵基因在胰腺癌患者中的具體作用機制還不清楚,還需進一步研究。
綜上所述,本研究是基于生物信息學方法對胰腺癌患者血漿差異miRNA進行分析,由此篩選出miR-122-5p,并發現其具有作為胰腺癌診斷標志物的潛力。通過數據庫驗證,miR-122-5p作用的關鍵靶基因VAMP3、ADAM10在胰腺癌組織中差異表達,可能與胰腺癌的侵襲與轉移相關。但上述miRNA及其靶基因與胰腺癌的相關性還需要進一步的大量臨床樣本和隨訪數據驗證。