呂燕萍,吳傳城,楊雙鳳,何陳周,韓仁杰,顏 偉,劉寶英,
(1.福建醫科大學公共衛生學院,福建 福州350108;2.福建省莆田市仙游縣總醫院,福建莆田 351200)
胃癌是全球范圍內死亡率最高的消化道腫瘤,美國癌癥學會最新數據表明,2018年全球胃癌新發病例100萬,死亡病例約78.3萬[1]。我國是胃癌大國,前期研究發現福建省仙游縣2014~2018 年全死因調查發現胃癌死亡率居惡性腫瘤死亡率之首,達36.20/10 萬,明顯高于全國一般水平(21.48/10萬)。因此,迫切需要尋找有效的生物標志物去準確診斷和精準預測胃癌預后,切實降低胃癌的發病率和死亡率。
微小RNA(microRNA,miRNA)是一類高度保守的、長度為16~29 nt的內源性非編碼小RNA,大量研究發現其異常表達可影響癌基因表達及癌細胞增殖、轉移和侵襲能力、促進化療耐藥等,有望成為胃癌的生物標志物及預后指標之一[2-5]。單核苷酸多態性(single nucleotide polymorphisms,SNPs)是主要遺傳因素之一,miRNA 及其相關基因的SNPs 可能會影響miRNA的調控作用進而改變癌癥的進展,產生不同的致癌作用[6]。miRNA 及其相關基因SNPs 數量多,涉及范圍廣,其中主要包括miRNA 自身、miRNA 靶序列、miRNA 生物合成通路基因以及其他相關的SNPs 位點。前期研究已發現,miRNA靶序列EGFR基因3′非翻譯區的rs884225 多態性位點與賁門癌發生存在關聯,可能是胃癌患者的特異性生物標志物[7-8]。然而目前關于miRNA及其相關基因SNPs與胃癌病人預后的相關性研究還較少,研究范圍也較窄,具體的機制也還不甚了解。本研究通過Affymetrix公司SNP芯片結合生物信息學分析全面系統的挖掘與胃癌關系密切的差異miRNA相關SNPs,采用病例-病例研究進一步探討胃癌差異表達的miRNA及其相關基因SNPs與胃癌預后的相關性。
胃癌病例來源于福建省仙游縣醫院的胃癌新發病例。病例組納入標準為:經手術或內窺鏡取得組織標本,經病理確診的新發病例;確診日期為2013年4月—2014年3月;在仙游本地居住10年以上。芯片組納入標準是在此基礎上選擇男性,年齡50~70 歲之間,經病理確診為胃腺癌的患者。排除標準:經病理確診為胃部炎癥、良性病變及病情危重或不能清晰回答問題者及腫瘤繼發病例和復發病例。芯片健康對照組納入標準:按性別、年齡、地區與病例進行配對,選擇年齡±3 歲、在仙游本地居住10 年以上者與病例進行配對。排除標準為:胃癌或慢性萎縮性胃炎的直系家屬。
以上研究對象均簽署了知情同意書,采集5 mL外周血,EDTA 抗凝,研究通過福建醫科大學生物醫學研究倫理委員會的審查及批準。最后SNP芯片篩選階段我們納入96 例胃癌患者和96 例對照,均為男性,年齡分布在52~71 歲之間。其中病例組平均年齡(63.8±4.6)歲,對照組平均年齡(63.8±4.7)歲。
所采集的外周血由Affymetrix 公司提取基因組DNA,抽取的血樣置于EDTA 抗凝管,3 000 r/min離心10 min 后,分裝成血漿、白細胞、紅細胞,置-80 ℃低溫冰箱保存。
本研究基于Axiom?2.0 Precision Medicine Research Array(PMRA 芯片)、生物信息學方法以及公用數據庫全面系統挖掘胃癌差異表達的miRNA相關SNPs。
1.3.1 miRNA 自身多態性位點選擇以SNP 芯片注釋數據庫為基礎,篩選出所有miRNA 相關的SNPs 位點并進行卡方檢驗,選取病例組和對照組中表達差異有統計學意義(P<0.05)的位點。進一步將篩選出的miRNA SNPs 位點逐一在單核苷酸多態性數據庫(dbSNP)(https://www.ncbi.nlm.nih.gov/snp/)查詢對應位點是否明確注釋為miRNA自身SNPs。
1.3.2 miRNA 靶基因多態性位點選擇進入MirSNP數據門戶主頁(http://bioinfo.bjmu.edu.cn/mirsnp/download/),選擇“MirSNPInTarget.txt”,將含有miRNA靶基因SNPs的數據匯總,與芯片數據取交集,最后選取其中病例組和對照組中表達差異有統計學意義(P<0.05)的位點。
1.3.3 miRNA 合成通路基因多態性位點選擇針對miRNA 合成通路涉及的11 個主要基因(DROSHA、DGCRB、XPOS、RAN、DICER、TRBP、AGO1、AGO2、GEMIN3、GEMIN4、HIWI),利用dbSNP數據庫選取這些基因功能性SNPs,納入位點條件如下:①編碼區SNP(同義突變的SNP 和錯義突變SNP)和調控區域SNP(5′側翼區、5′UTR 和 3′UT);②中國人群最小等位基因頻率(minor allele frequency,MAF)在 0.05~0.45 之間。與芯片數據取交集,并根據在病例組和對照組中表達是否有差異,篩選出差異具有統計學意義(P<0.05)的SNPs。
1.3.4 二次篩選將上述篩檢出的miRNA 自身SNPs、 miRNA 靶 序 列 SNPs 及 miRNA 合 成 通 路 相 關SNPs再結合文獻報道和生物信息學分析,進一步篩選與胃癌關系最密切的miRNA-SNPs,篩選條件為:①根據dbSNP 數據庫查找各SNPs 位點在中國人群中的MAF,選擇MAF 范圍在0.15~0.40 之間的位點;②結合PubMed 網站篩選與消化道腫瘤相關的位點,并根據功能性單核苷酸多態性數據庫(F-SNP)網站篩選有相應功能的位點。
將篩選得到的11 個SNPs 位點進行基因分型,使用 Sequenom 公 司 Genotyping Tools 及 MassARRAY Assay Design 軟件設計待測SNP 位點的PCR 擴增引物及單堿基延伸引物。通過基質輔助激光解吸附電離飛行時間質譜分析質譜技術(MALDI-TOF-MS),檢測延伸產物相對分子質量,應用專用的分析軟件,通過判斷分子大小的差異而進行SNP的基因分型檢測。
采用統一編制的調查表,由經過培訓并且考察合格的當地醫生對胃癌患者或(和)家屬解釋調查目的,取得病人家屬的同意后,進行面對面的訪談式調查。調查內容主要包括患者的病情和治療情況,如病理類型、大體分型、TNM分期、治療措施等;生活質量情況,如吸煙、喝酒、飲茶、睡眠、康復鍛煉等;飲食習慣,如飲食量、次數、飲食結構、使用腌制食品等。如患者已死亡,則由家屬配合調查。
基因型的檢測與判讀采用盲法。現場流行病學調查通過統一培訓調查員、制作調查員手冊、嚴格審核調查員;資料整理通過復核、雙錄入、邏輯糾錯、一致性檢驗、隨訪復查、數據分層分析、調整等方式來控制混雜因素對研究結果的影響。此外,本研究的患者病例資料來自醫院病案室存檔信息,由醫院病理科主任協助判定病理結果。
采用統計學軟件SPSS 24.0 進行統計學分析,利用壽命表法得出同一多態性位點不同基因型第1、3、5 年的生存率,通過Kaplan-Meier 法取得同一位點不同基因型患者的中位生存時間(中位生存時間),logrank 檢測法主要用于對比兩個或多個基因模型對胃癌預后的影響,單因素和多因素COX回歸分析用于計算風險比(hazard rate,HR)及其95%置信區間(95%confidence intervals,95%CI)以及調整混雜因素。聯合分層分析時,將胃癌患者按照年齡和TNM分期進行分層再進一步進行生存分析。基因聯合作用分析時,按照患者攜帶的不良基因型數量進行分組后再進行分析。所有結果的P值選用雙側檢驗,統計學檢驗水準α均設定為0.05。
芯片注釋數據庫中共包括47 960 個與miRNA 相關的SNPs位點,病例組和對照組中有差異的miRNASNPs有1 104個,最后經dbSNP查詢后注釋為miRNA自身 SNPs 有 12 個。MirSNP 數據庫共包含 234 573 個miRNA靶序列SNPs,與芯片中的位點取交集,得到芯片中涉及miRNA靶序列SNPs共4 089個,最終篩選出病例組和對照組中99 個差異性表達的miRNA 靶基因SNPs。根據dbSNP數據庫檢索人類基因組中miRNA生物合成通路相關基因SNPs共142個,與芯片中的位點取交集,得到芯片中涉及miRNA 生物合成通路相關SNPs共10個,最后篩選出1個病例組與對照組有統計學差異的位點。
上 述 篩 檢 到 的 12 個 miRNA 自 身 SNPs、 99 個miRNA 靶序列 SNPs 以及 1 個 miRNA 生物合成通路基因相關SNPs,進一步結合文獻報道和生物信息學分析,最終篩選得到11 個miRNA 及其相關基因的SNPs位點(見表 1)。
本次研究共發出問卷401 份,其中因家遷往外地調查困難、拒絕調查者49例,剔除不完整、不合格的問卷8 份,最終納入本研究的共344 人。其中,男性患者共253 例,女性患者為91 例,年齡36~96 歲,第1、3、5 年生存率分別為73.47%、45.71%、39.67%,中位生存時間為30.73 月。對胃癌患者的一般情況與預后的相關性進行生存分析檢驗,結果見表2,表明胃癌患者的年齡、TNM分期、手術與否均與胃癌預后相關(P<0.05)。
2.3.1 單因素分析單因素分析結果見表3、4。等位基因模型統計分析結果顯示,攜帶miR-1297 多態性位點rs9536676的A突變基因的胃癌患者相對于攜帶野生型基因G的患者生存率較低(P<0.05)。隱性模型統計分析結果顯示,MSH2的多態性位點rs17502941 基因型為GG 的胃癌患者比基因型為AA/AG 的患者生存率降低(P<0.05),其他位點對應基因型的生存率差異均無統計學意義。

表2 胃癌患者的一般情況與預后關系
2.3.2 多因素分析將上述有統計學意義的位點納入到多變量逐步COX回歸分析中,步進概率按照進入標準為0.05,除去標準為0.10,結果顯示,是否手術、TNM 分期、rs17502941 AA/AG 均是影響胃癌預后的獨立因素,其中,rs17502941隱性模型中的突變型GG相較于AA/AG 而言為影響胃癌預后的獨立危險因素(P<0.05,見表5)。

表1 SNP芯片結合生物信息學分析篩選出的miRNA及其相關基因SNPs

表3 miR-1297的多態性位點rs9536676與胃癌預后的相關性

表4 MSH2的多態性位點rs17502941與胃癌預后的相關性
2.3.3 miRNA 及其相關基因的各多態性位點與胃癌預后的分層分析按年齡TNM分期聯合分層后:共顯性模型統計分析結果顯示,miR-1297 的多態性位點rs9536676 基因型AG 對>65 歲的晚期胃癌患者是危險因素;miR-379 的多態性位點rs7143252 CG/GG 基因型對≤65 的晚期胃癌患者是保護因素;miRNA-519b的多態性位點rs10413288 GT/GG基因型對≤65歲的晚期胃癌患者是保護因素;FAS的多態性位點rs1468063 CT基因型對≤65歲的晚期胃癌患者是危險因素。顯性模型統計分析結果顯示,miR-1297 的多態性位點rs9536676 AG/AA 基因型對>65 歲的晚期胃癌患者是危險因素;miR-379 的多態性位點rs7143252 CG/GG基因型對≤65的晚期胃癌患者是保護因素;miR-519b的多態性位點rs10413288 GT/GG基因型對≤65歲的晚期胃癌患者是保護因素;FAS的多態性位點rs1468063 CT/TT基因型對≤65歲的晚期胃癌患者是危險因素。隱性模型統計分析結果顯示,miRNA-519b 的多態性位點rs10413288 GG 基因型對≤65 歲的晚期胃癌患者是危險因素,而對>65 歲的晚期胃癌患者是保護因素。其余多態性位點均無明顯差異,詳見表6~10。

表5 胃癌患者生存的逐步COX回歸分析
2.3.4 基因聯合作用根據以上分析,多態性位點rs9536676(AA/AG)、 rs7143252(CC)、 rs10413288(AA)、rs17502941(GG)、rs10277413(TT)、rs1468063(CC)為導致胃癌預后較差的基因型。為進一步探知SNPs之間可能的交互作用,構建新變量,具體見表11,結果顯示 同 時 攜 帶 rs9536676 和 rs10413288、 rs9536676 和rs17502941、rs10413288 和 rs17502941 不良基因型的胃癌患者胃癌預后不良的風險大(P<0.05),其余基因多態性位點均無明顯聯合作用。

表6 miR-1297的多態性位點rs9536676與胃癌預后的分層分析

表7 miR-379的多態性位點rs7143252與胃癌預后的分層分析

表8 miRNA-519b的多態性位點rs10413288與胃癌預后的分層分析

表9 EGFR基因的多態性位點rs10277413與胃癌預后的分層分析

表10 FAS基因的多態性位點rs1468063與胃癌預后的分層分析
miRNA 的SNPs 可以通過調節Pri-miRNA 轉錄、影響Pri-miRNA 到Pre-miRNA 的加工、成熟進而導致miRNA的異常表達。當miRNA靶序列相關的基因出現變異,也可能使得miRNA 與靶基因mRNA 配對出錯,繼而使原本受調控的靶mRNA 失去結合能力,或原本不受調控的mRNA 成為新的結合靶點,最終作用于疾病的形成和發展進程。本研究發現了6個miRNA 相關SNPs 與胃癌預后相關,即miR-1297 的多態性位點rs9536676、miR-379 的多態性位點rs7143252、miR-519b 的多態性位點rs10413288、MSH2基因的多態性位點rs17502941、EGFR基因的多態性位點rs10277413、FAS的多態性位點rs1468063。
miR-1297是近些年來發現的可抑制腫瘤的一種關鍵調控因素,其在胃癌組織中表達明顯下降,其表達異常影響AEG-1、PTEN、Meg3等基因進而影響腫瘤細胞的增殖、侵襲作用[9-10]。miR-379 位于14q32.31,是多種腫瘤的抑制基因,其主要是通過靶向IGF-1R介導的AKT和ERK途徑或者作用于TCF來抑制癌細胞的增殖、浸潤、侵襲和轉移[11-12],也可借助于靶向FAK/AKT 信號抑制胃癌轉移和上皮間充質轉移[13]。miRNA-519b可作為抑癌因子,通過翻譯后抑制COX-2等調控因子表達而使細胞周期被阻滯在G2/M期,從而抑制細胞生長,阻礙腫瘤進展[14]。
MSH2 是最重要的錯配修復蛋白,其相關基因對基因組保持穩定起著至關重要的作用,錯配修復功能正常的胃癌患者腫瘤細胞分化程度高,不易出現淋巴轉移[15]。本研究發現其多態性位點rs17502941 突變基因型AA/AG均是影響胃癌預后的危險因素,可能是當其發生突變,可使得基因的表達產物——錯配修復蛋白的表達量下降,DNA復制過程中的錯誤率增加,從而導致一些因癌癥而錯亂的基因無法得到及時的修復,可直接導致胃癌患者的生存時間減少[16]。
EGFR 即表皮生長因子受體,其相關基因在胃癌組織中表達增高,可以幫助腫瘤細胞逃離凋亡并促進其增殖,還與腫瘤微血管生成有關[17]。本研究發現其多態性位點rs10277413 突變基因型GT/GG 對≤65 歲的晚期胃癌患者是保護因素,可能是當其突變后,阻斷下游信號級聯的激活,使癌細胞增殖和分化進程減緩,腫瘤細胞程序性死亡的量增多[18]。
FAS 是一種表達于細胞表面可誘發凋亡的蛋白,屬于死亡受體家族,與其配體結合可傳遞細胞死亡信號,誘導細胞凋亡[19]。本研究發現其多態性位點rs1468063 CT/TT基因型對≤65歲的晚期胃癌患者是危險因素,可能是因為其基因多態性導致FAS相關因子表達異常,阻礙了轉錄因子結合而使基因無法表達,此時,FAS 表達減少或增加,都可導致細胞增殖與凋亡平衡打破,從而促進腫瘤的進程,改變腫瘤的侵襲、遠處轉移程度[20]。
本研究發現了6個miRNA相關SNPs與胃癌預后的關系,也發現了胃癌病人兩個miRNA 相關SNPs 同時存在不利于預后的基因型。但基因多態性存在著種族、地區差異,基因檢測過程中的檢測技術、檢測方法的不同,也可能造成檢測結果的不同,故還需要在大樣本、多中心研究中進一步驗證。