向麗娟, 汪圣毅, 包楚陽, 張 焱, 韓 坤, 劉 虎,4
胃癌(gastric cancer,GC)是世界第五大惡性腫瘤和第三大常見癌癥死亡原因[1]。GC作為消化道腫瘤與營養代謝密切相關。隨著脂質組學分析在癌癥研究中取得的重要進展,脂代謝(lipid metabolism,LM)異常與癌癥關系的研究日益受到關注[2-5]。轉錄組是連接基因組遺傳信息與生物功能的紐帶,是揭示疾病基因突變規律、疾病發生發展重要機制以及發現致病基因調控關鍵靶點等領域的最佳研究手段。該研究利用高通量測序對GC及癌旁組織的差異表達譜進行京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析,以期探索GC中LM相關通路的關鍵基因(key genes,KGS),為GC診斷與治療從轉錄組學和代謝組學上尋找新的線索。
1.1病例資料收集安徽醫科大學第一附屬醫院2017年4月7日~19日住院GC患者術后GC組織標本8例及相應癌旁正常組織標本4例,均經病理學診斷證實。其中男3例,女5例,年齡25~77(60.1±15.3)歲。病理顯示均為中-低分化腺癌,其中6例有淋巴結轉移,但無遠處臟器轉移。TNM ⅠB~ⅡB期4例,ⅢA~ⅢC期4例。患者術前均未接受過化療、放療或生物治療等干預措施,無其他腫瘤病史,無糖尿病、高血壓、腎病、免疫系統疾病及上呼吸道感染等合并癥。癌及癌旁兩組性別、年齡差異均無統計學意義。標本于術后0.5 h內放入RNAlater(美國Invitrogen公司)保存液中,-20 ℃保存,正常對照來自手術邊界5 cm以上。所有患者簽署知情同意書。該實驗經安徽醫科大學倫理委員會批準(倫理批準號:20140141)。
1.2主要儀器與試劑瓊脂糖凝膠電泳系統購自美國Nanodrop公司;NanoPhotometer?分光光度計購自德國Implen公司;安捷倫2100生物分析儀購自美國Agilent公司;HiSeq Xten、TruSeq PE簇生成試劑盒v3-cBot-HS購自美國Illumina公司; NEBNext?UltraTMRNA文庫制備試劑盒及Oligo d(T) 25磁珠購自美國NEB公司;Qubit?2.0熒光計、Superscript II逆轉錄試劑盒及TRIzol試劑購自美國 Invitrogen公司; 核酸純化試劑盒AMPure XP購自美國Beckman Coulter公司。
1.3cDNA文庫構建及質檢① 按TRIzol試劑說明書進行總RNA提取,隨后質控(樣品無污染時,RNA質量≥1 μg,RNA完整性(RNA integrity number,RIN) ≥6.8;樣品有輕微污染時,RNA質量≥2 μg,RIN≥6.8);② 通過Oligo(dT)磁珠富集mRNA,在NEBNext碎片緩沖區用二價陽離子將mRNA隨機打斷;③ 將片段化mRNA為模板合成cDNA第一條鏈,隨后用核糖核酸酶H降解RNA鏈,以dNTPs為原料合成cDNA第二條鏈;④ 末端修復、加A尾并連接測序接頭,用AMPure XP篩選150~200 bp的cDNA片段,進行PCR擴增并再次使用AMPure XP進行純化,最終獲得cDNA文庫;⑤ 使用Qubit 2.0熒光計對文庫進行初步定量,安捷倫2100生物分析儀對文庫的插入片段大小進行檢測,隨后qRT-PCR對文庫有效濃度進行準確定量(文庫有效濃度高于2 ×10-9mol/L ),以保證文庫質量。從而得到最終的cDNA文庫。
1.4上機測序根據制造商的說明,利用TruSeq PE簇生成試劑盒v3-cBot-HS 生成簇,然后在HiSeq Xten平臺上對文庫進行雙端150 bp測序。
1.5統計學處理經過測序錯誤率檢查、GC含量分布檢查及原始數據(raw read)過濾,獲得后續待分析數據(clean reads),采用STAR(v2.5.1b)軟件對獲得的clean reads進行比對分析,使用HTSeq(v0.6.0)進行基因水平定量分析,RSEM(v1.2.28)進行轉錄本水平的定量分析。采用edgeR(v3.12.1)軟件進行表達差異顯著性分析,將q (多重假設檢驗校正的P值)<0.05為差異有統計學意義。采用clusterProfiler(v3.0.5)軟件對差異基因集進行KEGG通路富集分析,將q<0.05為富集有統計學意義,篩選出與胃癌相關的脂代謝通路。
2.1mRNA轉錄組文庫的構建采用TRIzol法提取的GC和癌旁正常組織的總RNA的各項質量指標都基本達標,然后用Oligo磁珠分離出mRNA,合成雙鏈cDNA文庫,文庫質檢合格后,上機測序。
2.2RNA-seq數據處理將構建文庫用HiSeq Xten進行轉錄組的雙端測序,為了保證信息分析數據質量,將12個樣本的測序數據進行過濾和比對分析。clean reads均占相應raw reads的90%以上, Q20≥94%, Q30≥88%(Q為20和30分別代表堿基測序錯誤率為0.01和0.001,Q20和Q30分別表示質量值大于20和30的堿基占總堿基的百分比)。質量控制合格,后續分析都基于高質量的clean reads。然后對RNA-seq測序數據進行比對分析、基因水平定量及標準化處理。有91%~95%的reads可以比對到人類參考基因組上,兩組的唯一比對率66%~93%。
2.3差異表達分析根據以上判斷標準,利用edgeR軟件篩選差異基因。將q<0.05作為GC和癌旁正常組織差異表達基因篩選標準。一共檢測出差異表達基因3 198個。與正常胃黏膜相比,GC中表達上調基因共1 776個,下調基因共1 422個。火山圖表明了GC癌組織和正常組織間差異有統計學意義的表達基因分布情況,見圖1,上調基因用紅點表示,下調基因用綠點表示, PC表示癌旁組,DEG表示差異表達基因。差異倍數(fold change)表示基因在癌組織與正常組織間表達倍數變化,根據差異分析軟件中的收縮模型計算得到。

圖1 胃癌與正常胃黏膜差異表達基因火山圖
2.4差異表達KEGG分析進一步行KEGG 富集分析,評估差異表達基因涉及的生物途徑。結果表明,共映射到215種不同的代謝通路上。其中顯著富集的途徑是蛋白質的消化與吸收,細胞外基質受體相互作用,精氨酸和脯氨酸代謝,粘著斑,脂肪的消化與吸收,胃酸分泌,見表1。
2.5脂肪消化與吸收代謝通路的關鍵基因脂肪的消化與吸收代謝通路中有18個基因顯著差異表達,其中14個上調和4個下調,見表2。代謝通路圖見圖2。將基因差異倍數|fold change|>2作為進一步篩選標準,得到9個上調基因和2個下調基因,可能為脂代謝相關通路的潛在KGS。

表1 GC和正常組織差異表達基因的KEGG顯著富集通路(q <0.05)

表2 脂肪消化與吸收代謝通路顯著上調或下調基因
自從癌癥被提出是一種代謝異常性疾病以來,已有諸多研究[6-8]探索對腫瘤發生發展起關鍵作用的特定生化代謝途徑。脂質具有多種重要的生物學功能,脂質譜系變化及LM異常在癌癥的發生發展過程中扮演著十分重要的作用[4, 9]。
KEGG是一個用于從基因組和分子水平了解生物系統高級功能和效用的數據庫資源,它能通過圖形來表示細胞內代謝、膜運輸、信號傳導和細胞生長周期等生物學過程。該研究對GC差異表達基因行KEGG富集分析,發現LM通路中脂肪的消化與吸收代謝通路顯著富集。
脂質的消化吸收分為膽汁酸鹽協助脂質消化酶消化脂質和吸收的脂質經再合成進入血液循環兩部分。脂質消化產生的長鏈脂肪酸、2-甘油一酯、膽固醇和溶血磷脂等,在小腸進入腸黏膜細胞后需要單酰甘油-O-酰基轉移酶3(monoacylglycerol O-acyltransferase 3,MOGAT3)、脂肪酸結合蛋白2(fatty acid binding protein 2,FABP2)、載脂蛋白A4(apolipoprotein A4,APOA4)、NPC1樣細胞內膽固醇轉運蛋白1(NPC1 like intracellular cholesterol transporter 1,NPC1L1)等協助合成乳糜微粒,進而被腸黏膜細胞分泌,經淋巴系統進入血液循環。而該研究中合成這些蛋白的基因高表達,提示吸收的脂質再合成途徑未影響GC患者脂質的消化與吸收,而主要是脂質消化酶的低表達起了主導作用。

圖2 脂肪消化與吸收的代謝通路圖紅色表示基因上調,綠色表示基因下調;其中Lipase中包括PLA2G1B、PLA2G2A、PLA2G12B、PLA2G12A、LIPF
脂肪酶F,胃型 (lipase F,gastric type,LIPF)是最顯著下調的基因,它編碼的胃脂肪酶參與胃腸道中膳食甘油三酯的消化;其表達下調可嚴重影響機體對脂肪的存儲。而脂肪存儲障礙是引起癌癥惡病質的重要因素之一。因此,LIPF可能與癌癥惡病質的發生緊密相關。
由磷脂酶A2組IIA(phospholipase A2 group IIA,PLA2G2A)編碼的蛋白質是磷脂酶a2家族的成員,它催化磷酸甘油酯的sn-2脂肪酸酰基酯鍵的水解,并且被認為參與調節生物膜中的磷脂代謝。有研究[10]顯示PLA2G2A在GC細胞質中顯著表達,其表達程度與腫瘤大小、分化程度及分期相關,是GC患者生存的獨立預測因子。體外實驗顯示它的敲除能增加GC對5-氟尿嘧啶的敏感性[11]。該研究顯示PLA2G2A在GC中上調,這與以前的研究結果一致,提示PLA2G2A可能成為GC診斷、治療及預后的分子靶點。另外,PLA2G2A的過表達與直腸癌、肺癌的預后也相關[4, 12],并且可能參與前列腺癌的進展[13]。
PLA2G4A為花生四烯酸生成途徑的限速酶,而花生四烯酸代謝途徑與胃腸癌炎癥相關腫瘤的發生相關。這提示PLA2G4A在胃腸癌的產生中發揮關鍵作用。Zhang et al[14]發現與非癌組織相比,GC中PLA2G4A的表達顯著降低, 它的降低與GC患者的不利生存相關。而該研究卻顯示PLA2G4A在GC組高表達。有研究[5]顯示PLA2G4A在乳腺癌中也高表達,與其不良預后相關。此外,PLA2G4A過表達可以促進癌細胞遷移和侵襲[2]。各種癌癥中都報道了FABP1的過表達,并能促進腫瘤血管生成和遷移[9]。ATP結合轉運蛋白G超家族成員5(ATP binding cassette subfamily G member 5,ABCG5)編碼的蛋白質作為半轉運體可以限制腸吸收并促進膽固醇的膽汁排泄,其高表達可能與GC患者的吸收功能缺陷有關,尚需進一步研究。
綜上所述,對脂肪的消化與吸收代謝通路的分析顯示LIPF、PLA2G2A、PLA2G4A、FABP1及ABCG5可作為GC診斷與治療的候選生物標志物。本研究為探明GC脂質代謝改變機制提供了線索,有利于監控代謝異常和及早干預惡病質的發生,延長患者生存期和提高生活質量。