凌 宇,齊 昱,曹俊偉,王申元,周歡敏, 張焱如
(內蒙古農業大學生命科學學院,呼和浩特 010019)
駱駝科現存的物種分別為雙峰駝(bactrian camel)、單峰駝(arabian camel)、原駝(guanaco)、大羊駝(llama)、小羊駝(vicugna)、羊駝(alpaca)。其中駱駝屬包含雙峰駝和單峰駝。嚴苛的生存環境使得駱駝屬進化出抗旱、抗病、耐粗飼、耐高溫的特性,使駱駝成為蒙古高原的優勢畜牧品種。目前,人們對駱駝的研究主要集中在駱駝屬的進化歷史,以及人工選擇在駱駝遺傳物質中留下的馴化痕跡,也發現雙峰駝在長期進化中形成了胰島素不敏感[1]。已有的轉錄組研究顯示,駱駝腎能夠很好的利用血液中高濃度的葡萄糖,維持腎細胞的高滲透特征,證明高濃度血糖對于雙峰駝本身正常生理代謝是有利的[2],但針對于雙峰駝耐旱的生理學特征的研究尚屬空白。
動物在消化吸收過程中,小腸和胃等組織主要負責食物中特定氨基酸和礦物質的消化吸收。結腸作為消化系統的末端組織,承擔著代謝產物存儲與收集的任務。與小腸不同的是,結腸主要功能是吸收食物殘渣中大量的水分,將廢物殘渣中最后的水分和鹽回收。結腸對水吸收的機制是通過黏膜滲透壓梯度進行的,梯度滲透是水逆腸內滲透梯度的重吸收。腸內壁的細胞將鈉離子泵入細胞間隙,提高細胞間液的滲透壓,這種高滲液體產生滲透壓,通過緊密連接和相鄰細胞的滲透將水驅入側向細胞間隙,再穿過基膜進入毛細血管,同時鈉離子再次泵入細胞間液中[3-4]。雖然水在每個單獨的步驟中沿著滲透梯度下行,但總體而言,由于將鈉離子泵入細胞間液中,水通常逆著滲透梯度行進運輸。盡管與腸腔內的液體相比,毛細血管的血液是低滲的,但這允許大腸吸收水分。人類結腸約1.5 m長,每天吸收1.5 L水,對水分回收有著重要的作用。
盡管人們對于駱駝的水代謝能力有所了解,但目前尚未有研究揭示其水代謝的機制。本研究對極端缺水環境下的駱駝結腸進行基因表達測序與分析,為人們進一步探討缺水環境下駱駝結腸的水適應方式提供基礎數據及理論支持。
1.1.1 試驗動物處理與樣品采集 選取6峰6~9歲 的成年阿拉善雙峰駝,隨機分為2組,第一組為對照組(colon1_3),正常采食飼料與水;第二組為禁水組(colon3),不給駱駝飲水,其他處理(飼草量)與對照組相同,禁水24 d。
1.1.2 儀器與試劑 樣品總RNA提取采用TaKaRa公司RNA提取試劑盒(TaKaRa RNAiso Plus 9108)。總RNA質控試劑盒為RNA nanoAssay(Agilent 公司)。使用RNase Free Water溶解樣品,檢測試劑盒為RNA6000,檢測儀使用Agilent 2100。
1.2.1 組織RNA提取及RNA質量檢測 分別采集6峰駱駝的結腸組織,置于液氮中充分研磨,按照TaKaRa公司RNA提取試劑盒說明書提取總RNA,提取總RNA樣品經Agilent 2100檢測儀檢測,檢測樣品總量、RNA完整度以及OD值。
1.2.2 文庫構建 樣品檢測合格后,poly A作為mRNA序列中的特征序列,以此特征來捕獲組織中所有的mRNA,方法是用帶有Oligo(dT)的磁珠富集雙峰駝樣本mRNA。隨后加入片段緩沖液將mRNA打斷成短片段,以mRNA為模板,用六堿基隨機引物(random hexamers)合成一鏈cDNA,然后加入緩沖液、dNTPs和DNA polymerase I合成二鏈cDNA,隨后利用AMPure XP beads純化雙鏈cDNA。純化的雙鏈cDNA再進行末端修復、加A尾并連接測序接頭,然后用AMPure XP beads進行片段大小選擇,最后進行PCR富集得到最終的cDNA文庫。
1.2.3 文庫檢測 測序文庫構建完成后,先使用Qubit2.0進行初步定量,稀釋文庫至1 ng·μL-1,隨后使用Agilent 2100對文庫的插入片段大小進行檢測,符合預期后,使用qPCR方法對文庫的有效濃度進行準確定量(文庫有效濃度>2 nmol·L-1),以保證文庫質量。
1.2.4 測序與原始測序數據過濾評估 文庫檢測合格后,把不同文庫按照有效濃度及目標下機數據量的需求,將各組中3峰動物取等量RNA混池后進行測序。測序獲得原始數據,由于測得的堿基存在可能的錯誤,每個堿基測序錯誤率通過Q30進行過濾。同時GC含量分布檢查用來評估有無AT、GC 分離現象,判斷是否在測序或文庫構建過程中對堿基造成影響。本研究根據上述標準使用FastQC軟件衡量測得的堿基質量。
1.2.5 參考序列比對 本研究的物種屬于哺乳動物,所以選取使用軟件TopHat2,參數 mismatch為2,其余選用默認參數,選取NCBI已有雙峰駝基因組,版本號Ca_bactrianus_MBC_1.0(ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/767/855/GCF_ 000767855.1_Ca_bactrianus_MBC_1.0/GCF_000767855.1_Ca_bactrianus_MBC_1.0_genomic.fna.gz),基因組GFF文件(ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/767/855/GCF_ 000767855.1_Ca_bactrianus_MBC_1.0/GCF_000767855.1_Ca_bactrianus_MBC_1.0_genomic.gff.gz)。將過濾后的測序序列進行基因組定位分析。
1.2.6 基因表達水平分析及差異表達分析 本研究采用HTSeq(v0.6.1),參數為-munion定量基因表達水平。獲得基因表達量列表,采用TMM和DEGSeq(1.10.1)對基因進行差異表達分析,并根據|log2(Fold change)| > 1,且q-value< 0.005篩選顯著差異表達基因。
1.2.7 差異表達基因GO富集分析 通過軟件GOSeq對colon1-3與colon3比較得到的差異表達基因集合進行GO富集分析,基于GO數據庫的功能,本研究對差異表達基因按照分子功能(molecular function)、生物過程(biological process)和細胞組成(cellular component)3個部分進行分類。顯著富集的條件為校正P-value < 0.05。
1.2.8 差異表達基因KEGG富集分析 本研究使用KOBAS(2.0)(http://kobas. cbi. pku.edu.cn/download.php)進行pathway富集分析,由于pathway顯著性富集分析以KEGG 數據庫中pathway為單位,應用超幾何檢驗,找出與整個基因組背景相比,在差異表達基因中顯著性富集的pathway,故將校正P-value < 0.05作為條件來篩選顯著富集通路。
禁水組與對照組結腸組織提取RNA后,經Agilent 2100檢測樣品濃度、RNA完整度(RIN值)及28S∶18S。禁水組與對照組的RNA總量分別為24.12和54.00 μg,大于10 μg,RIN值分別為8.6和8.1,均大于7,28S∶18S均為1.5,可用于后續試驗分析。
通過Hiseq 2000測序平臺,本研究獲得對照組結腸組織總片段數(clean reads) 51 533 346條,Q30為91.28%,GC含量為48.32%;禁水組結腸組織總片段數(clean reads)為50 771 578條,Q30為91.02%,GC含量為53.62%(表1),測得的數據總量和質量合格。
表1對照組與試驗組結腸RNA測序數據統計
Table1SequencingdatastatisticsofcolonRNAofbactriancamelinthecontrolandexperimentalgroups

樣本Sample name總片段數/條Clean reads測序錯誤率/%Error rate質量值/%Q30GC含量/%GC content對照組colon1_3-1 25 766 6730.0392.1648.27對照組colon1_3-2 25 766 6730.0390.4148.38試驗組colon3-1 25 385 7890.0392.6253.57試驗組colon3-2 25 385 7890.0489.4353.68
將測得的reads與參考基因組進行比對,結果顯示,禁水組結腸與參考基因組的總比對率為90.58%,單一位點比對率為89.08%;對照組與參考基因組的總比對率為92.48%,單一位點比對率為91.62%(表2)。
表2樣品與參考基因組比對
Table2Samplealignmenttoreferencegenome

測序結果統計Sequencing results statistics對照組(占總reads比例/%)colon1_3(the proportion of total reads) 禁水組(占總reads比例/%)colon3(the proportion of total reads) 測序總片段數 Total reads51 533 34650 771 578總比對數目Total mapped47 658 974 (92.48)45 987 211 (90.58)多位點比對數 Multiple mapped443 387 (0.86)762 060 (1.50)單一位點比對Uniquely mapped47 215 587 (91.62)45 225 151 (89.08)
本研究統計了各表達區間基因在禁水組與對照組中的分布情況,根據經驗值RPKM大于1代表基因表達,本研究結果顯示,對照組與禁水組表達基因數量分別為總量的69.29%和66.35%(表3)。
本研究將|log2(Fold change)| > 1 且 q-value<0.005設定為差異基因的篩選標準,禁水組與對照組經過篩選后,發現顯著差異表達基因2 122個。其中禁水組上調表達基因為813個,下調表達基因1 309個(圖1)。
表3不同表達區間基因數量統計
Table3Statisticsofthenumberofgenesindifferentexpressionintervals

表達值區間RPKM interval對照組(占總表達區間比例/%)colon1_3禁水組(占總表達區間比例/%)colon30~16 629(30.71)7 263(33.65)1~32 800(12.97)3 014(13.96)3~156 286(29.12)6 003(27.81)15~604 299(19.92)3 815(17.67)>601 571(7.28)1 490(6.90)

圖1 禁水組與對照組差異表達基因分布
Fig.1 Distribution of differentially expressed genes in no drinking water group and control group
將差異表達基因按照GO條目進行分類,根據校正P-value<0.05篩選顯著富集GO條目,其值越小說明統計結果越顯著。結果顯示,禁水組下調表達基因富集到的GO條目共2 274條,其中具有統計學顯著意義的為 30條,包括細胞組分富集條目8條(胞內部分、大分子復合物、細胞器、細胞質、胞內、胞內細胞器、層粘連蛋白-1復合物、層粘連蛋白復合物),生物過程4條(細胞遷移、細胞黏附調節、細胞遷移調節、胚胎發育調節),分子功能18條(核苷酸結合、核苷磷酸結合、水解酶活性(作用于酸酐)、焦磷酸酶活性 、陰離子結合、嘌呤核糖核苷三磷酸結合、核苷-三磷酸酶活性、嘌呤核苷結合、核糖核苷結合、嘌呤核糖核苷結合、含磷酸酐中的水解酶活性(作用于酸酐) 、嘌呤核糖核苷酸結合、核糖核苷酸結合、有機環狀化合物結合、嘌呤核苷酸結合、小分子結合、核苷結合、雜環化合物結合)(圖2)。禁水組上調表達基因富集到的GO 條目共1 958 條,未發現有統計學意義的GO條目。

圖2 禁水組下調表達基因GO分類
Fig.2 GO classification of down-regulated expression genes in no drinking water group
將校正后的P-value (q值)< 0.05作為顯著pathway的篩選標準,KEGG分析獲得禁水組下調表達基因富集的代謝通路20個(圖3),顯著富集的包括剪接體(spliceosome)、蛋白輸出(protein export)、內質網內的蛋白質過程(protein processing in endoplasmic reticulum)、RNA轉運(RNA transport)、核糖體生物合成(ribosome biogenesis in eukaryotes)、mRNA監控(mRNA surveillance)(圖3、表4)。
禁水組上調表達基因富集到了20個通路,沒有發現有顯著富集的通路,結果顯示局部黏連(focal adhesion)通路有較高的富集程度(圖4)。

富集因子為該pathway中富集到的差異表達基因個數與注釋基因個數的比值,該值越大,表示富集的程度越高。q值是做過多重假設檢驗校正之后的P-value,此值越接近于零,表示該富集通路越顯著。下圖同
Enrich factor is the ratio of the number of differentially expressed genes enriched in the pathway to the number of annotated genes, the larger the value, the greater the degree of enrichment. The q-value is the corrected P-value, the q-value is closer to zero, the pathway is more significant enriched. The same as the following figure
圖3 禁水組下調表達基因KEGG通路分析
Fig.3 Statistics of pathway enriched by down-regulated expression genes in no drinking water group
根據禁水組與對照基因表達分析,本研究篩選出駱駝結腸組織在缺水條件下與缺水適應相關的基因。其中剪接體途徑中的20個基因、蛋白質排出途徑中的11個基因、蛋白質加工途徑中5個基因和RNA轉運途徑中的4個基因在禁水條件下,在駱駝結腸顯示出顯著的下調(表5)。
雙峰駝結腸組織禁水組與對照組參考基因組比對的總比對率分別為90.58%、92.48%,其中多位點比對率為1.5%、0.86%,唯一位點比對率分別為89.08%、91.62%。其中唯一位點比對率反映了測序建庫過程的規范性。本研究中,唯一位點比對率高于85%,說明研究中使用的測序質量良好,參考基因組選擇合適,并且參考基因組完整,未出現因參考基因組不完整或選擇版本不準確導致比對目標的缺失和總比對率的下降;RNA提取質量優異,建庫過程合乎規范,獲得了合乎測序要求的RNA 片段,在建庫或RNA 提取過程中未出現RNA降解,避免了多位點比對的比例增加和基因表達定量準確性差的現象。測序結果符合后續研究需求。
本研究針對禁水組上調和下調表達基因進行GO富集分析,對所有差異基因進行細胞組分、分子功能和生物過程分類識別。其中下調表達基因顯著富集到核苷酸結合、核苷磷酸結合、嘌呤核糖核苷三磷酸結合、核苷三磷酸酶活性、核糖核苷結合等分子功能,這些功能多與細胞的基礎代謝功能相關,例如核苷酸結合直接涉及細胞自身所有的功能,包括細胞分裂、增殖、分化等。說明在缺水環境下,駱駝結腸RNA合成功能受到影響,處于下調趨勢。這表明,在缺水環境下,駱駝結腸從RNA相關功能階段降低細胞代謝,從而使得結腸組織適應此環境。

圖4 禁水組上調表達基因KEGG通路分析
Fig.4 Statistics of pathway enriched by up-regulated expression genes in no drinking water group
表4禁水組下調表達基因顯富集通路
Table4Significantlyenrichedpathwaysbydown-regulatedexpressiongenesinnodrinkingwatergroup

顯著富集通路Pathway參與基因數Sample genes number背景基因數Background genes number校正后的P值CorrectedP-value參與基因Gene剪接體Spliceosome391272.590 7×10-9HNRNPM、LSM8、SNRPG、AQR、PRPF38B、TRA2B、MAGOHB、HNRNPA1、CDC40、SNRPB2、SF3B1、THOC2、LSM3、TRA2A、PLRG1、PLRG1、DDX46、RBM25、SYF2、LSM6、SNRPD1、SRSF1、TCERG1、PRPF40A、HNRNPA3、SRSF7、SNRNP27、HSPA8、SRSF5、HNRNPU、SMNDC1、SMNDC1、RBM8A、SRSF3、LOC102519550、U2SURP、SNRPE

(續表4 Continued)
表5雙峰駝缺水適應基因
Table5Waterdeficiencyadaptivegenesscreenedinbactriancamel

蛋白名稱Protein name組織表達類型Up- or down-regulation in colon3log2(差異倍數)log2(FC)參與通路PathwayPrp5下調-1.63SpliceosomePrp17下調-1.47SpliceosomeHSP73下調-1.13SpliceosomeAQR下調-1.21SpliceosomeSyf下調-1.63SpliceosomeTHOC下調-1.67SpliceosomeMagoh下調-2.88SpliceosomeY14下調-1.22SpliceosomeSR下調-1.79SpliceosomeHnRNPs下調-2.36SpliceosomePrp28下調-1.12SpliceosomeSR140下調-1.42SpliceosomeSnRNP27下調-1.36SpliceosomeCA150下調-1.26SpliceosomeP68下調-1.94SpliceosomeS164下調-1.42SpliceosomeSPF30下調-1.19SpliceosomeFBP11下調-1.73SpliceosomeSF3下調-1.21SpliceosomeSm下調-2.06SpliceosomeSEC62下調-1.86Protein exportSEC63下調-1.95Protein exportSEC61下調-1.33Protein exportBiP下調-1.39Protein exportSRP9下調-1.68Protein exportSRP72下調-1.03Protein exportSRP19下調-2.92Protein exportSRP54下調-1.89Protein exportSRPRB下調-1.20Protein exportSPCS3下調-1.30Protein exportSEC11下調-1.88Protein exportSAR1下調-1.35Protein processing in endoplasmic reticulumSec23下調-2.13Protein processing in endoplasmic reticulumERP57下調-1.08Protein processing in endoplasmic reticulumOSTs下調-1.03Protein processing in endoplasmic reticulumGRP94下調-1.77Protein processing in endoplasmic reticulumCRM1下調-2.15RNA transportNMD3下調-1.33RNA transportPHAX下調-1.99RNA transportExpt下調-1.43RNA transport
KEGG分析通過超幾何檢驗,確定差異表達基因參與的主要代謝通路和信號通路。本研究中,通過對差異表達基因的信號通路分析,顯著富集通路包括剪接體(spliceosome)、蛋白輸出(protein export)、內質網內的蛋白質加工(protein processing in endoplasmic reticulum)、RNA轉運(RNA transport)、核糖體生物合成(ribosome biogenesis in eukaryotes)。
3.3.1 剪接體途徑 剪接體途徑是真核生物中轉錄后mRNA前體經過剪接體的加工,將內含子去掉的過程[5]。該過程是真核生物的一種特有現象,在真核生物,細胞剪接體本身是一個蛋白復合體[6]。本研究鑒定到該復合體家族中多個基因的低表達,這表明結腸組織顯著降低了轉錄到翻譯過程的活性,由于剪接體功能的降低直接導致可用成熟mRNA 的減少,成熟的mRNA是蛋白質合成所必須的,這意味著可用于下游翻譯的模板減少,從而導致蛋白質合成活動的減少。
3.3.2 蛋白質輸出 蛋白質在內質網合成后,經過蛋白質輸出功能將蛋白質從細胞質運輸到細胞外部,是一種細胞內的主動轉運[7]。Sec蛋白依賴性的蛋白質輸出系統將協助新合成的蛋白質轉運穿過細胞膜[8]。本研究中,蛋白質輸出途徑低表達基因的顯著富集說明結腸細胞內蛋白質運輸功能下降,意味著結腸在缺水條件下降低了蛋白質的轉運,這可能與蛋白質合成減少相關。
3.3.3 內質網內的蛋白質加工 內質網作為一種亞細胞器,主要負責蛋白的正確折疊,將折疊后的蛋白包裝成運輸囊泡,轉運給高爾基體[8-10]。本研究中,下調表達基因顯著富集于該通路表明在缺水的環境下,結腸蛋白質合成作用降低,可能是在缺水條件下組織為了減少不必要的物質消耗。
3.3.4 RNA轉運 RNA轉運過程是從細胞核到細胞質RNA轉運的基礎,在細胞核中產生的RNA不能直接穿過核孔而需要通過移動輸出受體穿過核孔復合物,細胞內多數RNA都是由特定的輸出受體轉運到細胞質[11-12]。本研究中,RNA轉運過程被低表達基因的顯著富集表明,結腸在缺水環境下,該功能的降低將直接導致細胞內合成的RNA 不能轉運進入細胞質,這也將導致細胞內可用于蛋白質合成的RNA 減少。
3.3.5 核糖體生物合成 核糖體作為制造蛋白質的工廠,其運行正常與否直接影響后續蛋白質的產生。本研究發現,該過程中基因的顯著下調表達說明,結腸為適應缺水環境,從核糖體合成的根本上降低了生物合成。
3.3.6 mRNA監控 mRNA監控途徑是檢測和降解異常mRNA的質量控制機制[13]。當細胞RNA合成過程中,因外部環境造成新合成RNA的損傷時,該功能發揮作用[14-15]。例如,該途徑能夠消除過早的翻譯終止密碼子作用[16-17]。本研究中,該途徑得到顯著富集,表明試驗條件下水脅迫導致了該途徑的低表達,這與之前RNA轉運和剪接體功能下降直接相關。表明水脅迫下,不僅RNA的成熟過程和轉運過程被抑制,與RNA相關的質量監控也受到限制。
P68蛋白是RNA解旋酶DEAD盒家族的成員[18],作為連接分子參與多種細胞過程,促進與許多其他因子的相互作用[19]。 該蛋白質參與包括RNA結構改變的途徑,作為轉錄的共調節因子,在剪接調節劑以及小的非編碼RNA的加工中起作用[20]。該家族成員含有9個保守基序,包括保守的Asp-Glu-Ala-Asp(DEAD)基序,對ATP結合和水解以及RNA結合和解旋活性有很重要的作用[18]。
HSP73蛋白為熱休克蛋白70(HSP70)家族成員,屬熱休克同源蛋白[21],作為分子伴侶發揮作用[22]。同時,在細胞膜組分通過細胞的轉運中,該蛋白在囊泡的分解中起ATP酶的作用[23]。HnRNPs為異質核糖核蛋白, 作為RNA結合蛋白,它們與異源核RNA(hnRNA)復合[24-25]。這些蛋白質與細胞核中的前mRNA相關,并且似乎影響前mRNA加工和mRNA代謝和轉運[26]。hnRNP蛋白質具有不同的核酸結合特性。這種蛋白質也被認為在細胞周期進程中起作用。
BiP蛋白是熱休克蛋白70(HSP70)家族的成員,它位于內質網(ER)的內腔中,并參與ER中蛋白質的折疊和裝配[27-28]。由于這種蛋白質與許多ER蛋白質相互作用,它可能在監測細胞的蛋白質轉運中起關鍵作用[29]。
ERP57基因編碼內質網的蛋白質,其與凝集素伴侶鈣網蛋白和鈣聯蛋白相互作用以調節新合成的糖蛋白的折疊[30]。 這種蛋白質曾被認為是一種磷脂酶; 然而,已經證明該蛋白質實際上具有蛋白質二硫鍵異構酶活性。 據認為,凝集素和這種蛋白質的復合物通過促進其糖蛋白底物中二硫鍵的形成來介導蛋白質折疊。 該蛋白質還起分子伴侶的作用,可防止蛋白質聚集體的形成[31]。CRM1 作為細胞周期調節蛋白,是一種介導富含亮氨酸核輸出信號轉運的蛋白質[32],該蛋白特異性抑制Rev和U snRNA的核輸出[33]。通過控制細胞周期蛋白MPAK和MAPKAP激酶2的定位參與細胞過程的控制,該蛋白還調節NFAT和AP-1[34]。Expt屬于RAN-GTPase輸出蛋白家族,其介導tRNA從細胞核到細胞質的輸出[35]。一旦輸出蛋白結合tRNA和GTP結合的RNA,就會發生tRNA向細胞質的轉運[36]。Bms1可能編碼核糖體裝配蛋白,在酵母中存在的相似蛋白質在35S-rRNA加工中起作用,其包括一系列對于形成40S核糖體至關重要的切割步驟[37]。
上述基因作為下調表達基因,涉及到了蛋白質合成整個過程、核糖體轉運、RNA運出細胞核、蛋白質的內質網合成、蛋白質的定位、前體RNA的剪切與成熟、蛋白質信號識別等。這些相關功能基因的低表達直接影響了下游基因從RNA到最終蛋白質的翻譯過程。
本研究利用HiSeq 2000 高通量測序平臺對雙峰駝在正常飲水與極度缺水環境下的結腸組織進行轉錄組測序,獲得高質量的轉錄譜。研究發現,禁水環境下,結腸組織下調表達基因多于上調表達基因,下調表達基因多參與RNA加工和蛋白質合成,這些功能有利于駱駝在缺水環境下,減少RNA的合成,降低結腸組織的代謝速率。