焦晶凱
(上海乳業生物工程技術研究中心 乳業生物技術國家重點實驗室,上海 200436)
基于RNA-Seq技術的干酪基質下紅曲霉生長轉錄組初步信息分析
焦晶凱
(上海乳業生物工程技術研究中心 乳業生物技術國家重點實驗室,上海 200436)
采用轉錄組測序(RNA-Seq)技術,對生長在干酪基質環境下的紅曲霉(Monascus)進行了轉錄組分析。采用第二代測序技術,基于Illumina NextSeq 500測序平臺進行分析,得到了序列總長度為59 935 140 bp的轉錄本(transcripts),22 377 414 bp長度的非重復序列基因(unigene),共18 042條。對聚類得到的Unigene與數據庫NR、GO、KEGG、eggNOG和Swiss-Prot進行比對并作基因功能注釋,注釋到GO數據庫的序列有12 186條,注釋到eggNOG數據庫的序列有17 777條,KEGG中有3 251條序列被注釋到,涉及的pathway有42條。這些注釋信息的完成在基因組學上為紅曲霉應用于干酪的生產提供了重要依據。
紅曲霉;干酪;轉錄組;RNA-Seq技術;基因注釋
紅曲霉(Monascus)是我國最早應用于食品加工的有益真菌之一,紅曲中含有多種對人體有益的活性成分,紅曲霉發酵產物中含有洛伐他汀等多種活性物質、含有淀粉酶、糖化酶等多種酶類、含有Monacolin K、γ-氨基丁酸、麥角固醇、天然植物激素等功能成分、還含有大量的天然紅曲色素[1-3]。對于紅曲霉發酵研究已有幾十年的歷史,有研究將紅曲霉用于發酵豆粕[4]、豆腐黃漿水發酵紅曲色素[5]、以麥麩為基質的紅曲霉發酵[6]、也有研究者將小米、大米、大豆和玉米糠等充當底物[7],但將其應用于干酪生產卻罕有人研究。
隨著生物工程和分子生物學的高速發展,RNA-seq測序技術已被用于水稻在不同氮源供應下的轉錄組表達研究[8]、膜莢黃芪轉錄組表達研究[9]、南極海魚轉化生長因子-β(transforming growth factor-β,TGF-β)信號傳導研究[10]及微藻轉錄組研究[11]等。RNA-seq測序技術是近年來建立的進行轉錄組分析的分子生物學研究方法,具有數據冗余性低,信息涵蓋量大,分析準確,研究范圍小,針對性強,快速有效等優點,可檢測到低表達基因的存在,以及對沒有基因組學背景的新物種均可進行轉錄表達概況分析等多方面優點[12-15]。
為了充分了解紅曲霉在干酪基質上的表達信息,本研究使用RNA-seq測序技術分析了紅曲霉在干酪基質上生長的轉錄表達信息,旨在發現紅曲霉在不同基質上生長基因的差異化表達,為優化生產紅曲霉干酪提供理論依據。
1.1 材料與試劑
紅曲霉(Monascus):中國普通微生物菌種保藏管理中心(ChinaGeneralMicrobiologicalCultureCollectionCenter,CGMCC),編號CGMCC No.7603;干酪樣品(新西蘭低鹽切達):乳業生物技術國家重點實驗室,光明乳業股份有限公司乳業研究院提供。RNase酶H、DNA聚合酶I:賽默飛世爾科技(中國)有限公司。
1.2 儀器與設備
Trizol總RNA抽提試劑盒、Quant-iT PicoGreen dsDNA Assay試劑盒:美國Invitrogen公司;NanoDropTM8000分光光度計、Qubit熒光計:賽默飛世爾科技(中國)有限公司;TruSeq RNA Sample Prep試劑盒(Illumina)、QIAquick PCR純化試劑盒:德國Qiagen公司;AMPure XP分選磁珠:美國Beckman Coulter公司;E6090 QuantifluorTM-ST熒光計美國Promega公司。
1.3 試驗方法
1.3.1 樣品的制備
干酪樣品121℃、20 min滅菌,制備平板,挑取紅曲霉樣品放入無菌水,混合,取100 μL涂布。30℃培養7 d。
1.3.2 RNA提取和構建mRNA-Seq文庫
提取經過RNA提取和濃縮,使用分光光度計對RNA進行定性和定量,取2 μg RNA樣品進一步純化,使用帶有Oligo-dT的分選磁珠結合poly-A將mRNA從總RNA中分離出來,使用片段化試劑獲得200~300 bp的信使核糖核酸(messenger ribonucleic acid,mRNA)片段,隨后使用引物(5'-AATGATACG GCGACCACCGA和5'-CAAGCAGAAGACGGCATACGA)合成雙鏈互補脫氧核糖核酸(comple mentarydeoxyribonucleic acid,cDNA),對200~300 bp片段進行純化,對DNA片段進行末端修復,在DNA 3'末端引入堿基A,進行A、T配對,對目標DNA片段進行純化和擴增,對所構建mRNA-Seq文庫進行驗證和定量,在Illumina NextSeq500測序平臺下進行測序。
1.3.3 Illumina測序和注釋
通過Illumina測序得到下機數據,分別對每個樣品的下機數據進行統計,采用FastQC對下機數據進行質量控制,過濾測序數據中一些帶接頭、低質量的reads,使用針對轉錄組拼接的Trinity軟件對高質量序列進行拼接,拼接完成后,可獲得contig和transcript兩個序列,對拼接得到的contig和transcript序列進行統計,使用Unigene聚類及功能注釋。
2.1 Illumina測序和轉錄分析
通過Illumina測序得到下機數據,reads總數為46454276,堿基總數為6641541010,經過濾后得到Clean reads總數為46 272 196,Clean堿基數為6 614 000 681,對拼接得到的重疊群(contig)和轉錄本(transcript)序列進行統計,結果見表1。由表1可知,重疊群(contig)和轉錄本(transcript)序列總長度分別為39 102 300 bp和59 935 140 bp,序列總數分別為71 255 bp和19 732 bp,N50分別為1 470 bp和1 751bp,長度>N50分別為7 081條和10 739條。通過統計表明該轉錄組測序及數據組裝質量結果良好,符合進行進一步的基因功能注釋和分類要求。

表1 拼接結果統計Table 1 Statistics of transcriptome data results
2.2 Unigene功能注釋
將Trinity拼接得到的每一條transcript與美國國家生物技術信息中心(NationalCenterofBiotechnologyInformation,NCBI)數據庫BLAST比對,對得到Unigene進行統計和基因功能注釋,所用到的數據庫包括NR、GO、KEGG、eggNOG和Swiss-Prot。共18 042條序列在NR數據庫中被注釋,全部Unigene在此數據庫中被注釋到。KO數據庫中比對序列最少,僅有3 251條序列得到注釋,占比18.02%,有2 946條序列在全部數據庫中得到注釋,占比16.33%,如圖1所示,被注釋到主要同源基因為曲霉菌屬(Aspergillus),如米曲霉(Aspergillus oryzae)、煙曲霉(Aspergillus fumigatus)等。

圖1 Unigene注釋結果分布Fig.1 Distribution of Unigene annotation results
2.3 Unigene功能分類
2.3.1 GO分類注釋
BLAST2GO軟件將Unigene與GO數據庫進行比對,對比得到的同源序列有12186條,占總Unigene的67.54%,覆蓋GO數據庫中三大功能分類(生物過程、細胞組成和分子作用),涉及功能組分和生物學途徑共92項,如圖2所示,占比較大的主要包括生物合成過程、分解過程、碳水化合物代謝過程、細胞氮化合物代謝過程、細胞蛋白修飾過程、細胞周期、細胞分裂、氧化還原酶活性、核酸結合轉錄因子活性、小分子代謝過程、轉運、翻譯、細胞質、胞質溶膠、細胞器、質膜、蛋白復合物、DNA結合、酶結合、離子結合、RNA結合等。

圖2 Unigene的GO分類注釋Fig.2 GO classifications annotation of Unigene
2.3.2 eggNOG分類注釋
將所有Unigene與eggNOG數據庫進行BLAST對比,有17 777條序列被注釋成功,占比98.53%,除eggNOG數據庫中X分類目錄沒有注釋到序列外,其余分類目錄均有注釋,如表2所示。
由表2可知,在已知功能中,與一般性功能預測蛋白同源的序列最多,共3 376條,占比14.93%,然后依次是翻譯后修飾,蛋白質周轉,伴侶,共同源序列1 190條;信號轉導機制,共比對同源序列1 014條;轉錄,比對同源序列1 012條;碳水化合物運輸和代謝,比對同源序列932條;翻譯、核糖體結構和生物合成,共887條;細胞內運輸,分泌和水泡運輸,共859條;復制,重組和修復,共837條;脂質運輸和新陳代謝,共806條;此外還有氨基酸運輸和代謝、能源生產與轉化、RNA加工和修飾等。

表2 All-Unigenes的eggNOG分類注釋Table 2 eggNOG classifications annotation of All-Unigenes
2.3.3 KEGG通路分析
如圖3所示,通過KEGG的KAAS自動化注釋系統進行所有Unigene的KO及Pathway注釋,共3 251條序列得到注釋,占比18.02%,紅曲霉生長注釋信息主要涉及包括代謝、遺傳信息過程、環境信息過程、細胞過程、有機體系和人類疾病在內的的六大功能模塊,42條代謝通路,主要有碳水化合物代謝通路、脂代謝通路、氨基酸代謝通路、外源性物質的生物降解和代謝通路、翻譯、折疊、分選和退化、信號轉導通路、細胞生長和死亡通路、內分泌系統和神經系統通路等,此外還涉及癌癥、神經退行性疾病、傳染性疾病和內分泌代謝疾病等人類疾病的基因。

圖3 KEGG分類注釋及通路分析Fig.3 Classifications annotation of KEGG and Pathway analysis
本研究通過轉錄組測序,研究紅曲霉在干酪基質中生長的基因功能注釋、GO功能分類及對紅曲霉生長在干酪基質上的代謝通路的初步分析。新一代測序技術憑借著靈敏度高和運行成本低已成為生命科學研究的新手段,轉錄組測序可以對特定細胞在某一功能狀態下的轉錄本進行測序,并以此進一步做功能注釋、分類注釋、代謝通路分析和差異表達分析等。通過對紅曲霉的轉錄組GO分類注釋分析得出紅曲霉在干酪中的生長涉及的合成、分解過程、碳水化合物代謝過程、細胞氮化合物代謝過等一些列具體生物過程、細胞組成和分子作用過程。通過eggNOG分類注釋分析得出在干酪生長基質中紅曲霉主要運用翻譯后修飾,蛋白質周轉,伴侶,信號轉導機制,轉錄和碳水化合物運輸和代謝等。通過KEGG通路分析得出紅曲霉在干酪基質上表達通路主要是碳水化合物代謝通路、脂代謝通路、氨基酸代謝通路等。為此,通過調整干酪基質組成成分可以更好的調控紅曲霉的代謝表達,可誘導紅曲霉在干酪基質上向更有利的通路方向轉化,對研究高質量的紅曲霉干酪具有重要意義。此外通路分析得出紅曲霉轉錄中還涉及癌癥、神經退行性疾病、傳染性疾病和內分泌代謝疾病等人類疾病的基因,為進一步研究紅曲霉的益生功能特性提供理論支持。
[1]許贛榮.紅曲霉菌的研究進展[J].中國釀造,2002,21(s1):7-11.
[2]蒲立檸,陳光靜,闞建全.響應面試驗優化青稞麩皮薏仁紅曲霉發酵工藝[J].食品科學,2017,32(2):264-270.
[3]JIRASATID S,NOPHARATANA M,KITSUBUN P,et al.Statistical optimization forMonacolinK and yellow pigment production and citrinin reduction byMonascus purpureusin solid-state fermentation[J].J Microbiol Biotechnol,2013,23(3):364-374.
[4]石 琳,尹 園,王 帥,等.紅曲霉發酵高溫豆粕高產可溶性多肽[J].食品科學,2015,36(19):137-142.
[5]王 薇,馬 波,許云華,等.利用豆腐黃漿水發酵紅曲色素的研究[J].中國調味品,2017,42(1):44-46.
[6]姚 青.以麥麩為基質的紅曲霉的固態發酵及抗氧化活性研究[D].杭州:浙江工業大學,2015.
[7]余幫榮.基于不同底物的紅曲霉發酵產色素的研究[J].科技創新與應用,2017(16):82-85.
[8]YANGSY,HAODL,SONGZZ,etal.RNA-Seqanalysisofdifferentially expressed genes in rice under varied nitrogen supplies[J].Gene,2015,555(2):305-317.
[9]XIU B L,LING M,AI H Z,et al.High-throughput analysis and characterization ofAstragalus membranaceustranscriptome using 454 GS FLX[J].PLoS One,2014,9(5):1-8.
[10]XU Q H,CAI C,HU X X,et al.Evolutionary suppression of erythropoiesis via the modulation of TGF-β signalling in an Antarctic icefish[J].Mol Ecol,2015,24(18):4664-4678.
[11]ZHENG M G,TIAN J H,YANG G P,et al.Transcriptome sequencing,annotation and expression analysis ofNannochloropsissp.at different growth phases[J].Gene,2013,523(2):117-121.
[12]夏麗飛,陳林波,李 梅,等.基于RNA-Seq的雌蕊缺失茶樹花轉錄組分析[J].分子植物育種,2017,15(3):858-866.
[13]孫瑞芬,張艷芳,郭樹春,等.基于RNA-Seq技術的鹽脅迫向日葵轉錄組信息分析[J].分子植物育種,2015,13(12):2736-2742.
[14]蘭道亮,熊顯榮,位艷麗,等.基于RNA-Seq高通量測序技術的牦牛卵巢轉錄組研究:進一步完善牦牛基因結構及挖掘與繁殖相關新基因[J].中國科學:生命科學,2014,44(3):307-317.
[15]劉 歡,黃麗娜,張奮強,等.RNA-Seq高通量測序技術在果樹功能基因組學研究的應用進展[J].生物技術進展,2017,7(2):144-148.

JIAO Jingkai
(State Key Laboratory of Dairy Biotechnology,Shanghai Engineering Research Center of Dairy Biotechnology,Dairy Research Institute,Shanghai 200436,China)
TS261.1
0254-5071(2017)11-0118-04
10.11882/j.issn.0254-5071.2017.11.026
2017-08-07
上海市科委工程技術研究中心能力提升項目(16DZ2280600);國家“十二五”科技支撐計劃課題(2013BAD18B02)
焦晶凱(1988-),女,工程師,碩士,主要從事微生物分子生物學和乳制品方面的研究工作。