陸 娜, 宋吉玲, 閆 靜, 王偉科, 周祖法, 黃小蘇, 袁衛東
(杭州市農業科學研究院, 杭州 310024)
雙孢蘑菇(Agaricusbisporus)又稱白蘑菇、蘑菇、洋蘑菇,它是世界性栽培和消費的菇類,有"世界菇"之稱[1].浙江省也作為全國雙孢蘑菇主產區之一,主要采用工廠化栽培方式,產量高,質量優,且能周年生產.在工廠化雙孢蘑菇栽培中,雙孢蘑菇營養生長階段,環境條件主要以保持高溫濕等環境狀態,但轉入生殖生長階段,則需要一個“冷卻-降溫”的過程,保持相對較低的溫濕度,所謂催蕾就是采用人工干預環境溫度的方法讓蘑菇菌絲從營養生長狀態轉為生殖狀態,所以工廠化能實現利用降溫刺激調控原基發育并直接影響后期雙孢蘑菇子實體收獲的統一性及商品性[2].目前,工廠化雙孢蘑菇生產中頻繁出現菇蕾生長不均勻,層次不明顯、球菇發生等問題,影響了雙孢蘑菇的產量及品質,不利于產業健康發展,這些都是由于催蕾期雙孢蘑菇菌絲發育到菌絲扭結形成原基過程中的分子機制、一系列基因協調作用的過程尚未清楚[3]導致了催蕾技術的不完善.因此,深入了解雙孢蘑菇催蕾期至原基生長發育中整體基因表達情況,對差異表達基因進行功能注釋、分類并解析其代謝途徑,為闡明雙孢蘑菇原基分化發育的分子機理提供理論基礎.
近年來,隨著后基因組時代的到來,諸如轉錄組學、蛋白質組學等新興分子生物學技術的相繼出現,為食用菌生長發育分子機制研究提供了眾多方法.如在秀珍菇(Pleurotuspulmonarius)冷刺激時期的轉錄組分析中找到PpSln1和PpHog1基因表達起重要作用[4].雙孢蘑菇AS2796、灰樹花(grifolafrondosa,maitake)等子實體不同發育時期轉錄組分析獲得了大量轉錄本信息[5,6],雖然雙孢蘑菇的全基因組序列測定已經完成,但大量的研究只在于不同發育階段的進行了轉錄組分析,但針對雙孢蘑菇催蕾期菌絲發育至原基過程中的基因表達規律都未見報道.
本實驗基于雙孢蘑菇催蕾期對其原基、子實體發育的重要影響,選用催蕾期不同降溫刺激的下的菌絲體為材料,運用轉錄組測序技術進行研究分析,以期篩選出催蕾降溫開始至子實體時期差異表達基因,并利用生物信息學方法對篩選得到的差異表達基因進行功能注釋、分類并解析其代謝途徑,全面分析雙孢蘑菇催蕾期不同降溫刺激下菌絲生長、原基形成的關鍵基因,結合蘑菇產量和質量指標最終確定最佳降溫刺激時長,進一步完善雙孢蘑菇催蕾技術,促進產業健康發展.
供試菌株為雙孢蘑菇品種W192,實驗在浙江省嘉善市寧遠農業開發有限公司工廠化出菇房進行培養及樣品采集.雙孢蘑菇經過播種、覆土、搔菌后進入從21.5 ℃勻速降到17.5 ℃的降溫刺激催蕾階段,選取降溫刺激0 d、4 d、6 d、8 d的覆土層內菌絲體,每個處理設置3次重復,將采集到的菌絲體樣品(10 g)立即移至液氮冷凍罐并放于超低溫(-80 ℃)冰箱.
2.2.1 雙孢蘑菇不同樣品總RNA樣品提取及質量檢測 采用RNA試劑盒提取待測樣品總RNA,使用Nanodrop檢測RNA的濃度、純度(OD260/OD280、OD260/OD230)、核酸吸收峰.用Agilent2100進一步精確檢測RNA的RIN值、28 S/18 S、5 S峰等指標評價其完整性.樣品檢測合格后,進行文庫構建,使用Q-PCR方法對文庫的有效濃度(文庫有效濃度>2 nmol/L)進行準確定量,以保證文庫質量.庫檢合格后,不同文庫按照目標下機數據量進行pooling,用Illumina平臺進行測序.
2.2.2 數據組裝、表達量注釋及差異表達基因的篩選 將下機數據進行過濾得到Clean Data,利用HISAT2、StringTie與指定的參考基因組進行序列比對、組裝和定量,得到的Mapped Data進行文庫質量評估和結構水平分析.采用FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)方法計算每個注釋基因的表達量,獲得0vs4d、0vs6d、0vs8d的基因的FPKM值.并用DEseq法篩選兩個樣本之間的差異表達基因集,所得的P值使用Benjamini和Hochberg的方法進行調整,以控制FDR(False Discovery Rate),DEseq發現P值<0.05的基因被分配為差異表達基因.
2.2.3 差異表達基因GO分類 基于Wallenius非中心超幾何分布[7]的GOseqR軟件包用于篩選出差異表達基因(DEGs)的基因本體(GO)富集分析.
2.2.4 Pathway富集分析 使用KOBAS[8]軟件測試KEGG途徑中差異表達基因的統計富集.
2.2.5 生長趨勢及產量記錄 采用0 d、4 d、6 d、8 d降溫刺激進行催蕾出菇,每個處理為1個出菇房,隨機選取不同高度的菇架進行長勢觀察及產量記錄,設置3個重復,每個重復面積為10 m2,記載原基形成、出菇的時間、整齊度、層次、產量、子實體的數量性狀、優質菇率等數據.
如下表1所示,經過測序質量控制,共得到84.71 GbCleanData,基因組GC含量為49.45%,各樣品Q30堿基百分比均不小于95.61%.將CleanReads與參考基因組進行序列比對,獲取位置信息以及測序樣品特有的序列特征信息,對比結果表示:各樣品的Reads與參考基因組的比對效率在64.49%至85.52%之間,共比對到11 576個轉錄本,測序結果的組裝質量達到要求,質量較好,可以用于下一步的分析.

表1 測序數據結果統計
以對照0 h基因的表達為基準,分析采用4 d、6 d、8 d降溫刺激的基因差異表達情況,差異表達基因滿足Fold-change≥2、P≤0.05.從圖1可以看出樣本在不同降溫刺激后與對照相比差異表達基因數明顯增加,圖中的每一個點表示一個基因,0vs4d有1102個差異表達基因,其中顯著上調的基因個數為664,下調為438;0vs6d有1481個差異表達基因,其中顯著上調的基因個數為870,下調為611;0vs8d有1386個差異表達基因,其中顯著上調的基因個數為757,下調為629;同一時間段上調和下調基因數相差最大的是6d,有259個差異基因.維恩圖(圖2)顯示不同降溫刺激下共有820個共同差異基因,也產生特有的差異表達基因,其中 0vs6d形成的差異表達基因數最多,為328.

圖1 溫刺處理與對照間基因差異表達分析火山圖

圖2 差異表達基因集維恩圖
我們對不同降溫刺激下差異表達基因進行GO功能注釋,統計其注釋分類結果(圖3),發現生物學過程(biological process)、細胞組分(cellular componrnt)、分子功能(molecular function)三大功能分類分別包含了14、11和12個功能分類.其中差異表達基因在細胞組分和生物學過程中分布較多.在細胞組分分組中的差異表達基因主要分布在薄膜(membrane)及組分(membrane)和細胞(cell)及組分,所占比例分別為45.6%和30.93%,擬核(nucleoid)含量最低,僅有6個基因下調表達.在分子功能分組中的差異基因主要分布在催化活性(catalytic activity)和結合(binding),所占比例分別為52.57%和35.62%,營養庫活性類(nutrient reservoir activity)中包含的差異表達基因數最少,只有3個.在生物學過程分組中,代謝過程(metabolic process)、單生物過程(single-organism process)及細胞過程(cellular process)所占比例最高,分別為34.76%、23.4%及19.9%,且上調表達基因數在2/3以上.其中,0vs6d比較組除了在代謝、細胞過程中差異基因占優外,在脅迫響應(response to stimulus)、子實體分化(reproduction)和發育過程(developmental process)等條目下的差異基因明顯并基本為上調表達,說明6 d降溫刺激下更加有利于提高雙孢蘑菇發育過程中的適應能力,對生長發育起到促進作用.
根據差異表達基因顯著性富集結果顯示,在生物學過程分組中,氨基酸代謝過程是不同降溫刺激下共有顯著富集的類型,0vs6 d比較組在糖酵解類型中也顯著富集,說明6 d刺激下的差異表達基因參與的細胞內進行各種氨基酸和糖代謝更明顯.
對3個對照組的差異表達基因進行KEGG功能注釋,通過Pathway富集分析發現:差異表達基因富集到20個通路類別,主要參與代謝途徑和信號途徑(圖4),選取差異基因富集數目較多的Patheway進行分類整理分析得到主要代謝通路是氨基酸代謝(48個差異基因)和碳水化合物代謝(56個差異基因).4 d有186個差異表達基因注釋到92個分類代謝途徑中,有113個差異表達基因是上調表達的; 6 d有259個差異表達基因注釋到97個分類代謝途徑中,有169個差異表達基因是上調表達的; 8 d有241個差異表達基因注釋到96個分類代謝途徑中,有138個差異表達基因是上調表達的.進一步對3個對照組進行分析發現:6 d和8 d相關差異基因定位到丁酯代謝、脂類代謝、萜類化合物合成分類上,并且呈上調表達,而4 d沒有,其中6 d在多糖生物合成代謝的糖胺聚糖降解、脂類代謝的類固醇合成及亞麻酸代謝分類中都有特有的差異基因,并且呈上調表達.
3個樣本間的差異表達基因進行KEGG通路富集分析結果表明:差異表達基因主要富集在氨基酸和抗生素生物合成通路上.其中6 d出現了差異表達基因在糖酵解和核糖體生物合成通路富集,其中6 d比較組有16個基因富集到糖酵解途徑,并且15個呈上調表達,由圖6所示,糖酵解途徑將葡萄糖和糖原降解為丙酮酸并伴隨一系列反應,涉及基因作用于葡萄糖、果糖、甘油醛及磷酸烯醇丙酮酸等代謝產物,可能會參與到淀粉和蔗糖代謝、磷酸戊糖、丙酮酸代謝等途徑.

圖5 6 d差異表達基因KEGG通路富集圖Fig.5 Enrichment diagram of 6 d differentially expressed genes in KEGG pathway
對不同降溫刺激下的雙孢蘑菇長勢、產量及密度等進行了觀察記錄.如圖7所示,結果表明:降溫4 d的雙孢蘑菇長速最快,從降溫開始第7 d陸續出現原基,第12 d進入采收期;降溫6 d雙孢蘑菇從降溫開始第9 d陸續出現原基,第13 d進入采收期.降溫8 d雙孢蘑菇長速明顯較慢,從降溫開始第10 d陸續出現原基,第15 d進入采收期.
雙孢蘑菇產量情況如下表2所示,不同降溫刺激下的雙孢蘑菇均為第一潮產量較高,占總產的50%左右,二、三潮菇產量遞減的趨勢.4 d和6 d降溫刺激產量為26.39 kg/m2和26.23 kg/m2,4 d產量略高,但無顯著性差異,8 d和對照的產量較低,分別為21.79 kg/m2和19.47 kg/m2.
試驗以單位面積的出菇個數為統計依據,對出菇密度進行了觀測.4個處理下的出菇密度分別為602個/m2、627個/m2、575個/m2和483個/m2,出菇密度最高值為4 d,6 d低于4 d,8 d出菇密度最低,但是從商品菇角度來觀測,6 d刺激下產出商品菇最多,其次是8 d,次品菇發生率最多是4 d和對照.

圖6 6 d富集到糖酵解途徑紅色框代表上調表達基因,綠色框代表下調表達基因Fig.6 Enriched in glycolysis pathway at 6 dthe red box represents up-regulated genes, and the green box represents down-regulated genes

圖7 雙孢蘑菇生長趨勢

表2 不同降溫刺激下雙孢蘑菇產量情況

表3 不同降溫刺激下出菇密度
近年來轉錄組測序技術解決了雙孢蘑菇分子理論基礎研究薄弱,遺傳背景了解不深入的問題,從整體水平上研究了雙孢蘑菇不同生長期基因功能及結構[3],揭示了特定生物學過程中的分子機理.但催蕾期是雙孢蘑菇菌絲營養生長轉向生殖生長,菌絲體扭結形成原基乃至子實體分化發育的啟動期,是一個復雜的生長過程.其中低溫處理是催化原基形成的關鍵時期,該過程受一系列基因協調的作用.不同溫度刺激將影響其生長機理,其中涉及到基礎代謝、細胞伸長、細胞結構的變化、信號轉導和脅迫響應.所以對催蕾期不同環境控制下差異表達基因的研究有助于更深入了解菌絲體到原基發育的分子機理,對于雙孢蘑菇后期子實體發育和成熟有著重要的作用.本研究選用催蕾期中的不同溫刺強度處理的菌絲體進行轉錄組測序,通過了解差異基因的種類和數量、基因的功能、GO分類以及代謝過程等,有助于我們更深入研究雙孢蘑菇原基形成機制,為工廠化栽培雙孢蘑菇標準環境參數制定提供理論依據.
本研究發現,利用RNA-Seq轉錄組測序結合生物信息學對4 d、6 d、8 d溫刺強度處理的雙孢蘑菇菌絲體進行分析,篩選出不同溫刺處理下差異表達基因.其中6 d溫刺強度與對照有1481個差異基因,較8 d和4 d分別高出6.9%和34%,并且同一時間段上調和下調基因數相差最大的是6 d,有259個差異基因.
GO數據庫適用于各個物種,包含生物學過程(Biological Process),分子功能(Molecular Function)和細胞組分(Cellular Component)三個主要分支.將所有差異基因進行GO功能聚類分析發現差異基因在細胞組分和生物學過程中分布較多.重要的是發現6 d除了在代謝、細胞過程中差異基因占優外,在脅迫響應、子實體分化和發育過程等條目下的差異基因明顯并基本為上調表達,上調轉錄本大多是與細胞成長發育相關的轉錄本,上調表達大多都是促進作用[9].而4 d和8 d并沒有出現這類差異基因,可以推斷6 d處理下的雙孢蘑菇菌絲體在應對環境變換時有更好的適應能力,對生長發育起到促進作用.同時,根據差異表達基因顯著性富集結果顯示,在生物學過程分組中,氨基酸代謝過程是不同降溫刺激下共有顯著富集的類型, 6 d在糖酵解類型中也顯著富集,說明6 d刺激下的差異表達基因參與的細胞內進行各種氨基酸和糖代謝更明顯.
在生物體內,不同的基因產物相互協調來行使生物學功能,對差異表達基因的通路(Pathway)注釋分析有助于進一步解讀基因的功能.KEGG(Kyoto Encyclopedia of Genes and Genomes)是系統分析基因功能、基因組信息數據庫,它有助于研究者把基因及表達信息作為一個整體網絡進行研究.作為有關Pathway的主要公共數據庫[10],KEGG提供的是整合代謝途徑 (pathway)查詢,包括碳水化合物、核苷、氨基酸等的代謝及有機物的生物降解,不僅提供了所有可能的代謝途徑,而且對催化各步反應的酶進行了全面的注解,包含有氨基酸序列、PDB庫的鏈接等等,是進行生物體內代謝分析、代謝網絡研究的強有力工具.本研究通過Pathway富集分析發現:差異表達基因富集到通路類別,主要參與代謝途徑和信號途徑,選取差異基因富集數目較多的Patheway進行分類整理分析得到主要代謝通路是氨基酸代謝和碳水化合物代謝.其中6 d和8 d相關差異基因定位到丁酯代謝、脂類代謝、萜類化合物合成分類上,并且呈上調表達,而4 d沒有,其中6 d在多糖生物合成代謝的糖胺聚糖降解、脂類代謝的類固醇合成及亞麻酸代謝分類中都有特有的差異基因,并且呈上調表達.而形成脂肪類化合物能為生物體提供氮源,并在細胞分化、細胞膜穩定性的維持及職務的感知及生理應急方面起著重要作用[11].KEGG通路富集分析結果表明:差異表達基因主要富集在氨基酸和抗生素生物合成通路上.其中6 d出現了差異表達基因在糖酵解和核糖體生物合成通路富集,而4 d和8 d未出現,說明在6 d的降溫強度下雙孢蘑菇有更顯著的應答反應.根據mRNA差異顯示技術研究菌絲體及子實體差異表達基因[12]的研究結果表明,菌絲期的糖酵解可能涉及菌絲發育成原基過程中的某些活躍的生理生化活動,如能量代謝等.參與的糖酵解途徑將葡萄糖和糖原降解為丙酮酸并伴隨一系列反應,涉及基因作用于葡萄糖、果糖、甘油醛及磷酸烯醇丙酮酸等代謝產物,可能會參與到淀粉和蔗糖代謝、磷酸戊糖、丙酮酸代謝等途徑當中.
鮮菇質量和產量是雙孢蘑菇生產水平的重要體現,也是催蕾技術是否成熟的評價標準.研究通過記錄不同降溫刺激下雙孢蘑菇長勢、產量、密度及商品性發現4 d、6 d降溫刺激下蘑菇產量較高,4 d出菇早,密度高,但分層不明顯導致菇型受到影響,相比之下6 d降溫刺激在保證產量的同時也提升了產品的品質.
本研究利用轉錄組測序技術對工廠化雙孢蘑菇催蕾期降溫階段不同降溫刺激下菌絲體材料進行測序,通過生物信息學等方法對該階段雙孢蘑菇菌絲體多種代謝途徑進行分析,從不同角度對重要的差異基因進行了注釋和討論,初步明確了3種降溫刺激下基因表達變化情況、差異表達基因的數量、GO分類及代謝過程、出菇產量及品質等.研究表明6 d降溫刺激下的GO功能聚類分析、差異表達基因的Pathwai富集分析等較其他處理具有明顯不同,說明采用6 d的降溫刺激會讓菌絲體有更好的適應能力,對于原基形成和子實體生長發育起到促進作用,同時更加有利于蘑菇產量和品質的形成.此結果為工廠化雙孢蘑菇催蕾期環境調控提供了科學理論,為進一步挖掘雙孢蘑菇原基形成和子實體生長的關鍵基因奠定基礎.