王衍坤,沈怡,范佳琪,陳思旭,夏法剛,季彪俊
(福建農林大學農學院,福建 福州 350002)
甘藍型油菜(下稱“油菜”)是我國重要的油料作物之一,在世界上是僅次于大豆的油料作物[1]。油菜在為人類提供食用油的同時,也可以作為動物飼料、生物燃料等為人類生產生活提供豐富的物質材料,因此油菜的種植與研究對人類具有重要意義[2]。種子含油量是油菜最重要的品質性狀之一,對油菜種子含油量進行遺傳改良,可以滿足人們的食用需求。不同油菜種子材料之間的含油量差別明顯[3],提高油菜種子含油量,一直以來都是油菜育種工作者的研究重點和熱點。
目前,在油菜種子含油量的遺傳分析和QTL 定位[4]、調控油脂合成關鍵基因的功能研究、油脂合成相關基因的表達和代謝調控等方面取得了豐碩的研究成果。雖然油脂合成的代謝通路已經研究透徹,但影響油菜種子含油量和調控油脂合成的因素多種多樣[5-6],闡釋這些因素對油脂合成調控的機理,有助于加快油菜高含油量分子育種的進程。在種子發育的過程中,許多基因在不同階段所發揮的作用也不盡相同,因此,分析種子發育過程中油脂合成相關基因的動態表達水平以及在蛋白質組水平上的代謝調控,有利于系統地解析油脂的合成過程,進一步了解含油量的決定因子。
本試驗利用轉錄組測序技術,重點分析油菜種子不同發育時期油脂合成相關基因的動態表達水平,有利于加深對油菜油脂合成過程的了解,為后期高含油量油菜品種的選育以及轉錄組測序技術在油菜分子遺傳上的有效運用提供有力幫助。
甘藍型油菜“中9”為研究對象,取發育中(授粉后15 d)和成熟期種子作為試驗材料,每個材料3 次重復。
剝去種皮,只保留種子,用于RNA 提取。種子剝離后放入液氮冷凍,于-80 ℃保存。利用總RNA 提取試劑盒提取RNA,并于70%乙醇中-20 ℃長期保存。建庫和測序由北京諾禾致源科技股份有限公司完成。
測序的下機數據使用FastQC 進行質控,符合分析標準的測序數據轉而使用Trimmomatic 軟件進行過濾,以去除低質量的Reads(Trimmomatic 軟件參數如下:LEADING:3TRAILING:3SLIDINGWINDOW:4:15MINLEN:30)。使用STAR 軟件,將過濾后的reads 比對到油菜參考基因組序列上。接著,使用RSEM軟件對各個樣本進行轉錄本定量。使用定量分析的結果生成矩陣,構造DESeq2 的輸入文件,進行兩個組合之間的差異表達分析。P≤0.05 且|log2foldchange|>1 的基因被認為存在差異表達。
通過基迪奧生信分析平臺(https://www.omicshare.com/tools/)的GO 富集分析模塊實現差異表達基因的GO 富集分析(P<0.05)。
使用KOBAS 3.0 軟件分析KEGG 通路中差異表達基因的統計富集,以P 調整值作為閾值。
對油菜種子成熟期和發育期表達基因進行差異表達基因的篩選,共篩選得到油菜種子成熟期相對于發育期差異表達基因總數為36 294 個,其中上調轉錄基因數量為13 423 個,下調轉錄基因數量為22 871 個。
通過對成熟期種子表達上調的基因進行GO 注釋(如圖1 所示)可知,生物過程中富集到基因條目數量最多的依次為代謝過程(GO:0008152,3 435 個基因)、細胞過程(GO:0009987,3 250 個基因)、單有機體過程(GO:0044699,2 091 個基因)等。細胞組件富集到基因條目數量最多的依次為細胞(GO:0005623,1 827個基因)、細胞部分(GO:0044464,1 827 個基因)等。分子功能富集到基因條目數量最多的依次為綁定(GO:0005488,6286 個基因)、催化活性(GO:0003824,3228 個基因)等。

圖1 油菜成熟期種子上調表達基因GO 注釋圖
通過對成熟期種子表達下調的基因進行GO 注釋(如圖2 所示)可知,生物過程中富集到基因條目數量最多的依次為代謝過程(GO:0008152,6 262 個基因)、細胞過程(GO:0009987,5429 個基因)、單有機體過程(GO:0044699,4 589 個基因)等。細胞組件富集到基因條目數量最多的依次為細胞(GO:0005623,2 735 個基因)、細胞部分(GO:0044464,2 735 個基因)、膜(GO:0016020,2 294 個基因)等。分子功能富集到基因條目數量最多的依次為綁定(GO:0005488,8 925 個基因)、催化活性(GO:0003824,6 661 個基因)等。

圖2 油菜成熟期種子下調表達基因GO 注釋圖
差異表達基因GO 注釋分析結果表明,成熟期的油菜種子和發育期的油菜種子中表達差異基因在生物過程中都富集于代謝過程,在細胞組件一類中富集于細胞、細胞部分、膜和細胞器,在分子功能一類中富集于綁定。乙酰輔酶A 羧化酶是脂肪酸合成過程中的關鍵酶,其主要存在于質體和胞質中,脂肪酸的合成是在葉綠體中完成。由此得以說明,油菜種子油脂合成和植物質體的代謝過程有關。
根據KEGG 數據庫,對差異上調表達基因進行功能分類和Pathway 注釋,如圖3 所示,其中1 365 個基因注釋到115 條代謝途徑中,200 個基因富集到代謝通路途徑,注釋基因最多;156 個基因富集到核糖體途徑;104 個基因富集到次生代謝物生物合成途徑等。富集比例最高的是內酰胺類抗生素途徑,富集比例為0.15,然后依次是0.14 的咖啡因代謝途徑、0.125 的酮體合成和降解途徑等。

圖3 油菜成熟期種子上調表達基因KEGG 富集分析
對差異下調表達基因進行功能分類和Pathway 注釋,如圖4 所示,其中1 653 個基因注釋到115 條代謝途徑中,337 個基因富集到代謝通路途徑,注釋基因最多;184 個基因富集到次生代謝物生物合成途徑等。富集比例最高的是光合作用-天線蛋白通路途徑和次級代謝物的生物合成通路途徑,富集比例為0.295,然后是富集比例為0.237 的光合作用途徑等。

圖4 油菜成熟期種子下調表達基因KEGG 富集分析
差異表達基因的通路分析表明,甘藍型油菜成熟期種子中差異表達基因上調與代謝通路、核糖體途徑等相關,上調基因富集于內酰胺類抗生素途徑、咖啡因代謝途徑、酮體合成和降解途徑;差異基因下調則與代謝通路、次生代謝等相關,下調基因富集于光合作用-天線蛋白通路途徑和次級代謝物的生物合成通路途徑、光合作用途徑。相關研究表明,作為脂肪酸合成首步反應的關鍵因子之一的ACCase,其活性受光限制,并且在油菜光合作用時,一些從葉綠體中產生的ATP和NADPH 會被用在脂肪酸的合成中。
通過對差異表達基因的KEGG 富集分析發現,上調基因中參與脂肪酸降解、不飽和脂肪酸的生物合成、脂肪酸代謝、脂肪酸延伸的基因分別有11 個、4 個、7個和2 個,下調基因中參與脂肪酸生物合成、脂肪酸降解、不飽和脂肪酸的生物合成、脂肪酸代謝、脂肪酸延伸的基因分別有18 個、2 個、6 個、18 個和4 個,見表1。說明在油菜種子不同發育時期,參與脂肪酸生物合成、脂肪酸降解、不飽和脂肪酸的生物合成、脂肪酸代謝、脂肪酸延伸等與油脂代謝相關的基因表達水平發生了明顯變化,共同調控油脂的合成與代謝。

表1 油菜種子油脂代謝相關差異表達基因匯總
油菜作為我國的主要油料作物,在我國農業生產和生活中占據著非常重要的地位。隨著國民經濟的飛速發展和市場的需求,提高油菜品種的油脂含量成為了育種者的主要目標之一。目前,國際上有許多關于油菜油脂合成相關基因的研究報道,但對這些基因如何調控油菜油脂合成等相關問題還有待科研工作者的后續研究。
本試驗通過轉錄組測序技術,對甘藍型油菜“中9”不同發育時期的種子樣品的轉錄組數據進行分析,重點關注甘藍型油菜種子不同發育時期與油脂合成有關的基因表達變化,為研究油脂合成相關基因代謝調控機理提供理論基礎,同時也為后期選育高含油量油菜品種和RNA-seq 在分子生物學上的有效運用提供了支持。