陳義珍 李浩 傅明川 王立國 劉任重 柳展基



關鍵詞:陸地棉;膜結合脂肪酸去飽和酶;全基因組鑒定;生物信息學分析;基因表達;干旱和鹽脅迫;褪黑素
脂肪酸去飽和酶(fatty acid desaturase,FAD)能夠在脂肪酸鏈的特定位置引入雙鍵,是產生不飽和脂肪酸的關鍵酶。植物中的不飽和脂肪酸主要包括油酸、亞油酸、亞麻酸和花生四烯酸等,不僅是儲藏油脂的重要組分,還是植物細胞膜脂的主要成分。FAD包括FAD2、FAD3、FAD4、FAD5、FAD6、FAD7禾口FAD8,其中FAD2和FAD6為-6(也稱A12)去飽和酶,能夠在油酸脂肪酸鏈的A12處引入第二個氫鍵,催化油酸轉變為亞油酸;FAD3、FAD7和FAD8為(-3(A15)去飽和酶,能夠在亞油酸脂肪酸鏈的A15處添加第三個氫鍵,進而產生亞麻酸;FAD4、FAD5和FAD6的催化底物為棕櫚酸。1992年,Arondel等從擬南芥中圖位克隆了FAD3基因.其后FAD基因相繼在油菜、水稻、大豆、玉米等作物中被分離。
棉花是世界上最重要的天然纖維作物,同時也是重要的食用油和蛋白來源。棉仁中油分含量高達30%~40%,棉籽油富含多種不飽和脂肪酸,其中油酸和亞油酸含量約占80%。FAD2是脂肪酸去飽和反應的限速酶,決定了油脂中油酸和亞油酸的比例和油脂品質,抑制FAD2基因的表達,能夠降低A12-脂肪酸去飽和酶的活性,致使種子中油酸含量增加。利用TALENs技術靶向敲除大豆FAD2-1A和FAD2-1B基因,純合雙基因突變體的油酸含量顯著上升,由20%提高到80%,而亞油酸含量大幅下降,由50%降至4%。Liu等利用RNAi技術抑制棉花FAD2-基因的表達,獲得的棉花高油酸品系High-Ole-lC和Mono-Cott的油酸含量分別達到77%和81%。近年來,棉花基因組研究進展迅速,二倍體棉種雷蒙德氏棉(Ds)和亞洲棉(A2)以及四倍體棉種陸地棉(AD1)和海島棉(AD2)的基因組相繼被破譯,為利用生物信息學在全基因組范圍內進行重要基因家族的鑒定和分析提供了可能。目前,已知擬南芥基因組中含有17個FAD基因,水稻中有10個,油菜中多達84個。在雷蒙德氏棉基因組中,Liu等鑒定了19個FAD基因。然而,陸地棉中FAD基因家族的系統分析尚未見報道。本研究利用最新發布的陸地棉標準系TM-I的基因組數據,對膜結合FAD基因家族進行全基因組鑒定,分析其基因結構、染色體定位、保守基序、基因復制和順式作用元件,并分析其在干旱脅迫、鹽脅迫及施加外源褪黑素下基因的表達模式,為進一步研究棉花FAD基因家族各成員的功能奠定基礎。
1材料與方法
1.1供試材料
供試陸地棉(Gossypium hirsutum L.)品種為K836,種子由本實驗室保存。采用1/2Hoagland營養液水培法將棉花幼苗培養至兩葉一心。用100umol/L褪黑素進行處理,分別于處理后0、3、6、12h對棉花葉片進行取樣,每個樣品3次生物學重復,置于液氮中凍存備用。
1.2陸地棉FAD基因鑒定與注釋
陸地棉標準系TM-1的基因組序列數據來自于CottonFGD數據庫(http://www.
cottonfgd.org/)。利用擬南芥的17個FAD基因的氨基酸序列作為查詢序列,檢索棉花基因組蛋白數據庫(Blastp,E≤e-10)。同時,從Pfam數據庫(http://pfam.xfam. org/)下載FAD蛋白保守結構域FA—desaturase(PF00487)的隱馬爾可夫模型文件,利用HMMER 3.0軟件搜索陸地棉的蛋白數據庫。將獲得的候選序列提交Pfam和SMART(http://smart.embl- heidelberg. de/)數據庫,確認是否具有FAD蛋白保守結構域。利用ExPASy(https://web. expasy. org/compute—pi/)分析棉花FAD基因家族成員的分子量和等電點。利用CELLO(http://cello. life. nctu. edu. tw/)對棉花FAD基因家族成員進行亞細胞定位預測。
1.3陸地棉FAD的系統進化和染色體定位分析
利用ClustalW軟件對擬南芥和陸地棉FAD蛋白序列進行多重序列比對,利用MEGA-X軟件中的鄰接法(neighbor-joining,NJ)構建系統進化樹,Bootstrap值設置為1000。根據陸地棉基因組提供的基因注釋信息,獲得FAD基因在各染色體上的位置,利用MapChart 2.32軟件繪制其染色體分布圖。
1.4陸地棉FAD基因結構、保守基序和上游順式作用元件分析
首先從棉花基因組注釋文件(gff文件)獲得FAD基因的DNA和cDNA信息,利用GSDS 2.0軟件(http://gsds.cbi.pku.edu. cn/)繪制棉花FAD基因家族成員的基因結構圖23]:利用在線軟件MEME(http://meme - suite. org/tools/meme)分析FAD蛋白的保守基序,基序數值設定為10。利用陸地棉基因組數據,提取FAD基因轉錄起始位點上游1500bp序列,在PlantCARE數據庫(http://bioinformatics. psb. ugent. be/webtools/plantcare/html/)中檢索,鑒定上游啟動子區域可能存在的順式作用元件。
1.5陸地棉FAD基因復制分析
利用MCScanX軟件分析陸地棉基因組內的同源基因,如比對上的序列長度超過長序列長度的75%且序列的相似性超過75%,則認為此同源基因為復制基因,并利用可視化工具Circos(ht-tp://circos.ca/)展示復制的同源關系。采用KaKs_Calculator2.0計算復制基因的K(非同義替換率)和K(同義替換率)值,通過K/K值分析環境選擇壓力。
1.6RNA-seq分析
利用前期試驗得到的陸地棉干旱(PEG)和鹽脅迫(NaCl)處理3、6、12、24h后的轉錄組數據(未發表),篩選得到FAD基因表達量數據。利用FPKM(fragments per kilobase of million mappedreads)對原始表達數據進行標準化處理,并利用TBtools軟件繪制表達量熱圖。以log2(FC)絕對值大于1為差異基因的篩選標準。
1.7基因表達分析
采用北京艾德萊生物科技(Aidlab)有限公司植物RNA快速提取試劑盒(RN3802)提取葉片總RNA,分別取1ptg總RNA進行反轉錄,反應體系和操作程序參照TRUE script RT Master Mix( On-eStep gDNA Removal) -步法基因組清除反轉錄試劑盒(PC70)說明。將反轉錄產物稀釋10倍,選擇Ubiquitin(GenBankNo.
AY189972)基因作為內參基因,進行定量RT-PCR,所用引物見表1,由北京六合華大基因科技有限公司合成。選用Aidlab公司的2xSybr Green qPCR Mix試劑盒,反應體系為20uL:2xSYBR qPCR Mix10uL,基因特異性上下游引物各0.4uL(10umol/L),模板cDNA0.8uL,補ddH20至20uL。使用Ther-mo Fisher Scientific QuantStudio 5熒光定量PCR儀,反應程序:95℃預變性3min;95℃15 s,60℃15 s,40個循環;熔點曲線程序為95℃15 s,60℃1min,95℃15s。每個樣品進行3次重復試驗,采用2-△△法計算基因的表達量。利用Graphpad進行差異顯著性分析。
2結果與分析
2.1陸地棉FAD基因家族成員的鑒定
在陸地棉基因組中共鑒定出37個FAD基因(表2),均含有保守的FA—desaturase結構域(PF00487)。FAD蛋白的氨基酸序列長度差異較大,GH_A13G0678最短,為308個氨基酸,而GH—A10G2629和GH_D10G2734最長,均為450個氨基酸;GH_A13G0678的分子量最小,為35. 41kDa,GH_A12G1258的分子量最大,為51.87kDa;FAD蛋白的等電點差異較大,GH_D06G1474的等電點最小,為6.95,其余FAD蛋白的等電點均在7.29及以上,為堿性,以GH_D05G1245的等電點最大(9.37)。大多數FAD蛋白定位在內質網和質膜上,少數FAD蛋白位于葉綠體中,僅GH_D12G1274位于溶酶體中(表2)。
2.2陸地棉FAD基因的系統進化和染色體定位分析
為了研究陸地棉FAD基因家族成員之間的進化關系,我們利用陸地棉和擬南芥FAD蛋白序列構建了系統進化樹。按照親緣關系的遠近,將陸地棉FAD基因家族分為4個亞家族,分別為First、Sphingolipid、Front-end和Omega亞家族(圖1)。4個亞家族中的FAD成員數量差異較大,其中,First亞家族中陸地棉FAD成員最少,僅有2個,而擬南芥FAD成員多達9個;Sphingolipid亞家族中僅含有1個擬南芥FAD成員,卻含有4個陸地棉成員:Front-end亞家族中陸地棉和擬南芥的FAD成員分別為10個和2個;Omega亞家族中陸地棉FAD成員數量最多,為21個,擬南芥FAD成員為5個。
根據陸地棉標準系TM-1的基因組注釋信息,將37個FAD基因定位在22條染色體上,其中AO1、A13和D01染色體上分別含有3個FAD基因;A05、A07、A10、A11、D05、D07、D10、D11和D13染色體上分別含有2個FAD基因:其余10條染色體上分別含有1個FAD基因(圖2)。
2.3陸地棉FAD基因結構和保守基序分析
陸地棉FAD基因4個亞家族呈現不同的結構特征(圖3)。First亞家族的FAD成員具有相同的基因結構,均含有5個外顯子;Sphingolipid亞家族的FAD基因亦具有相同的基因結構,均含有2個外顯子;Front-end亞家族的基因結構也比較保守,10個FAD成員中,8個FAD基因含有1個外顯子,其余2個FAD成員含有2個或3個外顯子;Omega亞家族的基因結構存在3種方式,11個FAD成員含有8個外顯子,2個成員含有10個外顯子,剩余的8個成員含有1個外顯子。
利用MEME分析陸地棉FAD蛋白的保守基序,共發現3個保守組氨酸基序(Histidine-box 1、Histidine-box 2和Histidine-box 3),但不同亞家族成員的組氨酸基序的序列不同(圖4)。Omega亞家族的Histidine-box 1為H[D/ElC[G/A]H,His-tidine-box 2為H[R/D][R/T/I] HH, Histidine-box3為H[V/I][I/A/P] HH,盡管中間的氨基酸殘基不同,但兩側均為保守的組氨酸殘基。Front-end亞家族的Histidine-box 1和Histidine-box 2序列十分保守;Histidine-box 3為Q[L/I/V] EHH,其起始氨基酸為谷酰胺。Sphingolipid亞家族成員的3個組氨酸基序都十分保守,且基序兩側皆為保守的組氨酸。First亞家族Histidine-box 3為典型的組氨酸基序,Histidine-box 1的最后一個氨基酸殘基為亮氨酸,而Histidine-box 2不具有典型的組氨酸基序特征。
2.4陸地棉FAD基因復制分析
基因復制在基因家族擴張過程中發揮重要作用。利用MCScanX對陸地棉基因組中的基因復制事件進行分析,發現FAD基因家族共存在28對片段復制基因,無串聯復制基因。其中,21對基因復制發生在A和D亞基因組之間,4對發生在A亞基因組之內,剩余3對發生在D亞基因組之內(圖5),表明片段復制是棉花FAD基因家族擴張的主要方式。隨后,利用KaKs_Calculator分析復制基因的K1/K2值,結果顯示所有復制基因的K1/K2值均小于0.55(表3)。
2.5陸地棉FAD基因上游順式作用元件分析
利用陸地棉FAD基因轉錄起始位點上游1500bp序列分析順式作用元件,結果發現棉花FAD基因的上游序列除了存在啟動子核心元件TATA-box和CAAT-box外,還存在許多激素和逆境脅迫響應元件(圖6)。其中,植物激素響應元件有9種,分別是ABRE、AuxRE、CGTCA-mo-tif、TGA-element、ERE、GARE-motif、P-box、TCA-element和TGACG-motif; ABRE、ERE和TCA-ele-ment分別響應脫落酸、乙烯和水楊酸,TGACG -motif和CGTCA-motif為茉莉酸甲酯響應元件,AuxRE和TGA-element為生長素響應元件,GARE-motif和P-box為赤霉素響應元件。逆境脅迫響應元件有6種,包括ARE、DRE、LTR、MBS、WUN-motif和TC-rich,分別是缺氧脅迫、冷害、低溫、干旱、損傷和防御響應元件。
2.6陸地棉FAD家族基因在鹽脅迫和干旱脅迫下的表達特征
為明確FAD基因在鹽脅迫和干旱脅迫下的表達模式,基于轉錄組數據對37個FAD基因在兩種脅迫處理不同時間點陸地棉葉片中的表達量進行聚類分析,結果如圖7所示。
鹽脅迫下,37個FAD基因呈現不同的表達模式,其中有28個FAD基因在不同處理時間均有表達,7個FAD基因未檢測到表達信號,而GH一A06G1435基因僅在處理后6h檢測到表達量增加,GH一DOIG2529僅在處理后24h檢測到表達量增加。另外,28個FAD基因呈現不同的表達模式,17個FAD基因表達量降低,7個FAD基因表達量增加[log2(FC》1],4個基因的表達量先增后降,2個基因的表達量先降后增(GH一D08G2811和GH_D11G0999)。
干旱脅迫下,37個FAD基因中有27個在不同處理時間均有表達,有6個未檢測到表達量變化,有4個僅在兩個處理時間點下表達量增加。另外,27個FAD基因中僅GH_D04G1454表達量增加,17個基因在干旱脅迫下表達量降低,9個基因僅在一個或兩個處理時間(6h或12h)點下表達量增加,其他時間點的表達量降低。
褪黑素作為一種重要的多效性抗氧化分子,能幫助植物抵御不利環境的危害,而且外源褪黑素能顯著緩解逆境脅迫引起的傷害。因此,本研究基于干旱脅迫和鹽脅迫下FAD基因的轉錄組結果,選出25個FAD基因(包括Front-end亞家族的8個,Omega亞家族的15個,First亞家族的1個,Sphingolipid亞家族的1個),通過在棉花苗期施加外源褪黑素,進一步探究FAD基因在外源褪黑素下的表達特征。定量分析結果顯示,在褪黑素處理后,1個FAD基因(GH_AOIG1380)未檢測到表達量的變化,另外24個FAD基因與對照相比,有7個基因表達量增加,17個基因表達量降低,且上調表達的FAD基因均在處理后6h表達量增加最多。Front-end亞家族8個FAD基因中有6個基因在褪黑素處理后表達量增加,2個基因表達量降低;Omega亞家族表達的14個FAD基因中僅有1個在處理后表達量增加,其他基因都呈現表達量降低趨勢;First、Sphingolipid亞家族的各1個基因則均在處理后表現為表達量降低(圖8)。
3討論與結論
植物脂肪酸作為儲藏油脂和細胞膜脂的重要組分,既為植物的生長發育提供能量,也在響應多種逆境脅迫中發揮重要作用。FAD是植物脂肪酸進一步去飽和反應中的關鍵酶,目前已在擬南芥、水稻、花生、大豆和油菜等物種中相繼完成了全基因組水平上的鑒定和分析。本研究從陸地棉基因組中鑒定出37個FAD基因,而二倍體雷蒙德氏棉僅含有19個FAD成員,是其1.95倍,造成這種差異的原因可能是棉花進化過程中的異源多倍化現象。棉屬植物進化分析表明,在170萬~190萬年前,陸地棉由A基因組供體亞洲棉和D基因組供體雷蒙德氏棉種間雜交加倍而成。另外,陸地棉FAD基因數量遠多于模式植物擬南芥和水稻,分別是其2.18倍和3.70倍。
進化分析將陸地棉和擬南芥的FAD基因分為4個亞家族,且每個物種的FAD基因在4個亞家族中均有分布,表明FAD基因的分化可能早于棉花和擬南芥的物種分化。除了First亞家族,其他3個亞家族中陸地棉FAD基因的數量遠多于擬南芥,預示Omega、Front-end和Sphingolipid亞家族中的陸地棉FAD基因可能在進化過程中發生了物種特異性擴張。這一結果與之前二倍體雷蒙德氏棉中的報道一致。
基因復制是植物進化的主要動力,主要包括串聯復制、片段復制和全基因組復制。本研究在陸地棉FAD基因家族中發現了28對復制基因,來源于4個亞家族,且全為片段復制,表明在陸地棉進化過程中FAD基因由于片段復制發生了基因家族擴張。。值常用來檢驗同源基因是否經歷了選擇作用,K/K>1,認為有正選擇作用,為純化或負選擇作用;K/K=1,則認為存在中性選擇作用。本研究中所有復制基因的K/K值均小于1,表明陸地棉FAD基因在進化過程中經歷了純化選擇作用。
順式作用元件分析發現,陸地棉FAD基因的啟動子區含有植物激素和逆境脅迫響應元件,預示其可能在激素信號響應和防御逆境脅迫中起作用。目前,已知雷蒙德氏棉中有7個FAD基因受低溫誘導表達.5個FAD基因受低溫抑制表達。部分FAD基因呈現組織特異性表達,如FAD2-1在發育的種子中特異表達,FAD2-2和FAD2-3在種子發育過程中組成型表達,在葉片中少量表達。
植物中位于質膜上的脂肪酸大部分是不飽和脂肪酸,而植物對環境脅迫的抗性與質膜上脂肪酸的不飽和程度密切相關,膜結合基因對維持植株在多種脅迫下的正常生長起著非常重要的作用。在擬南中,FAD2和FAD6是提高幼苗早期生長耐鹽性的重要基因,FAD7基因的反義表達則降低了對鹽脅迫和干旱脅迫的耐性。在番茄中超表達LeFAD3基因增強幼苗早期生長的耐鹽性。為探究陸地棉FAD基因在逆境脅迫下的表達模式,利用鹽脅迫和干旱脅迫的轉錄組數據對陸地棉37個FAD基因進行分析,發現70%以上的FAD基因對兩種脅迫均有應答,其中下調表達的FAD基因分別占54%和63%。值得注意的是,本研究Front-end亞家族包含的10個基因中除了亞細胞定位預測在溶酶體的GH一D12G1274基因外,其余9個基因全部定位于質膜,干旱脅迫后7個基因都是下調表達,GH_A12G1258和GHD11G0999基因也僅在6h或24h表達量增加,說明干旱脅迫可能會抑制質膜上FAD基因的表達。
褪黑素在植物非生物脅迫防御系統中發揮重要作用,且幾乎所有非生物脅迫引起的過氧化傷害都能被褪黑素緩解。褪黑素提高植物對環境脅迫抗性機制主要是通過提高抗氧化物質含量和抗氧化酶活性,改善光合系統,調控激素合成和代謝,調控植物細胞中初級和次級代謝,刺激細胞合成更多的保護物質等方式。通過定量PCR,進一步分析了25個FAD基因在施加外源褪黑素后的表達特征,發現17個基因下調表達.7個基因上調表達,1個基因沒有表達變化。值得注意的是,Front-end亞家族中的5個基因在干旱脅迫后下調表達而在褪黑素處理后上調表達,且在處理后6h表達量顯著增加,它們可作為候選基因用于后續基因功能的進一步探究。本研究結果可為進一步揭示陸地棉FAD基因逆境響應機理提供參考。