肖艷華 鄒智 趙永國 郭安平 張麗
(1.中南民族大學生命科學學院 武陵山區特色資源植物種質保護與利用湖北省重點實驗室,武漢 430074;2.中國熱帶農業科學院三亞研究院 熱帶生物技術研究所 海南省南繁生物安全與分子育種重點實驗室,海口 571101;3.廣東石油化工學院生物與食品工程學院,茂名 525000)
雜草是影響農作物生長與產量的重要限制因子。一直以來,雜草防除都是病蟲草害防治過程中的重中之重。除草劑,又名除莠劑,是一類可使雜草徹底或選擇性枯死的藥劑。除草劑的發明及其在農業生產上的廣泛應用為雜草的高效防除創造了條件。根據有效成分的化學結構,除草劑可分為氨基酸類、三嗪類、苯脲類、酰胺類等,其作用機制是通過干擾與抑制生理代謝而使雜草死亡,如影響光合作用、影響脂肪酸的合成、影響色素的合成、阻礙氨基酸的合成、干擾葉酸的形成、干擾激素平衡等[1]。植物中目前已確定的除草劑靶標約有10余種[2],其中,乙酰乳酸合酶(acetolactate synthase,ALS,EC2.2.1.6)或乙酰羥酸合酶(acetohydroxyacid synthase,AHAS)是合成纈氨酸、亮氨酸、異亮氨酸等支鏈氨基酸的關鍵酶,其在纈氨酸和亮氨酸的合成中催化2分子丙酮酸生成乙酰乳酸和二氧化碳,而在異亮氨酸的合成中催化1分子丙酮酸與1分子α-丁酮酸生成2-乙醛基-2-羥基丁酸和二氧化碳[3]。ALS基因廣泛分布于各類植物以及真菌、細菌、古細菌和藻類中,在基因組中以單拷貝或小家族的形式存在[3]。目前己開發的ALS抑制劑有50多種,可歸為磺酰脲(sulfonylurea,SU)、咪唑啉酮(imidazolinone,IMI)、三唑并嘧啶(triazolopyrimidine,TP)、嘧啶硫代苯甲酸酯(pyrimidinyl-thiobenzoate,PTB)和磺酰胺羰基三唑啉酮(sulfonyl-aminocarbonyltriazolinone,SCT)等5大類[4]。這些抑制劑通過與ALS結合而使其失活,進而造成支鏈氨基酸合成受阻、蛋白質合成停止、有絲分裂細胞停止在G1階段的S期(DNA合成期)和G2階段的M期,最終導致植物停止生長并失綠黃化死亡,具有高效、低毒、環境友好、選擇性強等優點[2,4]。雖然如此,ALS抑制劑的廣泛和長期應用極大加速了雜草的進化,至今報道的抗性雜草已超過160種[5]。抗性的分子基礎主要源于ALS的點突變,如Ala122、Pro197、Ala205、Asp376、Arg377、Trp574、Ser653和 Gly654( 對 應于 AtALS 的相應位點)[4-5]。
油莎豆(Cyperus esculentus L.),又名油莎草、虎堅果、鐵荸薺、黃色特格拉斯(yellow nutsedge)、地下板栗、地下核桃等,是一種優質、高產、綜合利用前景廣闊的集油、糧、草、飼于一體的經濟作物[6]。與香附子(Cyperus rotundus)或紫色特格拉斯(purple nutsedge)一樣,隸屬于禾本目莎草科莎草屬的油莎豆地上長草、地下結豆;不同的是,油莎豆的塊莖積累高水平的油脂(24%-35%)[7]。相比其他油料作物,油莎豆具有生育期短(70-150 d)、生物量大(畝產鮮豆800-2 000 kg、鮮草2 000 kg以上)、每畝產油量高(超過100 kg)、適應性廣(我國多數地區均可種植)、病蟲害少、抗逆性強(耐旱、耐澇、耐高溫、耐鹽堿、耐貧瘠等)、發展潛力大、適合機械化等特點,便于在不擠占糧食和大豆生產面積的情況下增加我國的油脂和飼料原料供給,緩減對國外大豆的依賴程度,滿足國家的戰略需求[6,8]。但是,在我國華中、華南乃至華北地區大面積推廣種植油莎豆存在一定的生態風險:首先,油莎豆的地下莖系統非常發達,其中匍匐莖和塊莖均可繁殖,多數除草劑不能將其徹底清除,這也是為什么香附子成為世界惡性雜草的主要原因;其次,地里殘留的油莎豆塊莖萌發不整齊,且在上述區域可安全越冬,來年勢必成為連茬作物的雜草;此外,ALS抑制劑抗性在莎草屬的部分植物中已有發現,其中包括油莎豆[9-12]。為摸清我國油莎豆資源的遺傳基礎,本研究對油莎豆的ALS基因進行克隆,并基于現有的種質資源分析其遺傳變異,揭示其序列特征、進化關系及表達特性,以期為今后的分子設計育種奠定基礎。
供試材料為種植于中國熱帶農業科學院熱帶生物技術研究所文昌試驗基地(海南文昌)的圓粒型油莎豆熱研1號及另外55份種質,早期初步發現其對ALS抑制劑無抗性。用于提取DNA的幼嫩葉片直接采集于試驗地,而用于提取RNA的熱研1號于采樣前10 d移栽至溫室(海南海口),具體培養條件和樣品采集詳見文獻[8]。大腸桿菌DH5α感受態細胞和植物表達載體pCAMBIA1301由本實驗室制備和保存;引物合成和常規DNA測序委托北京擎科生物技術有限公司完成;基因組測序委托武漢希望組生物科技有限公司完成;天根DNA Marker Ⅲ(貨號MD103)、天根植物多糖多酚RNA提取試劑盒、賽默飛cDNA第一鏈合成試劑盒、Omega快速質粒小提試劑盒、Omega DNA純化回收試劑盒、諾唯贊ClonExpress II One Step Cloning Kit(C112-02)試劑盒、Promega DNase I酶、寶生物高保真DNA聚合酶及各類分析純生化試劑和實驗耗材均購自相應的試劑公司。
1.2.1 ALS基因的鑒定 擬南芥的ALS基因下載于Araport11(https://www.arabidopsis.org/),并以其蛋白序列作為種子tBLASTn檢索研究組前期獲得的油莎豆全長轉錄組[8]以及代表性植物的基因組[13-14]。
1.2.2 總RNA提取與cDNA第一鏈的合成 采用天根試劑盒單獨提取幼嫩葉片、成熟葉片、衰老葉片、芽、芽莖、塊莖等不同組織樣本的總RNA,經純度、濃度和完整性檢測合格后用DNase I酶清除殘存的DNA,并用反轉錄試劑盒合成cDNA第一鏈,然后置于-80℃冰箱保存備用。
1.2.3 基因克隆 基于上述轉錄組文庫獲得的CeALS轉錄本序列,采用PrimerPremier5.0軟件設計基因克隆和同源重組引物對CeALSF(5′-TCC TCT CCA TTC CAT TCC ATT CG-3′)/CeALSR(5′-ACA ACA CCT GAG GGA ACC GC-3′)和 CeALSHF(5′-CAC GGG GGA CTC TTG ACC ATG GCT TCC TCT TCC TCC CTC-3′)/CeALSHR(5′-CTG GTC ACC TGT AAT TCA CAC CTA GTA CAC AGT CCG GCC ATC-3′)(下劃線為可與pCAMBIA1301重組的同源臂)。基因克隆參照文獻[15]進行,PCR產物采用1%瓊脂糖凝膠電泳檢測;為一步完成植物表達載體的構建,研究以稀釋100倍的第一輪PCR產物作為模板,利用同源重組引物進行第二輪PCR,產物電泳檢測后切膠回收目的條帶;同時,用Nco I和Pml I 37℃酶切pCAMBIA1301 12 h,產物經0.8%瓊脂糖凝膠電泳檢測后回收目的條帶;然后,將上述線性化載體和PCR膠回收產物按1∶2比例混合,并用Exnase II 37℃催化2 h,構建載體pCAMBIA1301-CeALS。重組質粒轉化DH5α感受態后,參照文獻[15]進行后續的菌落PCR、測序及質粒的提取。
1.2.4 基因組測序與分析 采用改良的CTAB法[16]分別提取56份葉片材料的基因組DNA,經純度、濃度和完整性檢測合格后等量混合,然后用全基因組鳥槍法構建二代400 bp的小片段DNA文庫,并利用NovaSeq 6000進行150 bp雙末端測序。序列比對和SNP分析分別采用 bwa-mem(v0.7-17)[17]和GATK(v3.8.1)[18]。
1.2.5 序列分析 參照文獻[19],利用ProtParam(https://web.expasy.org/protparam/)分析蛋白的理化特性;利用Protscale(http://cn.expasy.org/tools/protscale.html)分析親水 /疏水性;利用 TMHMM 2.0(http://www.cbs.dtu.dk/services/TMHMM/)預測跨膜螺旋;利用ChloroP 1.1(http://www.cbs.dtu.dk/services/ChloroP/)預測亞細胞定位和葉綠體信號肽剪切位點;利用CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 和 SMART(http://smart.embl-heidelberg.de/) 分析保守結構域;利用InterPro(http://www.ebi.ac.uk/interpro/search/)預測生物學功能;利用MEGA6.0進行多序列比對及進化樹的構建。
1.2.6 表達特性分析 熒光定量分析具體參照文獻[20],以18S rRNA作為內參,引物對分別為18SF(5′-TGT GAT GCC CTT AGA TGT TCT GG-3′)/18SR(5′-GAC GTA GTC AAC GCG AGC TGA-3′)和 CeALSFq(5′-GCA GGT TTG GGT GCT ATG GG-3′)/CeALSRq(5′-TGG CCT TGA CAG GTA GGT TCT CTA T-3′),每樣品至少3次生物學重復,基因相對表達值和方差分析分別用2ΔΔCt法和SPSS進行。
通過搜索實驗室前期構建的油莎豆全長轉錄組文庫,獲得一條2 425 bp的轉錄本(圖1),該序列包含1 938 bp的開放讀碼框(ORF),其序列長度與其他植物相近,將基因命名為CeALS。為實驗克隆該基因,在其5′和3′轉錄非翻譯區(UTR)分別設計引物CeALSF和CeALSR,目標擴增長度為2 161 bp;通過以熱研1號反轉錄的cDNA作為模板進行PCR擴增,成功獲得一條約2 000 bp的特異條帶(圖2-A);隨后,以上述PCR產物作為模板、CeALSHF/HR作為引物進行第二輪PCR,成功擴增到一條約1 977 bp的清亮條帶(圖2-B)。將目標條帶切膠回收后與線性化載體pCAMBIA1301混勻、孵育、轉化大腸桿菌,菌落PCR后挑取陽性克隆進行測序分析。結果顯示,研究分離到的序列與上述全長轉錄本的編碼區(CDS)完全一致。

圖1 CeALS的全長cDNA及其推測編碼的氨基酸Fig.1 Full-length cDNA sequence of CeALS and its deduced coding amino acids

圖2 油莎豆CeALS基因的PCR擴增Fig.2 PCR amplification of CeALS in C.esculentus
為揭示油莎豆的分類學地位并探討ALS基因在單子葉植物中的分布與進化特征,研究基于公共數據庫中釋放的全基因組序列對ALS基因進行了鑒定,從14種代表性的單子葉植物中共計鑒定到19個ALS基因;同時,研究還從4種無參考基因組的莎草科植物中檢索獲得7個包含完整編碼區的ALS基因。如表1所示,ALS基因在這些植物中多以單拷貝的形式存在,而在康藏嵩草(Carex littledalei)、二穗短柄草(Brachypodium distachyon)、水稻(Oryza sativa)、玉米(Zea mays)和香蕉(Musa acuminata)中存在2個拷貝;基因在擬南芥和多數單子葉植物中無內含子,而在康藏嵩草、短葉水蜈蚣(Cyperus brevifolius)、 螢 藺(Schoenoplectiella juncoides)、 豬毛草(Schoenoplectiella wallichii)和沼澤蘆葦(Schoenoplectiella mucronata)等莎草科植物中存在一個內含子(表1)。
2.3.1 CeALS編碼蛋白的理化特性、亞細胞定位及保守結構域 序列分析顯示,CeALS編碼區的GC含量為55.01%,預測編碼645個氨基酸(圖1),其中含量較高的依次為Leu(9.30%)、Ala(9.30%)、Ser(8.37%)和Val(8.20%);強堿性、強酸性、極性和疏水氨基酸所占比例分別為9.61%、10.70%、24.19%和35.66%;蛋白的理論分子量(MW)為69.94 kD,等電點(pI)為6.10,pH 7.0時的帶點荷數(ch)為-4.785,脂肪族指數(AI)為89.36,這與其他物種相近;與多數物種類似,CeALS的總平均疏水指數(GRAVY)<0,為-0.156,疏水性最高的為343位的Leu和345位的Phe(分值2.011)、親水性最高的為473位的Tyr和474位的Lys(分值-2.822);CeALS的不穩定系數(II)與多數物種類似,為44.93,屬于不穩定蛋白(表1)。TMHMM分析顯示CeALS無跨膜螺旋;ChloroP分析顯示蛋白葉綠體定位,其前端的54個氨基酸殘基為信號肽;CDD分析顯示蛋白的67-645為乙酰乳酸合酶結構域(PLN02470,E值0e+00);SMART分析進一步顯示蛋白的72-240為硫胺素焦磷酸酶N端TPP結合結構域(TPP_enzyme_N,PF02776,E值4.4e-50)、264-397為硫胺素焦磷酸酶中央結構域(TPP_enzyme_M,PF00205,E值1.5e-42)、459-614為硫胺素焦磷酸酶C端TPP結合結構域(TPP_enzyme_C,E值 2.3e-45)(圖2);InterPro分析顯示 CeALS主要參與分支氨基酸的生物合成(GO:0009082),具有TPP結合(GO:0030976)、FAD結合(GO:0050660)、Mg2+結合(GO:0000287)、催化活性(GO:0003824)和乙酰乳酸合酶活性(GO:0003984)等分子功能。

表1 擬南芥和20種單子葉植物中ALS基因的結構及其編碼蛋白的理化特性Table 1 Gene structure and physicochemical properties of ALS genes in Arabidopsis and 20 monocots
2.3.2 SNP分析 如圖3所示,序列比對表明至今已報道可引起除草劑抗性改變的8個位點在CeALS與AtALS間完全一致。為進一步摸清研究組收集的其他種質是否存在相關抗性變異,我們對其進行了基因組重測序,并從中獲得30個SNP(表2),深入分析顯示他們僅造成了4個氨基酸的變異,即Lys211Gln、Leu538Val、Asp568Asn 和 Ser591Ala。

表2 SNP分布情況Table 2 Distribution of SNPs

圖3 CeALS蛋白的多序列比對和序列特征Fig.3 Multiple sequence alignment and sequence features of CeALS protein
2.3.3 進化分析 同源分析顯示,NCBI中至今僅報道了CeALS 716 bp的部分編碼區序列(序列號KM624613.1);而CeALS與莎草科植物中同源蛋白的一致性都在90%以上,其中,與CbALS的一致性甚至高達94.92%。進一步的進化分析證實了這種結果,CeALS與CbALS聚在一起,接著是同屬的CdALS以及同科物種來源的蛋白,其次才是同目的禾本科植物;雙子葉植物擬南芥位于基部,棕櫚目的油棕(Elaeis guineensis)和椰棗(Phoenix dactylifera)、芭蕉目的香蕉、微子目的小蘭嶼蝴蝶蘭(Phalaenopsis equestris)和天南星目的紫萍(Spirodela polyrhiza)都形成獨立的分支。有意思的是,除二穗短柄草和水稻外,其他來源于同一物種的旁系同源蛋白都聚在一起,暗示他們可能通過物種特異性的基因重復產生(圖4)。OsALS1/OsALS2和BdALS1/BdALS2的一致性分別為75.70%和83.60%,但OsALS1/BdALS1和OsALS2/BdALS2的一致性分別為89.30%和76.60%,這表明這些重復基因在兩物種分化之前就已產生。

圖4 ALS蛋白的進化分析Fig.4 Phylogenetic analysis of ALS proteins
圖5所示的組織表達特性分析顯示,基因在成熟和衰老葉片中的表達豐度最高,顯著高于幼嫩葉片;在塊莖中的表達豐度與幼嫩葉片相當,顯著高于芽和芽莖。

圖5 CeALS在不同組織中的表達模式Fig.5 Expression pattern of CeALS in various tissues
作為支鏈氨基酸生物合成的關鍵酶,ALS是SU、IMI、TP、PTB和SCT等除草劑的作用靶標[3]。雖然絕大多數植物原本對這些除草劑高度敏感,但高選擇壓引起的ALS突變賦予了部分生態型的抗藥性,并且有關抗藥突變的報道與日俱增[5]。如以模式植物擬南芥的ALS作為標準分子,目前的抗性突變主要集中在Ala122等8個位點,他們對除草劑的種類和抗性程度均存在較大的差異:Ala122Thr突變可產生IMI抗性,但對SU和PTB敏感,對于TP而言則似乎存在物種差異;Ala122Val突變產生SU和IMI抗性,卻對SCT、TP和PTB敏感;Ala122Asn突變則產生對SU、IMI、TP和PTB四類除草劑的抗性;Pro197和Trp574是目前報道變異最多的位點,Pro197突變主要引起SU抗性,而Trp574突變則可造成更為廣譜的抗性(含上述5類除草劑);Ala205突變主要引起IMI和PTB抗性;Asp376突變可引起5類除草劑的抗性,但抗性程度物種差異較大;Asp376His突變可引起SU、TP和SCT抗性;Ser653突變主要引起IMI和SCT抗性;Gly654突變可引起SU、IMI和SCT抗性,但對PTB敏感[4-5]。在莎草科中,至今已有7種植物發現抗藥性,即螢藺、沼澤蘆葦、短葉水蜈蚣、異花莎草(Cyperus difformis)、碎米莎草(Cyperus iria)、扁穗莎草(Cyperus compressus)和油莎豆[10-12,21-24]。螢藺至少含有 2個 ALS基因,均含有一個內含子,其任一拷貝的Pro197His/Ser/Leu突變都可賦予SU抗性,而其對SU、IMI和PTB的抗性則為SjALS2的Trp574Leu突變引起[21];此外,SjALS2的Asp376Glu突變可引起高水平的SU和PTB抗性以及低水平的IMI抗性[23]。沼澤蘆葦至少含有3個ALS基因,SmALS1和SmALS2包含1個內含子,而SmALS3則無內含子;作為主要表達的基因,SmALS1編碼蛋白的Pro197His和Trp574Leu均可引起抗藥性[22]。短葉水蜈蚣、異花莎草、扁穗莎草和碎米莎草可能僅編碼一個ALS基因,其在短葉水蜈蚣中含有1個內含子,Pro197His/Ser/Ala突變是前3者抗藥性產生的原因,而Trp574Leu突變則是碎米莎草抗藥性產生的原因,這與油莎豆類似[10-12,24-25]。
研究基于實驗室前期獲得的油莎豆全長轉錄組,首次完成了CeALS全長cDNA的克隆。為便于進化和比較分析,研究同時還從14個已完成基因組測序的代表性單子葉植物中鑒定到19個同源基因,其中,基因以單拷貝居多,約占64.29%。在含有2個拷貝的5種植物中,康藏嵩草隸屬于禾本目莎草科,二穗短柄草、水稻和玉米屬于禾本目禾本科,香蕉屬于芭蕉目;康藏嵩草的2個拷貝均含有1個內含子,這與其他莎草科的螢藺、沼澤蘆葦、豬毛草和短葉水蜈蚣一致,而另外4種植物的2個拷貝均無內含子,這與擬南芥和其他多數單子葉植物一致,暗示莎草科植物ALS基因的內含子可能是在科分化后獲得,屬于莎草科特異的,而無內含子的SmALS3可能通過逆轉錄產生[22]。事實上,將克隆到的CeALS轉錄本比對到油莎豆的基因組也證實該物種同樣也含有1個內含子。與康藏嵩草、螢藺、沼澤蘆葦和豬毛草不同的是,油莎豆僅含有1個拷貝,暗示油莎豆在莎草科的分化過程沒有經歷多倍化事件或者基因加倍后又發生了丟失。
基于葉綠體基因的進化分析顯示油莎豆可歸為禾本目[26]。然而,前期的全長轉錄組測序與分析顯示,在獲得的57 849條高質量序列中,除將近30%的注釋為禾本科植物外,另有約40%的被注釋為油棕和椰棗[8]。為進一步揭示油莎豆的分類學地位,研究利用ALS蛋白構建了包括擬南芥在內的21種植物的無根進化樹。與前期分類學一致的是,擬南芥位于進化樹的基部,天南星目、微子目、芭蕉目、棕櫚目和禾本目都形成獨立的分支。隸屬于粉狀胚乳目的菠蘿(Ananas comosus)雖然與禾本目聚在一支,但主要原因可能與低樣本量有關,適當增加粉狀胚乳目的物種數有望較好解決上述問題。在禾本目分支中,進化樹明顯支持莎草科與禾本科的姊妹科關系。
研究克隆到的CeALS編碼645個氨基酸,其理論分子量為69.94 kD、等電點為6.10、脂肪族指數為89.36、總平均疏水指數為-0.156,屬于葉綠體定位的親水性蛋白,這與其他物種類似。CeALS蛋白含有乙酰乳酸合酶特有的PLN02470結構域,其中 包 含TPP_enzyme_N、TPP_enzyme_M和TPP_enzyme_C三個完整的功能域,可與TPP、FAD和Mg2+三種輔助因子結合。序列比對和SNP分析證實,熱研1號及本團隊收集的其他55份種質不存在抗藥性突變,這與生產實踐中ALS抑制劑可高效殺死這些種質是一致的。根據表達分析結果,CeALS的表達水平隨著葉片的發育而顯著增加;值得注意的是,CeALS在塊莖中的表達豐度與幼嫩葉片相當,暗示其在該組織的分支氨基酸積累中可能起著重要的作用。
完成了油莎豆參與支鏈氨基酸合成的CeALS基因的克隆、序列特征、進化及表達特性分析,較好地揭示了油莎豆的分類學地位,同時也證實團隊收集的56份油莎豆種質不存在抗藥性變異。