郭盼 孔華 王雨 戴云素 賈瑞宗 周瑤 郭安平 紀長綿 馬春花
關鍵詞:番木瓜;LysM-RLK 家族;生物信息分析;基因表達;蛋白三維結構
中圖分類號:S667.9 文獻標識碼:A
大多數蛋白質編碼基因在植物基因組中以多拷貝或基因家族的形式存在[1–3]。例如,水稻和擬南芥分別有41 908 和31 135 個基因,分別包含13 055 和10 193 個基因家族[1]。ZHANG 等[2]研究發現一個基因家族基因成員的數量不僅在屬內物種之間存在差異,而且在一個物種內也存在變化,基因家族成員數量的變化與生物性狀的遺傳變異顯著相關。因此,系統鑒定并解析基因家族進化關系是理解目標基因家族參與植物生物學過程的基礎。類受體蛋白激酶家族(receptor-like kinase,RLK)是植物基因組中一個大基因家族,前期研究主要集中于基因家族的結構和系統發育分析[4],較少涉及解析該家族成員的功能和活性。第一個植物RLK 基因在玉米(Zea mays L.)中被鑒定[5]。在雙子葉植物模式物種擬南芥( Arabidopsisthaliana)中,至少鑒定了610 個RLK 基因,約占其蛋白質編碼基因的2.5%[4]。在單子葉植物模式物種水稻(Oryza sativa L.)中,RLK 家族由1130個基因組成,其成員數量是擬南芥的1.85 倍[6]。
RLK 基因已被證明參與包括植物生長發育、激素信號感知、抗病和抗逆等在內的生物學過程[7]。賴氨酸基序受體激酶(LysM-RLK)是植物中重要的RLK 亞家族之一,其成員屬于包含賴氨酸基序(LysM)的蛋白質,是識別微生物相關分子模式( microbe-associated molecular patterns,MAMPs)的模式識別受體(pattern recognitionreceptors, PPR)[8-10]。LysM 首次在芽孢桿菌噬菌體溶菌酶中發現之后,在來自糞腸球菌(Enterococcusfaecalis)的名為肽聚糖水解酶的酶中亦發現了LysM[11-12]。植物細胞膜上有一個識別受體,其包含LysM 結構域,能夠與真菌細胞壁上的幾丁質結合并傳遞信號以激活免疫反應,這一類蛋白根據亞細胞定位的預測和結構域的差異,可以分為LysM 類受體激酶(LysM-containing recetor-likekinases, LYKs ) 、LysM 類受體蛋白( LysMcontainingreceptor-like protein, LYPs)、細胞外LysM 蛋白(extracellular LysM, LysMe)及非分泌型胞內LysM 蛋白( intracellular non-secretoryLysM genes, LysMn),不同物種的單個蛋白含LysM結構域的數量有所不同,這是長期進化導致的差異,且與蛋白的功能相關[13]。隨著測序技術的快速發展和相關組學數據的積累,已證實LysM 結構域蛋白廣泛存在于動植物生物體基因組中[14-15]。
番木瓜(Carica papaya L.)是熱帶特色水果,具有很高的營養價值和藥用價值,屬于熱區重要經濟作物之一。番木瓜基因組小(350.3 Mb)、常年開花結果、種子多、生長快、代際短及遺傳轉化體系成熟,是果樹研究重要模式材料[16]。已有研究報道表明LysM-RLK 家族參與植物抗病和脅迫響應[17],然而其在番木瓜全基因組水平基礎特征信息、進化關系及基因表達模式研究的不足嚴重阻礙了其在番木瓜新品種選育中的開發利用。本研究采用生物信息學方法在全基因組水平系統鑒定了番木瓜LysM 家族基因,并分析了其家族成員的進化關系、染色體分布、基因蛋白和結構特征等。基于已有的84 份代表性轉錄組樣品數據,系統解析了番木瓜LysM 家族成員在不同組織、不同發育過程和不同脅迫處理條件下的轉錄模式及表達分化。相關研究為理解番木瓜LysM家族起源演化,復制基因表達分化及其在不同生物學過程中轉錄表達模式提供重要理論基礎,將促進其在番木瓜抗病育種中的研究和應用。
1 材料與方法
1.1 材料
從Pfam 數據庫下載LysM 種子文件,用hmmer search 方法篩選番木瓜和葡萄(Vitis viniferaL.)基因組中對應的同源基因作為候選基因。
1.2 方法
1.2.1 番木瓜LysM-RLK 成員鑒定及理化性質與亞細胞定位分析 利用NCBI Conserved DomainSearch(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)數據庫,基于保守結構域、在線分析工具Pfam( http://pfam.xfam.org/ ) 和SMART(http://smart.emblheidelberg.de/)[18]預測保守域[19]。利用ExPASy(http://expasy.org/)在線軟件對從番木瓜基因組中鑒定到的7 條候選類受體蛋白激酶家族的蛋白序列進行分子量、理論等電點預測。利用SMART(http://smart.embi-heidelberg.de/)在線軟件對所有基因保守結構域的位置進行預測。進一步利用在線工具WoLFPSORT(http://wolfpsort.hgc.jp)對番木瓜LysM-RLK 基因進行亞細胞定位預測。
1.2.2 番木瓜LysM-RLK 家族蛋白的基因結構、結構域分析及蛋白質三級結構預測 使用TBtools 軟件[20]對基因結構進行可視化。利用MEME(http://meme-suite.org/)在線軟件基于相似度較高的基序(motif),分析番木瓜LysM-RLK基因家族成員蛋白序列保守特征及特征展示。使用SMART(https://smart.embl.de/)在線軟件進行LysM-RLK 基因結構域預測。使用人工智能網絡算法工具AlphaFold2[21]預測番木瓜LysM-RLK 家族蛋白三維結構,獲得蛋白三維結構PDB 文件。將獲得的PDB 文件輸入到PyMOL V2.3[22]軟件包中,對蛋白三維結構進行可視化展示。
1.2.3 番木瓜LysM-RLK 蛋白系統發育分析及LysM-RLK 基因染色體定位 為了闡明番木瓜(Carica papaya)、擬南芥(Arabidopsis thaliana)和葡萄(Vitis vinifera L.)中的LysM-RLK 家族成員之間的系統發育關系,構建LysM-RLK 家族進化樹。采用muscle v3.8.31 軟件對來自番木瓜(7個LysM-RLKs)、擬南芥(4 個LysM-RLKs)和葡萄(11 個LysM-RLKs)的22 個LysM-RLK 蛋白質序列進行多重序列比對。使用BMGE1.12 軟件,選用參數為默認參數,在多重序列比對中選擇適合系統發育推斷的高質量比對區域。最后,利用IQ-TREE(V2.1.2)軟件[23]構建LysM-RLK亞基因家族的最大似然( maximum-likelihood,ML)系統發育樹。
根據番木瓜基因組注釋文件,提取番木瓜LysM-RLK 基因在染色體上的位置信息,利用在線程序(http://mg2c.iask.in/mg2c v2.1/)展示其在番木瓜基因組上位置分布特征。
1.2.4 復制基因鑒定及選擇壓力(Ka/Ks)分析及復制基因共線性鑒定 使用Dup Gen finder[24]流程鑒定番木瓜LysM-RLK 基因家族的復制基因對及復制類型。進一步計算復制基因對的Ka/Ks 值,評估其在進化過程中面臨的選擇壓力。首先利用Muscle(https://www.ebi.ac.uk//Tools/msa/muscle/)在線軟件對每一個復制基因對蛋白序列進行全局比對。然后,利用ParaAT(V2.0)軟件[25]將比對序列反向翻譯成對應的cds 序列。最后,利用KaKscalculator 軟件[26]計算非同義替換率(Ka)、同義替換率(Ks)和Ka/Ks[24]值,使用多重序列共線性搜索工具MCscan 搜索番木瓜全基因組的同源共線片段。
1.2.5 番木瓜LysM-RLK 家族啟動子分析 根據番木瓜基因組注釋gff 文件,提取得到番木瓜LysM 基因翻譯起始位點上游2000 bp 的序列作為候選啟動子區域。通過在線軟件PlantCARE( http://bioinformatic.psb.ugent.be/webtools/plantcare/html/)分析LysM-RLK 家族啟動子順式作用元件。
1.2.6 LysM-RLK 基因在生物與非生物脅迫條件下的表達模式分析 番木瓜轉錄組數據收集。從NCBI 數據庫中下載84 份與番木瓜相關轉錄組數據,其中非生物脅迫相關的轉錄組測序數據29條、不同組織轉錄組測序數據15 條,生物脅迫相關轉錄組數據40 條,共組成43 組轉錄組數據,具體信息見附表S1。
基因表達定量。轉錄原始測序數據經過Fastp軟件包質控以后,用HISAT2 軟件[27]將高質量的轉錄組測序數據比對到番木瓜參考基因組得到序列比對文件。然后采用StringTie 軟件[28]組裝比對上的reads,構建轉錄本序列,并采用FPKM 算法對read count 做歸一化處理計算基因和轉錄本的表達量。
差異表達及表達分化基因鑒定。最后利用DESeq2 軟件[29]鑒定差異表達基因:差異倍數FC≥2,差異顯著性FDR>0.05。利用R 語言的heatmap函數繪制LysM-RLK 基因表達量熱圖。同一組樣品中復制基因對之間表達量的比值≥2,定義為表達顯著分化的復制基因對。
1.2.7 番木瓜LysM-RLK 家族蛋白的基因結構、結構域分析及蛋白質三級結構預測 使用TBtools[20]軟件對基因結構進行可視化。利用MEME(http://meme-suite.org/)在線軟件基于相似度較高的基序,即motif,分析番木瓜LysM-RLK基因家族成員蛋白序列保守特征及特征展示。使用在線軟件SMART(https://smart.embl.de/)進行LysM-RLK 基因結構域預測。使用人工智能網絡算法工具AlphaFold2[21]預測番木瓜LysM-RLK 家族蛋白三維結構,獲得蛋白三維結構PDB 文件。將獲得的PDB 文件輸入到PyMOL V2.3[22]軟件包中,對蛋白三維結構進行可視化展示。
1.2.8 番木瓜LysM-RLK 家族加權基因共表達網絡分析 通過炭疽病、番木瓜畸形花葉病毒(Papaya leaf-distortion mosaic virus,PLDMV)、禾生素(CTS)、干旱等處理的轉錄組數據篩選差異表達基因(DEGs)。處理組與對照組差異基因鑒定參數為|log2 FC(FPKM)|≥1,FDR≤0.05。共篩選出10 490 個差異基因。采用R 語言的WGCNA 包構建LysM-RLK 家族基因的加權共表達網絡。分析鑒定共表達模塊,在模塊中鑒定基因共表達差異表達基因作為核心基因(hub-genes),并利用Cytoscape 軟件對核心基因的共表達網絡(hub-network)可視化。
2 結果與分析
2.1 LysM-RLK 家族基因鑒定及特征分析
利用5 個擬南芥的LysM-RLK 家族基因作為參考[4],將其比對到番木瓜和葡萄的蛋白序列,根據序列相似性篩選到LysM-RLK 候選同源基因(identify≥45%)。如果其編碼區同時存在N 末端LysM 基序、1 個跨膜結構域和C 末端Pkinase保守結構域的經典的LysM-RLK 結構域模式,則認為其屬于LysM-RLK 基因家族。本研究在番木瓜、擬南芥和葡萄基因組中分別鑒定到7 個、4個和11 個LysM-RLK 家族基因。為獲得番木瓜LysM-RLK 家族蛋白的理化特征信息,利用生物信息學方法解析了番木瓜的7 個LysM-RLK 基因家族成員的蛋白長度、分子量、理論等電點和亞細胞定位。結果表明其氨基酸序列大小為445~692,分子量為49.85~76.10 kDa,等電點為5.12~8.69(表1)。利用在線軟件WoLFPSORT 預測番木瓜7 個LysM-RLK 基因的亞細胞定位信息,結果發現這7 個家族成員定位于不同亞細胞區域。其中1 個基因(CpLYK5)位于細胞質膜,1 個基因( CpLYK5-like ) 位于胞質, 1 個基因位于(CpLYK2)胞外區域,其余4 個基因(CpLYK4-1、CpLYK3、CpLysM-RLK3、CpLYK4)定位于葉綠體(表1)。該分析結果暗示不同的LysM-RLK基產物可能被轉運到番木瓜不同的亞細胞區域,進而參與不同的生物學過程。
2.2 LysM-RLK 家族的基因結構特征及保守結構域分析
外顯子的獲得或丟失可能引起基因對應的蛋白質結構域結構和蛋白質功能的變化[30]。因而,本研究比較了LysM-RLK家族成員之間的基因結構特征。結果發現LysM-RLK 基因主要由1~11 個外顯子構成,其中CpLYK5 屬于單外顯子基因,CpLYK3基因長度達到53 476 kb,包含11 個較小的外顯子。CpLYK3 存在多個大內含子插入的現象,導致其基因長度明顯大于該家族的其他基因(圖1A)。外顯子數量的增加可以增加mRNA 剪接模式多樣性,并導致包括DNA 結合親和力[31],蛋白質溶解度[32]和蛋白質功能[30]等改變,內含子的插入能夠增強目標基因的表達并影響轉錄本(mRNA)的衰變或定位[30, 33]。以上證據暗示內含子插入和外顯子數量差異可能會引起番木瓜LysM-RLK 家族不同成員之間的結構差異和功能分化。
基因家族中共有的基序(motif)可能是該基因家族保守結構域序列,暗示其是基因家族基礎功能核心序列。利用MEME(http://meme-suite.org/)在線工具對番木瓜的LysM-RLK 基因家族成員進行保守結構域鑒定(圖1B,表2)。結果表明番木瓜LysM-RLK 蛋白的motif 長度最小為15,最大為50。在MEME 鑒定得到的10 個motif中,motif2 的保守性得分最高,并且按照一致的順序排布(圖1B)。
2.3 LysM-RLK 基因家族進化關系及染色體位置分布特征
為了揭示LysM-RLK 基因家族成員的進化關系,本研究利用極大似然法構建了葡萄、番木瓜和擬南芥的LysM-RLK 基因家族系統發育樹(圖2)。結果表明番木瓜的LysM-RLK 基因家族成員分成3 個獨立分支(LysM-Ⅱ~LysM-IV),其中分支LysM-Ⅱ中含有2 個番木瓜LysM-RLK 基因,分支LysM-Ⅲ中含有2 個番木瓜LysM-RLK基因,分支LysM-IV 中含有3 個番木瓜LysM-RLK基因,暗示其在進化過程中產生了功能分化。
解析LysM-RLK 在番木瓜基因組上分布特征,結果表明番木瓜的7 個LysM-RLK 家族基因主要分布在chr02、Chr04、chr07 和chr09 染色體上(圖3)。CpLYK5-like 分布在2 號染色體的遠端粒區(chr02: 37 470 447~37 472 556 bp)。CpLYK2(chr04: 4 182 588~4 189 453 bp)、CpLYK5(chr04:32 118 333~32 120 412 bp) 、CpLYK4-1 ( chr04:34 635 116~34 637 111 bp)分別位于4 號染色體遠端粒區域。CpLYK3(chr07: 9 452 026~9 505 502 bp)、CpLYK4(chr07: 15 723 626~15 726 091 bp)分布在7號染色體的遠端粒區域。CpLysM-RLK3(chr09:7 478 070~7 487 382 bp)分布于9 號染色體的遠端粒區域。
2.4 早期基因復制事件驅動番木瓜LysM-RLK家族的形成
已有研究表明基因復制是導致植物基因家族擴張的重要進化驅動力,促進基因家族內部同源基因之間功能分化,為植物的遺傳多樣性提供重要支撐[33]。基因復制分析發現番木瓜LysM-RLK家族中5 個基因均來源于dispersed 類型復制(表3),表明基因復制對其家族成員形成具有重要貢獻。番木瓜與葡萄、擬南芥一樣經歷了大約1.2億年前的一次真雙子葉植物共有的祖先全基因組三倍化事件(γ-WGT)[34-35]。然而,本研究未發現由全基因組復制事件(whole genome duplication,WGD)對番木瓜LysM-RLK 基因家族的貢獻(表3),暗示LysM-RLK 基因家族的基因復制可能發生在γ-WGT 事件之后。因而,本研究進一步評估了基因復制發生的時間(表3)。結果發現番木瓜LysM-RLK 家族的基因發生復制的時間大約在1.83 百萬年~3.00 百萬年之間,遠遠晚于真雙子葉γ-WGT 事件發生時間。推測祖先基因組三倍化事件(γ-WGT)產生的LysM-RLK 復制基因(wgd-type duplicated genes)可能在番木瓜基因組進化過程中被丟失[33, 35],而番木瓜基因組中新的基因復制促進了番木瓜LysM-RLK 家族的形成。
為了明確重復基因的位點關系,在番木瓜基因組上用紅線將LysM-RLK 復制基因對相連(圖4)。結果發現4 號染色體上含有3 個基因參與復制,2 號染色體和9 號染色體上都含有1 條基因參與復制。在番木瓜的7 個LysM-RLK 基因中有5 個基因被鑒定為基因復制來源基因。LysM-RLK基因家族中,位于2 號染色體的基因CpLYK5-like是LysM-RLK 基因家族中最早出現基因復制的基因,并分化出基因CpLYK2 和基因CpLYK4-1 兩個基因,推測4 號染色體的CpLYK2、CpLYK4-1可能來自2 號染色體CpLYK5-like 內部的基因復制事件。CpLysM-RLK3 由CpLYK5 復制得到,推測9 號染色體的CpLysM-RLK3 可能來自4 號染色體CpLYK5 的基因復制事件。
2.5 番木瓜LysM-RLK 家族基因啟動子區域的順式作用元件預測
本研究將番木瓜LysM-RLK 基因5?UTR 上游2000 bp 的序列作為啟動子序列。通過PlantCARE軟件分析啟動子區域的順式作用元件。發現番木瓜LysM-RLK 基因啟動子區域的包括組織特異性元件、非生物脅迫相關元件、激素響應元件和功能相關元件4 類順式作用元件(圖5)。其中CpLYK4 和CpLysM-RLK3 含有參與低溫響應順式元件。CpLYK5、CpLYK4-1 和CpLYK4 含有參與水楊酸反應的順式作用元件。部分基因的啟動子序列中包含包括多種激素響應、低溫應答及逆境響應等生物學過程相關的順式作用元件。上述結果暗示LysM-RLK 基因可能參與調控番木瓜的抗逆防御和生長發育等重要生物學過程。
2.6 LysM-RLK 基因在番木瓜不同組織和生物學過程中表達模式
為了研究番木瓜中LysM-RLK 家族潛在的生物學功能,本研究系統地解析其在番木瓜生物脅迫、非生物脅迫條件下及不同組織中的基因表達模式(圖6A)。通過對84 個轉錄組數據進行表達定量分析,發現番木瓜LysM-RLK 基因家族成員明顯地分成高表達和低表達2 個模式。CpLYK4-1 和CpLYK5-like 基因整體表現出低表達的趨勢,而CpLYK2、CpLysM-RLK3、CpLYK4、CpLYK5 和CpLYK3 傾向于高表達。值得注意的是CpLYK4-1 和CpLYK4 在不同病毒和炭疽病侵染條件下(ANT, AIN1, PAPMV, SIN2, G20, Y61)顯著差異表達,并且相對于對照組其表達量明顯上調,暗示它們在番木瓜抗病響應中具有重要生物學功能。相對于其他組織,CpLYK5-like 在正常的根組織中特異性高表達,并且在干旱脅迫條件下表達量明顯下調,表明其在根組織中負調控干旱脅迫。轉錄組數據分析表明,干旱脅迫過程(0~20 d)中,CpLYK4 在葉片組織表達量逐漸上調,在根組織表達量逐漸下調。同時,CpLYK4 在番木瓜炭疽病侵染過程中高表達量,并且隨著侵染時間延長(0、24、48 h)表達量逐漸上調。以上結果表明CpLYK4 同時參與響應葉片干旱脅迫和炭疽病侵染過程。CpLYK5 和CpLYK3 兩個基因在不同組織、不同發育過程、生物脅迫和非生物脅迫條件下整體呈現高表達現象,暗示它們的功能對番木瓜生長發育和脅迫響應至關重要。CpLYK3 在WMV 病毒侵染和花粉組織中不表達,表明其不參與WMV 病毒侵染過程和花粉發育。
為了解析復制基因之間功能差異,本研究重點關注鑒定得到的7 對復制基因的表達情況(圖6B)。發現CpLYK5-like/CpLYK2、CpLYK5-like/CpLYK4-1、CpLYK2/CpLYK5、CpLYK4-1/CpLYK2和CpLysM-RLK3/CpLYK5 五對復制基因在不同組織、生物脅迫和非生物脅迫條件下表現出明顯的基因表達量分化現象。其中約3 百萬年前產生的復制基因CpLYK5-like、CpLYK5 和CpLYK4-1 之間出現明顯的表達量分化。CpLYK5 在不同組織、生物脅迫和非生物脅迫條件下顯著高表達,而其復制基因CpLYK5-like 和 CpLYK4-1 則表現出低表達量,暗示復制基因在進化過程中出現了功能分化現象。
2.7 LysM-RLK 家族的功能結構域和蛋白序列三級結構解析
根據表達分析結果,推測復制基因對CpLYK5-like/CpLYK5 和CpLYK5-like/CpLYK4-1 之間表達分化可能引起功能變化。因此對CpLYK5-like、CpLYK5 和CpLYK4-1 三個基因的蛋白功能結構域和蛋白質三維結構進行了比較分析。結構域分析結果發現3 個LysM-RLK 基因都含有典型胞外LysM 結構域,CpLYK5-like 和CpLYK5 分別包含1 個跨膜結構域和1 個胞內蛋白激酶結構域,屬于典型的LysM 型受體激酶,而CpLYK4-1 跨膜結構域缺失(圖7A)。為了解析這3 個復制基因之間蛋白空間結構變化,本研究利用人工智能網絡算法AlphaFold2 進行了蛋白三維結構預測(圖7B)。結果發現LysM 結構域和跨膜區均存在-螺旋結構且基因CpLYK5-like 的LysM結構域包含β-折疊,然而它們的蛋白三維空間結構已經表現出明顯差異。結合其在不同轉錄組中的基因表達分化,本研究認為番木瓜復制基因CpLYK5-like、CpLYK5 和CpLYK4-1 在長期進化過程中已經表現明顯的基因功能分化。
2.8 番木瓜基因LysM-RLK3 加權基因共表達網絡分析(WGCNA)
為了進一步揭示3 個復制基因(CpLYK5-like、CpLYK5 和CpLYK4-1)的轉錄調控網絡,本研究對基于4 個不同脅迫條件下[炭疽病、番木瓜畸形花葉病毒(PLDMV)、禾生素(CTS)、干旱等]的轉錄組數據構建的差異表達基因的共表達網絡發現,CpLYK5(Cpa04g020240)位于plum1 共表達模塊。選取模塊內連接度最高的前27 個基因作為該模塊的核心基因,構建了核心共表達網絡。基因表達熱圖(圖8A)表明,這些核心基因在不同脅迫條件下表達模式出現明顯的表達差異,尤其是在炭疽病侵染過程中表達量顯著下調,而在PLDMV 病毒侵染過程中表達量明顯上調,暗示這些核心基因協同參與不同生物和非生物脅迫響應。Cpa01g017940 、Cpa02g003800 和Cpa04g021650 分別為編碼膜結合蛋白蘇氨酸激酶(CpPHOT2)、糖轉運蛋白(CpSWEET1)、3-酮基-CoA合成酶6(CpKCS6)的基因,其在炭疽病侵染的果實和干旱脅迫的莖組織中表達量下調,而在番木瓜畸形花葉病毒(PLDMV)和禾生素(CTS)處理葉片組織中表達量上調。CpLysM-RLK3 是擬南芥AtLYK5 的同源基因,屬于主要的幾丁質受體,可與幾丁質激發子受體激酶(AtCERK1)結合形成幾丁質介導的復合物,誘導植物免疫。在核心共表達網絡中(圖8B),CpLysM-RLK3 與膜結合蛋白蘇氨酸激酶(CpPHOT2)、糖轉運蛋白(CpSWEET1)、3-酮基-CoA 合成酶6(CpKCS6)等核心基因表現出強共表達關系,暗示這些核心基因通過相互之間的轉錄調控協同響應植物不同逆境脅迫。CpLYK5-like、CpLYK5 和CpLYK4-1不在同一個核心共表達網絡,為復制基因之間的功能分化提供新的證據,其具體功能差異需要后續進行更加深入的研究。
3 討論
LysM 型類受體蛋白激酶基因在植物生長發育及逆境脅迫中發揮重要功能,已成為當今植物中基因功能研究的熱點之一[36]。本研究采用生物信息學方法對番木瓜基因組中的LysM-RLK 家族基因進行系統鑒定、分類及理化特征評估。同時比較基因組學角度來闡明番木瓜LysM-RLK 家族形成的演化歷史,明確近期的基因復制對其家族形成重要貢獻。
本研究鑒定了番木瓜7 個LysM-RLK 家族基因,LysM-RLK 家族成員數多于擬南芥(4 個),小于葡萄(11 個)。高梅等[36]研究的小立碗蘚(Physcomitrium patens)是早期登陸的植物代表,其LysM-RLK 家族成員數量多于擬南芥和水稻,推測該家族成員在小立碗蘚中可能存在基因功能的冗余。隨著不斷進化發展,一些高等植物中LysMRLK家族成員數量得到擴展,意味著該家族新功能的引入。
通過系統進化分析,將番木瓜LysM-RLK 基因分為3 個亞組(LysM-Ⅱ、LysM-Ⅲ和LysM-Ⅳ),它們均與擬南芥和葡萄的部分成員聚為一類,而高等植物中LysM-RLK 家族分為4 個亞組,推測番木瓜中LysM-RLK 家族成員的功能相對單一[37]。
順式作用調控元件作為一個重要的分子開關,如王東東等[37]發現大多數LysM-RLK 基因的啟動子序列中富含多種激素相關的作用元件,如水楊酸(salicylic acid, SA)響應元件TCA-element(S)、茉莉酸甲酯(methyl jasmonate, MeJA)響應元件CGTCA-motif(M)等,但不同基因之間的元件含量和種類均不相同,表明LysM-RLK 家族不同成員能對不同激素發生響應且響應程度不同[38]。本文預測的番木瓜順式作用調控元件表明LysM-RLK 參與各種環境因素(干旱、低溫等)、光響應和植物激素[生長素(auxin,IAA)、脫落酸(abscisic acid,ABA)、水楊酸(salicylicacid,SA)、茉莉酸甲酯、赤霉素(gibberellins,GAs)等],與前人研究一致。
植物脅迫反應機制的一個潛在創新來源是基因復制,ZOU 等[38]對復制基因參與應激調節的啟動子順式作用DNA 調節元件的分析表明,祖先應激反應的不對稱分配可能部分歸因于DNA 調控元件的差異;失去大部分順式作用元件的重復基因不參與應激反應,但可能參與其他反應。因此,失去順式作用元件的復制基因可能形成新功能而保留下來,擬南芥重復基因之間的順式調節元件部分解釋了為什么重復基因對脅迫有不同的應答反應。
左存武等[39]發現LysM-RLK 在蘋果腐爛病發生前后,發生差異表達的基因較多推測部分蘋果LysM-RLK 基因可能在部分蘋果真菌病害發生的過程中起重要的感受和調控,秦春曉[40]研究表明星星草(Borago officinalis)Put LysM 基因可能參與種子萌發與根的鹽應答調控過程, 表明LysM-RLK 與抗病抗逆相關,并參與組織發育。番木瓜基因表達譜分析表明LysM-RLK 廣泛參與生物脅迫(肯尼亞不知名病毒、PapMV 和PRSV協同處理、PRSV 和PapMV 協同處理、PapMV、PLDMV、炭疽病)、非生物脅迫(低溫脅迫、乙烯處理、1-甲基環丙烯、干旱脅迫、凍融處理)和不同組織發育(胚珠、花粉、雄蕾、葉、根、莖、雌花、雄花和不同發育時期的果實)。
本研究在轉錄組水平上挖掘番木瓜抗病和抗逆相關的LysM-RLK 基因,揭示LysM-RLK 基因參與番木瓜抗病和抗逆反應。為番木瓜的遺傳改良和育種提供了必要的LysM-RLK 基因資源。