董琰鈺,徐碧玉,董澤宇,汪露瑤,陳錦文,方磊
棉花EXO70基因家族全基因組的鑒定及種間比較
董琰鈺,徐碧玉,董澤宇,汪露瑤,陳錦文,方磊
浙江大學農業與生物技術學院,杭州 310058
【目的】當前四倍體棉花的主栽品種是陸地棉與海島棉,陸地棉產量高且適應性好,海島棉纖維品質優異但產量一般。EXO70是胞外分泌體(exocyst complex)中的關鍵亞基,在植物生長發育、脅迫響應等方面發揮重要作用。通過全基因組水平鑒定和分析陸地棉與海島棉EXO70基因家族成員,并研究其在纖維發育、環境適應等方面的功能,有助于揭示陸地棉與海島棉種間性狀差異形成的分子基礎。【方法】從擬南芥數據庫(TAIR)獲取EXO70家族蛋白序列作為參考序列,采用HMMER、ExPASy、MEME、TBtools等分析工具對陸地棉TM-1和海島棉Hai7124基因組中EXO70家族成員進行鑒定與分析,系統比較該家族在基因表達模式、重要農藝性狀的相關性、逆境響應等方面的異同點。【結果】通過對陸地棉和海島棉的基因組水平分析,均鑒定出54個EXO70家族成員,根據系統進化發育可將其分為8個分支。陸地棉和海島棉同源基因可一一對應,分布在陸地棉與海島棉的20條染色體上,絕大多數成員為單外顯子,但是兩者間有12對同源基因在閱讀框序列上存在較大差異。陸地棉與海島棉大部分同源基因表達模式類似,但在同一纖維發育時期表達量存在差異,如分支A中的與同源基因。重要農藝性狀關聯分析中發現,海島棉有16個EXO70基因與纖維品質性狀顯著相關,多于陸地棉;陸地棉有13個基因與產量性狀衣分顯著相關,多于海島棉。發現部分性狀關聯的差異可能由海陸種間的基因結構差異造成,如和。在不同逆境脅迫下,陸地棉中有25個基因受誘導,顯著多于海島棉中10個受誘導基因。【結論】在棉花四倍體形成、分化與馴化過程中,陸地棉與海島棉EXO70家族基因序列結構相對保守,基因表達模式也保持較高的一致性。海島棉有更多的EXO70基因與纖維品質性狀相關,陸地棉有更多的基因與產量性狀相關且對環境逆境更為敏感。
陸地棉;海島棉;EXO70基因家族;表達模式;性狀關聯分析;逆境響應
【研究意義】棉花是世界上最重要的經濟作物之一,陸地棉()與海島棉()是目前最主要的2個棉花栽培種。陸地棉產量高、適應性強,而海島棉產量低但纖維品質較好,因此,研究陸地棉適應性強和海島棉纖維品質好的相關基因對于培育高抗優質的棉花新品種具有重要意義。EXO70(exocyst component of 70 kDa)是控制囊泡運輸的重要基因[1],參與細胞壁形成、細胞分泌和抗逆應答等重要細胞學過程。鑒定陸地棉和海島棉的EXO70家族基因,可為揭示EXO70在棉花生長發育尤其是纖維發育中的作用提供基礎數據,進行該類基因與重要農藝性狀的關聯分析為挖掘關鍵EXO70基因找到切入點,分析和對比該類基因在陸地棉、海島棉中的表達模式,將為深入探究EXO70調控機制奠定參考基礎。【前人研究進展】囊泡運輸是真核細胞中一種關鍵的跨膜運輸和物質交流方式,用于轉運大分子等無法直接穿越細胞膜和質膜的物質[2],為細胞的分裂、生長、形態建成和極性建立等基本的生理活動運送原料或傳遞信號[3]。經典的囊泡運輸可劃分為4個過程:出芽(小泡形成)、轉運(沿細胞骨架運輸)、拴系(兩膜最初接觸)、膜融合(運輸完成),由拴系因子介導的拴系過程是膜融合發生的必要條件[4]。Exocyst復合體是重要的拴系因子之一,是由SEC3(Secretory3)、SEC5、SEC6、SEC8、SEC10、SEC15、EXO70和EXO84(exocyst component of 84 kDa)組成的八亞基復合體[5-8]。EXO70是Exocyst復合體的關鍵亞基[9],決定胞吐時的靶標膜位點。近年來,越來越多植物中EXO70基因家族成員的功能研究被報道,主要集中在調控花粉管伸長和極化、根毛生長、細胞壁物質沉積、細胞板激活和成熟、防御和自噬方面[10-15],廣泛參與植物生長發育和免疫反應。在植物生長方面,擬南芥影響細胞板的組裝、導管組織分化及運輸、凱氏帶及次生壁的形成[11, 16-17];和參與調節花粉管的極性生長與成熟[1, 18];突變會影響水稻對礦質營養素的吸收及維管束的分化[19]。在免疫調節方面,擬南芥EXO70B1和EXO70B2蛋白可以相互作用調節鞭毛受體蛋白(FLS2)向質膜的運輸,從而參與植物的免疫調節[12]。水稻與AVR-Pii互作,進而參與調節免疫過程[20];沉默煙草中的2個EXO70B基因可以增加植株對晚疫病菌的感病性[21]。在不同逆境脅迫條件下,葡萄中14個EXO70基因的表達有顯著差異,這些基因在抗逆調控中起重要作用[22]。目前,對于棉花EXO70家族的報道主要集中在抗逆與免疫調節方面。在棉花應對鹽脅迫過程中發揮重要作用,并且還與自噬相關[23]。2021年,Zhu等[24]在亞洲棉、雷蒙德氏棉、陸地棉和海島棉共鑒定到165個EXO70基因,系統發育分析表明擬南芥與棉花這兩種雙子葉植物中EXO70基因相似。通過VIGS技術沉默陸地棉驗證基因功能,揭示了棉花EXO70基因可能廣泛參與代謝,也可能影響植物激素的生物合成和分布[24]。【本研究切入點】雖然關于棉花EXO70基因家族及部分棉花EXO70基因的功能已有相關報道,但還未見針對陸地棉與海島棉EXO70家族成員的組織表達及關聯重要農藝性狀的海陸種間比較研究,且EXO70家族成員對棉花纖維發育的影響尚不明確。【擬解決的關鍵問題】本研究基于陸地棉和海島棉基因組數據和二者不同組織及逆境脅迫的轉錄組數據,利用生物信息學方法進行海島棉和陸地棉的EXO70基因家族全基因組鑒定和種間比較分析等工作,旨在揭示EXO70基因家族在生長發育過程和抗逆境脅迫過程中的作用,結合陸地棉與海島棉EXO70基因各自優勢可進一步應用于棉花選育與改良方面。
為了鑒定EXO70基因家族成員,從Cottonomics數據庫(http://cotton.zju.edu.cn/)[25]中下載異源四倍體陸地棉TM-1(v2.1)、異源四倍體海島棉Hai7124(v1.1)基因組序列及基因注釋文件(general feature format,GFF),從Pfam[26]數據庫(http://pfam.xfam.org/)中下載EXO70蛋白結構域的隱馬爾可夫模型(編號PF3081),從擬南芥基因組網站(https://www.arabidopsis. org/)下載已報道的擬南芥EXO70蛋白的氨基酸序列。利用HMMER 3.0軟件的hmmsearch搜索程序鑒定棉花全基因組中含有EXO70保守結構域的蛋白序列,同時,利用BLAST+v2.6.0[27]搜索棉花全基因組中與已報道的擬南芥EXO70蛋白的氨基酸序列最相近的蛋白序列(值<1×10-5),將所獲得的EXO70蛋白序列提交至NCBI網站的保守結構域數據庫(conserved domain database,CDD)進行保守結構域驗證。
根據陸地棉與海島棉注釋文件,通過ExPASy在線網站(http://cn.expasy.org/tools)對GhEXO70和GbEXO70蛋白序列的等電點(isoelectric point,)、相對分子質量(relative molecular mass,Mr)、親水性平均系數(grand average of hydropathicity,GRAVY)等理化性質進行預測。
利用MEGA 11.0軟件中的MUSCLE對擬南芥、海島棉、陸地棉的EXO70家族成員的氨基酸序列進行多重序列比對,采用最大似然法自動選擇最佳替代模型,自展值(bootstrap value)設為1 000構建系統進化樹,利用iTOL(https://itol.embl.de/)對結果進行可視化分析。通過MEME程序[28]對家族成員進行基序分析(最大發現數設為20)。通過陸地棉與海島棉基因組注釋文件,利用TBtools[29]軟件對EXO70基因的基因結構及保守基序進行數據可視化處理。
通過MCScanX[30]軟件對海島棉和陸地棉中EXO70基因進行共線性分析,鑒定基因復制事件,用Circos[31]對共線性分析結果進行可視化,參數均使用軟件默認參數。利用TBTools軟件分別計算陸地棉和海島棉復制基因對的非同義突變率(non-synonymous mutation rate,Ka)、同義突變率(synonymous mutation rate,Ks)和二者的比值(Ka/Ks)。
從Cottonomics數據庫和NCBI數據庫中下載海島棉與陸地棉不同組織、不同纖維發育時期的轉錄組原始數據,數據編號為PRJNA490626。使用軟件fastp[32]過濾以獲得高質量讀長,使用HISAT2(v2.1)[33]將高質量讀長比對到TM-1參考基因組或Hai7124參考基因組上,使用featureCounts 2.0.0[34]對基因表達進行定量,計算EXO70基因的表達分度FPKM值以評估基因的表達水平。取陸地棉和海島棉葉、根、莖、花瓣及以開花后天數(day post-anthesis,DPA)計算的纖維發育時期(0、1、3、5、10、20和25 DPA)的EXO70家族基因FPKM數據,利用R語言做組織表達模式可視化分析。
采用陌凡生物公司EASYspin PLUS植物RNA快速提取試劑盒,提取2021年種植在杭州市永安基地的陸地棉TM-1的0 DPA、3 DPA、5 DPA和10 DPA的RNA,分別取3 μl總RNA用諾唯贊公司的HiScript Ⅱ 1st Strand cDNA Synthesis Kit(+gDNA wiper)進行逆轉錄,將反轉后的cDNA稀釋為100—200 ng·μl-1。選擇作為內參基因,隨機挑選4個基因(、、和)進行qRT-PCR。反應體系選用ChamQ SYBR qPCR Master Mix(諾唯贊)體系。每個樣品進行3次重復試驗,用2-ΔΔCt方法計算該基因的相對表達量。
下載陸地棉群體和海島棉群體遺傳變異信息和對應的表型數據[35-37],利用ANNOVAR軟件[38]分別對遺傳變異位點進行注釋,隨后基于非同義突變的分型對EXO70基因進行單倍型分析。EXO70基因的不同單倍型的纖維品質和產量相關的重要農藝性狀(即纖維長度、纖維強度和衣分)進行差異分析(<0.05),利用R語言可視化。
從Cottonomics數據庫和NCBI數據庫中下載海島棉與陸地棉不同逆境脅迫處理的轉錄組原始數據(編號PRJNA490626)。原始數據的處理和基因表達量的計算方法同1.5,以FPKM=1作為條件進行過濾,即FPKM>1的基因視為表達,若所有組織中FPKM<1的基因視為不表達,不表達的基因過濾不進行差異基因分析。基于基因轉移格式(gene transfer format,GTF)的注釋文件和DESeq2軟件包對陸地棉和海島棉應對逆境脅迫差異表達基因(differentially expressed genes,DEGs)進行鑒定并篩選,差異基因的篩選標準為取偽發現率(false discovery rate,FDR)矯正后的<0.05。對應逆境脅迫條件下篩選到的差異基因也即受到脅迫誘導的基因記為“1”,其他記為“0”,并用R語言可視化標記EXO70家族基因是否受到脅迫誘導。
通過序列相似性與保守結構域搜索在陸地棉TM-1和海島棉Hai7124基因組中均鑒定到了54個EXO70家族基因。以擬南芥、陸地棉和海島棉EXO70氨基酸序列構建棉花EXO70家族成員系統發育樹(圖1),所有EXO70可分為8個分支,每個分支的成員數量不等但各分支內海島棉和陸地棉EXO70基因數量相同,分支A、B、C、D、E、F、G和H中的陸地棉成員數量分別為4、2、9、4、9、4、7和15個。從鑒定家族成員與系統進化發育來看,陸地棉與海島棉在EXO70家族的每個分支數量保持一致,并且陸地棉與海島棉同源基因能夠一一對應,表明EXO70基因家族在海島棉與陸地棉分化過程中相對保守。

圖1 擬南芥(At)、陸地棉(Gh)和海島棉(Gb)EXO70基因家族的系統發育樹
通過對陸地棉EXO70家族成員編碼的蛋白質進行理化性質分析(電子附表1)。EXO70家族成員編碼的肽鏈由310—743個氨基酸組成,相對分子質量介于34 871.98—86 021.92 Da,平均值為71 029.997 Da;理論等電點介于4.84—8.94,平均值為6.22,多數偏酸性;蛋白不穩定指數介于37.42—61.76,平均值為46.32,其中8個EXO70成員為穩定蛋白(蛋白不穩定指數<40),其余的46個基因為不穩定蛋白(蛋白不穩定指數>40)。亞細胞定位預測顯示,EXO70家族基因主要定位于葉綠體、細胞核、細胞質以及線粒體中,其中,有48個基因定位在細胞核中,22個定位在葉綠體上,9個定位在細胞質中,4個定位在線粒體上,以細胞核中分布最廣泛。海島棉家族成員理化性質(電子附表2)與陸地棉類似,無明顯差異。
通過對陸地棉與海島棉EXO70家族的保守基序、基因結構進行查詢和比較后發現,同一分支中的海陸同源基因含有相似的保守基序和外顯子結構。保守基序分析(圖2)將預測到的20種基序依次命名為motif 1—motif 20。同一分支的蛋白序列呈現相似的保守基序排列方式,不同EXO70蛋白所包含的保守基序數目及種類存在差異。陸地棉與海島棉EXO70蛋白中,基序種類最少的蛋白僅含8種,而最多的含有19種motif,說明家族中的一些成員在保守基序上存在差異。陸地棉和海島棉除了分支A的全部成員與分支G的個別成員,其他成員都為單外顯子基因。從基因長度來看,不同的基因具有相似長度的編碼區序列,說明EXO70基因在進化過程中內含子長度存在較大的變異,這可能是導致其功能多樣化的原因之一。
通過對比陸地棉和海島棉同源基因全長序列與編碼序列,發現有12對陸地棉海島棉同源基因編碼序列有差異(電子附表3)。其中,編碼序列差異較大的有6對同源基因集中在分支H中,如的長度小于陸地棉同源基因,且氨基酸數目比后者少83個。此外,分支A中的海島棉的編碼序列比它在陸地棉中的同源基因長1 035 bp,相應氨基酸數目多345個。分析對比外顯子個數可知,在54對陸地棉海島棉同源基因中,45對同源基因為單外顯子,6對多外顯子,其余3對同源基因外顯子個數存在差異。如有2個外顯子,而海島棉同源基因為單外顯子基因。
對陸地棉和海島棉中EXO70基因分別進行種內共線性分析,對該家族成員進行復制基因比對。在陸地棉中共檢測出108個同源基因對(圖3),其中,A、D亞組內分別有23對、20對直系同源基因,A、D亞組間有65對旁系同源基因,這些同源基因對的Ka/Ks值范圍在0.04—1.05(電子附表4)。而同源基因對中只有與的Ka/Ks值大于1,為1.043。有6個同源基因對發生同義突變,有22個基因沒有找到復制的同源基因對。在海島棉中共檢測出104個同源基因對(圖3),其中,A亞組內有24對同源基因,D亞組內有18對,A、D亞組間有62對旁系同源基因。這些同源基因對的Ka/Ks值范圍在0.03—1.05(電子附表5),也只有與基因對的Ka/Ks值>1,為1.047。其中,有2個同源基因對發生同義突變,有21個基因沒有找到復制的同源基因對。從圖3可知,陸地棉除了A亞組的第2、6和8染色體與D亞組的第2、6和8染色體沒有EXO70家族成員外,其他每條染色體上都至少含有一個EXO70基因,其中,A亞組第5染色體上最多,包含7個EXO70基因,海島棉EXO70基因在染色體上的分布情況與陸地棉一致。
但這個趨勢越來越明顯。像教育、家裝、交通,醫療,都在發生很大的變化,都出現了有一定代表性的網絡協同或智能商業的企業。
根據已發表的陸地棉和海島棉不同組織和不同發育階段的轉錄組數據(電子附表5和電子附表6),比較分析陸地棉和海島棉EXO70基因的表達模式(圖4)。總體來看,不同EXO70家族分支呈現不同的表達規律,陸地棉和海島棉在同一分支中的表達趨勢又大致相似。在分支A中,陸地棉與海島棉存在4對同源基因在纖維發育時期較其他時期呈現優勢表達,分支F中的4對同源基因與分支A情況一致。分支B中的2對同源基因都呈現組成型表達,在主要組織和纖維發育時期表達量都較高。陸地棉與海島棉在分支C與分支G中的成員在組織和胚珠纖維發育中表達量極低。由圖4可知,存在多數基因呈組成型表達,陸地棉中共有18個,海島棉中共有17個。陸地棉在纖維發育時期表達基因有34個,海島棉中有36個,多于陸地棉。

圖2 陸地棉(A)和海島棉(B)EXO70基因家族系統進化樹、蛋白基序、超家族和基因結構

圖3 陸地棉(A)與海島棉(B)EXO70家族種內共線性分析
海島棉和陸地棉同源基因表達模式大致相似,但在纖維發育時期中,海島棉整體表達量高于陸地棉。如,分支C中的海島棉在纖維發育時期20 DPA時表達量高于同源基因(圖4)。從纖維整體發育時期來看,陸地棉與海島棉同源基因的表達峰值時期也有所差異。分支A中陸地棉與同源基因都在纖維發育后期表達較高(圖4),前者集中表達在10 DPA,而海島棉在20 DPA表達達到高峰并高于陸地棉,表達高峰較陸地棉延后。為了進一步驗證轉錄組數據的準確性,隨機選取4個基因設計引物(電子附表8)對其在纖維發育時期中的0、3、5和10 DPA進行定量表達分析驗證,發現表達趨勢均與轉錄組數據一致(圖4和圖5)。
通過對EXO70家族基因的不同單倍型的表型特征進行差異分析,發現15個陸地棉和18個海島棉的EXO70基因的不同單倍型存在顯著性差異(<0.05)(電子附表9)。經過分析對比可知,海島棉EXO70基因成員大部分與纖維長度和纖維強度這兩個纖維品質性狀相關,陸地棉EXO70基因成員更多是與產量性狀衣分相關(電子附表9)。如圖6-A可知,與纖維長度性狀呈顯著相關的海島棉基因個數有15個,而陸地棉只有7個,與纖維強度性狀顯著相關的海島棉基因有16個,而陸地棉只有7個。在產量相關性狀——衣分方面,陸地棉與之顯著相關基因個數多于海島棉,分別為13和8個。分析比對同源基因可知,陸地棉與海島棉只有2對基因與纖維長度性狀相關聯,有3對同源基因與纖維強度相關聯,有2對同源基因與衣分相關聯。其中,只有分支B中的陸地棉和海島棉同源基因可找到與3個性狀同時關聯的位點。
結合EXO70家族成員基因結構分析與基因關聯分析可知,基因結構存在差異的陸地棉與海島棉同源基因,在關聯性狀時也有差異。如,在分支H中的陸地棉與同源基因海島棉編碼序列存在較大差異(圖6-B),前者相對于后者存在提前終止情況,而海島棉在A11:115905472位點處可顯著關聯纖維長度、纖維強度性狀但陸地棉同源基因在對應位點無關聯性狀。分支A中存在編碼序列差異的與(電子附表3),海島棉在D09:42925528與D09:42925541 2個位點與纖維長度、纖維強度和衣分3個性狀顯著關聯(電子附表8),而在陸地棉同源基因對應位點處無性狀關聯。

圖5 4個基因在纖維發育時期的定量表達分析
結合組織表達模式與關聯分析結果可知,纖維發育時期的表達差異與基因關聯表型的差異相互印證。如,陸地棉在纖維發育時期基本不表達,而海島棉同源基因有表達,并且在20 DPA時達到表達高峰(圖4),群體數據中顯示部分海島棉的 EXO基因可關聯纖維長度、纖維強度等纖維品質性狀,而陸地棉并無EXO70基因與此類纖維相關性狀關聯,且只能關聯到衣分這種產量性狀(電子附表9)。
如圖7所示,在相同算法條件下,將脅迫處理中是否受誘導基因區分,陸地棉和海島棉的同源基因在應對低溫(4 ℃)、高溫(37 ℃)、鹽脅迫(NaCl)、干旱脅迫(PEG)逆境條件下響應表達有所不同。4種非生物脅迫條件下,陸地棉受逆境脅迫誘導的EXO70基因有25個,而海島棉只存在10個。整體數量上看,陸地棉要多于海島棉:在低溫4 ℃脅迫條件下,陸地棉受誘導基因有11個,海島棉中只有1個;在高溫37 ℃脅迫條件下,受誘導陸地棉基因個數為11,而海島棉為6個;在鹽(NaCl)脅迫條件下,陸地棉有14個基因受誘導,而海島棉中有2個;在干旱(PEG)脅迫條件下,陸地棉有4個基因受誘導,海島棉中也有4個。
不同進化分支中,陸地棉與海島棉在4種非生物脅迫條件下受誘導情況各自都具有一定的偏好性。陸地棉受誘導基因分布在分支C、D、E、F、G和H中,集中分布于E和H這2個分支中。而海島棉受誘導基因存在于A、C和H中,在分支H中受誘導基因個數最多,為5個,占總海島棉EXO70整體受誘導基因個數的50%,其余分支不存在海島棉基因受誘導的情況。
對于同一分支中,陸地棉與海島棉同源基因在不同脅迫條件下受誘導情況也不同。例如,在分支H中的陸地棉在4 ℃與NaCl條件下都會受到誘導,而海島棉同源基因卻只在干旱條件(PEG)下受誘導。存在于分支C的陸地棉在高溫、低溫條件下都會受誘導,而同源基因只在高溫中存在誘導情況。

A:陸地棉(Gh)和海島棉(Gb)與纖維長度(FL)、纖維強度(FS)、衣分(LP)性狀呈顯著相關基因個數;B:GH_D09G1462與同源基因GB_D09G1473的基因結構,和位于外顯子的非同義SNP(上部);GB_D09G1473的2個非同義SNP的不同單倍型在纖維長度、纖維強度和衣分的差異;****表示在P<0.05時單倍型間差異極顯著(t檢驗)
陸地棉和海島棉是目前世界上最主要的2個棉花栽培種,且均已完成全基因組序列的測序和組裝工作[39-41],這為本研究進行海島棉和陸地棉中EXO70基因家族的鑒定和分析提供極有利的先決條件。本文從陸地棉(TM-1)、海島棉(Hai7124)2個四倍體栽培棉種中都分別鑒定出54個EXO70基因,說明EXO70這類多拷貝基因在四倍體棉花的分別進化階段在數量上較為保守。二倍體擬南芥EXO70基因家族成員數是23個,本文鑒定出異源四倍體棉花EXO70家族成員數量是擬南芥的2.35倍,可能是因為棉花進化過程中發生了基因組的加倍和復制事件。近幾年,隨著測序技術的不斷更新和改進,基因組測序和組裝的水平得到了大幅提高。這樣的技術進展導致不同的基因組版本中基因注釋等信息存在一些差異。未來,整合多個版本的基因組信息和分子試驗,可以更加有效和準確地鑒定EXO70基因家族成員。酵母與大多數動物的EXO70基因為單拷貝,而大部分植物尤其是陸生植物中EXO70基因為多拷貝,這可能是因為植物具有多種多樣的細胞壁及復雜的液泡結構,需要多種胞泌復合體滿足其適應環境,進而演化出不同基因特有的調控機制[42-43],相關報道也證明不同的EXO70蛋白會參與細胞壁形成、細胞分泌和細胞免疫等不同的重要細胞學過程[44]。本研究鑒定的EXO70家族成員中既有組織特異型基因,也有少數組成型基因,這說明不同的棉花EXO70基因通過組織特異的表達模式參與不同組織的生長發育進程。已有報道證明,在非生物脅迫下,囊泡運輸相關蛋白可通過參與質膜修復來增加植物對溫度等非生物脅迫的耐受性[28],而在本研究的另一個表達模式——逆境脅迫誘導表達模式研究中,不同分支的EXO70成員存在脅迫誘導多樣化、不同基因特異逆境誘導的情況,說明EXO70基因在棉花抗逆境脅迫過程中具有一定的功能。

熱圖表示基因在應對非生物脅迫過程中,是否顯著差異表達(紅色,差異表達;白色,未差異表達)
陸地棉與海島棉EXO70家族同源基因結構有所差異,并且外顯子的個數也有所不同,而內含子-外顯子的基因結構通常被認為是進化的印記[45]。陸地棉與海島棉同源基因存在的基因結構差異,可能會導致二者基因表達的差異從而引起基因功能的不同。從種內共線性分析來看,陸地棉與海島棉中存在發生同義突變的基因對,說明這些序列分歧度太大,進化距離很遠。此外,陸地棉與海島棉都只有1個基因對的Ka/Ks值大于1,其余都小于1,說明這些基因是受到正向選擇,EXO70家族基因在進化過程中經歷了較為強烈的凈化選擇[46],暗示大部分EXO70基因進化保守,功能穩定。
棉花纖維的各個發育時期對纖維品質與產量都至關重要。棉花纖維是從棉花胚珠表皮單個細胞突起進而發育形成,與擬南芥表皮毛形成過程類似,并且當今學者普遍認為二者表皮毛發育相關基因的調控網絡類似[47]。在擬南芥表皮毛無胼胝質的突變體中,功能缺失可導致表皮毛中胼胝質合成酶PMR4分泌受阻,在毛狀體成熟階段細胞壁成分積累產生缺陷,而野生型毛狀體細胞壁可發生大量二次增厚[42, 48]。還有研究表明是在擬南芥氣管元件(tracheary element)發育過程中表達的基因,并在TE的囊泡運輸中起作用從而調節細胞壁增厚[16]。本研究通過對比陸地棉與海島棉EXO70基因家族中同源基因在編碼序列、組織表達及重要農藝性狀的基因關聯分析,可為后續棉花選育與改良方面結合陸地棉與海島棉優勢基因,提供基礎。
陸地棉和海島棉均存在54個EXO70家族基因,在進化過程中基因家族數目相對保守,但基因結構序列存在部分差異,同源基因的分子功能也發生了分化。海島棉存在更多EXO70基因與纖維長度、強度等品質性狀顯著關聯,可能與其優異的纖維品質特性相關;陸地棉存在更多EXO70基因與衣分、籽指等產量性狀顯著關聯,并且具有更強的非生物脅迫響應能力,可能與其高產、廣適性等特性相關。
[1] LI S P, VAN OS G M A, REN S C, YU D L, KETELAAR T, EMONS A M C, LIU C M. Expression and functional analyses ofgenes inimplicate their roles in regulating cell type-specific exocytosis. Plant Physiology, 2010, 154(4): 1819-1830.
[2] WU L G, HAMID E, SHIN W, CHIANG H C. Exocytosis and endocytosis: modes, functions, and coupling mechanisms. Annual Review of Physiology, 2014, 76: 301-331.
[3] ZHANG L, XING J J, LIN J X. At the intersection of exocytosis and endocytosis in plants. The New Phytologist, 2019, 224(4): 1479-1489.
[4] BONIFACINO J S, GLICK B S. The mechanisms of vesicle budding and fusion. Cell, 2004, 116(2): 153-166.
[5] PLESKOT R, CWIKLIK L, JUNGWIRTH P, ?áRSKY V, POTOCKY M. Membrane targeting of the yeast exocyst complex. Biochimica et Biophysica Acta, 2015, 1848(7): 1481-1489.
[6] YU I M, HUGHSON F M. Tethering factors as organizers of intracellular vesicular traffic. Annual Review of Cell and Developmental Biology, 2010, 26: 137-156.
[7] TERBUSH D R, MAURICE T, ROTH D, NOVICK P. The Exocyst is a multiprotein complex required for exocytosis in. The EMBO Journal, 1996, 15(23): 6483-6494.
[8] TERBUSH D R, NOVICK P. Sec6, Sec8, and Sec15 are components of a multisubunit complex which localizes to small bud tips in. The Journal of Cell Biology, 1995, 130(2): 299-312.
[9] HE B, GUO W. The exocyst complex in polarized exocytosis. Current Opinion in Cell Biology, 2009, 21(4): 537-542.
[10] SYNEK L, SCHLAGER N, ELIáS M, QUENTIN M, HAUSER M-T, ZáRSKy V. AtEXO70A1, a member of a family of putative exocyst subunits specifically expanded in land plants, is important for polar growth and plant development. The Plant Journal, 2006, 48(1): 54-72.
[11] FENDRYCH M, SYNEK L, PE?ENKOVá T, TOUPALOVá H, COLE R, DRDOVá E, NEBESá?OVá J, ?EDINOVá M, HáLA M, FOWLER J E, ?áRSKY V. Theexocyst complex is involved in cytokinesis and cell plate maturation. The Plant Cell, 2010, 22(9): 3053-3065.
[12] WANG W, LIU N, GAO C Y, CAI H R, ROMEIS T, TANG D Z. Theexocyst subunits EXO70B1 and EXO70B2 regulate FLS2 homeostasis at the plasma membrane. The New Phytologist, 2020, 227(2): 529-544.
[13] KULICH I, PE?ENKOVá T, SEKERE? J, SMETANA O, FENDRYCH M, FOISSNER I, H?FTBERGER M, ZáRSKy V.exocyst sub complex containing subunit EXO70B1 is involved in autophagy-related transport to the vacuole. Traffic (Copenhagen, Denmark), 2013, 14(11): 1155-1165.
[14] ZáRSKy V, KULICH I, FENDRYCH M, PE?ENKOVá T. Exocyst complexes multiple functions in plant cells secretory pathways. Current Opinion in Plant Biology, 2013, 16(6): 726-733.
[15] LIU N, HAKE K, WANG W, ZHAO T, ROMEIS T, TANG D Z. Calcium-dependent protein kinase5 associates with the truncated NLR protein TIR-NBS2 to contribute to-mediated immunity. The Plant Cell, 2017, 29(4): 746-759.
[16] LI S P, CHEN M, YU D L, REN S C, SUN S F, LIU L D, KETELAAR T, EMONS A M C, LIU C M. EXO70A1-mediated vesicle trafficking is critical for tracheary element development in. The Plant Cell, 2013, 25(5): 1774-1786.
[17] KALMBACH L, HéMATY K, DE BELLIS D, BARBERON M, FUJITA S, URSACHE R, DARASPE J, GELDNER N. Transient cell-specific EXO70A1 activity in the CASP domain and Casparian strip localization. Nature Plants, 2017, 3: 17058.
[18] SYNEK L, VUKA?INOVI? N, KULICH I, HáLA M, ALDORFOVá K, FENDRYCH M, ?áRSKY V. EXO70C2 is a key regulatory factor for optimal tip growth of pollen. Plant Physiology, 2017, 174(1): 223-240.
[19] TU B, HU L, CHEN W L, LI T, HU B H, ZHENG L, LV Z, YOU S J, WANG Y P, MA B T, CHEN X W, QIN P, LI S G. Disruption ofcauses irregular vascular bundles and perturbs mineral nutrient assimilation in rice. Scientific Reports, 2015, 5: 18609.
[20] FUJISAKI K, ABE Y, ITO A, SAITOH H, YOSHIDA K, KANZAKI H, KANZAKI E, UTSUSHI H, YAMASHITA T, KAMOUN S, TERAUCHI R. Rice Exo70 interacts with a fungal effector, AVR-Pii, and is required for AVR-Pii-triggered immunity. The Plant Journal, 2015, 83(5): 875-887.
[21] DU Y, OVERDIJK E J R, BERG J A, GOVERS F, BOUWMEESTER K. Solanaceous exocyst subunits are involved in immunity to diverse plant pathogens. Journal of Experimental Botany, 2018, 69(3): 655-666.
[22] WANG H, MA Z H, MAO J, CHEN B H. Genome-wide identification and expression analysis of the EXO70 gene family in grape (l.). PeerJ, 2021, 9: e11176.
[23] 丁顏朋, 葛曉陽, 王鵬, 吳潔, 王省芬, 李付廣. 棉花鹽脅迫應答基因功能分析. 棉花學報, 2018, 30(6): 423-434.
DING Y P, GE X Y, WANG P, WU J, WANG X F, LI F G. Functional analysis of a salt stress response gene,, in upland cotton (L.). Cotton Science, 2018, 30(6): 423-434. (in Chinese)
[24] ZHU Y Q, QIU L, LIU L L, LUO L, HAN X P, ZHAI Y H, WANG W J, REN M Z, XING Y D. Identification and comprehensive structural and functional analyses of thegene family in cotton. Genes, 2021, 12(10): 1594.
[25] DAI F, CHEN J D, ZHANG Z Q, LIU F J, LI J, ZHAO T, HU Y, ZHANG T Z, FANG L. COTTONOMICS: A comprehensive cotton multi-omics database. Database, 2022, 2022: baac080.
[26] EL-GEBALI S, MISTRY J, BATEMAN A, EDDY S R, LUCIANI A, POTTER S C, QURESHI M, RICHARDSON L J, SALAZAR G A, SMART A, SONNHAMMER E L, HIRSH L, PALADIN L, PIOVESAN D, TOSATTO S C, FINN R D. The Pfam protein families database in 2019. Nucleic Acids Research, 2019, 47(D1): D427-D432.
[27] CAMACHO C, COULOURIS G, AVAGYAN V, MA N, PAPADOPOULOSJ, BEALER K, MADDEN T L. BLAST+: architecture and applications. BMC Bioinformatics, 2009, 10: 421.
[28] BAILEY T L, BODEN M, BUSKE F A, FRITH M, GRANT C E, CLEMENTI L, REN J Y, LI W W, NOBLE W S. MEME Suite: tools for motif discovery and searching. Nucleic Acids Research, 2009, 37(supp1_2): W202- W208.
[29] CHEN C J, CHEN H, ZHANG Y, THOMAS H R, FRANK M H, HE Y H, XIA R. TBtools: an integrative toolkit developed for interactive analyses of big biological data. Molecular Plant, 2020, 13(8): 1194-1202.
[30] WANG Y P, TANG H B, DEBARRY J D, TAN X, LI J P, WANG X Y, LEE T H, JIN H Z, MARLER B, GUO H, KISSINGER J C, PATERSON A H.: a toolkit for detection and evolutionary analysis of gene synteny and collinearity. Nucleic Acids Research, 2012, 40(7): e49.
[31] KRZYWINSKI M, SCHEIN J, BIROL I, CONNORS J, GASCOYNE R, HORSMAN D, JONES S J, MARRA M A. Circos: An information aesthetic for comparative genomics. Genome Research, 2009, 19(9): 1639-1645.
[32] CHEN S F, ZHOU Y Q, CHEN Y R, GU J. Fastp: an ultra-fast all-in- one FASTQ preprocessor. Bioinformatics, 2018, 34(17): i884-i890.
[33] KIM D, LANGMEAD B, SALZBERG S L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods, 2015, 12(4): 357-360.
[34] LIAO Y, SMYTH G K, SHI W. FeatureCounts: an efficient general purpose program for assigning sequence reads to genomic features. Bioinformatics, 2014, 30(7): 923-930.
[35] HU Y, CHEN J D, FANG L, ZHANG Z Y, MA W, NIU Y C, JU L Z, DENG J Q, ZHAO T, LIAN J M, BARUCH K, FANG D, LIU X, RUAN Y L, RAHMAN M U, HAN J L, WANG K, WANG Q, WU H T, MEI G F, ZANG Y H, HAN Z G, XU C Y, SHEN W J, YANG D F, SI Z F, DAI F, ZOU L F, HUANG F, BAI Y L, ZHANG Y G, BRODT A, BEN-HAMO H, ZHU X F, ZHOU B L, GUAN X Y, ZHU S J, CHEN X Y, ZHANG T Z.andgenomes provide insights into the origin and evolution of allotetraploid cotton. Nature Genetics, 2019, 51(4): 739-748.
[36] FANG L, GONG H, HU Y, LIU C X, ZHOU B L, HUANG T, WANG Y K, CHEN S Q, FANG D D, DU X M, CHEN H, CHEN J D, WANG S, WANG Q, WAN Q, LIU B L, PAN M Q, CHANG L J, WU H T, MEI G F, XIANG D, LI X H, CAI C P, ZHU X F, CHEN Z J, HAN B, CHEN X Y, GUO W Z, ZHANG T Z, HUANG X H. Genomic insights into divergence and dual domestication of cultivated allotetraploid cottons. Genome Biology, 2017, 18(1): 33.
[37] FANG L, ZHAO T, HU Y, SI Z F, ZHU X F, HAN Z G, LIU G Z, WANG S, JU L Z, GUO M L, MEI H, WANG L Y, QI B W, WANG H, GUAN X Y, ZHANG T Z. Divergent improvement of two cultivated allotetraploid cotton species. Plant Biotechnology Journal, 2021, 19(7): 1325-1336.
[38] WANG K, LI M Y, HAKONARSON H. Annovar: Functional annotation of genetic variants from high-throughput sequencing data. Nucleic Acids Research, 2010, 38(16): e164.
[39] LI F G, FAN G Y, LU C R, XIAO G H, ZOU C S, KOHEL R J, MA Z Y, SHANG H H, MA X F, WU J Y, LIANG X M, HUANG G, PERCY R G, LIU K, YANG W H, CHEN W B, DU X M, SHI C C, YUAN Y L, YE W W, LIU X, ZHANG X Y, LIU W Q, WEI H L, WEI S J, HUANG G D, ZHANG X L, ZHU S J, ZHANG H, SUN F M, WANG X F, LIANG J, WANG J H, HE Q, HUANG L H, WANG J, CUI J J, SONG G L, WANG K B, XU X, YU J Z, ZHU Y X, YU S X. Genome sequence of cultivated Upland cotton (TM-1) provides insights into genome evolution. Nature Biotechnology, 2015, 33(5): 524-530.
[40] ZHU T, LIANG C Z, MENG Z G, SUN G Q, MENG Z, GUO S D, ZHANG R. CottonFGD: an integrated functional genomics database for cotton. BMC Plant Biology, 2017, 17(1): 101.
[41] WANG M J, TU L L, YUAN D J, ZHU D, SHEN C, LI J Y, LIU F Y, PEI L L, WANG P C, ZHAO G N, YE Z X, HUANG H, YAN F L, MA Y Z, ZHANG L, LIU M, YOU J Q, YANG Y C, LIU Z P, HUANG F, LI B Q, QIU P, ZHANG Q H, ZHU L F, JIN S X, YANG X Y, MIN L, LI G L, CHEN L L, ZHENG H K, LINDSEY K, LIN Z X, UDALL J A, ZHANG X L. Reference genome sequences of two cultivated allotetraploid cottons,and. Nature Genetics, 2019, 51(2): 224-229.
[42] KULICH I, VOJTíKOVá Z, SABOL P, ORTMANNOVá J, NEDěLA V, TIHLA?íKOVá E, ?áRSKY V. Exocyst subunit EXO70H4 has a specific role in callose synthase secretion and silica accumulation. Plant Physiology, 2018, 176(3): 2040-2051.
[43] YAMAZAKI T, KAWAMURA Y, MINAMI A, UEMURA M. Calcium-dependent freezing tolerance ininvolves membrane resealing via synaptotagmin SYT1. The Plant Cell, 2009, 20(12): 3389-3404.
[44] SEKERE? J, PEJCHAR P, ?ANTR??EK J, VUKA?INOVI? N, ?áRSKy V, POTOCKy M. Analysis of exocyst subunit EXO70 family reveals distinct membrane polar domains in tobacco pollen tubes. Plant Physiology, 2017, 173(3): 1659-1675.
[45] YU H H, LI M, SANDHU J, SUN G C, SCHNABLE J C, WALIA H, XIE W B, YU B, MOWER J P, ZHANG C. Pervasive misannotation of microexons that are evolutionarily conserved and crucial for gene function in plants. Nature Communications, 2022, 13: 820.
[46] HURST L D. Theratio: Diagnosing the form of sequence evolution. Trends in Genetics, 2002, 18(9): 486.
[47] GUAN X Y, YU N, SHANGGUAN X X, WANG S, LU S, WANG L J, CHEN X Y.trichome research sheds light on cotton fiber development mechanisms. Chinese Science Bulletin, 2007, 52(13): 1734-1741.
[48] KULICH I, VOJTíKOVá Z, GLANC M, ORTMANNOVá J, RASMANN S, ?áRSKy V. Cell wall maturation oftrichomes is dependent on exocyst subunit EXO70H4 and involves callose deposition. Plant Physiology, 2015, 168(1): 120-131.
Genome-wide identification and interspecific comparative analysis of the EXO70 gene family in cotton
DONG YanYu, XU BiYu, DONG ZeYu, WANG LuYao, CHEN JinWen, FANG Lei
College of Agriculture & Biotechnology, Zhejiang University, Hangzhou 310058
【Objective】The two main types of allotetraploid cotton that are currently cultivated are upland cotton, known for its high yield and good adaptability, and island cotton, which boasts excellent fiber quality but lower yield. EXO70, a vital subunit of the exocyst complex, plays a significant role in plant growth, development, and stress response. By identifying and analyzing members of the EXO70 gene family in upland and island cotton at the whole-genome level, and studying their functions in fiber development and environmental adaptation, we can shed light on the molecular basis for the differences in traits between these two varieties. 【Method】The reference sequences of EXO70 protein inwere obtained from the TAIR database. HMMER, ExPASy, MEME, TBtools, and other analysis tools were used to identify and analyze the members of EXO70 gene family in the genomes of upland cotton TM-1 and island cotton Hai7124. The similarities and differences in gene expression patterns, correlations with crucial agronomic traits, and stress responses of this family were systematically compared. 【Result】Through genome-level analysis of upland cotton and sea-island cotton, 54 EXO70 family members were identified in both upland and sea-island cotton, which could be divided into eight subgroups based on phylogenetic analysis. Orthologous genes between upland cotton and sea-island cotton can be paired one-to-one and are distributed across the 20 chromosomes of both species. The majority of the members have single exons, while 12 pairs of homologous genes displayed significant differences in the reading frame sequences. Most orthologous genes inanddisplay similar expression patterns, but differences in expression levels are observed during the same fiber development stage, such asand its orthologous geneand. Under different stresses, upland cotton showed a significantly higher number of induced genes compared to sea-island cotton. 【Conclusion】The sequence structure and gene expression patterns of the EXO70 family were found to be relatively conserved in both upland and island cotton during the formation, differentiation, and domestication of tetraploid cotton. However, in terms of EXO70 family members, island cotton had more genes related to fiber quality traits, while upland cotton had more genes related to yield traits and exhibited greater sensitivity to environmental stress.
;; EXO70 gene family; expression pattern; trait association analysis; abiotic stress response

10.3864/j.issn.0578-1752.2023.23.005
2023-02-14;
2023-05-04
國家自然科學基金面上基金(32172008)、中央高校基本科研業務費專項資金(226-2022-00153)
董琰鈺,E-mail:dongyy@zju.edu.cn。通信作者方磊,E-mail:fangl@zju.edu.cn
(責任編輯 李莉)