中圖分類號:S664.1 文獻標識碼:A 文章編號:1000-4440(2025)06-1080-15
Abstract:The MADS genesareaclass of importanttranscriptionalregulatory factors,with extensive biological functions.Theyareinvolvedinthegrowth,development,andsignal transductionof multiple species,andtheir biological characteristicshavebeenidentifedinvariousorganisms.Inthisstudy,bioinformaticsmethodswereemployedtoidentifyand analyze the MADS genefamily members in Caryailinoinensis (Wangenh.)K.Koch.Atotalof81MADSgenefamilymemberswereidentified,which wereunevenlydistributedacross16chromosomes.Basedontheresultsof phylogenetictree illinoinensiswerefoundto containalarge numberofcisactingelements,including plant hormone response elements,stress response elements,and light response elements.The study revealed that these cis-acting elements werewidely distributed in the promoter regions of the
MADS genes,indicating that the MADS genes had played an important role inthe adaptation to environmental changes and thegrowthanddevelopmentofCaryaillnoinensis.TheexpresionlevelsofdiferentMADSfamilygenesinCaryaillninensis varied greatlyindiferenttissuesandatdifferenttimes.For example,CiMADS46 hada high expressionlevel inthe stem,CiMADS7hada high expresion level in thefruit,and the expression levelof CiMADS11 decreased over time.The (2號 MADS genes were found to exhibit distinct tissue-specific expresson patterns.It was speculated that the MADS gene family mightplayimportantrolesintheprocessesofflowerformationandfruitdevelopment,andtheymighthaveacertaindegree offunctionaldiversityatdiferentdevelopmental stages.Theresultsofthisstudylaythefoundationforfurtherresearchon thefunctionsand characteristicsof CiMADS genesandprovideareference fortheidentificationand characterizationof MADS gene family members in other species.
Key words:Carya illinoinensis(Wangenh.)K.Koch;MADS gene family;bioinformatics;expression analysis
薄殼山核桃(Caryaillinoinensis),俗稱美國山核桃,隸屬于胡桃科山核桃屬,是一種廣泛種植的干果油料樹種。這種山核桃因殼薄且脆,容易剝離而得名,加之獨特的風味和豐富的營養價值而廣受贊譽[1]。其果仁中富含大量蛋白質、纖維素、維生素、不飽和脂肪酸以及鈣、鎂、鋅、磷等22種對人體有重要作用的礦物元素[2]。該樹種能適應各種土壤和氣候條件,果實可以在樹上保存多年,這意味著種植者可以獲得長期穩定的收入。
MADS基因家族成員幾乎存在于所有的真核生物中,在植物生長發育過程中發揮關鍵性作用。根據基因結構、蛋白質結構和系統發育關系,MADS基因家族分為type-I和type-II(MIKC)兩種類型。type-I型通常含有1\~2個外顯子而不含內含子,type-Ⅱ型基因含有明顯的k-box 結構域[3]。MADS基因家族包含多種成員,包括控制植物莖、葉片、花、果實以及種子等生長發育的關鍵基因[4]。這些基因通過調節蛋白質的活性和表達,控制植物細胞的生長和分化,從而影響植物的整體發育。MADS基因家族的突變可能會導致植物形態和生理上的異常,如花器官畸形、果實不正常發育等,因此開展MADS基因的鑒定分析對了解植物生長發育調控機制具有重要意義。
目前,越來越多的植物MADS基因家族得到鑒定,如擬南芥、水稻[5]、甜瓜[等,并進行了相關的深入研究。本研究主要基于薄殼山核桃的基因組數據,通過生物信息學方法對MADS基因家族成員進行生物學特性分析,并基于轉錄組數據對其基因功能進行預測,深入探究MADS基因家族成員的生物學功能及對果實發育的調控機制,為識別和表征其他物種的MADS基因家族提供參考。
1材料與方法
1.1薄殼山核桃MADS基因家族的鑒定
在Pfam數據庫中,利用PF00319(SRF-TF結構域)獲得MADS蛋白結構域的隱馬爾可夫模型。從Tair網站下載擬南芥MADS基因的ID號并借助TBtools軟件獲取其編碼的蛋白質氨基酸序列[7]。利用HMMER軟件檢索薄殼山核桃的MADS蛋白,下載薄殼山核桃基因組和注釋文件,以擬南芥MADS蛋白氨基酸序列為索引,篩選期望值(Eval-ue)小于 1×e-5 的CiMADS候選基因。再進一步結合HMMER軟件和保守結構域CDD軟件篩選驗證候選基因是否具有MADS基因的典型特征。
1.2 理化性質分析
借助在線網站 Expasy(https://www.expasy.org/)和TBtools 軟件(https://github.com/CJ-Chen/TBtools-II/releases)[8]測定薄殼山核桃MADS蛋白理化性質,輸入其蛋白質氨基酸序列獲取理化性質分析結果,指標包括氨基酸數量、相對分子量、等電點、不穩定指數、脂肪系數和平均親疏水性等[9],并通過PSORTPrediction 在線分析工具(htp://www.genscript.com/psort.html)預測 MADS 蛋白的亞細胞定位[10]
1.3 進化樹分析
通過薄殼山核桃和擬南芥的MADS蛋白氨基酸序列在 MEGA-X(https://www.megasoftware.net/dload_win_gui)軟件中進行多序列比對。采取鄰接法和 p -distance模型建立進化樹,參數設置為Boot-strap重復1000次。以擬南芥的MADS分類情況為輔助對薄殼山核桃的CiMADS家族成員進行分類,最后利用ITOL在線網站(https://itol.embl.de)可視化系統發育樹。
1.4保守基序與基因結構分析
借助MEME在線工具對CiMADS蛋白氨基酸序列進行保守基序分析,并對分析結果進行檢驗。在薄殼山核桃GFF3注釋文件中提取CiMADS基因對應的GFF3文件,并通過GSDS在線網站獲取其基因結構信息并進行可視化。
1.5染色體定位與共線性分析
在TBtools工具中,通過GFF3注釋文件提取CiMADS基因在染色體上的定位信息,并進行分析和繪圖[11]。通過TBtools的MCScanX插件對薄殼山核桃MADS基因家族進行物種內的共線性分析。再利用擬南芥和薄殼山核桃全基因組文件和注釋文件進行物種間的共線性分析,為進一步揭示其基因功能和進化模式提供依據。
1.6啟動子的順式作用元件分析
為進一步分析CiMADS基因的表達機制,使用TBtools軟件從薄殼山核桃的全基因組文件中提取基因轉錄上游 2000bp 的區域序列作為啟動子,接著利用PlantCARE 網站(https://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測薄殼山核桃MADS基因啟動子順式作用元件并對結果進行統計分析。
1.7 組織表達分析
為探究MADS基因在薄殼山核桃不同發育階段和不同組織的表達豐度,利用轉錄組數據獲取薄殼山核桃根、莖、果實、種子、雄花、雌花等組織(NCBIBio-project:PRJNA799663)[13]和薄殼山核桃果實不同發育期(NCBIBioproject:PRJNA 34743O)[14]的每千堿基轉錄本百萬映射讀數(FPKM)值,最后利用TBtools軟件的HeatMap工具繪制基因表達量熱圖并可視化。
2 結果與分析
2.1薄殼山核桃MADS基因家族的鑒定及其編碼蛋白質理化性質
如表1所示,本研究在薄殼山核桃全基因組中最終鑒定出81個編碼蛋白質具有MADS結構域的基因家族成員,根據其在染色體的位置命名為CiMADS1\~CiMADS81。結果表明,MADS基因家族成員編碼的蛋白質的氨基酸長度為 57~369aa ,蛋白質的相對分子量大小介于6549.62至41741.17,等電點為 5.42~ 10.97,其中有18個酸性蛋白質,63個堿性蛋白質,平均等電點大小為8.75。在蛋白質穩定性方面,不穩定系數為25.05\~67.53,有14個穩定蛋白質,穩定蛋白質占總數的 17.28% ,脂肪系數最小的為60.17,最大的為 107.98 。此外,有74個蛋白質為疏水性蛋白質,7個為親水性蛋白質。亞細胞定位預測結果顯示,MADS蛋白主要分布于細胞核中。
2.2 染色體定位及進化樹
為了確定CiMADS基因在染色體上的物理分布位置,本研究通過TBtools軟件繪制了染色體定位分布圖(圖1)。由圖1可見,MADS基因在薄殼山核桃16條染色體上的分布并不均衡,3號、4號、5號染色體上MADS基因分布較多,分別為11個、14個和11個,其余染色體上不規則地分布著1\~6個基因。
為進一步分析CiMADS蛋白與其他植物MADS蛋白之間的系統發育關系,使用MEGA軟件將107條擬南芥蛋白質氨基酸序列與81條薄殼山核桃蛋白質氨基酸序列進行多序列比對,構建二者之間的系統發育樹(圖2)。并以擬南芥的MADS蛋白分類為依據,將81個CiMADS蛋白分為20個type-I型和61個type-Ⅱ型(MIKC),type-I型可進一步被分為 Mα(9 個)、Mβ(3個) .Mγ (5個)和M8(3個)。
2.3 共線性分析
通過TBtools軟件的MCScanX功能對薄殼山核桃MADS基因家族進行物種內和物種間的共線性分析(圖3、圖4)。結果顯示,薄殼山核桃MADS基因家族物種內的共線性分析發現了41對旁系同源基因對,在薄殼山核桃和擬南芥的共線性分析中發現了79對直系同源基因對。其中除CiMADS4、CiMADS11、CiMADS23等9個基因為串聯重復基因外,其余絕大多數基因為全基因組復制或片段復制,僅保留存在共線性關系的基因。表明薄殼山核桃MADS基因家族發生了一定規模的復制事件,推測片段復制可能為CiMADS基因家族進化的主要驅動力。
2.4保守基序和基因結構
對薄殼山核桃MADS基因家族進化樹及其保守基序(Motif)以及基因結構分析結果利用TBtools軟件進行分析并可視化(圖5)。結果顯示,薄殼山核桃MADS基因共含有8個Motif,分別命名為Motif1\~Motif8,絕大多數基因中含有Motif1和Motif3,它們對應典型的MADS結構域,并且在家族基因中發揮顯著作用。Motif2和Motif6對應的是K-box結構域,Motif的分布顯示處于同一分支亞類的基因具有相似的結構。使用在線網站GS-DS(Gene Structure Display Server2.0)對每個Ci-MADS基因編碼序列內含子和外顯子的排列進行分析,以便于深入了解基因結構的多樣性、相似性和進化關系。研究結果如圖6所示,薄殼山核桃
只有 Mδ 亞類基因含有較多的內含子,其余3個亞類含有很少或幾乎不含有內含子。Type-Ⅱ型Ci-MADS基因含有較多的內含子,其中約有 50% 的基因中含有4\~8個內含子,且內含子的長度較長。結合薄殼山核桃MADS基因家族的進化樹來看,同一亞家族中大多數CiMADS基因具有類似的基因結構,且薄殼山核桃MADS基因的內含子密度差異較大,說明不同MADS基因可能受不同選擇性剪接的精細調控,暗示了MADS基因家族具有復雜的生物學功能。
2.5 啟動子作用元件
分析CiMADS基因家族的啟動子順式作用元件,從中鑒定出29個作用元件,這些MADS基因啟動子含有光響應元件、激素響應元件以及與低溫、干旱相關的脅迫響應元件等(圖7)。依據功能注釋將它們分為4大類,鑒定出了14個光響應元件(G-box、ACE、GT1-motif、AE-box、I-box、GA-motif等),8個激素響應元件(ABRE、TCA-motif、TGACG-motif、P-box等),5個脅迫響應元件(ARE、TC-richrepeats、WUN-motif、LTR、MBS),2個控制植物生長元件(CAT-box、RY-element)。結果表明CiMADS基因家族光響應元件的數目較多,推測其可能在薄殼山核桃的生長發育過程中發揮了重要作用。CiMADS基因家族的啟動子含有逆境脅迫響應元件如低溫脅迫響應元件LTR和干旱脅迫響應元件MBS,表明薄殼山核桃MADS基因可能具有抵御多種逆境脅迫和適應環境變化的能力,由此預測出該基因具有功能多樣性。植物激素在植物的開花和花器官發育過程中具有關鍵作用,推測出MADS基因在參與植物生長發育和果實發育過程中發揮著重要的調控功能。
2.6 CiMADS基因表達
經轉錄組分析,提取MADS基因家族成員相關表達量的值,剔除部分空白數據后繪制基因表達熱圖(圖8)。圖8A為MADS基因在薄殼山核桃不同組織的表達熱圖,表達量越高顏色越深,CiMADS46在莖、CiMADS7在果實中的表達量較高,CiMADS77在雄花中的表達量很高,而在其他的組織幾乎不表達。有14個MADS基因在植株的雌花、雄花和果實上表達豐度都比較高,在其他組織表達量很少。CiMADS17、CiMADS19和CiMADS20基因不僅在種子中表達水平較高,在植株的其他組織也均有表達,
且表達量較高。
圖8B包含了植物發育的4個時期(采樣時間分別為2023年8月25日、2023年9月14日、2023年9月24日、2023年10月14日)的基因表達水平,基因表達譜顯示,CiMADS11在8月25日具有很高的表達量,之后隨著時間的推移逐漸遞減。除此以外,還有8個基因在第一階段的表達量較高,隨后逐漸遞減,至2023年10月14日表達量很少或幾乎不表達。CiMADS2和CiMADS54基因在4個時期的表達量比較相近,且都表現為9月14日和10月14日表達量更高。CiMADS57、CiMADS73、CiMADS65基因在發育的第一階段幾乎不表達,之后隨著時間推移表達量先升高后降低。有13個基因在2023年9月14日表達量下降較為迅速,后趨于平緩,表達量穩定在低值。
3 討論與結論
對基因家族的全基因組開展鑒定和表達分析是了解基因結構和功能的有效方法[15-20]。目前 MADS基因家族已在多種植物中獲得鑒定并進行了深入分析。研究發現,MADS基因家族對很多植物的生長發育具有調節作用,如控制花器官開花、果實發育及成熟等作用[21]。為了探究MADS基因在薄殼山核桃生長發育過程中的作用,本研究通過對薄殼山核桃全基因組數據進行分析,鑒定出81個MADS基因家族成員,薄殼山核桃基因家族成員數目少于模式作物擬南芥[22],高于紅欖李[Lumnitzera littorea(Jack.)Voigt][23]和錐栗(Castanea henryi)[24]等,不同物種之間MADS基因數量具有明顯差異,如中華弼猴桃(Ac-tinidia chinensis)有 68個[25]、紅皮柳(Salix sinopur-pureaC.Wangamp;C.Y.Yang)有98個[26]、龍眼(Dimo-carpuslongan)有91個[27],這種差異可能與基因組的大小和基因組的復制水平有關[28]
基于擬南芥的MADS基因家族分類,將薄殼山核桃的MADS基因家族成員分成5個亞類,其中大部分為type-I型,少部分為type-I型。薄殼山核桃MADS基因家族的保守基序分析結果表明,同一亞家族的保守基序比較相似。基因結構的分析結果表明,type-Ⅱ型CiMADS基因一般含有6個內含子,7個外顯子,而 type-I型通常含有1\~2個外顯子,幾乎不含內含子[29]。CiMADS基因啟動子的順式作用元件分析結果表明,該基因啟動子區域存在許多光
A為薄殼山核桃MADS 基因在不同組織的表達量,從內到外依次為母本、父本、果實、根、種子、莖;B為薄殼山核桃MADS 基因在不同采樣時間(2023-08-25、2023-09-14、2023-09-24、2023-10-14)的表達量。
響應元件,植物激素響應元件以及與低溫、干旱相關的逆境脅迫響應元件等[30],MADS基因有利于調節植物的生長發育,增強對外界因素的適應性[31],體現在可能影響內源生長激素如吲哚乙酸(IAA)、脫落酸(ABA)等的分泌量,且不同種源薄殼山核桃抗旱性有差異[32]。對面包小麥180個MADS基因研究發現有許多基因之間出現了表達量的顯著差異[33」;谷子MADS基因家族成員在干旱脅迫信號通路中可能位于不同的調控層級,促使相關抗非生物脅迫蛋白質的合成[34]。這些都進一步證實了MADS基因家族成員可能參與了植物響應脅迫反應的調控。
MADS基因的表達模式通常反映其功能。本試驗發現,少部分屬于type-I型的薄殼山核桃MADS基因在雄花、雌花和果實中表達量較高,在根、莖、葉中表達量相對較低,推測該類型基因在薄殼山核桃中可能主要參與調控花器官發育,這一結果與欒雨濛[35]對山核桃MADS-box基因調控花發育的結果一致。此外,余玉云等[24]對錐栗(Castaneahenryi)的研究結果表明,錐栗的MADS-box基因在果實發育中也具有關鍵功能。王溪唯等3研究發現,云南移[木衣]的MADS基因在不同組織中表達水平具有顯著差異,推測其原因可能是基因功能不同引起的,如CiMADS22和CiMADS7可能對種子休眠有負調控作用,抑制種子萌發。這些研究結果對今后MADS基因家族的功能與調控機制的研究具有重要參考價值。
參考文獻:
[1] 龍成根,賀義昌,黃建建,等.萬載縣薄殼山核桃引種現狀和產業發展思路[J].現代園藝,2024(1):78-80.
[2] VENKATACHALAMM,KSHIRSAGARHH,SEERAMNP,etal.Biochemical composition and immunological comparison of se-lectpecan[Carya illinoinensis(Wangenh.)K.Koch]cultivars[J].Journal of Agricultural and Food Chemistry,2Oo7,55(24):9899-9907.
[3] PARENICOVAL,DE FOLTERS,KIEFFERM,et al.Molecularandphylogenetic analysesof the complete MADS-box transcriptionfactor family in Arabidopsis:new openings to the MADSworld[J].ThePlant Cell,2003,15(7) :1538-1551.
[4] 孫福輝,方慧儀,溫小蕙,等.馬銀花MADS-box基因家族系統進化與表達分析[J].植物學報,2023,58(3):404-416.
[5] ABDULLAH-ZAWAWIMR,AHMAD-NIZAMMUDDINNF,GOVENDER N,et al. Comparative genome-wide analysis ofWRKY,MADS-boxandMYB transcription factorfamilies in Ara-bidopsis and rice[J]. Scientific Reports,2021,11(1) :19678.
[6]秦玉杰,任輝,祝建波.甜瓜MADS-box 基因家族的鑒定及系統進化分析[J].分子植物育種,2024,22(5):1430-1443.
[7]楊光彬,王瑾,陳愷琳,等.辣椒 MADS-box 基因家族的鑒定及表達分析[J].湖南農業大學學報(自然科學版),2023,49(5) :558-566.
[8] CHENCJ,CHENH,ZHANGY,etal. TBtools:anintegrativetoolkitdeveloped for interactive analysesof big biological data[J].Molecular Plant,2020,13(8) :1194-1202.
[9]YU C S,LIN C J, HWANG J K. Predicting subcellular localiza-tionof proteins for Gram-negative bacteria by support vector ma-chines based onn-peptidecompositions[J].Protein Science,2004,13(5):1402-1406.
[10]董金金,劉偉,李萌,等.銀杏MADS-box 基因家族的表達及系統發育分析[J].植物生理學報,2018,54(6):1055-1063.
[11]步洪鳳,顧振華,張文斗,等.桃花花期調控 FT 基因家族分析研究[J].農業與技術,2024,44(15):35-39.
[12]董茗秀,易芳,胡帥,等.山核桃油體蛋白oleosin基因家族鑒定和表達模式分析[J].果樹學報,2023,40(1):35-47.
[13]ZHUKK,FANPH,LIUH,et al. Insight into the CBL andCIPK gene families inpecan(Carya illinoinensis):identification,evolution and expression patterns in drought response[J].BMCPlant Biology,2022,22(1) :221.
[14]JIA X,LI M Z,LUO H T,et al. Transcriptome survey revealscandidate genes involved in lipid metabolism of Carya ilinoinensis[J].International Journal ofAgricultureand Biology,2O15,20:991-1004.
[15]王占軍,汪虹妍,楊妍萍,等.油桐HSP70 基因家族的全基因組鑒定與表達分析[J].江蘇農業學報,2024,40(5):806-816.
[16]汪瑞涵,雷子逸,匡明珠,等.泡桐卷野螟(草螟科:斑野螟亞科)線粒體全基因組測序與分析[J].南方農業學報,2024,55(5) :1355-1365.
[17]劉莉,瞿印權,余延浩,等.青錢柳全基因組SSR位點分析及多態性引物開發[J].南京林業大學學報(自然科學版),2024,48(4) :67-75.
[18]高輝,蔣尚伯,楊迪,等.基于全基因組關聯分析的香蕉枯萎病菌致病基因挖掘與功能研究[J].南方農業學報,2024,55(8) :2442-2453.
[19]徐鵬,李春宏,范昕琦,等.高梁CIPK家族基因的全基因組鑒定及非生物脅迫下的表達特征[J].江蘇農業學報,2024,40(4) :591-598.
[20]李韻,劉昱君,潘若云,等.雞蛋果 SUT 基因家族的鑒定及表達分析[J].植物資源與環境學報,2023,32(3):33-44.
[21]畢遠洋,陳佳婷,連輝,等.米褚MADS-box 基因家族鑒定及其在花序、果實發育中的作用探析[J].福建農林大學學報(自然科學版),2023,52(4):490-499.
[22] PARENICOVA L, DE FOLTER S, KIEFFER M, et al. Molecularand phylogenetic analyses of the complete MADS-box transcriptionfactor family in Arabidopsis:new openings to the MADSworld[J].ThePlantCell,2003,15(7):1538-1551.
[23]李佳文.瀕危紅樹植物紅欖李MADS-box基因的鑒定及功能分析[D].海口:海南師范大學,2020.
[24]余玉云,沈軍,柳明珠,等.錐栗MADS-box基因家族鑒定及組織特異性表達分析[J].森林與環境學報,2023,43(1):60-67.
[25]高歡,鄭珂昕,廖光聯,等.中華弼猴桃全基因組MADS-box基因家族鑒定及表達分析[J].果樹學報,2023,40(11):2307-2324.
[26]王媛,翁慧瑩,曾思文,等.柳屬植物花發育相關的MADS-box基因家族成員鑒定與表達分析[J].福建農林大學學報(自然科學版),2024,53(3):355-363.
[27]李曉斐,申序,張舒婷,等.龍眼MADS-box基因家族的全基因組鑒定及表達模式[J].應用與環境生物學報,2022,28(2):451-463.
[28]王育選,張夢超,常麗君,等.谷子MADS-box基因家族的鑒定和表達分析[J].生物信息學,2023,21(1):51-59.
[29]潘志演,唐博希,田慧源,等.煙草MADS-box基因家族鑒定及其腋芽發育相關基因表達分析[J].分子植物育種,2022,20(7):2217-2232.
[30]NIECR,XUXG,ZHANGXQ,etal.Genome-wideidentifiedMADS-box genesin Prunuscampanulata‘plena’and theirsrolesindouble-flowerdevelopment[J].Plants,2023,12(17) :3171.
[31]ZHENGB,WANGSB,WUHX,et al.Genome-wide identifica-tion of mango(Mangifera indicaL.)MADS-box genesrelated tofruit ripening[J].Horticulturae,2023,9(12):1289.
[32]廖健明,黃曉露,梁鐘芳,等.干旱脅迫下薄殼山核桃實生苗內源激素的變化規律[J].廣西林業科學,2020,49(4):511-517.
[33]MAJ,YANGYJ,LUOW,etal.Genome-wideidentificationandanalysisof theMADS-boxgenefamilyin bread wheat(TriticumaestivumL.)[J].PLoSOne,2017,12(7):e0181443.
[34]馬鑫磊.谷子MADS-box和Ⅲ型PRX基因家族的生物信息學分析及干旱脅迫下的表達分析[D].秦皇島:河北科技師范學院,2022.
[35]欒雨濛.植物MADS-box基因家族與山核桃雌雄轉錄組分析[D].杭州:浙江農林大學,2019.
[36]王溪唯,陳璨,王大瑋.云南移[木衣]MADS-box基因家族鑒定與表達分析[J].生物工程學報,2023,39(7):2897-2913.
(責任編輯:黃克玲)