薛明云陳杰陳偉吳紀中蘭彩霞李東芹
1.華中農業大學植物科學技術學院,武漢 430070; 2.華中農業大學作物遺傳改良國家重點實驗室,武漢 430070;3.江蘇省農業科學院種質資源與生物技術研究所,南京 210014
代謝物在植物正常生長發育以及適應不同環境條件過程中扮演著不可或缺的角色[1-2]。與此同時,這些代謝物也是人類所需營養元素的重要組成部分[2-4]。例如,具有不同化學修飾類別的黃酮類物質與水稻或者擬南芥在地球不同緯度分布狀況相關聯[5-6],而人類飲食結構中的這類黃酮代謝物具有良好的抗炎癥等生物活性[7-8]。由于代謝物種類數量龐大[9-10]且變異豐富[11],通過結合代謝組學檢測手段與不同的遺傳學設計,能夠幫助我們更系統地研究代謝物在植物體內的含量變化及其可能的生物學意義。該研究思路已經成功應用于水稻、番茄和玉米等多種作物的代謝組學研究中[12-14],相關研究結果有助于解析代謝物與植物響應逆境[6,15]或者與食物口感風味[16-17]等之間的關聯。例如,代謝組學已經成功用于解析番茄風味和果皮顏色的遺傳基礎和代謝機制[14],為番茄果色和風味育種提供了理論指導。玉米中的mQTL分析[13]則有助于幫助我們全面了解玉米初生代謝物調控網絡。
然而,與其他作物相比,這種將代謝物與數量性狀位點(quantitative trait loci)相結合(mQTL)或者與全基因組關聯分析(genome-wide association study)相結合(mGWAS)的方法在小麥研究中僅有少量報道。在這些研究中,早期的mQTL研究由于沒有參考基因組信息,未能提供任何候選基因[18-19];隨著小麥基因組測序工作的進行,之后的小麥mGWAS結果能夠提供可能的候選基因信息[20],但是未進行后續驗證。目前,在小麥中已經能夠使用酶活功能驗證等方式對小麥mGWAS位點候選基因的功能進行初步驗證[21],還能嘗試探討這些代謝物與小麥農藝性狀之間的可能關聯[22]。與水稻、玉米等作物相比,小麥代謝組學相關研究,尤其是將代謝組學測定方法與遺傳學設計相結合的研究方式現在還處于起步階段,需要進一步研究,一方面促進對控制小麥不同代謝物的潛在遺傳基礎的了解,另一方面則有助于揭示復雜農藝性狀背后的分子機制,從而為小麥遺傳改良提供理論基礎和分子資源。
本研究使用由雙親Soru#1和Naxos構建的重組自交系(RIL)群體材料。由于雙親的抗性差異,前人已利用該RIL群體進行了小麥赤霉病和條銹病等的QTL定位研究,獲得了潛在抗性數量性狀位點[23-24]。然而,目前還沒有針對該群體代謝組學的研究報道。通過對其進行代謝組學檢測,能夠了解群體中不同材料的籽粒代謝譜。與此同時,結合代謝譜信息和對應材料基因型信息進行mQTL定位,能夠獲得可能調控不同代謝物含量的數量性狀位點,為候選基因克隆和功能驗證等后續研究提供基礎數據。另外,還可以將代謝物QTL和抗病QTL信息進行聯合分析,挖掘可能同時影響特定代謝物含量與病害抗性的位點,從而為小麥抗病育種研究提供新的視角。
本研究使用由Soru#1和Naxos雜交所形成的含有119個株系的F2∶9代RIL群體,其中Soru#1為國際玉米小麥改良中心(CIMMYT)育種的1個六倍體人工小麥品系[23],系譜為SABUF/5/BCN/4/RABI//GS/CRA/3/AE.SQUARROSA(190)。Naxos為德國小麥品種,系譜為Tordo/St.Mir808-Bastion//Miranet。該群體成熟籽粒由江蘇省農業科學院吳紀中研究員團隊提供。對大田收獲的成熟籽粒隨機取5粒進行研磨,即為1個生物學重復。
曬干后的種子使用植物組織研磨儀(Qiagen,Germany)于29 Hz研磨1 min后,按照1 000 μL/0.1 g粉末的比例加入70%甲醇用于提取小麥籽粒代謝物。代謝物提取過程在冰上進行,提取液(70%甲醇,預先加入阿昔洛韋至終質量濃度0.1 mg/L作為內標)與粉末充分混合后,每10 min渦旋混勻1次,渦旋3次后將混合溶液于4 °C過夜浸提,于10 000 r/min離心5 min后,取上清經0.22 μm孔徑濾膜(上海安譜)過濾后,即為代謝物樣品。代謝物檢測按照參考文獻[25]方法使用LC-ESI-MS/MS系統進行。對于檢測到的代謝物信號,使用步進多反應監測(sMRM)對每種代謝物在不同小麥籽粒樣品中的相對含量進行定量檢測[26]。每個sMRM檢測窗口為90 s,檢測時長1 s,使用Analyst 1.5軟件進行數據分析。由于代謝物在不同生物學樣品之間的含量變異遠遠大于技術重復之間的變異[21],本次代謝物檢測未進行技術重復。
廣義遺傳力H2=VG/(VG+VE),其中VG和VE分別為基因型變異和環境變異[27]。使用IciMapping軟件利用群體基因型數據[23]構建遺傳圖譜,結合代謝組數據進行mQTL定位并計算每個位點的加性效應值。取LOD值大于2.5的位點為顯著mQTL位點。熱圖使用R軟件包繪制,網絡圖使用Cytoscape軟件獲得。
在群體樣品中共檢測到478種已知代謝物,其中154種物質通過與標準品比對鑒定得到。所檢測到的物質主要包含氨基酸及其衍生物(Ami,50種)、黃酮類物質(Fla,72種)、脂質(Lip,44種)、核苷酸及其衍生物(Nuc,32種)、有機酸(Org,12種)、酚胺(Phe,29種)、植物激素及其衍生物(Phy,73種)、多酚(Pol,43種)、糖類(Sug,16種)、維生素及其衍生物(Vit,24種)以及其他代謝物(Oth,83種),見圖1A。這些代謝物中廣義遺傳力介于0.4~0.9范圍內的代謝物數量占比88.28%(圖1B)。同時,有349種代謝物含量的變異系數為0.2~0.9,且有114種代謝物含量的變異系數大于0.9(圖1C)。對這些代謝物含量分布規律分析顯示,結構或者類別相似的部分代謝物被聚類在一起(圖2A),例如包含吲哚環結構的一些代謝物在群體材料中具有類似的分布規律(圖2B)。

圖1 代謝譜測定結果中代謝物種類 (A)、廣義遺傳力 (B) 以及變異系數 (C) 分布信息Fig.1 Distribution of metabolite classes (A),broad-sense heritability (B) and coefficient of variance (C)for each metabolite detected in the current study

A:所有代謝物在小麥籽粒中分布規律的相關性熱圖,其中紫色、藍色和綠色矩形方框標識所對應的代謝物具有相似分布規律,綠色方框內代謝物詳情見圖B; B:圖A中綠色矩形方框對應的代謝物信息,這些代謝物之間分布規律的相關系數用灰色連線表示,連線越粗對應相關系數越高。這些高相關性代謝物中包含9種具有吲哚環結構(該結構骨架用綠色標識)的代謝物。A:Heatmap of correlation values regarding the similarities of metabolites distributed in wheat samples,within which the metabolites included in the colored (i.e.,purple,blue and green) rectangles have similar distribution patterns. The more detailed information of metabolites involved in the green rectangle are shown in Fig. 1B; B:Detailed information of metabolites included in the green rectangle of Fig. 1A. The Pearson correlation values are indicated by the grey lines,where higher correlation values correspond to thicker lines. The indole skeletons were commonly found in nine of the metabolites,and the skeletons are indicated by green.
利用IciMapping軟件對RIL群體的SNP基因型所構建的遺傳連鎖圖譜[24]和代謝物測定結果進行QTL分析,對236個代謝物共定位到385個mQTL位點(LOD > 2.5)。這些位點分布于小麥21條染色體上,其中2B和6B染色體定位到的mQTL位點最多,均為36個(圖3A)。分析不同類別代謝物的定位結果數量,發現植物激素類物質(Phy)定位到的QTL位點數量更多,共有70個mQTL位點(圖3B)。另外,不同類別的代謝物的平均定位位點數差異不大,而黃酮類(Fla)和酚胺類(Phe)代謝物最低,平均近2個代謝物才能定位到1個位點(圖3B)。和其余類別代謝物相比,本研究中所檢測到的大量黃酮類(Fla)和酚胺類(Phe)代謝物均沒有定位到有效的QTL位點。除了2A和2D染色體的mQTL數量相等(圖3A),mQTL數目在小麥3個亞基因組的分布整體呈現D基因組上mQTL數量更少的染色體偏好性。對于維生素類代謝物,在B基因組和D基因組所定位mQTL數量相等,而核苷酸類物質在D基因組上的位點數甚至超過B基因組(圖3C)。此外,各類代謝物均呈現D基因組定位結果更少的染色體偏好性(圖3C)。具體到每條染色體,有5類代謝物(氨基酸、核苷酸、有機酸、酚胺和糖類)在單條染色體mQTL數占該類物質所有位點數的20%以上(圖3D),其中酚胺類物質接近50%的mQTL位點均位于5B染色體(圖3D)。對定位到的所有mQTL位點進行匯總,發現共有5個位點為mQTL熱點區域,這些位點均有不少于5個代謝物的定位結果(圖4)。在這些熱點區域中,共定位代謝物最多的位點為6B染色體短臂末端的0.0~0.5 cM區段(標記為RAC875_c1305_120和RAC875_c44002_81),共有22個代謝物共定位于該區段范圍內。另外,位于5A染色體的熱點2(BS00075308_51和Td_c94007_225)被5種核苷酸類物質共定位(圖4);熱點1(wExc15046_23216392和IAAV4072)被16種代謝物共定位,其中1個氨基酸類物質(S19_2400,N-Acetyl-tryptophan)的LOD值為20.9(圖4A)。同時,該定位熱點共包含5個含有吲哚環結構的色氨酸類似物(S19_2400、 mr677、mr1346、mr1974和mr2070,圖4B),這些物質在該小麥群體中具有相似的含量分布規律(圖1)。最后分析這5個定位熱點區域對應位點的加性效應來源,發現其中3個熱點(熱點1、3、4)來源于親本Naxos, 2個熱點(熱點2、5)則來源于Soru#1。

A:mQTL在不同染色體上的數量分布; B:不同類別代謝物所定位mQTL數量信息; C:不同類別代謝物在不同亞基因組上的mQTL分布; D;不同類別代謝物在21條小麥染色體上的mQTL分布。A:Distribution of mQTL on different chromosomes; B:mQTL numbers from each metabolite category; C:Distribution of mQTL on the three sub-genomes; D:Distribution of mQTL on the 21 wheat chromosomes.

5個mQTL熱點分布在4個連鎖群上(A),每個熱點均定位到不同類別的代謝物類型(B)。熱點1中所定位到的氨基酸類物質為5種色氨酸類似物(B),其中1種物質(S19_2400)定位的LOD值為20.9(A)。The five mQTL hotspots are distributed on four linkage groups (A),numerous metabolites classified into different categories were co-mapped on each of the hotspots (B). The amino acid derivatives mapped in hotspot 1 were five tryptophan-decorative metabolites (B),in which one (S19_2400) was mapped with LOD value of 20.9 (A).
本研究通過對Soru#1與Naxos構建的高代RIL群體進行代謝組測定和定位,成功獲得了大量的mQTL位點,這些信息將為未來解析該群體中代謝組差異的分子機制提供參考。同時,由于2個親本在多種病蟲害抗性上存在顯著差異[23-24],相關定位結果還能與抗性定位結果進行聯合分析,以便挖掘小麥抗病與代謝物之間可能存在的關聯。本研究通過分析代謝譜,發現處于相同通路、結構類似的代謝物可能具有相似的含量分布規律(圖2),該結果與小麥中已有報道[21]類似,相關結果有助于代謝物候選基因鑒定和通路解析。通過統計mQTL結果,發現代謝物定位結果的染色體偏好性(圖3),這種偏好性有可能是由于小麥D基因組遺傳多樣性相對于A或者B基因組更低[28]所導致的。所獲得的定位結果中還包含5個可能控制多種代謝物含量的熱點區域(圖4),在這些熱點區域內可能存在同時控制多個代謝物含量的候選基因[25,29]。例如,位于5A染色體的熱點2僅被6種核苷酸類物質共同定位(圖4),該區域內可能包含影響多種核苷酸代謝物的候選基因;與此同時,5A染色體的熱點1不僅對于代謝物S19_2400有較大LOD值,還被另外4種包含吲哚環結構的代謝物共同定位。由于這些代謝物結構類似(圖1B)且處于色氨酸代謝途徑,該染色體區段可能存在候選基因,主要通過控制代謝物S19_2400的合成或者分解,影響多種與之結構相關、處于相同代謝通路的色氨酸類物質的相對含量。通過分析所獲得5個mQTL熱點的加性效應來源,發現2個親本對其中不同熱點均有貢獻,表明合理利用不同親本組合有助于更好地進行小麥代謝組學研究,以及針對這些熱點區域的進一步研究有助于候選基因鑒定和解析該群體代謝組差異。