郭靜文,史曉蕾,劉 茜,趙青松,邸 銳,劉兵強,閆 龍,王鳳敏,張孟臣,趙寶華,楊春燕
(1.河北省農林科學院 糧油作物研究所,國家大豆改良中心石家莊分中心,農業部黃淮海大豆生物學與遺傳育種重點實驗室,河北省遺傳育種重點實驗室,河北 石家莊 050035; 2.河北師范大學 生命科學學院,河北 石家莊 050024)
大豆(Glycinemax(L.) Merrill)起源于中國[1],大豆籽粒中蛋白質含量約占干質量的40%左右,是人類重要的植物蛋白來源。21世紀以來,品質性狀改良成為大豆育種的主要目標之一,而提高大豆籽粒蛋白質含量也成為國內外品質育種的重要指標[2-3]。目前,通過常規雜交育種方法培育高蛋白大豆品種難度較大,而已發表的QTL定位結果有時也難以用于指導作物育種實踐。因此,如何利用大豆資源中的優異基因,從分子水平揭示復雜的蛋白質合成代謝機制,是進行分子育種的重要前提。
國內外關于大豆蛋白質含量的研究有諸多報道。普遍認為大豆蛋白質合成受微效多基因調控,是數量性狀遺傳,加性效應明顯[4]。試驗材料的不同,環境條件的差異對蛋白質的含量也均有較大的影響。目前,在大豆所有的20個染色體上均發現有相關的QTL位點,共有298個QTL,詳細信息可參考公共網站(http://soybase.org/)。連鎖分析和關聯分析均顯示20號染色體檢測到的大豆籽粒蛋白質合成相關QTL的頻率最高[5-7],且在該染色體上有一個QTL區段(A688~Satt239)在多個環境和群體中均被檢測到[8]。同時,大量研究表明,蛋白質含量與油分含量、單株產量、株高、主莖節數、主莖分枝數、開花期、成熟期均呈負相關[9-11],而蛋白質與脂肪兩性狀很難通過染色體片段重組的方法分開,因此,推測這2個性狀緊密連鎖或一因多效[12]。
對于蛋白質合成積累的研究,早期主要集中在闡述蛋白質構成因子、物質積累過程和環境條件幾個方面。蛋白質的基本組成單位是氨基酸,氨基酸通過脫水縮合形成肽鏈。蛋白質是由1條或多條多肽鏈組成的生物大分子,每一條多肽鏈有20至數百個氨基酸殘基不等。關于蛋白質合成的調控,前人研究發現,磷酸烯醇式丙酮酸羧化酶(PEPC)是控制種子中蛋白質和脂肪酸合成的重要調控基因,廣泛分布于高等植物的細胞質中。Chen等[13]發現利用反義PEP基因轉化油菜籽粒后,檢測到蛋白質含量降低,同時含油量比對照增加了15%以上,該研究證明了底物競爭調控籽粒蛋白質、脂肪比率的理論。轉錄因子是一類蛋白質合成的重要調控因子,它們在蛋白質代謝中發揮著重要作用。大豆轉錄因子GmDof4和GmDof11轉化擬南芥后,抑制了蛋白質合成相關基因的表達[14]。近些年來,研究人員通過比較不同物種間蛋白質合成相關的基因,從中發現一些共性的調控基因:LEC1、LEC2、ABI3、FUS3,這些關鍵的轉錄因子調控著胚胎發生和種子的成熟。LEC1是ABI3、FUS3上游的正向調控因子,而ABI3、FUS3、LEC1 基因協同作用以控制種子發育過程中的多個基本過程,當其中某個基因發生突變后,不僅貯藏蛋白的含量降低,同時也降低了對ABA的敏感性[15]。通過對蛋白質合成基因啟動子區域的順式調控元件進行研究發現,貯藏蛋白基因的啟動子區域具有2個保守的結構域 RY/G和B-box,其中RY/G結構域包括2個作用元件 RY(CATGCA)和G-box(CACGTG)分別與B3或bZIP、bHLH類轉錄因子結合,而B-box由DistB (GCCACTTGTC)和ProxB(CAAACACC)2個作用元件組成,分別與bZIP或MYB類轉錄因子結合,因此,推測這些轉錄因子對蛋白質的合成具有調控作用[16]。
轉錄組測序技術(RNA-Seq)的發展使得功能基因和蛋白的發現步伐大大加快。該技術將 RNA 進行反轉錄得到 cDNA,然后對 cDNA 文庫進行測序,旨在快速全面的獲取某物種在某狀態的下的全部轉錄本[17]。其以速度快、準確性高、運行成本低等特性受到廣泛關注。與基因芯片技術相比,RNA-Seq技術能夠對特定細胞或組織在特定狀態下的基因表達種類和豐度進行更精準的定性定量分析。近年來 RNA-Seq 技術在作物研究中被廣泛應用于基因資源挖掘、揭示突變體變異機制、探究作物生理生化過程、研究抗病、抗逆的機制等方面,為不同生物的功能基因組學開展提供了新的思路與研究方法[18-19]。在基因資源的挖掘方面,Wang等[20]利用轉錄組測序技術對野生和突變型棉花的毛狀體纖維細胞的分裂與延長過程進行探究;和小燕等[21]以含油量高及含油量低的2個花生品系為研究材料,構建了與油脂累積相關的2個發育時期的轉錄組測序文庫,發現各類調控脂肪酸生物合成的基因在花生種子油脂合成初期十分活躍,并挖掘到油體固醇蛋白等基因可能參與了油脂的合成與代謝;除此之外,研究人員利用 454 平臺從玉米[22]、羊草、油橄欖[23]等植物中發現了新基因。RNA-Seq技術對揭示突變體變異機制也具有一定的作用。欒海業等[24]以大麥白化穎殼突變體與野生型植株為研究材料進行轉錄組測序分析,結果表明,導致大麥白化穎殼突變體的出現,可能是因為葉綠體形成和發育的相關基因其表達受到了相關抑制,從而導致了光合作用的降低。在探究作物生理生化過程方面,陳靜[25]利用 RNA-Seq 技術對花生種子休眠與解除休眠過程進行了研究,發現赤霉素 20 氧化酶、EREBP-like 因子熱激蛋白等綜合調控花生種子休眠解除以及萌發。在抗病蟲害研究中,李海燕等[26]以抗病的五寨黑豆為材料,對大豆胞囊線蟲侵染前與侵染后的轉錄組文庫進行檢測對比,發現苯丙烷類代謝途徑及氧化磷酸化代謝通路對五寨黑豆的抗病有重要作用。黃啟秀等[27]利用轉錄組測序技術對抗枯萎病抗性表現不同的7種材料進行研究,發現了可能與海島棉枯萎病抗性相關的代謝通路-類黃酮代謝通路。除此之外,研究人員還應用轉錄組技術在水稻[28]、小麥[29-30]以及甘薯[31]等作物中進行了相關的抗病試驗,取得了一定的結果。在抗逆境領域,任夢露等[32]利用轉錄組測序技術研究大豆莖稈對蔭蔽脅迫的響應,發現南豆 12 在蔭蔽脅迫下其細胞壁多糖的含量和木質素含量有明顯提升,并對生長素發生響應,以此方式來增加植株莖的強度,從而保持莖的某種形態優勢,并提升其抗倒伏性,最終實現提高對蔭蔽環境的適應程度。孫愛清等[33]以強抗旱花生品種為材料,對干旱處理過的花生葉片進行 RNA-Seq 分析,旨在探究花生干旱脅迫下的植株響應,結果發現類黃酮代謝途徑可能在該過程中有重要作用。目前,作物中利用轉錄組測序技術的應用十分廣泛,但在挖掘大豆發育時期籽粒中蛋白質合成相關基因的研究鮮有報道。
因此,本研究以遺傳背景相近的大豆高蛋白品系冀HJ117及其回交親本冀豆12為研究材料,利用測序技術檢測兩樣本開花后14 d籽粒的表達譜。通過對差異表達基因進行功能注釋、GO功能分類、富集代謝途徑的分析以及熒光定量PCR分析,篩選出與蛋白質合成密切相關的基因,為揭示蛋白質合成代謝機制奠定理論基礎。
親本組合冀豆12與茶秣食豆雜交后代與母本冀豆12(蛋白質含量46.48%)回交2次,得到高蛋白大豆冀HJ117(蛋白質含量52.99%)。冀HJ117和冀豆12由河北省農林科學院糧油作物研究所提供。將冀HJ117和冀豆12大豆籽粒種植于河北省農林科學院糧油作物研究所堤上試驗站,當試驗材料進入開花盛期時,分別對冀HJ117和冀豆12同一天開花的花朵進行標記,并對開花后14 d的籽粒進行取樣,使用液氮速凍保存。
1.2.1 RNA-Seq文庫的構建及測序 RNA-Seq文庫構建及測序工作由華大基因科技有限公司完成。
1.2.2 數據處理及差異表達基因的篩選 對測序得到的原始數據進行去雜處理得到有效序列(Clean reads),使用比對軟件SOAPaligner/soap2將有效序列比對到參考基因組。利用唯一比對上基因的reads數目和比對上參考序列的總reads數來計算基因表達量,基因表達量的計算使用RPKM法[34],差異表達基因的篩選參照Audic等[35]發表在Genome Research上的基于測序的差異基因檢測方法。基于差異基因的功能注釋,對所有差異表達基因進行Gene Ontology(GO)功能顯著性富集分析,分析將計算得到的P值(P-value)通過Bonferroni校正之后,以correctedP-value≤0.05為閾值,滿足此條件的GO條目(GO term)定義為在差異表達基因中顯著富集的GO term,以此確定差異表達基因行使的主要生物學功能。代謝通路(Pathway)顯著性富集分析將Q值(Q value)≤0.05的Pathway定義為在差異表達基因中顯著富集的Pathway,從而確定差異表達基因參與的最主要生化代謝途徑和信號轉導途徑。
1.2.3 qRT-PCR檢測候選基因的表達量 隨機選取9個差異表達基因進行基因的表達量檢測,使用北京天根公司的RNA prep pure Plant Kit試劑盒分別提取大豆冀HJ117及冀豆12 14 d籽粒的RNA,并使用TaKaRa RNA PCRTMKit(AMV) Ver.3.0反轉錄得到cDNA,進行熒光定量PCR分析,選用CYP2基因為內參基因。
試驗所選基因及引物序列如表1,合成于生工生物工程(上海)股份有限公司。qRT-PCR試驗參照TaKaRa Premix Ex TaqTMⅡ試劑盒,反應體系含SYBR Premix Ex Taq Ⅱ 10 μL、模板0.5 ng、PCR正向引物(10 μmol/L) 1 μL、PCR反向引物(10 μmol/L) 1 μL, 補水至總體積20 μL。擴增反應程序為:95 ℃孵育30 s;40個循環的95 ℃ 5 s,60 ℃ 30 s,55 ℃ 30 s。該反應使用美國Bio-Rad Lcycleri Q5熒光定量PCR儀進行擴增。
試驗數據分析采用 2-ΔΔCt法進行相對定量分析,計算過程如下:先分別計算出每組的ΔΔCt=(Ct目的基因1-Ct內參基因)-(Ct目的基因2-Ct內參基因),再根據ΔΔCt 求出 2-ΔΔCt以及標準誤。使用Microsoft Excel 2007 軟件處理數據并作圖。

表1 基因名稱及引物序列Tab.1 Genes and primers for qRT-PCR
通過高通量測序儀Illumina HiSeqTM2000對冀豆12和冀HJ117 14 d籽粒的cDNA測序,分別得到原始序列8 747 900,8 486 919條。通過過濾,冀豆12得到有效序列8 684 049條,占原始序列的99.27%;冀HJ117得到有效序列8 410 499條,占原始序列的99.10%。表明測序質量較高,適合進行后續的生物信息分析。
將冀豆12與冀HJ117過濾得到的有效序列與大豆參考基因組進行比對,表2是各樣品與參考基因組的數據比對統計。從比對結果看,兩樣本成功比對上的序列均在700萬條以上,效率分別為85.75%,86.01%。

表2 有效序列與參考基因組比對結果統計Tab.2 Comparison between clear reads and reference genomes
由于不同參考基因有不同的長度,筆者把reads在參考基因上的位置標準化到相對位置(reads在基因上的位置與基因長度的比值),然后統計基因不同位置比對上的reads數量。從圖1可以看出,2個樣品的reads在參考基因上不同位置的分布相對比較均勻,表明cDNA片段化的隨機性好,保證了測序質量。
將兩樣本差異檢驗的P-value作多重假設檢驗(FDR)校正,并根據基因的表達量(RPKM值)計算該基因在不同樣本間的差異表達倍數。將同時滿足FDR≤0.001且倍數差異不低于2倍的基因定義為差異表達基因。經分析冀HJ117和冀豆12 2個轉錄組,共得到差異表達基因336個,其中冀HJ117較冀豆12上調表達基因195個,下調表達基因141個(圖2-A)。
通過差異表達基因的篩選,獲得差異表達基因的GO IDs。對冀豆12和冀HJ117的差異表達基因進行功能注釋,在336個差異表達基因中,獲得功能注釋的基因為234個,未找到匹配信息的基因數為102個,2種情況占比分別為69.94%,30.36%(圖2-B)。

A.冀豆12的reads在參考基因上的分布均勻性統計;B.冀HJ117的reads在參考基因上的分布均勻性統計。A.Distribution statistics of reads mapped to reference gene in Jidou 12; B. Distribution statistics of reads mapped to reference gene in Ji HJ117.

A.差異表達基因的篩選;B.差異表達基因的功能注釋統計。A.Screening of differential transcription genes; B. Functional annotation of differential transcription genes.
對樣本冀HJ117與冀豆12的336個差異表達基因的GO功能注釋進行統計分析,GO總共有3個類目,分別描述基因參與的生物過程、所處的細胞位置以及基因的分子功能。
圖3是冀HJ117與冀豆12樣品差異表達基因GO注釋聚類圖,從圖中可知,在生物過程分組的差異表達基因注釋到了15個GO條目中,其中新陳代謝過程有95個差異表達基因,占生物過程分類的22.9%,其中61個基因上調表達,34個基因下調表達;細胞過程有76個差異表達基因,占生物過程的18.4%,47個基因上調表達,29個基因下調表達;應激反應有58個差異表達基因,占14.0%,上調表達基因41個,下調表達基因17個;而生物過程正向調控所占比例最低,僅有2個差異表達基因下調表達,占比例0.5%。
在所處的細胞位置類目下差異表達基因共注釋到6個GO條目中,其中細胞、細胞組分、細胞器3個條目的差異表達基因較多,分別有160,144,98個差異表達基因,占細胞位置的36.2%,32.7%,22.2%;封閉性膜和大分子復合物的差異表達基因數目最少,均為4個,占0.9%比例。
然而在分子功能分組中差異表達基因注釋到5個GO條目,其中具有催化活性的差異表達基因有117個,占49.5%;具有連接活性的差異表達基因有101個,占42.8%;而酶調節活性和分子傳感器活性均僅有2個差異表達基因,占該分組比例0.8%。
GO功能顯著性富集分析可以篩選出在差異表達基因中顯著富集的GO功能條目,并篩選出差異表達基因與哪些生物學功能顯著相關。結果如表3所示,參考基因在生物過程分組中有注釋的基因共25 633個,本研究有注釋的差異表達的基因共171個。在該分組中有3個條目顯著富集,主要涉及應激反應、化學穩態以及離子穩態;在細胞位置分組,有注釋的參考基因共27 869個,本研究注釋到162個基因差異表達,并在高爾基堆,高爾基池2個條目達到顯著富集;在分子功能分組,有注釋的參考基因共29 635個,本研究有179個注釋的差異表達基因,這些差異表達基因在氧化還原酶類、氧化金屬離子、受體氧,氧化還原酶類、氧化金屬離子,氧化還原酶類3個條目顯著富集。

圖3 差異表達基因GO注釋聚類圖Fig.3 GO annotation of differentially expressed genes

表3 差異表達基因中顯著富集的GO termsTab.3 Significantly enriched GO items in DEGs
將樣本冀HJ117與冀豆12的表達基因與KEGG數據庫比對,數據庫中具有通路注釋的基因共29 169個,本研究中注釋到的差異表達的基因共有197個,參與了72個代謝通路。將Qvalue≤0.05的pathway定義為在差異表達基因中顯著富集的Pathway。本試驗的Pathway顯著性富集分析結果發現,差異基因僅顯著富集在蛋白質內質網合成途徑中,該途徑共有34個差異表達基因,占有注釋的差異表達基因的17.26%,其中冀HJ117較冀豆12有33個基因上調表達,1個基因下調表達。
除此之外,差異表達基因還參與黃酮和黃酮醇的生物合成,丙氨酸、天門冬氨酸和谷氨酸代謝,脂肪酸生物合成,檸檬烯和蒎烯降解,類黃酮生物合成以及各類氨基酸的代謝和蛋白質輸出途徑等通路中,其詳細信息統計于表4中。
圖4為KEGG數據庫中蛋白質內質網合成途徑的詳細信息,其中加粗方框為上調基因所在位置,虛線方框為同時存在上調基因和下調基因。差異表達基因推測的蛋白名稱、所對應的KO號以及該基因的log2ratio值統計于表5中。從表中發現,差異表達基因所對應的表達蛋白主要有鈣聯蛋白(Calnexin,CNX)、結合免疫球蛋白(Binding immunoglobulin protein,Bip)、內質網膜結合連接酶(RING-finger protein with membrane anchor 1,RMA1)以及熱激蛋白(Heat shoct proteins,Hsp20、Hsp40、Hsp70、Hsp90)。其中熱激蛋白Hsp20的差異表達基因最多,共21個,其中20個基因上調表達,1個基因下調表達。

表4 Pathway顯著性富集分析結果Tab.4 Pathway enrichment analysis of DEGs
注:**.達到極顯著差異。
Note:**.The difference is significant at the 0.01 level.

加粗標記為上調基因所在位置;虛線標記為下調基因所在位置。The bold marker is the location of the up-regulated genes; The dotted marker is the location of the down-regulated gene.

表5 蛋白質內質網合成途徑差異表達基因詳細信息Tab.5 Details of genes in protein processing in endoplasmic reticulum
在冀HJ117與冀豆12差異表達的336個差異表達基因中,共有6個調控表達的轉錄因子,分屬在5個轉錄因子家族中,分別是MYB、AP2、HSF、B3、以及Trihelix。其中有4個轉錄因子在冀HJ117中表達量較高,有2個轉錄因子在冀豆12中表達量較高,表6是差異表達基因中的轉錄因子的詳細信息。

表6 差異表達基因中的轉錄因子Tab.6 Transcription factors of differential transcription genes
為驗證轉錄組測序數據的可靠性,從蛋白質內質網合成途徑的34個差異表達基因中隨機挑選9個基因(表1)進行qRT-PCR檢測,經檢測候選基因擴增的引物熔解曲線均為單峰,表明該引物對基因的擴增具有特異性。
通過對9個基因分別在冀HJ117與冀豆12 14 d籽粒中的表達量分析發現,候選基因在冀HJ117中的表達量均高于在冀豆12中的表達量(圖5),該結果與RNA-Seq的分析結果趨勢相一致。

圖5 候選基因在冀HJ117與冀豆12的表達量Fig.5 Expression of candidate genes in Ji HJ117 and Jidou12
蛋白質的合成代謝是個復雜的過程,主要涉及兩方面:一是氨基酸的生理合成,即碳素和氮素的調運,二是貯藏蛋白基因的轉錄翻譯及加工。大豆作為固氮植物將大氣中的氮氣轉化為氨,氨通過轉氨作用為其他氨基酸提供氨基,其中谷氨酰胺合成酶是氨代謝中的一個主要調控點。對于氨基酸的生物合成機理,多數氨基酸有其各自的合成通路,并與眾多基因和酶的參與有關,其發生作用的位點、啟動功能的時期以及如何使細胞內的各組分發生變化目前尚無定論[36]。杜若琛[37]研究發現,大豆種子的發育可分為 3 個時期:開花后 10~30 d為前期,該時期為蛋白質合成階段;30~80 d為中期,該時期蛋白質發生快速積累,并合成貯藏蛋白;80~100 d為后期,蛋白質積累緩慢。其中貯藏蛋白占種子總蛋白含量的80%左右[38],可分為白蛋白、球蛋白、谷蛋白和醇溶蛋白4類。在種子的胚發育過程中,醇溶蛋白在粗面內質網合成,而后形成蛋白質聚集體,直接形成蛋白體并于其中貯存。白蛋白、球蛋白和谷蛋白首先在粗面內質網上形成分子量較大的前體,經過高爾基體的受體分選,進入特定的運輸囊泡,經由受依賴型運輸或聚集體形式運輸至蛋白質貯存液泡中,最后經過液泡加工酶等的剪接轉換為成熟型貯藏蛋白質[39]。
在本研究中,冀HJ117與冀豆12的差異表達基因顯著富集在蛋白質內質網合成途徑中,其差異表達的基因主要為鈣聯蛋白(CNX)、結合免疫球蛋白(Bip)、內質網膜結合連接酶(RMA1)以及熱激蛋白(Hsp20、Hsp40、Hsp70、Hsp90)。該途徑中,差異表達的Hsp基因所占比例最高,尤其以Hsp20的差異表達基因最多,共有21個。Hsp是一類從細菌到高等真核生物中普遍存在且高度保守的蛋白,根據分子量的大小可以分為5個家族,即Hsp100、Hsp90、Hsp70、Hsp60和小分子熱激蛋白(sHSF),因為sHSF的分子量普遍在20 ku左右,故也稱為Hsp20[40]。許多研究表明,熱激蛋白在細胞中可以作為“分子伴侶”參與合成中的多肽反應,使其正確折疊;它還能夠幫助新生肽穿過細胞膜結構,使蛋白質運轉到細胞的不同部位發生作用;在高溫等脅迫環境中,熱激蛋白可以組織熱變性蛋白的聚集,阻止蛋白的不可逆變性或有利于蛋白質變性后的復性[41]。
鈣聯蛋白是內質網中的一種磷酸化的鈣結合蛋白,在哺乳細胞中它會與單葡糖基化修飾的糖蛋白相連接,幫助其成熟[42]。對于那些需要更多加工的非天然蛋白質,將會被UDP葡萄糖糖蛋白葡萄糖基轉移酶(Glycoprotein glucosyltransferase,GT)識別,并使其聚糖分子A分支重新葡萄糖基化,這樣就可以再次與鈣聯接蛋白或鈣網織蛋白相連,進行重新折疊,這就是鈣聯接蛋白-鈣網織蛋白循環(Calnexin-calreticulin cycle)[43]。Bip屬于Hsp70家族蛋白在內質網體中的成員,參與進入內質網體的分泌型蛋白質和膜蛋白的折疊、貯存和轉運過程[44]。
本研究中對差異表達基因進行GO功能的顯著性富集分析,顯示差異表達基因在氧化還原酶類條目中顯著富集。而有研究表明,當蛋白質經過內質網的時候,會有一套“質控”系統將折疊正確的蛋白質釋放,對于發生錯誤的蛋白將通過內質網相關的降解途徑(ER-associated degradation,ERAD)運出內質網并降解[45]。在該降解途徑中,Hsp70伴侶蛋白會與非天然蛋白結合,并使其與內質網膜結合酶Doa10、RMA1、HRD相結合,防止其轉運至高爾基體。Hsp70分子蛋白還可以與氧化還原酶類蛋白一起幫助構象不正確的蛋白重新折疊,改變其構象[46]。攜帶有膜錨定結構的RMA1存在于內質網中,該蛋白是一種在擬南芥到人類中都廣泛存在、非常保守的泛素連接酶[32]。RMA1蛋白能與UBE2J1蛋白相互作用,如果過表達RMA1蛋白會降低細胞內囊性纖維化病跨膜傳導調節蛋白(Cystic fibrosis transmembrane conductance regulator,CFTR)的水平[47]。RMA1蛋白最主要的作用是在CFTR蛋白翻譯過程中或翻譯剛剛完成之后檢測CFTR蛋白N末端結構域的折疊情況。
本研究中還篩選到一些與蛋白質合成相關的轉錄因子,主要包括5個家族的轉錄因子,分別是MYB、AP2、Hsf、B3、以及Trihelix家族的轉錄因子。前人研究表明,熱休克轉錄因子是一組結構及功能具有廣泛同源性,普遍存在于真核生物細胞中的蛋白質,其結構高度保守[48]。植物中Hsfs分為A、 B、 C 3個家族,又分為16個亞族。前人研究表明,植物中存在的Hsfs,能夠與Hsps的啟動子區域的熱機元件(HSEs)結合,從而啟動熱激反應,激活下游基因的表達,對提高植物的耐熱性有重要的調控作用。大豆中有38個Hsfs基因,劃分到3個家族,12個亞族中,其中GmHsf-34基因在擬南芥中的超量表達,提高了植株對干旱和熱脅迫的耐受性[49]。Chauhan等[50]從小麥種子中克隆了TaHsfA2d,轉TaHsfA2d擬南芥植株不僅表現耐高溫,還表現出耐鹽和抗旱性,同時轉基因植株還表現出較高的產量和生物量積累。在黃淮海地區,大豆的生長季在6-10月之間,而大豆一般在7月下旬進入開花期,因此,大豆的開花期至鼓粒期是黃淮海地區最熱的時期。本研究中檢測到一個Hsf轉錄因子的高表達,推測該基因與提高大豆的耐熱性有關,對蛋白質合成的影響還需進一步的研究。除此之外,在冀HJ117與冀豆12的差異表達基因中還檢測到MYB和B3類轉錄因子,Ezcurra[18]和Reidt[15]等研究表明,該類轉錄因子對蛋白質的合成具有調控影響。因此,推測本研究篩選到的轉錄因子與蛋白質合成密切相關,但這些轉錄因子具體的作用機制還需深入的研究。
綜合上述研究,本研究以遺傳背景接近的冀HJ117與冀豆12為材料,對開花后14 d的籽粒進行了轉錄組測序,篩選到與蛋白質合成相關的基因。差異表達基因富集的GO分子功能條目與蛋白折疊有關,并且通過Pathway顯著性富集分析發現差異表達基因富集在蛋白質內質網合成途徑中,該途徑中的鈣聯蛋白、結合免疫球蛋白、熱激蛋白以及內質網膜結合連接酶均在蛋白質合成通路中起關鍵作用,因此,該途徑是冀HJ117與冀豆12蛋白質含量產生差異的重要通路。
RNA-Seq分析獲得了大豆中蛋白質合成相關的基因的基本信息及其可能的生物學功能。蛋白質內質網合成途徑可能是冀豆12與冀HJ117蛋白含量產生差異的重要通路,因此,在該途徑中富集的差異表達基因以及篩選到的差異表達的轉錄因子很可能是與蛋白合成密切相關的基因。