陳佳佳,仲雨晴
(1.蘇州科技大學 化學與生命科學學院,江蘇 蘇州 215009;2.蘇州市環(huán)境監(jiān)測站,江蘇 蘇州 215012)
農業(yè)土壤重金屬污染已成為世界性的環(huán)境和公共健康問題[1]。農藥和化肥的過量使用、采礦、制造業(yè)和污水排放均可造成重金屬污染[2-3]。農業(yè)土壤中的重金屬包括兩類:第一類是鎘(Cd)、鉛(Pb)、汞(Hg)等有毒元素,在極低濃度下即可對活細胞產生毒性;第二類是必需微量元素,如鋅(Zn)、鐵(Fe)、銅(Cu)和錳(Mn),在植物代謝反應中起關鍵作用,然而過量存在時也會阻礙其他營養(yǎng)素的代謝功能,對植物產生毒害作用[4]。對于植物而言,重金屬中毒可導致生理、形態(tài)和結構紊亂,對生長產生不利影響。環(huán)境中的重金屬可通過食物鏈在動植物體內積累,最終轉移到人體系統(tǒng),對人體健康構成威脅。
為應對重金屬脅迫,植物進化出了非常復雜的免疫系統(tǒng)和防御機制。遭受重金屬脅迫時,植物的信號轉導通路首先被激活,通過信號轉導級聯(lián)的次級信使激活脅迫響應基因,繼而進行轉錄調控,由RNA 控制相應蛋白的翻譯,最后調控代謝物合成來維持植物體代謝平衡[5]。隨著核酸序列平臺、肽測序平臺、質譜和生物信息學方法的進步,組學技術近年來在植物抗逆研究領域取得了長足發(fā)展,對植物金屬脅迫應答的研究也深入到了基因組學、轉錄組學、蛋白質組學、代謝組學等水平。組學平臺通過高通量方法對DNA、轉錄本、蛋白質、代謝物等多個層面的變化進行表征和量化,可在不同維度揭示植物耐重金屬機理,為重金屬應答基因鑒定、標志性代謝物及通路挖掘提供有力手段[6]。
然而,單一的組學手段并不足以描述重金屬脅迫逆境下植物反應的復雜性。因此,需要整合不同組學層面的信息,理解各分子之間的調控及因果關系,構建調控網絡,才能深層挖掘參與植物非生物脅迫耐受反應的關鍵分子。圖1 展示了在植物重金屬脅迫研究中應用的組學方法。

圖1 多組學技術在植物重金屬抗逆機制研究中的應用
筆者綜述了基因組學、轉錄組學、蛋白質組學和代謝組學的主要技術方法及其特點,對組學技術在植物重金屬應答機制研究中的應用進展進行分類介紹,并對多組學聯(lián)合分析的研究思路進行展望,以期為重金屬耐受植物的培育提供參考。
基因組學是研究基因組的結構、功能、進化和修飾的學科。近年來分子生物學技術的突破加快了高通量基因組測序、基因組表征和基因表達分析的速度。利用基因表達序列分析(SAGE)、表達序列標簽(EST)、下一代測序(NGS)、基因組全關聯(lián)研究(GWAS)等高通量方法,可以大規(guī)模、高通量地對參與重金屬脅迫反應的基因進行鑒定和表征。
表觀基因組在DNA 序列不改變的情況下,研究基因組的化學修飾和空間結構改變對基因功能和表達的調控[7]。表觀遺傳修飾包括DNA 甲基化、組蛋白修飾、染色質重塑等,這些表觀遺傳機制導致染色質結構的改變,從而在轉錄水平上調控mRNA 的積累[8]。多項證據(jù)表明,表觀遺傳修飾在植物應對重金屬脅迫中發(fā)揮重要作用。重金屬脅迫會導致許多應激響應基因編碼區(qū)甲基化模式的改變,從而調節(jié)其表達。例如,在Pb、Cd 和Zn 抗性小麥中,重金屬ATP 酶HMA2 和TaABCC2/3/4 金屬解毒轉運體的啟動子區(qū)域DNA 甲基化水平顯著降低[9]。TaHMA2在金屬遠距離轉運中起重要作用,說明DNA 甲基化可通過調節(jié)重金屬解毒轉運蛋白的表達賦予小麥重金屬抗性。除了DNA 甲基化,組蛋白修飾是重金屬脅迫下植物調節(jié)基因表達的另一種適應性機制。例如,Cd 處理可誘導小麥根系中12 個組蛋白修飾基因TaHMs 的表達水平增加2.2~6.4 倍[10]。
比較基因組學是檢驗植物物種間基因組相似性和差異性的關鍵技術。通過比較基因組圖譜能夠了解調控植物基因組進化的模式和策略,并揭示基因組的功能區(qū)域。植物基因組因插入、缺失、重復、倒置和易位導致的改變在遺傳和表型多樣性研究中發(fā)揮著重要作用。數(shù)量性狀基因座(Quantitative Trait Loci,QTL)定位和GWAS 是了解由多基因控制的復雜性狀遺傳基礎的重要途徑。QTL 是對性狀有不同影響的多態(tài)位點,QTL 定位利用DNA 標記生成連鎖圖譜,識別與某些特征相關的基因組區(qū)域。然而,QTL 區(qū)域較大,所含基因眾多,給候選基因的鑒定帶來困難。GWAS 則基于測序和微陣列提供的植物基因組序列和遺傳圖譜來分析樣本,能夠更準確地預測和識別與有益性狀相關的等位基因、基因組位點和SNP/indel,這是基于圖譜的QTL 分析無法達到的。目前,QTL 定位和GWAS 已廣泛用于定位植物重金屬耐受相關的分子標記。
Qiao 等[11]從春小麥籽粒中鑒定獲得Cd 含量相關的3 個QTL 區(qū)域,并進一步從中篩選與Cd 攝取和運輸相關的候選基因。Ci 等[12]在小麥染色體4A 和5D 上發(fā)現(xiàn)了Cd 積累相關的2 個QTL。Ban 等[13]在小麥4BS 和6BL 染色體上發(fā)現(xiàn)了2 個低Cd 含量相關QTL。姚等[14]利用栽培稻與野生稻構建的雙單倍體(DH)群體構建連鎖圖譜,共檢測到11 個與硫酸銅脅迫相關的QTL。朱等[15]以粳稻和秈稻雜交獲得的重組自交系群體為材料,檢測到9 個耐金屬離子脅迫的QTL,對這些QTL 區(qū)間內與耐金屬離子脅迫的候選基因定量分析,發(fā)現(xiàn)4個基因在雙親間的表達量差異顯著。林等[16]以秈粳交DH 群體為材料,發(fā)現(xiàn)8 個耐4 種金屬離子(Fe2+、Cd2+、Al3+、Na+)脅迫的QTL。Pan 等[17]在水稻品系中通過GWAS 鑒定出35 個與Cd 積累顯著相關的QTL。Guttieri等[18]利用GWAS,在硬粒小麥5BL 上Cdu1 位點同源區(qū)域的5AL 上發(fā)現(xiàn)了Cd 積累相關的SNP。除此以外,GWAS 在玉米、高粱和谷子等糧食作物上均已成功完成。
組學技術的另一個分支是轉錄組學,其研究對象為細胞或生物體中轉錄本的全部集合。與基因組不同,轉錄組是高度復雜和動態(tài)的,并具有時空特異性。轉錄組學采用多種方法對基因表達水平進行定量分析,如DNA 微陣列、SAGE 或基于下一代測序的高通量技術,如RNA 測序(RNA-seq)和數(shù)字基因表達(DGE),從而對特定表型相關的基因轉錄本或RNA 進行精確描述。
轉錄組分析已被廣泛應用于比較重金屬脅迫條件下耐受基因型和敏感基因型之間轉錄水平的差異,從而實現(xiàn)脅迫耐受相關基因的鑒定[19]。Beyene 等[20]通過RNA-seq 分析,在鐵脅迫的小麥根系中鑒定出5 654 個差異表達基因,其中編碼金屬轉運體和ABC 轉運體的基因占主導地位,并發(fā)現(xiàn)谷胱甘肽在鐵脅迫下參與小麥的轉錄和酶活性水平。玉米根系的基因組表達譜分析[21]揭示了響應鉛脅迫的重要轉錄本,發(fā)現(xiàn)4 000 多個基因受到差異調控,基因產物與細胞過程和信號傳導有關。Zhang 等[22]采用比較轉錄組學方法分析了Cd 抗性和敏感性的小麥的Cd 解毒機制。Cd 抗性株中,編碼谷胱甘肽、抗壞血酸和過氧化氫酶活性的轉錄物積累,過氧化物酶和超氧化物歧化酶的表達水平較低。Zhou 等[23]通過RNA 測序,在高Cd 積累型小麥中發(fā)現(xiàn)了399個Cd 誘導的差異表達基因,主要通過參與苯丙素生物合成和谷胱甘肽代謝響應Cd 脅迫。
除了mRNA 外,轉錄組學也可用于研究生物體中非編碼RNA,如微小RNA(microRNA)和長鏈非編碼RNA(lncRNA)的差異表達。
2.2.1 microRNA 表達譜分析
microRNA 是長度約為21 個核苷酸的小分子非編碼RNA,可通過抑制或降解轉錄物來負向調節(jié)其靶基因[24]。轉錄組學可用于評估m(xù)icroRNA 及其下游靶標在應對重金屬脅迫時的表達變化。Qiu 等[25]通過RT-PCR檢測microRNA 表達譜,發(fā)現(xiàn)在Cd 脅迫下小麥幼苗的根和葉中5 種microRNA 及其靶基因存在差異表達。其中miR398 通過調節(jié)其靶基因CSD 參與小麥Cd 脅迫,從而影響小麥對氧化脅迫的耐受。Zhou 等[23]用Cd分別處理低Cd 積累和高Cd 積累兩個小麥品種,同時鑒定獲得差異表達的microRNA 和mRNA,通過表達相關性分析發(fā)現(xiàn),microRNA 可以調控重金屬ATP 酶(HMA)的表達。Zhou 等[26]的另一項研究發(fā)現(xiàn),低Cd 積累小麥中差異表達的microRNA 調控的靶基因富集在PI3K-Akt 信號通路中,而高Cd 積累型中差異microRNA調控的靶基因與碳水化合物消化和吸收途徑相關。
2.2.2 lncRNA 表達譜分析
lncRNA 是一類長度超過200 個核苷酸的RNA,作為各種發(fā)育過程和脅迫反應的生物調節(jié)劑,在轉錄、轉錄后和表觀遺傳水平中發(fā)揮著重要的調控作用。lncRNA 可靶向各種應激反應mRNA、轉錄因子調控基因以及microRNA,在植物脅迫應答中起著重要作用。
最近研究發(fā)現(xiàn),lncRNA 參與調控重金屬進入植物系統(tǒng)的吸收過程。Feng 等[27]通過RNA-seq 鑒定了甘藍型油菜中鎘響應的lncRNA,發(fā)現(xiàn)了鎘響應microRNA 的內源性靶標類似物。利用qRT-PCR 對其中3 個lncRNA 進行功能驗證表明,它們和參與Cd 攝取與解毒的3 個mRNA 具有序列相似性,可競爭性結合miRNA,從而提高相應mRNA 的表達。Liang 等[28]使用RNA 測序對水稻lncRNA 進行了全基因組分析和功能鑒定,發(fā)現(xiàn)Cd 誘導的差異lncRNA 參與調控半胱氨酸和蛋氨酸代謝相關靶基因。
蛋白質組學是對細胞、器官或物種在特定時間點上存在的整個蛋白質序列的研究和表征。由于蛋白質的翻譯后修飾會影響蛋白質的實際功能,因此蛋白質組比DNA 標記物和轉錄組更能準確地反映細胞內的實際狀態(tài)。
傳統(tǒng)的蛋白質組學分析方法主要為凝膠電泳法,如二維電泳(2-DE)和凝膠內差異電泳(DIGE)。多維蛋白鑒定技術(MudPIT)是一種非凝膠的蛋白質組分析方法。質譜(MS)方法包括液相色譜-MS(LC-MS)、離子阱-MS(IT-MS)、基質輔助激光解吸/電離-MS(MALDI-MS)等技術。最近開發(fā)的熒光團標記的蛋白質免疫沉淀和無標記的基于質譜的定量方法,在鑒定低豐度信號和調節(jié)蛋白復合物方面可達到更高的精度。激光捕獲顯微解剖(Laser-Capture Microdissection,LCM)可用于鑒定組織和細胞特異性蛋白質,這些蛋白質在作物對環(huán)境脅迫的反應中起著至關重要的作用。在調節(jié)植物對環(huán)境脅迫的反應過程中,磷酸化和糖基化等翻譯后修飾起著關鍵作用[29],蛋白質磷酸化位點可通過基于質譜的磷酸化蛋白質組學技術、固定化金屬親和層析(IMAC)進行分析。特定激酶結構域的變化則可通過SILAC 和iTRAQ 進行檢測。
蛋白質是植物應激反應的主要關鍵調節(jié)因子,可作為環(huán)境脅迫下的生物標志物,蛋白質組學分析已在重金屬脅迫的植物研究中得到廣泛應用。Jian 等[30]發(fā)現(xiàn)Cd 脅迫誘導小麥產生多種蛋白質,主要參與抗氧化過程、重金屬解毒和谷胱甘肽代謝途徑。此外,Cu 脅迫誘導小麥根和葉片中蛋白質組顯著變化,參與信號轉導、脅迫防御和能量產生的蛋白質顯著增加,而參與蛋白質代謝、碳水化合物代謝和光合作用的蛋白質嚴重減少[31]。Cr 脅迫下玉米葉片蛋白質組分析發(fā)現(xiàn),Cr 誘導的差異表達的蛋白主要參與ROS 解毒和防御反應[32]。
代謝組是指機體細胞、組織或器官內所有內源性低分子量(<1 000~1 500 D)的化合物。植物界約有20 萬~100 萬種不同的代謝物,其種類、理化性質、化學結構和極性水平各不相同。作為基因和蛋白質的下游產物,代謝組是連接表型和遺傳信息的紐帶,對生物體的生理狀況起著決定作用。代謝組學旨在對代謝組進行定量、定性和動態(tài)研究。
代謝組學分析常用的分離技術包括氣相色譜(GC)、液相色譜(LC)和毛細管電泳(CE)。檢測技術包括質譜(MS)、光譜、核磁共振(NMR)和電化學方法。分離與檢測技術的結合產生了一系列不同的代謝組學研究平臺,如LC-MS、GC-MS、LC+UV、CE-MS 等。新型代謝組學分析技術,如傅里葉變換離子回旋共振MS、基質輔助激光解吸/電離MS 成像(MALDI-MSI)、離子遷移率光譜MS(IMS-MS)的進步,為植物代謝物的研究提供了更精準的研究手段。
近年來,許多研究對代謝產物的變化進行定性和定量分析,從代謝組學的角度分析植物耐受重金屬脅迫的機制,主要包括降低重金屬吸收、重金屬螯合、抗氧化防御、清除自由基等。
細胞壁是植物接觸重金屬的第一個結構,主要成分包含木質素和低聚果糖。木質素大量存在于根內皮層細胞壁中,可作為屏障來控制細胞體對水和礦物質的吸收,并且影響營養(yǎng)礦物質的積累和轉運。低聚果糖包含多糖,能夠結合二價和三價的重金屬離子。因此,植物體通過改變細胞壁的成分來促進重金屬陽離子結合至細胞壁,從而減少自身對有毒金屬的吸收。例如,在Cd 脅迫條件下,小麥中半纖維素和果膠的積累增加,有助于提高根細胞壁結合Cd 的能力[33]。在白菜葉片和根系中,銅和鐵離子脅迫導致硫代葡萄糖苷、羥基肉桂酸以及碳水化合物的積累[34],推測糖解/糖異生途徑通過抑制Cd 攝取來減輕Cd 毒性。針對低鎘和高鎘積累基因型甘藍油菜的代謝組學[35]比較發(fā)現(xiàn),高Cd 積累型油菜中木質素高表達,說明木質素可作為物理屏障阻止Cd 進入植物體。此外,Cd 誘導植物甾體、單萜和類胡蘿卜素表達上調,用于清除脅迫產生的超氧陰離子自由基。吲哚乙酸IAA 顯著減少,由于IAA 能促進植物對重金屬的吸收,其表達水平降低減少了植物的Cd 攝取。
植物代謝產生的天然植物螯合素如有機酸等,可以結合自由移動的重金屬離子形成螯合物,從而降低毒性作用。Xie 等[36]對鎘脅迫下莧的代謝組研究證明了植物螯合素與重金屬的關系,結果表明,高Cd 脅迫下的12 種氨基酸類植物螯合素含量均有所增加。
此外,抗氧化防御機制在高等植物對重金屬的耐受和富集中具有重要作用。植物的很多次生代謝產物具有抗氧化功能,能夠清除重金屬誘導的活性氧基團(ROS)。Lai 等[37]利用代謝組分析發(fā)現(xiàn)Cd 誘導紫色甘薯根中色氨酸和谷胱甘肽顯著表達。色氨酸和谷胱甘肽都是酶促抗氧化劑的輔助因子,也可以直接猝滅ROS并調節(jié)與生物和非生物應激反應相關的基因表達。同樣,Keunen 等[38]證實了谷胱甘肽(GSH)誘導的抗氧化防御在擬南芥抗Cd 脅迫中的重要作用。水培向日葵根和葉片的代謝組學[39]顯示,Cr 脅迫誘導產生具有抗氧化活性的萜類物質。常見重金屬脅迫下植物差異表達的代謝物見表1。

表1 重金屬脅迫下差異表達的植物代謝物
組學方法的最新進展產生了大量數(shù)據(jù),然而,單一組學數(shù)據(jù)不足以理解植物脅迫反應的復雜性。多組學數(shù)據(jù)整合將降低使用單一數(shù)據(jù)產生的假陽性結果,有助于精準理解復雜的脅迫反應。如何全面地注釋、整合和建模來自不同組學層面的高通量數(shù)據(jù)是交互式組學的最大挑戰(zhàn)之一。數(shù)據(jù)整合的關鍵在于構建可用于預測復雜特征并提高預測精度的模型。預測表型的相關統(tǒng)計模型主要包括線性和非線性模型。線性模型如基因組最佳線性無偏預測(GBLUP)、線性混合模型(LMM)、貝葉斯稀疏線性混合模型(BSLMM)、懲罰線性混合模型和廣義矩估計方法(MpLMMGMM)模型,已被廣泛用于多組學數(shù)據(jù)建模。機器學習(ML)則是一種非線性的建模方法,同時使用有監(jiān)督和無監(jiān)督學習編程范式,從復雜大數(shù)據(jù)中進行統(tǒng)計推斷。處理多組學數(shù)據(jù)時,可使用主成分分析(PCA)和DIABLO 進行數(shù)據(jù)集成分析,從而推斷不同組學層分子之間的相互聯(lián)系,發(fā)現(xiàn)關鍵生物過程、調控因子和生物標志物[41]。
組學實驗產生的高通量數(shù)據(jù)需要大量的計算資源進行存儲和分析,近年來綜合組學數(shù)據(jù)庫應運而生。Gramene 數(shù)據(jù)庫[42](http://www.gramene.org)是一個作物和模式植物物種的功能基因組學數(shù)據(jù)庫,收錄了基因、蛋白質、microRNA、sRNA、代謝物、分子標記和表型信息等信息,同時還提供了多組學數(shù)據(jù)集信息的集成。WheatGmap 數(shù)據(jù)庫[43](https://www.wheatgmap.org)集成了多種繪圖模型和大量公共數(shù)據(jù),如全基因組測序(WGS)、全外顯子組測序(WES)和轉錄組深度測序(RNA-seq)數(shù)據(jù)集,為小麥抗逆功能基因組學研究提供了豐富的信息。
此外,基于網絡的分析服務器和高通量數(shù)據(jù)分析平臺也不斷涌現(xiàn),如PaintOmics[44]、KaPPA-view[45]、COVAIN[46]和O-miner[47]、3Omics[48]、MiBiOmics[49]、VANTED[50]和IOMA[51]。這些組學分析工具均具有用戶友好的使用界面,并可用于整合來自不同方法的組學數(shù)據(jù)。PaintOmics[44]是一個基于網絡的服務器,利用生物通路圖實現(xiàn)多組學數(shù)據(jù)集的整合。PaintOmics 可將轉錄組學和代謝組學數(shù)據(jù)中關鍵的差異基因或代謝物映射到KEGG 通路,從而對多組學數(shù)據(jù)進行可視化分析。KaPPA-view[45]工具則針對用戶提交的定量轉錄組和代謝組信息,在植物代謝通路圖上對關鍵轉錄本和代謝物進行注釋。COVAIN[46]是一個基于MATLAB 的圖形用戶界面工具,可針對代謝組、基因組、蛋白質組和轉錄組等不同水平的組學數(shù)據(jù)進行數(shù)據(jù)預處理、單元或多元統(tǒng)計分析、通路映射、相關網絡拓撲分析和可視化。O-miner[47]也是一個基于WEB 的組學分析工具,可自動處理大型復雜的轉錄組、基因組和甲基組數(shù)據(jù)集,識別顯著改變的信號通路和新型生物標志物和靶點。3Omics[48]通過相關性網絡、共表達、通路富集和GO(基因本體)富集,可快速整合多個轉錄組、蛋白質組和代謝組數(shù)據(jù),并生成組間相關性網絡,將具有時空特異性的轉錄本、蛋白質和代謝物之間的數(shù)據(jù)關系可視化。MiBiOmics[49]是一個基于網絡的獨立應用程序,實現(xiàn)了多組學數(shù)據(jù)的可視化、集成和分析,基于組學網絡來挖掘復雜的生物系統(tǒng),并識別與特定表型相關的可靠生物標志物。VANTED[50]軟件基于圖形標準將不同層次組學數(shù)據(jù)進行網絡集成并可視化,可實現(xiàn)對組學數(shù)據(jù)的功能注釋和直觀分析。IOMA[51]平臺是一個綜合組學和代謝分析平臺,可以定量地將蛋白質組學和代謝組學數(shù)據(jù)與基因組水平的代謝模型相結合,以更準確地預測代謝通路分布。總之,多組學整合分析可以實現(xiàn)生物系統(tǒng)的多尺度表征,有助于全面理解脅迫耐受相關的復雜調控網絡。
植物重金屬脅迫的組學研究領域近來獲得了長足發(fā)展,加深了對于植物耐受重金屬響應機制的理解。然而對于高度復雜的植物脅迫應答調控網絡,目前的認識遠遠不夠。隨著組學分析技術的進步,多組學數(shù)據(jù)庫的建立,數(shù)據(jù)挖掘和建模方法的完善,有望將來自不同組學的數(shù)據(jù)源進行整合分析,從而構建跨層次的分子互作用關系網絡。多組學整合未來在植物研究中會得到更加廣泛的應用,為重金屬脅迫分子標記的鑒定、代謝通路解析提供重要的參考依據(jù),也為組學輔助育種開辟一條新的途徑。