馮玉超,王長遠,2,,李 雪,富天昕,張麗媛,2
(1.黑龍江八一農墾大學食品學院,黑龍江 大慶 163319;2.黑龍江省農產品加工與質量安全重點實驗室,黑龍江 大慶 163319)
代謝組學是一門通過對生物體特定組織或細胞內代謝物組成成分進行鑒定和定量分析,從代謝角度揭示生物體的生物學功能,并最終詮釋生命現象的學科[1-3]。近幾十年,代謝組學發展迅速,廣泛應用于各個領域,成為探究物質內在機理的有力手段,植物體內的代謝物種類多樣化,目前植物代謝組學是代謝組學中最重要的一個研究方向[4]。植物代謝組學的研究主要集中在代謝指紋或代謝物指紋圖譜方面,主要用于探索植物表型和基因型的關系,進一步挖掘植物代謝途徑[5],以及受刺激后植物自身的免疫應答[6],除此之外還可用于生長環境對植物代謝物產生的影響進行探索[7-10]。代謝組學逐漸成為農產品產地鑒別的一種分析平臺。Nicholson等[10]對不同地區生產的擬南芥進行代謝組學研究,發現生長環境的不同會使擬南芥的氨基酸、糖等均產生差異。最具代表性的是Fiehn等[11]研究的工作,利用氣相色譜-質譜(gas chromatography-mass spectrometry,GC-MS)聯用技術通過對不同表型擬南芥中433 種代謝產物進行分析,并對這些植物的表型進行分類,檢測出4 種對分類有重要貢獻的代謝物質。Giansante等[12]利用GC分析意大利4 個不同地區橄欖油中脂肪酸組成和含量,結果表明不同產地的橄欖油中棕櫚酸、亞油酸等含量存在顯著差異,并對不同地區橄欖油進行鑒別。GC-MS分離效率高,而且具有較為完善的數據庫,適用于復雜的生物混合物代謝指紋分析,至今仍是代謝組學研究中主要的分析平臺之一[13]。
水稻(Oryza sativa L.)是主要的糧食作物,近幾年成為植物代謝組學研究的熱點[14-19],水稻的品質除受遺傳基因控制外,環境因素的影響也很顯著,黑龍江省是全國地理標志品牌大米最多的省份,其中建三江地區位于三江平原腹地,以盛產綠色優質水稻聞名,有“東方第一稻”和“中國綠色米都”之譽,所產水稻品質佳,口感好,說明產地環境對水稻的生長具有重要影響。水稻中代謝產物不僅可以全面反映水稻種子的整體代謝狀態[20-21],且代謝物的種類和含量對大米品質有著重要影響。
本實驗利用GC-MS代謝組學技術對來源于建三江地區的水稻與黑龍江其他3 個水稻產區的水稻種子進行代謝物比較分析,探究產地對水稻代謝物的影響,及代謝物對水稻品質的影響,從代謝物差異上為水稻的產地區分提供理論基礎。
水稻采自黑龍江省建三江地區(JSJ)、查哈陽農場(CHY)、五常地區(WC)和響水地區(XS)4 個地理標志大米保護區,在保護區范圍內依據代表性采樣原則,采用棋盤式采樣法進行主栽品種隨機采集,每個采樣點按照不同方位采集1~2 kg稻穗,每個產區選取30 個水稻樣品。采集的樣品均為粳稻,所選水稻品種主要為龍粳26、龍粳29、龍粳31、龍粳39、龍粳40、龍粳46、綏粳4、松粳9、空育131、五優4號以及稻花香和龍粳43品種。采集年份為2015年。每個產區水稻樣本編號分別為JSJ1~JSJ30、CHY1~CHY30、XS1~XS30、WC1~WC30,水稻樣本共分為2 組,1組為建三江地區樣本,1組為黑龍江省其他3 個產區樣本。
吡啶(純度≥99.9%)、甲醇(均為色譜純) 阿拉丁試劑有限公司;甲氧基胺鹽酸鹽(純度98%)、N,O-雙(三甲基硅)三氟乙酰胺(N,O-bis (trimethylsilyl)trifluoroacetamide,BSTFA)(含1%三甲基氯硅烷)麥克林試劑有限公司。
7 8 9 0 A/5 9 7 5 C G C-M S、色譜柱H P-5 m s(30 m×0.25 mm,0.25 μm) 美國Agilent公司;DHG-9123A型電熱恒溫鼓風干燥箱 上海精宏實驗設備有限公司;FC2K礱谷機 日本大竹制作所;恒溫箱上海森信實驗儀器有限公司;TGL-16B臺式離心機 上海安亭科學儀器廠。
1.3.1 樣品制備
樣品的制備參照周佳等[22]的方法并加以改進,采集樣品后對其進行自然風干處理,脫粒,礱谷后,選擇飽滿,無蟲害、干癟、變色的水稻種子-80 ℃低溫保存。實驗時用研缽進行液氮研磨后稱取粉末50 mg,加入800 μL甲醇渦旋混勻30 s,而后置于4 ℃離心機中,12 000 r/min離心15 min,吸取200 μL上清液,轉入進樣小瓶中氮氣吹干。
衍生化:取30 μL甲氧氨鹽酸吡啶溶液至濃縮后的樣品中,渦旋混勻至完全溶解,置于37 ℃恒溫箱90 min,取出后加入30 μL的BSTFA,置于70 ℃烘箱60 min,取出后待檢測。每個樣品進行3 個生物學重復測定。
1.3.2 GC-MS條件
GC條件:色譜柱:Agilent J&W Scientific HP-5ms(30 m×0.25 mm,0.25 μm);升溫程序:初始溫度80 ℃,維持2 min,以10 ℃/min升溫至320 ℃,并維持6 min;高純氦氣(純度大于99.999%)作為載氣,不分流進樣,進樣量1.0 μL。
MS條件:進樣口溫度280 ℃,電子電離源溫度230 ℃,四極桿溫度150 ℃。采用全掃描模式,檢測范圍m/z 50~550。
1.3.3 建三江地區與其他產區水稻代謝組學差異分析
主成分分析(principal component analysis,PCA):使用SIMCA軟件(V13.0)和R語言ropls包,對數據進行對數轉換加中心化格式化處理,然后進行自動建模分析,有效地利用少量的主成分使得數據的維度降低。
偏最小二乘法-判別分析(partial least squaresdiscriminate analysis,PLS-DA):使用SIMCA軟件(V13.0)對數據進行對數轉換加UV格式化處理,首先對第1主成分進行PLS-DA建模分析,模型的質量用交叉驗證進行檢驗;然后用交叉驗證后得到的R2Y(模型對分類變量Y的可解釋性)和Q2(模型的可預測性)對模型有效性進行評判。
凝聚層次聚類分析:通過R(v3.3.2)中pheatmap程序包對數據集進行數據縮放,同時對樣本和代謝物進行雙向聚類。熱圖表現的是一個數據矩陣,通過使用顏色梯度使數據間的差異實現可視化,通過數據縮放,保留較大差異,同時也能突顯較小差異。不同顏色的區域代表不同的聚類分組信息。
1.3.4 差異代謝物通路分析
采用MetPA數據庫分析2 組差異代謝物的相關代謝通路,采用超幾何檢驗數據分析算法,采用Relativebetweeness Centrality pathway拓撲結構。
數據利用R(v3.3.2)軟件的XCMS程序包進行特征峰提取及預處理,得到包括m/z和保留時間及峰面積等信息的數據矩陣,導出數據至Excel進行編輯。代謝物的定性:根據保留時間及m/z在NIST庫和Wiley Registry代謝組數據庫中查找與其匹配的物質。使用SIMCA軟件進行多元統計分析,為使不同量級的數據能夠進行比較,對數據進行總峰面積歸一化處理。GC-MS代謝組學數據由蘇州帕諾米克公司進行分析。
所有水稻樣品中共檢測到173 個峰,根據NIST商業數據庫和Wiley Registry代謝組數據庫以及標準品進行代謝物的注釋,最終解析出44 個代謝物。典型樣品的總離子流色譜圖如圖1所示,可以看出總離子流色譜圖基線平穩,峰分離效果較好,儀器穩定,從而提高了儀器分析和數據結果的可靠性。
根據GC-MS檢測結果可知,建三江地區水稻精確定性29 個化合物,黑龍江省其他3 個產地注釋得到44 個化合物,其中含有初生代謝物23 種,次生代謝物21 種。從定性結果可知,水稻代謝物主要是氨基酸、糖類、有機酸和脂肪酸等,這一結果符合水稻營養物質類型。

圖1 典型樣品的總離子流色譜圖Fig.1 Total ion chromatograms of a typical sample

表1 各產地水稻組分相對含量Table1 Metabolite composition of rice seeds from different producing areas%
由表1可知,建三江地區水稻與本省其他地區的水稻組分相比,氨基酸、脂肪酸、核苷酸、有機酸以及其他所占比例高出其他3 個地區1%~2%,糖類和多元醇所占比例則分別低于4%和3%。其中氨基酸、脂肪酸以及糖類對水稻品質具有一定的影響。建三江是我國“最早迎接太陽的墾區”,地處世界聞名的三大黑土帶,屬寒溫帶濕潤季風氣候區,其雨量、熱量、日照時數特征是水稻的最佳生長區帶[23],可能是這些產地環境的差異,造成建三江地區水稻代謝物組成的不同。
2.2.1 PCA
由圖2可知,PCA得分圖模型具有2 個主成分,累計R2X=0.615,Q2=0.538,Q2>0.5,說明模型擬合度較好。PCA[24-25]能從總體上反映各組樣本之間的總體代謝差異和樣本之間的變異度大小。建三江地區與其他地區的樣本除個別異常樣本外均處于置信區間內,且建三江組樣本與其他產地樣本區分比較明顯,2 組樣本均有明顯的樣本聚集區,也均存在離散的樣本。對于建三江地區樣本,離散樣本可能是由于樣本品種間差異造成的,況且水稻基礎組分有相同物質,故發生重疊,不好區分;對于其他3 個地區樣本,作為整體與建三江地區進行比較,產地不同,其生長環境就不同,對水稻的代謝物就會產生不同的影響,故存在差異樣本。

圖 2 JSJ與CHYWCXS兩組樣本的PCA得分圖Fig.2 PCA score plots for two samples of JSJ and CHY + WC + XS
2.2.2 PLS-DA

圖 3 JSJ與CHYWCXS兩組樣本的PLS-DA得分圖Fig.3 PLS-DA score plots for JSJ and CHY + WC + XS
PCA結果表明,建三江地區與其他地區的水稻之間具有代謝差異。為獲得導致這種顯著差異的代謝物信息,進一步采用監督性的多維統計方法即PLS-DA[26]法對兩組樣本進行分析。圖3為PLS-DA得分圖,模型具有2 個主成分,R2X=0.652,R2Y=0.634,Q2=0.52,說明此PLS-DA模型解釋能力較好,預測數據能力較強。由圖3可知,樣本整體基本處于置信區間內,相比于PCA得分圖,兩組樣本間基本不重疊,2 組樣本內重疊現象也減少,分離效果更好。對于其他地區樣本,重疊樣本較多,可能是因為雖然水稻代謝物的含量受到環境等因素的影響,但是水稻代謝物的種類大體相同,即使品種和產地之間存在一定差異,使得水稻樣本代謝物也存在差異,但這些樣本的代謝物組成或者濃度相近,也會出現樣本點的接近或重疊的情況。
2.2.3 總體代謝物層次聚類分析
圖4為本實驗整體代謝物相對定量值層次聚類圖,將代謝物相對定量值進行歸一化轉換并進行聚類,紅色表示高表達代謝物,藍色表示低表達代謝物,其中,列代表所有樣本,行代表全部代謝物。由圖4可看出,通過鑒定出的全部代謝物進行聚類,高低表達交互在一起,并未形成明確的高、低表達區域。而由圖上部的條帶顏色可以看出,建三江地區的樣本被分成很多部分,與其他產地樣本有代謝相似的部分。而且整體來講,左右兩大部分間距離也較遠,并不能直接看出建三江地區水稻樣本與其他產地水稻樣本的區別。

圖4 總體代謝物層次聚類熱圖Fig.4 Hierarchical cluster heatmap of metabolites
2.3.1 差異性代謝產物的挖掘及鑒定
采用PLS-DA模型的主成分1的變量投影重要度(variable importance in the projection,VIP)大于1并結合t檢驗的P值(閾值≤0.05)尋找差異性表達代謝物。
由表2可知,建三江地區和其他3 個地區對比篩選出的差異代謝物共23 個,其中包括糖、脂肪酸、氨基酸、有機酸、多元醇以及少量其他次生代謝物,可以看出這些組分均是構成水稻營養成分的物質,同時也正是這些組分含量的差異,最終導致不同水稻的品質差異。這23 個差異代謝物中,建三江組相對于其他地區組差異代謝物含量高的僅有一個即α-D-甲基呋喃果糖苷,且含量增加27.66 倍。建三江地區其他22 種水稻代謝物含量均低于其他地區,降低28%~64%,可見組別間差異代謝物在含量上差異巨大,不同產地對水稻代謝物的含量具有重要影響,王玲[27]對武漢和海南的TP309水稻樣本進行代謝物研究,發現生長環境不同且產地跨度很大的水稻種子其代謝物存在明顯差異。程建華等[28]對武漢和海南的轉Bt基因水稻進行研究,發現不同產地對水稻代謝物的影響很大,且這種差異還大于基因修飾對代謝物的影響。本實驗的結果與上述報道結果一致,但區別在于本實驗研究的水稻樣本均在同一省份范圍內,地理跨度較小,但整體實驗效果較好,說明產地對水稻代謝物的影響比較顯著,且不同品種的水稻種子具有相同的產地特征,同時也說明水稻代謝產物攜帶其產地信息,差異代謝物還可以作為產地間區分的依據。

圖5 應用差異代謝物層次聚類分析熱圖Fig.5 Hierarchical clustering heatmap of differential metabolites

表2 建三江地區相對于其他3 個產地的差異代謝物Table2 Differential metabolites in rice seeds from Jiansanjiang area compared to those from three other producing areas
2.3.2 差異代謝物聚類分析
由圖5可知,本實驗整體代謝物相對定量值層次聚類圖顏色區分明顯,左側為低表達區,右側為高表達區,兩部分區域代謝物含量差異很大。建三江地區的所有樣品位于左側藍色區域的中后部分,而黑龍江省其他3 個主產區的水稻樣本則集中在右側和藍色區域前面部分,聚類效果顯著。在藍色區域的建三江地區的樣本中還可以明顯看到,高表達的“紅色條帶”,其對應的為α-D-甲基呋喃果糖苷,這些現象與表2結果相吻合,同時也說明同色區域中的異色部分是區分兩組樣本的重要指標。
2.3.3 差異代謝物通路分析

圖6 代謝通路影響因子圖Fig.6 Factors affecting metabolic pathways
采用MetPA數據庫在假陽性矯正后P值為1的條件下,分析組間差異代謝物的相關代謝通路,通過代謝通路濃縮和拓撲分析,識別出可能的受生物擾動的代謝通路,圖6為代謝通路影響因子圖,圖中每一個點代表檢索到一條代謝通路,圖中共10 個點,即在KEGG[29]中查詢到了10 個代謝通路,其中5 個屬于氨基酸代謝途徑,且既有合成途徑也有分解途徑,分別為酪氨酸代謝,精氨酸和脯氨酸代謝,丙氨酸、天冬氨酸和谷氨酸代謝,纈氨酸、亮氨酸和異亮氨酸降解,纈氨酸、亮氨酸和異亮氨酸生物合成,除此之外,還有半乳糖代謝、嘧啶代謝、檸檬酸循環以及脂肪酸合成和氨酰生物合成。
涉及到這些代謝通路的差異代謝物有富馬酸、脯氨酸、異亮氨酸、硬脂酸、9-(Z)-十八碳烯酸、十四酸、棉子糖和胸苷共8 個,其中富馬酸、脯氨酸、異亮氨酸這3 種差異代謝物參與到不少于兩條的代謝通路中,說明這些物質是處于復雜的網絡代謝通路的節點上,是連接各通路的樞紐[30]。在所有檢索到的代謝通路中,氨基酸代謝途徑占得比重非常大,氨基酸含量與蛋白質含量密切相關,稻米的營養價值也體現在蛋白質與氨基酸含量上,異亮氨酸是必需氨基酸之一,是水稻營養價值的一個重要體現,脯氨酸等氨基酸類代謝物還能夠充當植物的滲透因子抵御干旱、鹽脅迫所帶來的生存壓力[31-32],可見氨基酸不僅可以提供營養,還可以作為調節因子幫助水稻適應環境。富馬酸對于水稻的風味有調節作用,棉子糖是一種功能性低聚糖,脂肪酸是提供能量的物質,其飽和水平還可以改變植物對寒冷條件的抗性[33],可見這些差異代謝物都從不同的方面影響水稻的品質。氨基酸代謝途徑所占比重最大,在產地對水稻品質的影響中,氨基酸代謝可作為深入研究的方向。
基于GC-MS技術對黑龍江省建三江地區與其他地區的水稻種子進行代謝組學研究,檢測出173個峰,共定性出44 種化合物,篩選出建三江地區與黑龍江省其他水稻產區的差異代謝物23 個,其中建三江地區所產水稻中α-D-甲基呋喃果糖苷的含量是其他3 個地區樣本的27.66 倍,而其他22 種水稻代謝物含量均低于其他地區,降低28%~64%,可見差異代謝物含量具有顯著差異,證實產地對水稻代謝物具有顯著影響,水稻的代謝產物攜帶其產地信息,通過代謝物差異對水稻產地進行區分具有可行性。實驗結果說明,同省份、跨度距離極近的不同產地水稻在代謝產物上存在差異,主要是含量上的差異。同時,也說明本方法對水稻種子中代謝物成分的分離和鑒定是可行的。代謝通路分析說明氨基酸代謝途徑對研究產地對水稻品質的影響具有指導意義,說明產地的差異對水稻機體的多種終端代謝途徑造成了非常明顯的影響,這為研究水稻種子代謝產物的動態變化規律提供參考。