富天昕,馮玉超,張麗媛,2,李 雪,王長遠,2,*
(黑龍江八一農墾大學食品學院,黑龍江省農產品加工與質量安全重點實驗室,黑龍江 大慶 163319)
代謝組學這一概念由Nicholson在2002年提出,是繼基因組學和蛋白質組學之后新發展起來的一門學科,是系統生物學的重要組成部分[1]。概念提出后,該領域的研究迅速發展并滲透到多個領域[2-3]。植物代謝組學是代謝組學的重要分支,它主要研究的是作為各種代謝路徑的底物和產物的小分子代謝物(mw<1 000 Da),結合基因、蛋白質、表型等綜合分析植物的生理生化過程[4-5]。而植物體的最終表現方式則由代謝產物體現,代謝產物在生物體信息傳遞鏈的末端,是植物代謝的最終產物[6]。
近年來植物代謝得到迅速發展,而稻米作為主要糧食作物之一,也成為研究的熱點[7-11]。稻米中富含豐富的蛋白質、糖類、脂肪和膳食纖維等營養成分且氨基酸組成比較完全,有助于人體的吸收[12]。稻米的品質不僅與品種有關,還與其生長環境密切相關。不同產地的稻米因其種植的土壤、氣候、水源不同,其營養品質和代謝產物的種類、含量也不盡相同[13]。代謝組學的研究方法,可以從系統生物學的角度解釋代謝物變化與生命活動現象的關系,近幾年代謝組學在農產品鑒別與產地區分方向應用廣泛,為農產品的溯源提供了新的途徑[14-18]。氣相色譜-質譜(gas chromatography-mass spectrometry,GC-MS)聯用技術具有重復性好、靈敏度高等特點,是目前代謝組學研究中廣泛運用的分析技術并且有很長的研究歷史[18-22]。田福林等[23]利用GC-MS技術對4 種不同產地大米中的脂溶性成分進行分析,結合主成分分析(principal component analysis,PCA)和聚類分析,建立一種對不同產地大米進行快速鑒定的方法。本實驗利用GC-MS聯用技術對黑龍江省建三江地區和響水地區的稻米進行差異代謝物的研究,探討產地對水稻代謝物的影響,并從代謝物的角度著手,篩選對區分2 個產地具有重要作用的差異代謝物,為通過代謝物對稻米進行產地溯源提供理論依據。
水稻采自黑龍江省建三江和響水地理標志稻米保護區,建三江采樣地點選擇為12 個農場布點;響水采樣地點選擇5 個鄉鎮布點,均選擇主產縣、主產鄉(鎮或管理區)、主產村(屯)的大面積種植地塊進行采樣,采樣點依照種植范圍大小設置,每塊地塊隨機設置分點5 個重復,采樣地點按照東、西、南、北、中5 個區域設計,依據代表性采樣原則,每個采樣點按照不同方位采集1~2 kg稻穗,每個產區選取30 個樣本。響水地區水稻品種為稻花香,建三江地區品種主要為龍粳系列,龍粳26、龍粳29、龍粳31、龍粳39、龍粳40、龍粳43、龍粳46,以及綏粳4、松粳9等。
吡啶(純度≥99.9%)、甲醇(均為色譜純) 美國阿拉丁試劑有限公司;2-氯苯丙氨酸(純度98.5%)、甲氧基胺鹽酸鹽(純度98%)、99% N,O-雙(三甲基硅)三氟乙酰胺(含1%三甲基氯硅烷) 上海麥克林試劑有限公司。
7890A/5975C GC-MS聯用儀、HP-5ms色譜柱(30 m×0.25 mm,0.25 μm) 美國Agilent公司;QP2010 GC-MS聯用儀 日本島津公司;DHG-9123A型電熱恒溫鼓風干燥箱 上海精宏實驗設備有限公司;MTN-2800D氮吹濃縮裝置 天津奧特賽恩斯儀器有限公司;恒溫箱 上海森信實驗儀器有限公司;TGL-16B臺式離心機 上海安亭科學儀器廠。
樣品制備根據王玲[24]的方法加以改進。稻種子液氮研磨后稱取50 mg粉末于2 mL的EP管中,加入800 μL甲醇和10 μL內標(2-氯苯丙氨酸),渦旋混勻30 s,置于4 ℃離心機中,12 000 r/min離心15 min,吸取200 μL上清液,轉入進樣小瓶中氮氣吹干。衍生化:取30 μL甲氧氨鹽酸吡啶溶液至濃縮后的樣品中,渦旋混勻至完全溶解,置于37 ℃恒溫箱90 min,取出后加入30 μL N,O-雙(三甲基硅)三氟乙酰胺,置于70 ℃烘箱60 min,取出后待檢測。
數據的特征峰提取和預處理在R軟件平臺采用XCMS軟件包條件下進行,將處理的數據矩陣導入SIMCA-P軟件,進行PCA[24]、正交偏最小二乘-判別分析(orthogonal partial least squares-discriminant analysis,OPLS-DA)等多元統計分析,再根據變量對分組貢獻值(variable importance in the projection,VIP)的大小和組間變化的顯著性(P<0.05)進行差異性代謝產物的篩選。差異性代謝物的定性方法為:根據保留時間及質荷比(m/z)在NIST商業數據庫和Wiley Registry代謝組數據庫進行注釋。
2.1.1 典型離子流色譜分析
由圖1可以看出,色譜峰基線平穩,峰分離效果良好,儀器穩定性良好。

圖1 典型樣本的總離子流色譜圖Fig. 1 Typical total ion chromatogram of rice metabolites
2.1.2 代謝組分的質譜分析
通過對GC-MS原始數據的處理,兩產地60 個稻米種子樣品中共掃描到143 個峰,根據保留時間及m/z在NIST商業數據庫和Wiley Registry代謝組數據庫進行注釋,共注釋到39 個代謝產物,其中建三江地區有29 個代謝產物,響水地區有26 個代謝產物,如表1所示。
表1中1~16號為建三江地區和響水地區共同存在的代謝物,17~29號為建三江地區稻米樣品相對于響水地區樣品具有的代謝物,30~39號為響水地區稻米樣品相對于建三江地區樣品具有的代謝物,除共同存在的代謝物外,2 個產地單獨具有的代謝物并不一定是相應產地特有的代謝物,可能還與稻米樣品的品種有關,由此可知,產地不同,稻米的代謝物的數量不也相同。如表2所示,建三江地區與響水地區相比,多元醇、有機酸類物質含量要高于響水地區,而響水地區的糖類、脂肪酸、氨基酸和其他類物質要高于建三江地區,核苷酸類物質含量相差不多,可見產地不同對稻米代謝物的種類也會有影響。

表2 建三江地區和響水地區稻米代謝物分類Table 2 Classification of metabolites in rice samples from Jiansanjiang and Xiangshui%
2.2.1 PCA結果

圖2 2 種樣品的PCA得分圖Fig. 2 PCA scores plot of two rice samples
為判別建三江地區和響水地區稻米樣品間的差異,首先采用PCA方法進行分析,共得到3 個主成分,累計R2X=0.675,Q2=0.52,2 個參數數值均大于0.5,且二者數值相差不大,說明PCA效果較好。如圖2所示,兩產地稻米樣品除個別異常樣品外絕大部分的樣品均處于在置信區間內,但兩產地樣品并未完全分開,還存在個別的重疊樣品,說明這些樣本中所含有的分子的組成和濃度越接近,而分子組成和濃度接近可能是相同品種間的聚集,也有可能是不同品種但是組分含量上相近。PCA這種無監督分析方法不能忽略組內誤差、消除與研究目的無關的隨機誤差,所以不利于發現組間差異,之后將采用有監督的方法進行進一步研究。
2.2.2 OPLS-DA結果
通過OPLS-DA可以過濾掉代謝物中,與分類變量不相關的正交變量,并對非正交變量和正交變量分別分析,從而獲取更加可靠的代謝物的組間差異與實驗組的相關程度信息[26]。如圖3所示,建三江地區的稻米樣品主要分布在置信區間的左側,響水地區的稻米樣品主要分布在置信區間的右側,兩產地稻米樣品區分效果很好。本次OPLS-DA得到2 個主成分,R2X=0.575,R2Y=0.63,Q2=0.479,3 個參數數值接近或大于0.5,且相差不多,說明OPLS-DA模型可解釋度較好,相比于PCA模型效果更好。

圖3 兩產地樣本OPLS-DA得分圖Fig. 3 OPLS-DA score plot of two rice samples
2.2.3 OPLS-DA置換檢驗結果
置換檢驗通過隨機改變分類變量Y的排列順序,多次建立對應的OPLS-DA模型以獲取隨機模型的R2和Q2值,在避免檢驗模型的過擬合以及評估模型的統計顯著性上有重要作用。對OPLS-DA模型的置換檢驗結果如4圖所示。

圖4 建三江地區與響水地區稻米樣品OPLS-DA置換檢驗結果圖Fig. 4 OPLS-DA replacement test results of rice samples collected from Jiansanjiang and Xiangshui
由圖4可知,所有R2點從左到右均低于最右的原始的R2點,所有Q2點均低于右側的原始Q2點,且點的回歸線與橫坐標交叉或者小于0,說明OPLS-DA模型是可靠的,可以較好地解釋兩組樣本之間的差異。同時隨著置換保留度逐漸降低,置換的Y變量比例增大,隨機模型的R2和Q2均逐漸下降,說明原模型不存在過擬合現象,模型穩健性較好。
2.2.4 兩地區稻米樣品的差異代謝物鑒定
采用OPLS-DA模型的VIP值(閾值>1),并結合學生氏t檢驗(t-test)的P值(閾值<0.05)來尋找差異性表達代謝物。差異性代謝物的定性方法為:根據保留時間及m/z在NIST庫和Wiley Registry代謝組數據庫中查找與其匹配的物質。兩地區樣品差異代謝物的定性結果見表3。由表3可知,兩產地水稻樣品共篩選出16 種差異代謝產物,由log2(fc-XS/JSJ)值可知,篩選出的16 種差異代謝物中除α-D-甲基呋喃果糖苷外,其余15 種差異代謝物含量均是響水地區稻米樣品高于建三江地區的稻米樣品,且倍數在1.54~3.05之間,含量差異顯著,雖然α-D-甲基呋喃果糖苷的含量是建三江地區高于響水地區,但是可以看出高出的倍數為0.02,數值很小。整體看來響水地區稻米中差異代謝物的含量要高于建三江地區,說明稻米的產地不同,相同代謝產物的含量也有明顯差異,稻米代謝產物受產地的影響顯著。

表3 兩地區樣品差異代謝物的定性結果Table 3 Qualitative analysis of differential metabolites in rice samples collected from two regions
2.3.1 差異代謝物熱圖分析

圖5 差異代謝物熱圖Fig. 5 Heatmap of the differential metabolites
通過R(v3.3.2)中pheatmap程序包對數據集進行數據縮放,同時對樣本和代謝物進行雙向聚類。由圖5可知,圖中紅色區域表示差異代謝物的高表達區,綠色部分表示差異代謝產物的低表達區。通過篩選出的差異代謝物將兩產地的樣品進行聚類分析,響水地區的稻米樣品主要集中在紅色的高表達區域,而建三江地區的稻米樣品則主要集中在綠色低表達區,說明響水地區的稻米樣品中差異代謝物的含量普遍高于建三江地區,響水稻米樣品中的差異代謝物的代謝機能更為活躍,同時也可以看出同產地樣品的代謝物具有相近的表達程度,可見產地對稻米的代謝具有很大的影響。影響水稻生長的因素非常復雜,其中溫度與光照是最為重要的因素[27]。響水地區所處的地理位置位于火山爆發出的巖漿凝結的熔巖臺地,地溫、水溫比一般的稻田地高2~3 ℃左右,在晝夜溫差大的北方,形成了有利的稻米生長環境,使其具備更好的溫度和濕度條件,較高的溫度條件能增強水稻的光合作用和根葉的呼吸作用,從而提高了稻米的代謝速率[28],這可能是導致響水地區的稻米代謝產物高表達的原因。
2.3.2 差異代謝物通路分析
京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Gnomes,KEGG)注釋分析僅找到所有差異代謝物參與的通路,MetPA數據庫通過代謝通路濃縮和拓撲分析,能識別出可能的受生物擾動的代謝通路,可以對通路進行進一步的篩選,找到與代謝物差異相關性最高的關鍵通路,結果如表4所示。

表4 差異代謝物參與的代謝途徑明細Table 4 List of metabolic pathways with the involvement of differential metabolites
富集分析和拓撲分析共標注到4 個較為重要的代謝途徑,包括脂肪酸生物合成、精氨酸和脯氨酸代謝、嘧啶代謝、氨酰-tRNA生物合成。脂肪酸可為稻米提供能量,且對植物本身的抗逆性起重要的作用,使其可以適應寒冷的生長環境[29]。精氨酸和脯氨酸是稻米氨基酸重要組成,脯氨酸是稻米代謝產物中重要的滲透調節物質,它起到保持原生質和環境滲透平衡、阻止水分喪失的作用。此外,脯氨酸還直接影響蛋白質的穩定性,還可作為含氮的儲藏物質和恢復生長的能源,還有研究表明,低溫下水稻幼苗脯氨酸含量會隨著脅迫時間的延長而增加[30-31]。不同產地環境特點不同,盡管建三江地區與響水地區位于同省份內,且均適合水稻的生長,但建三江地處三江平原腹地,屬寒溫帶濕潤季風氣候,年平均氣溫1~2 ℃,平均降水量為550~600 mm,而響水大米產區寧安市屬溫帶大陸性季風氣候,年平均氣溫3.5 ℃,平均降水量為400~600 mm,氣溫、降水量均有較大差異,所以其產地生長的稻米為適應環境會通過調節代謝水平來適應環境,以便更好地生長,從而其各種代謝物的含量會出現差異,同時也會賦予稻米不同的品質。氨酰-tRNA生物合成是形成蛋白質的重要通路。在蛋白質的生物合成中,氨酰-tRNA作為氨基酸轉移到肽鏈的羧末端過程的中間物而發揮重要的作用[32-33]。氨酰-tRNA合成酶在識別它所催化的氨基酸時需要ATP,所以光照是氨酰-tRNA生物合成途徑的關鍵因素[34],響水大米的光照周期明期與暗期比為7∶17,建三江大米的光照周期明期與暗期比為6∶18,兩地區均有充足的光照可滿足氨酰-tRNA生物合成途徑,但光照情況還是有所差異。產地的差異對水稻機體的多種終端代謝途徑造成了一定影響,但產地影響稻米代謝途徑及其機理尚未清楚,有待進一步研究。
本研究基于GC-MS的代謝組學技術對黑龍江省響水地區和建三江地區的60 個的稻米樣品進行代謝組學分析,考察不同產地對稻米代謝產物的影響。實驗共鑒定出39 個代謝產物,其中響水地區包括26 個代謝產物,建三江地區包括29 個代謝產物。對樣品進行PCA和OPLSDA等多元分析,兩產地共篩選出16 種差異代謝物,響水地區稻米差異代謝物含量要高于建三江地區,且倍數在1.54~3.05 倍之間,通過差異代謝物可以對兩產地的稻米樣品進行較好的區分,說明不同產地生長的稻米其代謝產物的種類和含量均不相同,產地對稻米的代謝具有重要的影響,而稻米的代謝產物可能攜帶著其產地的信息。綜上所述,基于GC-MS技術的代謝組學分析方法用于分析產地對水稻代謝產物的影響具有一定的可行性,可為因環境不同而導致的稻米品質差別提供可視化的理論基礎。實驗證明利用基于GC-MS聯用技術,結合多元統計分析的方法,可用于分析環境對水稻代謝產物的影響,可為稻米的溯源提供理論基礎。