阮長青 ,鹿保鑫 ,梁雪梅 ,李志江 ,張愛武 ,張東杰
(1.黑龍江八一農墾大學食品學院,黑龍江大慶 163319;2.黑龍江省農產品加工與質量安全重點實驗室,黑龍江大慶 163319;3.北大荒現代農業產業技術省級培育協同創新中心,黑龍江大慶 163319)
黑龍江省是我國大豆主產區,而北安則是黑龍江省大豆的主產區。市場經常會出現一些以次充好和冒牌的黑龍江大豆、北安大豆。如何保護和提升黑龍江省大豆品牌優勢,實現原產地溯源和種質資源保護,進而提升大豆種植業和加工業整體水平,成為農業科技者和監管機構關注的問題。
產地鑒別、溯源技術對特色名優品牌產品保護的應用日益廣泛[1]。近紅外光譜分析技術將樣品中有機分子含氫基團的特征信息,用于對比光譜曲線趨勢不同、不同地區、組成與含量不同的大豆樣品,從而確定未知樣品與已知樣品的關系,具有樣品制備簡單、無污染、分析快速的特點[2]。
由于大豆中礦物元素含量在不同地域間存在差異,利用礦物元素進行的大豆產地判別是可行的[3],但檢測的設備昂貴、成本高、周期長。研究表明,近紅外高光譜成像技術可實現大豆非轉基因親本與轉基因品種的判別分析[4],利用近紅外光譜分析的理論及技術優勢對非轉基因大豆進行產地鑒別是一種有益的嘗試。從黑龍江省不同產地和品種的大豆樣品中篩選出有明顯差異的光譜波段,結合化學計量手段,建立近紅外光譜定性、定量分析模型并進行北安地區大豆的產地判別。
隨機選取北安地區地理標志的63份大豆樣品,其他3個地區108份,在每個區域的9個采樣點按“S”進行布點,隨機采樣獲得共計171份樣品,每500 g為一個樣品。
樣品經挑選、清洗、60℃下干燥、磨粉、篩分(100目),密封于-20℃條件下保存備用。
采用凱氏定氮法、索氏抽提法、灼燒法、苯酚-硫酸法分別測定蛋白、油脂、總灰分、可溶性糖含量[5-8]。
傅立葉近紅外光譜儀開機、預熱,每隔1 h掃描一次背景,單通道采集光譜。漫反射鍍金積分球,InGaAs檢測器,分辨率8 cm-1,環境溫度25±1℃,相對濕度20%~30%,光譜范圍12 000~4 000 cm-1,掃描64次。
1.4.1 建模和預測
隨機選擇北安和其他地區全部樣品量的2/3作為訓練集樣品,用于模型的建立;1/3作為驗證集樣品,用于模型的驗證。北安地區建模訓練集樣品個數為42個,預測集樣品個數為21個;其他地區建模訓練集樣品個數為72個,預測集樣品個數為36個。
1.4.2 基于定性分析的大豆產地判別模型
利用OPUS7.5軟件選出有明顯差異的波段建立定性分析模型。預處理方式分別為矢量歸一化(SNV)、一階導數(FD) /平滑、一階導數/SNV/平滑、二階導數(SD) /平滑、二階導數/SNV/平滑等,平滑點數分別記為5PS、9PS、13PS、17PS、21PS、25PS,為防止外界干擾、提高模型精度,采用因子化法對光譜進行計算處理。通過比較S值來確定最優預處理方式及光譜計算方法,建立定性分析模型[9-10]。
1.4.3 基于定量分析的大豆產地判別模型
采用交叉檢驗以偏最小二乘法(PLS)在特征波段建立定量分析模型。將北安大豆組分值用1表示,其他地區大豆組分值用-1表示,以0作為中間值判斷真偽。通過模型將計算值大于0的視為北安大豆,小于0的為其他地區大豆,系統自動優化篩選出最優波段及預處理方式,光譜的預處理方式有消除常數偏移量、減去一條直線、SNV、最小-最大歸一化、多元散射矯正(MSC)、內部標準、一階導數/平滑、二階導數/平滑、一階導數/減去一條直線/平滑、一階導數/SNV/平滑、一階導數/MSC/平滑等,通常采用檢驗集檢驗方式進行模型檢驗,并最終建立定量分析模型。定量分析模型判別方法選用PLS,用一個線性模型來描述獨立變量Y與預測變量組X之間的關系。
1.4.4 模型驗證方法
利用OPUS 7.5軟件分別選擇定性分析,聚類分析測試和定量分析工具欄,調入模型,調入預測樣品光譜圖,獲得結果。
不同產地大豆品質的差異分析見表1。
由表1可知,不同地區其營養成分含量差異較大,北安大豆中蛋白質、油脂、可溶性糖及灰分含量均高于其他地區大豆(p<0.05),可溶性糖的含量比其他地區大豆高出近10%,這可能與北安地區獨有的氣候和土壤環境有關[11]。試驗表明,將樣品大豆營養成分作為鑒別北安大豆的指標是可行的。

表1 不同產地大豆品質的差異分析
北安與其他地區大豆的近紅外光譜圖見圖1。
經過不同的預處理后,對北安大豆與其他地區大豆進行紅外光譜掃描(圖1),在7 495.12 cm-1處有較寬吸收峰,是脂肪族烴中C-H振動所引起的;在7 945.29 cm-1處的吸收峰是脂肪烴中的-CH2的二級振動所引起的;在8 393.14 cm-1處的吸收峰與蛋白質和脂肪中的N-H鍵、C-H鍵、O-H鍵及C=O鍵的振動有關。結果表明,不同產地的近紅外光譜走勢大體一致,利用一階導數對光譜預處理后進行方差分析,發現品種相同的大豆在不同的產地近紅外光譜也存在顯著性差異。
大豆在經過不同的預處理之后,在波段70 00~7 500,7 900~8 400 cm-1處差異明顯,出現波段特性,選取波段范圍為 7 000~7 500,7 900~8 400,7 000~7 500,7 900~8 400 cm-1區域進行建模分析。
不同的預處理方式對不同波段的影響見表2。

表2 不同的預處理方式對不同波段的影響
由表2可知,根據S值的大小來評價模型的準確度,即S>1時,表示兩類樣品被唯一鑒別,S值越大模型準確度越高;S<1時,表示兩類樣品未被均勻鑒別,S值越小模型準確度越低。當采用因子化法結合二階導數/5點平滑的預處理方式時,北安大豆和其他地區大豆樣品均能被唯一鑒別,且S值為1.313,因此選取該預處理方式并建立定性分析模型。
不同地區大豆樣品的因子化2D得分散點圖見圖2。
由圖2可知,將近紅外光譜技術與因子化法結合在特征波段采用二階導數/SNV/5點平滑對大米產地進行判別,準確率大于90%以上。
建立近紅外光譜與樣品組分化學值相關聯的模型,采用PLS法根據樣品光譜波段的差異波段范圍、預處理方式的選擇及維數的確立,利用加互驗證均方根誤差(RMSECV)進行優化處理,得出最優組合。R2為定向系數,其值越大表示預測含量值越接近真值,而RMSECV越小,模型的預測性能越好[12]。大豆中蛋白質、油脂、灰分和可溶性糖的定量分析結果如下。
北安大豆中蛋白質經篩選分析處理后選擇無光譜預處理方式,最優組合波段為9 400.9~6 098 cm-1和 5 450.6~4 249.8 cm-1,其 RMSECV 為 0.108,R2為99.46%,維數為10;其他地區大豆中蛋白質采用消除常數偏移量處理方式,組合波段為9 400.9~7 498.5 cm-1和 6 100.9~5 447.7 cm-1,其 RMSECV為0.305,R2為97.26%,維數為7。
大豆蛋白質預測值與參考值、RMSECV與維數的關系圖見圖3。
北安大豆中灰分采用多元散射校正的預處理方式,選擇特征波段7 501.3~6 799.7 cm-1和4 600.6~4 249.8 cm-1為最優組合,其RMSECV為0.066 8,R2為94.16%,維數為6;其他地區大豆中灰分采用消除常數偏移量的預處理方式,特征波段為9 400.9~7 498.5 cm-1和 5 450.6~4 249.8 cm-1,其 RMSECV為0.070 5,R2為93.38%,維數為9。
大豆灰分預測值與參考值、RMSECV與維數的關系圖見圖4。
北安大豆中油脂采用消除常數偏移量的預處理方式,最優組合波段9 400.9~6 098 cm-1和5 450.6~4 249.8 cm-1,其 RMSECV為 0.064,R2為 99.38%,維數為8;其他地區大豆中油脂采用最小-最大歸一化的預處理方式,組合波段為7 501.3~6 098和5 025.6~4 597.8,其RMSECV為0.093 1,R2為 99.48%,維數為8。
大豆油脂預測值與參考值、RMSECV與維數的關系圖見圖5。
北安大豆中可溶性糖采用SNV的處理方式,選擇特征波段為7 501.3~5 447.7 cm-1,其RMSECV為0.010 2,R2為100.00%,維數為10;其他地區大豆中可溶性糖采用無光譜預處理的方式,選擇特征波段為 5 775.7~5 447.7 cm-1,其 RMSECV為 0.046 4,R2為99.99%,維數為10。
大豆可溶性糖預測值與參考值、RMSECV與維數關系圖見圖6。
以大豆4種成分定量優化分析結果確定定量分析模型。PLS法較其他方法建立的回歸模型更易于辨識系統信息與噪聲,也能夠在自變量存在嚴重多重相關性的條件下進行回歸建模,其模型效果具有較高的精度。
調入已建立的定性定量分析模型,對北安大豆和其他地區大豆進行分析。
定性定量分析模型對預測集大豆樣品的判定結果見表3。

表3 定性定量分析模型對預測集大豆樣品的判定結果
由表3可知,定性分析時,北安大豆和其他地區大豆的正確鑒別率分別為100.0%和97.1%。定量分析時,以灰分為基準,北安大豆和其他地區大豆的正確鑒別率均高達100.0%,這可能與北安地區特殊的地質環境,大豆對礦物質的富集能力較強有關[12];以蛋白質、油脂、可溶性糖為基準,正確鑒別率均高于94.4%。表明建立的定性、定量分析模型對北安和其他地區的大豆的產地判別是可行的。
選取北安與其他地區大豆共171份樣品進行產地鑒別研究,通過因子化法建立了定性鑒別分析模型,其S值為1.313。結果表明,北安地區、其他地區大豆正確鑒別率分別為100.0%和97.1%。采用PLS法建立的定量分析對北安大豆各組分的正確鑒別率分別為蛋白質100.0%,灰分100.0%,油脂96.2%,可溶性糖96.2%。除此之外,其他地區大豆各組分的正確鑒別率為蛋白質97.2%,灰分100.0%,油脂94.4%,可溶性糖94.4%,其中對北安和其他地區的灰分進行定量分析鑒別的正確率最高。由此可知,采用FTNIS法結合因子化法和PLS法所建立的定性分析模型和定量分析模型可以用于快速準確判別北安大豆,對于實現北安地區以及黑龍江省非轉基因大豆品牌的保護提供了技術支持。