陳繁,劉翠玲*,陳蘭珍,孫曉榮,李熠,金玥
1(北京工商大學 計算機與信息工程學院,北京,100048) 2(北京工商大學,食品安全大數據技術北京市重點實驗室,北京,100048) 3(中國農業科學院,蜜蜂研究所農業部蜂產品質量安全風險評估實驗室,北京,100093)
蜂王漿是由工蜂舌腺和上顎腺分泌的一種乳漿狀物質,其化學成分復雜,主要含有水分、蛋白質、氨基酸和大量活性蛋白酶等物質,屬于純天然營養保健食品,具有調節免疫、抗氧化、改善睡眠等極其重要的功能[1]。但蜂王漿中含有的一些活性成分穩定性較差,對貯存條件要求較高。蜂王漿品質變差主要體現在水溶性蛋白的降解[2-5]。張紅城等[6]研究表明,隨著蜂王漿在室溫貯存時間的延長,其含有的水溶性蛋白85.2 kDa(葡萄糖氧化酶)和MRJP-4發生較大程度降解,因此,蛋白質的變化可作為鑒別蜂王漿品質的指標[6-8]。但目前對蜂王漿品質變化的檢測主要是通過高效液相色譜法、SDS-PAGE凝膠電泳等方法進行,專業性強,技術難度大,且需要昂貴的儀器設備。探究一種快速、無損的方法來有效地鑒別不同儲存條件下的蜂王漿具有重要意義。
近年來中紅外光譜技術以快速、無損、高效等優點廣泛應用于食品、農業等領域,且其不需要對樣品進行過多的前處理操作就可以獲得大量信息,指紋性強,對樣品進行定性分析具有較好的效果[9-12]。吳黎明等[13]利用傅里葉變換紅外光譜對蜂王漿的新鮮程度進行研究,分析比較了蜂王漿的紅外譜圖,及其相對峰強與貯存條件之間的相關性,研究表明,利用紅外光譜評價不同的貯存條件下蜂王漿的新鮮度是可行的,但未結合化學計量學算法對蜂王漿紅外光譜建立定性分析模型。徐榮等[14]對比了肉蓯蓉樣品及其活性成分提取物的紅外光譜圖差異,取得3種提取物的特征紅外吸收峰,計算分析得出不同波段內藥材圖譜與提取物的紅外相關系數呈極顯著相關,研究表明中紅外光譜可作為藥材定性分析的快速有效方法。這些研究均表明中紅外光譜在定性分析方面具有較好的應用前景,且更容易提取出有效信息,表達出豐富的樣品信息,分子選擇性更好,在蜂產品定性檢測方面中具有較大的發展空間[15-19]。
本研究應用中紅外光譜技術,以冷凍條件和室溫下儲存7、14、21 d的蜂王漿為樣品,采用VERTEX 70傅里葉紅外光譜儀掃取、分析不同儲存條件下的蜂王漿中紅外光譜圖,并利用標準正態變換、savitzky-golay卷積求導法對光譜數據進行預處理,并結合支持向量機算法(support vector machine,SVM)和正交偏最小二乘判別(orthogonal partial least squares discriminant analysis, OPLS-DA)建立蜂王漿的定性分析模型。
樣品為中國農業科學院蜜蜂研究所提供的荊條漿,共34份。
VERTEX 70傅里葉紅外光譜儀,德國Bruker公司;智能生化培養箱SPX-80,杭州碩聯儀器有限公司。
取冷凍狀態下的蜂王漿樣本34份,為避免不同樣品間的差異,取同一批冷凍蜂王漿樣品分裝到離心管中,將分裝出來的34份樣品放置在25 ℃的生化培養箱,以模擬室溫,同時避免了室內溫度的不確定性。蜂王漿樣品的培養方案:冷凍、室溫條件下分別儲存7、14、21 d。
為避免蜂王漿樣品的進一步變化,操作應快速準確,試驗溫度保持在25 ℃左右。
試驗采集不同儲存條件的蜂王漿樣品中紅外光譜各34個。為了消除儀器漂移的影響,采集樣品光譜數據前,首先采集空氣光譜作為背景光譜,用樣品光譜扣除相鄰背景光譜后作為待分析的光譜數據。然后用吸管吸取少量蜂王漿樣品均勻涂抹在樣品室的衰減全反射ATR附件上,為避免樣品間的交叉污染,每掃取完1個樣品需要用酒精將樣品室清洗干凈。儀器參數設置為分辨率4 cm-1,樣本掃描次數為16次,背景掃描次數16次,光譜范圍4 500~600 cm-1。并利用OPUS 7.2軟件進行光譜采集。


圖1 不同儲存條件的蜂王漿中紅外光譜圖
Fig.1 Mid-IR spectra of royal jelly under different storage conditions

圖2 不同儲存條件的蜂王漿中紅外光譜圖譜峰變化
Fig.2 Peak change of Mid-IR spectrum in royal jelly under different storage conditions
在光譜采集過程中,儀器采集的噪聲及與自身信息無關的變量等一些干擾因素會影響模型的預測能力,因此為保證模型的穩定性,建模之前需要對原始光譜數據進行預處理,從而獲得更多有效的樣本信息[23],并在此基礎上對光譜圖進行標準正態變換(standard normal variate correction,SNV)和Savitzky-Golay卷積求導(平滑點數為7)。圖3為冷凍儲存蜂王漿的原始中紅外光譜圖和預處理后的光譜圖。

圖3 光譜預處理前后對比圖
Fig.3 Comparison chart before and after spectral pretreatment
如圖2所示,不同儲存條件的蜂王漿光譜圖之間差異很小,很難用肉眼區分樣本所屬類別,需要利用定性方法建立定性模型,實現對蜂王漿的快速鑒別。本研究采用支持向量機(SVM)算法,建立蜂王漿不同儲存條件的快速鑒別模型。SVM是一種有監督的模式識別算法,可解決小樣本、高維度和非線性的問題。它的基本思想是通過核函數將線性不可分的輸入數據映射到更高維的特征空間,求解線性約束問題后找到可以線性分割輸入數據的最大間隔分類面。故采用SVM建立不同儲存條件蜂王漿的定性分析模型[24-25]。
首先建立不同儲存條件的二分類模型。采用基于網格搜索及交叉驗證方法進行參數尋優的SVM多分類算法,以冷凍王漿與室溫王漿(儲存7 d)為樣本,對預處理后的樣本建立不同儲存溫度蜂王漿的二分類模型。其中隨機選取建模集樣本55個,預測集樣本13個。建模結果如圖4所示,其中箭頭所指為誤分類樣本。可以看出僅有一個樣本被誤分類,模型預測準確率為92.31%。
圖4 基于SVM的不同儲存溫度二分類模型
Fig.4 Two-class model of different storage temperatures based on SVM
為進一步探究中紅外光譜在鑒別室溫下儲存不同時間蜂王漿的可行性,對室溫下儲存7、14、21 d的蜂王漿樣本建立不同儲存時間的三分類模型。共102個樣本,隨機選取82個樣本作為建模集,20個樣本作為測試集。建模結果如圖5所示,隨機選取的3類測試集樣本全部分類正確,模型預測準確率為100%。為進一步驗證同時探究最優判別方法,采用判別分析方法建立模型。
圖5 基于SVM的室溫儲存不同時間三分類模型
Fig.5 Three-class model of different times of store at room temperature based on SVM
正交偏最小二乘判別分析是基于偏最小二乘判別分析(PLS-DA)法發展起來的算法,OPLS-DA法主要反映了自變量和因變量間的線性關系,并基于X變量建立Y變量的預測模型,根據X變量所得新的預測集數據構建預測變量Y。與PLS-DA不同的是,OPLS-DA將X變量中的系統變異分解為同Y線性相關的部分和同Y正交的部分,且正交變異組分的增加可以減少結果誤差[26-28]。本試驗采用交叉驗證的方法對模型進行驗證,即數據模型樣本共N個,進行N次訓練每次訓練樣本數為N-1個,由此獲得模型預測指數,以實現模型的分類鑒別等目的。
以冷凍王漿與室溫王漿(儲存7 d)為樣本建立不同儲存溫度的二分類模型。篩選出4個主成分,模型的自變量擬合指數(R2X)為0.859,說明4個主成分解釋了85.9%的X變量;因變量擬合指數(R2Y)為0.88,說明4個主成分解釋了88%的Y變量;模型預測指數(Q2)為0.775,說明模型預測能力為77.5%,內部交叉驗證均方差(the root mean square error of cross-validation, RMSECV)值為0.23(表2)。一般R2和Q2>5時,認為模型的穩定性和預測能力較好,故可以認為試驗所建模型是穩定且可靠的。不同儲存溫度OPLS-DA得分圖如圖6所示,可以看到冷凍儲存樣本與室溫儲存樣本2類樣本中僅有少數重疊,模型預測準確率為95.52%。

圖6 不同儲存溫度OPLS-DA得分圖
Fig.6 OPLS-DA score plot of different storage temperatures
室溫儲存7、14、21 d的蜂王漿共102個為樣本,建立基于OPLS-DA室溫儲存不同時間蜂王漿的三分類模型,篩選出2個主成分時,R2X為0.701,R2Y為0.639,模型預測指數Q2最高為0.719,RMSECV為0.24(表2)。圖7為室溫不同儲存時間OPLS-DA得分圖,從圖中可以看出,3類樣本完全分離,建模效果較理想,可靠性高,模型預測準確率為96.97%。

圖7 室溫儲存不同時間OPLS-DA得分圖
Fig.7 OPLS-DA score plot of different times of store at room temperature
表2 模型參數與預測結果
Table 2 Model parameters and results

分類模型R2XR2YQ2RMSECV總體預測準確率/%二分類模型0.8590.880.7750.2395.52三分類模型0.7010.6390.7190.2496.97
本試驗采用中紅外光譜技術結合SVM和OPLS-DA法對不同儲存條件的蜂王漿樣品進行了定性分析探究。通過對光譜圖的分析發現,不同儲存條件的蜂王漿樣本在中紅外光譜的1 480~1 800 cm-1和900~1 200 cm-1存在一定的位移,對光譜進行預處理后結合SVM和OPLS-DA法建立了不同儲存條件蜂王漿的定性分析模型。其中基于SVM算法建立蜂王漿不同儲存溫度的定性模型預測正確率達到了92.31%,3類室溫條件儲存不同時間的蜂王漿定性分析模型預測正確率達到了100%。結合OPLS-DA法所建不同儲存溫度蜂王漿二分類模型和室溫儲存不同時間蜂王漿的三分類模型的預測準確率分別為95.52%和96.97%。結果表明,基于SVM和OPLS-DA法建立不同儲存條件下的蜂王漿定性分析模型,模型效果較為理想,模型分類準確率高;同時表明采用中紅外光譜技術作為一種快速、無損的方法對不同儲存條件下的蜂王漿進行檢測具有一定的可行性。