黃保軍
摘要:采用誤差反傳前向人工神經網絡(BP-ANN)建立了63種大棗香味成分的結構與色譜保留之間的定量關系模型(QSRR)。以63種大棗香味成分的分子電性距離矢量為輸入參數,色譜保留時間為輸出參數,采用內外雙重驗證法分析該模型的穩定性和外部預測能力。所構建網絡模型的相關系數為0.998 9,交叉檢驗相關系數為0.998 9,標準偏差為0.959,殘差絕對值低于3.844,應用于外部預測集,外部預測集相關系數為0.998 9;而多元線性回歸(MLR)法模型的相關系數為0.981 9,交叉檢驗相關系數為0.982 0,標準偏差為3.697、殘差絕對值低于9.264,外部預測集相關系數為0.986 1。結果表明,ANN模型的擬合效果明顯優于MLR模型。
關鍵詞:大棗;香氣成分;定量結構色譜保留關系(QSRR);人工神經網絡(ANN)
中圖分類號:TP29;O657.7 文獻標識碼:A 文章編號:0439-8114(2013)08-1927-04
大棗營養豐富,是天然的藥食同源食品,具有較高保健和藥用功效[1]。隨著人們對棗營養價值認識的深入,棗的深加工產品種類日益豐富[2-4],其中,具有獨特香味的棗油、棗酊逐漸應用于食品、保健品、化妝品、煙草等行業[4]。但目前這些研究工作主要集中于香氣成分提取、加工工藝、抗氧化性等方面[1,5],而對香味成分的分子結構與其性質之間的相關關系研究報道較少。目前,用于定量結構色譜保留關系(Quantitative structure-chromatography retention relationship,QSRR)建模的線性方法,主要包括多元線性回歸法(Multiple linear regressions,MLR)[6]、偏最小二乘(Partial least squares,PLS)法等[7-9]。但因為分子結構與色譜保留關系之間的復雜性,線性建模方法逐漸顯示其不足,而非線性方法在建模當中受到青睞。其中,人工神經網絡方法(Artificial neural network,ANN)因其獨特的結構與功能,對高度非線性問題具有較好的擬合能力,因此在QSRR研究中頗受關注[10,11]。本試驗采用人工神經網絡方法構建大棗香味成分的定量結構色譜保留關系模型,對預測大棗香味成分色譜保留值、選擇香味成分分離條件等具有重要意義,為進一步了解大棗的香味特征、對大棗進行深加工和開發應用、香氣成分分離條件的選擇等提供理論依據。
1 材料與方法
1.1 數據來源
網絡的訓練集和預測集由63種大棗的香味成分與其色譜保留時間組成,數據引自文獻[6],輸入參數分別是分子電性距離矢量M11、M12、M13、M22、M23、M33(共6個),輸出參數為大棗香味成分一定條件下在色譜柱(Ultra2柱,50 m×320 μm×0.17 μm)中的保留指數。
1.2 建模方法
采用3層BP網絡對63種大棗香味成分的結構與保留時間進行建模,BP網絡來自于MATLAB工具箱。
1.3 BP網絡模型的檢驗
在QSRR研究中,模型的穩健性和實用性的檢驗非常重要。模型的穩健性檢驗采用交互檢驗(Cross validation,CV),而模型的實用性通過外部預測能力衡量。為保障模型的可靠性和外部預測能力,本試驗將63種大棗香味成分的保留時間按由小到大排序,每間隔5個樣本選擇1個,共12個作為外部預測集,其他51個作為訓練集。采用ANN和MLR分別進行建模,模型有效性通過R(相關系數——包含訓練集和外部預測集)、RCV (LOO法交互檢驗相關系數)、s(標準偏差)、Rext(外部預測集相關系數)、Sext(外部預測集標準偏差)等判別。
2 結果與討論
2.1 QSQR模型的建立
采用BP網絡構建63種大棗香味成分的定量結構與色譜保留之間的關系。所用3層神經網絡結構及參數通過反復數據試驗優化,最終確定結構及參數如下:網絡拓撲結構為6 × 6 × 1,輸入層、隱含層和輸出層傳遞函數均為Logsig函數,學習目標函數為0.000 2,學習速度為0.1,迭代次數10 000次。
網絡拓撲結構的輸入節點數由分子結構參數決定(通過回歸分析統計方法優選6個指數,即節點數為6),隱含層節點數分別設為3、4、5、6,由數據處理試驗優選為6,輸出為色譜保留時間(維數為1)。Logsig函數為BP-ANN常用的3種傳遞函數之一,能夠將輸入、輸出限制在0~1之間,比較符合數據處理的需求。學習目標函數分別設定為0.000 000 08、0.000 2、0.000 1,最終選擇0.000 2,當實際輸出與理論輸出的誤差達到此數值時,網絡停止學習。學習速率快慢也由數據處理試驗確定,學習速率過高將引起網絡的振蕩,導致數據結果不太穩定;而太小則需要更多的學習預測時間。迭代次數由能夠達到學習目標函數的學習次數確定,10 000次能夠滿足要求。
63種大棗香味成分結構與色譜保留的BP-ANN、MLR結果見表1。由表1可見,BP-ANN模型的預測值與試驗值的絕對誤差分布在-3.844~2.220之間,而MLR預測值與試驗值絕對誤差分布在-9.264~7.796之間,BP-ANN模型訓練集的預測值、外部集的預測值、留一交叉檢驗的預測值更接近于試驗值,其絕對誤差(殘差)明顯小于MLR預測值。由圖1可明顯看出,BP網絡QSRR模型與MLR模型得到的預測值與試驗值的殘差基本在y軸等于0的直線上下分布,殘差絕對值低于3.844,頻率分布接近于正態,接近于0的較多,誤差大的較少。而MLR法得到的結果離散性更強,殘差值高達-9.264。由此可見,用神經網絡研究大棗香味成分與色譜保留之間的關系結果更好,擬合能力明顯優于多元線性回歸法。
2.2 QSQR模型的檢驗
ANN模型和MLR模型的相關系數(R)、標準偏差(s)、留一交互檢驗相關系數(RCV)、外部預測集相關系數RTRST分別見表2、圖2和圖3。BP-ANN模型的預測值與試驗值相關系數R為0.998 9、訓練集留一交叉檢驗的相關系數RCV為0.998 9,模型穩健性良好;當將其應用于外部預測集時,外部預測集的預測值與試驗值的相關系數Rext為0.998 9,說明模型外推能力很強;統計分析結果Sext為0.985,顯著性系數低于0.000 1,結合殘差散點圖可知,模型無顯著性差異。而MLR法的R為0.981 9、Rext為0.986 1、Sext為3.724,顯然不及BP-ANN模型。由此可知,BP-ANN模型的穩定性和外推能力都明顯優于MLR模型。
3 結論
采用BP-ANN對大棗香味成分與色譜保留之間的定量構效關系進行建模,取得了較好的預測結果,相關系數R為0.998 9、RCV為0.998 9、Rext為0.998 9,模型的穩健性和實用性均較好;殘差絕對值分布在-3.844~2.220,頻率直方圖基本符合正態分布,且統計分析的Sext為0.985,顯著性系數小于0.000 1,說明模型無顯著性差異。這對預測棗香味成分色譜保留值、選擇香味成分分離條件等具有重要意義。并且可為進一步了解大棗香味成分特征、對大棗深加工和開發應用、實現香氣成分分離條件的選擇等提供一定的理論依據。
參考文獻:
[1] 胡 芳,趙智慧,劉孟軍.金絲小棗類黃酮提取最佳條件及抗氧化研究[J].中國食品學報,2012,12(4):77-83.
[2] 張軍和,師玉忠,杜朝曦.紅棗糯米酒的研制[J]. 食品與機械,2012,28(2):210-212.
[3] 李 俠,彭 丹,張春暉,等.紅棗酒發酵動力學研究[J].中國釀造,2012,31(1):190-193.
[4] 張峻松,賈春曉,毛多斌,等.生物技術制備天然棗香料的香味化合物分析[J].精細化工,2003,20(2):82-84.
[5] 凌圣寶,向進樂,李志西,等.拐棗醋飲加工工藝及其抗氧化活性分析[J]. 食品工業科技,2012,33(15):254-257,262.
[6] 吳菊花,張生萬,張嬋娟,等.棗香味成分的結構表征及其色譜保留值的預測[J].山西大學學報(自然科學版),2010,33(3):425-429.
[7] GHAVAMI R, FAHAM S. QSRR Models for Kova‘ts retention indices of a variety of volatile organic compounds on polar and apolar gc stationary phases using molecular connectivity indexes[J]. Chromatographia,2010,72(9-10):893-903.
[8] NOORIZADEH H, FARMANY A. QSRR models to predict retention indices of cyclic compounds of essential oils[J]. Chromatographia, 2010,72(5-6):563-569.
[9] NOORIZADEH H, NOORIZADEH M. QSRR-based estimation of the retention time of opiate and sedative drugs by comprehensive two-dimensional gas chromatography[J]. Medicinal Chemistry Research,2012,21(8):1997-2005.
[10] GARKANI-NEJAD Z. Use of self-training artificial neural networks in a qsrr study of a diverse set of organic compounds[J]. Chromatographia,2009,70(5-6):869-874.
[11] NEMECEK P, MOCAK J, LEHOTAY J, et al. Prediction of HPLC retention factor of potential antituberculotics by QSRR[J]. Journal of Liquid Chromatography & Related Technologies,2011,34(3):168-181.