堵錫華,田 林,徐 艷,李 靖,吳 瓊
徐州工程學院 材料與化學工程學院,江蘇 徐州 221018
棗樹是原產于我國的優勢果樹,已有7 000多年栽培歷史,優良品種達800 多種[1],其適應性、抗逆性和抗鹽堿性等都很強,棗果由于口感香脆、營養豐富,而且其中的活性成分具有抗氧化、抗炎和預防癌癥等功效[2-3],因此既有顯著的經濟價值和生態效益[4],又具有極高的保健價值,故近年來受到國內外營養學家以及醫藥科研工作者越來越多的關注[5].如: 李潔等人[6]以3種棗為研究對象,檢測分析了糖含量及相關酶活性的變化,取得了滿意的結果;王蓉蓉等人[7]則對6種棗果活性成分的抗氧化性能進行了比較分析,研究了抗氧化物與抗氧化能力之間的相關性,為棗果產品的開發利用提供了理論依據.為獲得更好品質的棗果,研究工作者將更多的工作注重于棗花的研究方面.張瑜等人[8]利用氣質聯用技術,對沙棗花揮發油香氣成分進行分析檢測,為后期相關研究打好了堅實基礎;丁嘉文等人[9]則利用氣質聯用儀分別對多種方法提取的沙棗花揮發性物質進行了成分分析,不但研究了最優的提取方法,還研究了沙棗花揮發性主要成分.同樣,由棗花所得的棗花蜜也具有抑菌、抗氧化及抗炎等功效[10],故也逐漸受到科研工作者的重視[11],Cheng等人[12]對此進行了研究并取得了較好的成果.
已有的研究工作較多地集中于揮發性成分的提取、分析檢測或抗氧化活性等方面[13-17],而對香氣成分性質的研究相對較少,特別是利用在化學[18-19]、醫學[20-21]、食品科學[22]、環境科學[23-24]和建筑學[25]等方面廣泛應用的神經網絡方法,對棗花和棗花蜜揮發性成分的相關性質的研究未見有報道,為此在前面研究[26-28]工作的基礎上,本研究采用人工神經網絡法中的BP算法,對敖常偉等人[29]檢測棗花得到的84種揮發性香氣成分、檢測棗花蜜得到的65種香氣成分化合物分子,建立連接性指數、電性距離矢量與這些化合物的色譜保留指數之間的神經網絡模型.根據預測模型得到的保留指數值與實驗值較為吻合,故利用神經網絡法對物質香氣成分進行研究,可快速獲取香氣成分的保留指數值,提高定性分析檢測能力,從而為改良果品品質提供可靠的理論指導.
棗花和棗花蜜香氣成分種類及其色譜保留指數均來源于文獻[29],其中棗花香氣成分84種,包括酯、烯烴、醇、酸、醚、酮及其他少量的酚、胺等種類化合物;棗花蜜香氣成分65種,包括醇、酸、醛、烷烴、酮類、萜烯類、酚類、酯類及其他少量芳香烴類化合物.棗花香氣成分化合物見表1,棗花蜜香氣成分化合物見表2.

表1 棗花香氣成分的分子連接性指數和電性距離矢量

續表1

表2 棗花蜜香氣成分的分子連接性指數和電性距離矢量

續表2
采用Chem3D 9.0三維分子結構演示軟件,繪制文獻[29]列出的棗花84種和棗花蜜65種香氣成分分子的結構圖,然后應用MATLAB數學分析建模計算軟件,以文獻[30-31]的方法編程程序,分別計算了84種棗花香氣成分分子、65種棗花蜜香氣成分分子的連接性指數及電性距離矢量兩大類分子結構參數,去掉每種結構參數值中大部分分子為0的數組,用MINITAB質量統計分析軟件以及SPSS統計分析運算軟件,對結構參數進行變量分析,優化篩選了連接性指數中0X,1X,2X,3X,5Xc,4Xpc和電性距離矢量中M14,M15,M21和M32共10種參數,與棗花香氣成分色譜保留指數相關性相對最優,得到的多元線性回歸模型為:
(1)

同理,針對文獻[29]中列出的65種棗花蜜香氣成分色譜保留指數,優化篩選了連接性指數中0X,1X,3X和電性距離矢量中M1,M2,M14,M15,M21和M32共9種參數,得到多元線性回歸方程為:
(2)
將棗花及棗花蜜的分子結構參數分別列入表1和表2中.從(1)式和(2)式可以看到,這兩個多元回歸模型的相關系數均不到0.9,相關性不是特別理想,為此需要進一步采用神經網絡方法進行分析研究.
為提高多元回歸模型(1)和模型(2)預測棗花和棗花蜜香氣成分色譜保留指數的能力,這里應用MATLAB軟件中的神經網絡法進一步進行研究.神經網絡法的三層結構中,主要是隱含層變量的選擇,按照許祿[32]及Andrea等人[33]的建議規則綜合分析,隱含層變量(Y)計算式為
2.2>n/M≥1.4
(3)
式中:n為總的樣本數,M為權重,其計算公式為
M=(Si+1)Y+(H+1)So
(4)
式中:Si,Y,So分別為神經網絡的輸入層變量、隱含層變量和輸出層變量.將棗花香氣成分的連接性指數和電性距離矢量共10個參數作為輸入層變量,相應分子色譜保留指數作為輸出層變量,根據(3)式和(4)式,隱含層變量Y取4,故對棗花香氣成分色譜保留指數預測的神經網絡結構采用10-4-1方式,為防止建模過程中的過擬合現象,將84個棗花香氣成分分子分為3組: 第1組為訓練集組(以每5個分子為1組,取其中第1,2,4個分子)、第2組為測試集組(每5個分子組中的第5個分子)、第3組為驗證集組(每5個分子組中的第3個分子),用MATLAB軟件中神經網絡計算軟件進行計算分析,得到了預測棗花香氣成分色譜保留指數模型的總相關系數rt=0.988 6,3個集組的相關系數分別為: 訓練集組的相關系數r1=0.987 7、測試集組的相關系數r2=0.981 8、驗證集組的相關系數r3=0.994 4.這里明顯可以看出,模型總相關系數相比多元回歸方法得到了明顯的提升,達到了0.99左右的優級相關性,而且3個集組的相關系數與模型總相關系數較為接近,說明模型的穩定性相對較好,利用該神經網絡模型預測的棗花香氣成分的色譜保留指數與實驗值的吻合度較為理想,兩者的平均相對誤差為2.34%,而利用方程(1)預測棗花揮發性成分保留指數的誤差為10.26%,故神經網絡法明顯優于多元回歸法結果,將棗花香氣成分保留指數的預測值與實驗值列于表3中,預測值與實驗值的關系見圖1.

圖1 棗花色譜保留指數實驗值與預測值關系

表3 棗花香氣成分色譜保留指數的預測
同理,將棗花蜜香氣成分的9個參數作為輸入層變量,相應分子色譜保留指數作為輸出層變量,根據(3)式和(4)式,隱含層變量Y可取3或4,經分析比較,當Y取4時,所得的結果更好,故對棗花蜜香氣成分色譜保留指數預測的神經網絡結構采用9-4-1方式,這樣得到了預測棗花蜜香氣成分色譜保留指數模型的總相關系數rt=0.992 3,3個集組的相關系數分別為: 訓練集組的相關系數r1=0.991 2、測試集組的相關系數r2=0.996 7、驗證集組的相關系數r3=0.992 2,模型的各相關系數均大于0.99的優級相關,利用該神經網絡模型預測的棗花蜜香氣成分的色譜保留指數與實驗值的吻合度更為理想,兩者的平均相對誤差為2.07%,將棗花蜜香氣成分保留指數的預測值與實驗值列于表4中,預測值與實驗值的關系見圖2.

圖2 棗花蜜色譜保留指數實驗值與預測值關系

表4 棗花蜜香氣成分色譜保留指數的預測
各種不同的花卉或花蜜有其自身特征的香味,這主要是花卉或花蜜含有的香氣成分化合物分子種類及含量有所不同,而形成這些香味成分的種類繁多,有烷烴類、烯烴類、芳香烴類、酯類、酸類、胺類、酚類、醛類、醇類、酮類和萜烯類等等眾多類型的揮發性有機物,有的種類化合物含量相對較多,有的化合物種類雖然含量極少,但對其香氣具有獨特的作用.棗花香氣成分中,酯類化合物和烯烴類化合物含量最多,醇、酸、酮、酚和胺等成分雖然含量很少,但也對棗花獨特的香味影響較大;棗花蜜的香氣成分則與棗花的成分有所不同,其醇、醛和酸類化合物含量最多,烷烴、酮、酚、酯、萜烯和芳烴等成分雖然含量很少,但也對棗花蜜的風味有一定影響.而香氣化合物分子性質均與其結構有密切的聯系,從表1-表4列出的棗花和棗花蜜香氣成分的分子結構參數和保留指數可以看出,棗花和棗花蜜香氣成分保留指數大小,不但與化合物種類有關,還與某種類化合物分子中所包含的取代基有關,取代基的數量、連接的位置、連接的方式以及基團之間相互影響大小,均對保留指數的大小有影響;一般而言,香氣成分分子體積越大,其保留指數值也越大,故利用保留指數對揮發性成分進行定性分析,可指導對該物質具有的獨特香氣作出評價.
在本研究對棗花和棗花蜜建構的兩個模型中,連接性指數中的0X,1X,2X,3X是0,1,2,3階路徑指數,5Xc是簇項指數,4Xpc是簇項/鏈項指數,電性距離矢量中的M1,M2,M14,M15,M21,M32是指—C與—C—、—C與—C=、—C=與—C=、—C—與—C<或—C=、—C—與=O、>C=與—O兩兩基團之間的相互作用.這里可以看出,影響保留指數大小的結構因素主要有—C—、—C=、—C<、=C<或=O這些片段以及連接方式.正是利用能反映空間連接拓撲結構信息的連接性指數,與能反映電性結構的電性距離矢量相互結合,才可以充分反映保留指數的變化規律,由此構建的神經網絡模型才具有良好的預測能力,對棗花和棗花蜜的預測模型的總相關系數能達到0.988 6和0.992 3的優級相關,相應的預測值與實驗值的相對平均誤差達到2.34%和2.07%.由于沒有對棗花和棗花蜜香氣成分保留指數進行預測的相關報道,故無法直接進行比較分析,與其他復雜化合物成分的保留指數預測建模相比較,本法建構模型的相關系數達到0.988 6以上,已屬較好結果.
1) 優化篩選的連接性指數中0X,1X,2X,3X,5Xc,4Xpc和電性距離矢量中M1,M2,M14,M15,M21,M32,這些結構參數能充分反映棗花或棗花蜜香氣成分的空間結構和電性結構信息,它們與棗花或棗花蜜香氣成分的保留指數有良好的非線性相關性.
2) 神經網絡法模型的預測能力明顯優于多元回歸分析法,所得結果更為理想.
3) 影響棗花或棗花蜜香氣成分保留指數大小的主要結構因素是—C—、—C=、—C<、=C<或=O等基團片段.