堵錫華,周 俊,李 靖,陳 艷,馮 惠,田 林
(徐州工程學院 化學化工學院,江蘇 徐州 221018)
結構指數預測古井貢酒風味成分的色譜保留指數
堵錫華,周 俊,李 靖,陳 艷,馮 惠,田 林
(徐州工程學院 化學化工學院,江蘇 徐州 221018)
為建立古井貢酒風味成分保留指數的定量結構-保留相關性(QSRR)模型,計算了古井貢酒風味成分的分子連接性指數、分子形狀指數、電性拓撲狀態指數和電性距離矢量,優化篩選了分子連接性指數的0X、1X、3X和5Xc,分子形狀指數的K1、K2和K3,電性拓撲狀態指數的E1和電性距離矢量的m1,將這9種指數與古井貢酒風味成分的色譜保留指數進行回歸分析,以這9種分子結構指數作為反向傳播(BP)神經網絡的輸入參數,保留指數作為輸出參數,采用9∶13∶1的網絡結構,構建了BP神經網絡預測模型,總的相關系數rt為0.996 6,計算的預測值與文獻值較為吻合,平均相對誤差為1.88%。結果表明,模型具有良好的預測保留指數的能力,從構建的模型可知,甲基等取代基數量及所處位置是影響古井貢酒風味成分色譜保留指數大小的主要因素。
色譜保留指數;分子結構指數;古井貢酒;風味成分;定量結構-保留相關性;BP神經網絡
白酒是中國特有的酒種,它以獨特的工藝和風味特色,在世界七大蒸餾酒中獨樹一幟。由于不同產地白酒的風味成分各有不同,目前白酒已形成了十二大香型[1]。國家統計局統計數據顯示,2016年全國白酒規模企業完成釀酒總產量高達1 358.36萬千升,同比增長了3.23%,我國已成為名副其實的白酒生產和消費大國。正是由于白酒中含有的呈香呈味物質決定了白酒的風味,故為了能研制出香氣與口味協調平衡的新品白酒,對白酒中風味成分的研究逐漸受到科研工作者越來越多的重視[2-4],在這些研究中,現大多集中于香氣香味成分的分析檢測等方面[5-8],對風味成分的性質研究較為少見。
古井貢酒是濃香型白酒的典型代表[9],近年來其香味的研究受到關注[10-12]。定量結構-保留相關性(quantitative structure-retention relationship,QSRR)研究在化合物性質、生物活性(毒性)預測方面,受到越來越多國內外科研人員的重視,該法主要是通過建立化合物分子結構與其保留性質之間的模型,來對各種未知保留性質進行預測,所得預測結果也得到了相關權威機構的認可,因此具有簡便高效的優點,特別是利用該法,結合在環境科學[13]、食品科學[14]、藥學[15]、農業科學[16]等領域得到廣泛應用的人工神經網絡(artificial neural networks,ANN)方法進行研究,使預測結果更為準確,由于利用神經網絡法對古井貢酒風味成分的研究鮮見報道,為了能快速分析古井貢酒揮發性有效成分,開發更好的濃香型酒類飲品,在前期工作[17-19]的基礎上,采用神經網絡中的BP算法,對文獻[20]中所列的188個古井貢酒風味成分化合物分子建立分子結構指數與其保留指數之間的BP神經網絡模型,對古井貢酒風味成分的性質進行研究,以期為古井貢酒特征風味成分的進一步改良提供有效的理論基礎。
1.1 古井貢酒風味成分的數據來源
在文獻[20]列出的188種古井貢酒風味成分中,其中有187種列出了保留指數值(retention index,RI),第122個分子硬脂酸的保留指數則來源于文獻[21],具體數據見表1。
1.2 結構指數的計算和篩選
應用Chemoffice 2005中的Chem3D Ultra 9.0繪圖軟件,繪制188個古井貢酒風味成分的分子結構圖,在MATLAB應用軟件中,采用參考文獻[22]中的方法自編的程序,計算了188個古井貢酒風味成分分子的分子連接性指數(0X、1X、2X、3X、4X、5X、3Xc、5Xc、4Xpc、5Xpc共10種)、分子形狀指數(K1、K2、K3、K4共4種)、電性拓撲狀態指數(E1、E2、E3、E5、E6、E7、E8、E9、E13、E14、E16共11種)和電性距離矢量(m1、m2、m3、m9、m10、m14、m15、m21、m22、m26、m32、m33、m77、m78、m82共15種)等4類結構指數(不包括數據全部為0的數組),對這些數據用MINITAB14軟件中的最佳變量子集回歸法,優化篩選與保留指數相關性最好的結構指數,發現選用0X、1X、3X、5Xc、K1、K2、K3、E1、m1共9種結構指數時,所得模型相關性最優,模型也最穩定,9種結構指數及保留指數的數值見表1。

表1 古井貢酒風味成分的結構指數及保留指數Table 1 Structure indexes and retention indexes of flavor components in GujinggongBaijiu

續表

續表

續表

續表
2.1 多元回歸分析
將188種古井貢酒香味成分的保留指數(retentionindex,RI),與篩選的4類結構指數中的9種指數進行多元回歸分析,得到的線性回歸方程為:

式中:N、n、R、R2adj、R2cv、S、F分別為樣本數、變量數、相關系數、調整的可決系數、交互檢驗相關系數、標準誤差、Fischer檢驗值。
利用式(1)對古井貢酒香味成分的色譜保留指數進行預測,所得預測值并不理想,與文獻[20-21]值的平均相對誤差達到13.27%,說明這些結構指數與保留指數之間不是簡單的線性關系。
2.2 穩健性檢驗
用Jackknifed逐一剔除法進行穩健性的檢驗,以檢驗數據是否存在“異常離域點”,由于樣本數據較多,這里采用剔除數組的方法進行檢驗,如第一數組剔除的分子為1、11、21、31、41……181號分子,這樣建立方程得到相關系數R1,第二數組剔除的分子為2、12、22、32、42……等分子,得到R2,依此類推,共得到10個檢驗的相關系數R,結果見表2。由表2可知,這些檢驗的相關系數R平均值為0.826,與方程(1)的相關系數(0.825)基本吻合,說明模型的穩定性較為理想。將這10個檢驗的相關系數作雷達圖(見圖1),可直觀判斷是否存在“離域異常數據”,以0.800為圓心,0.005為間距,10個Jackknifed的R值均落在0.800~0.840,波動性不大,說明模型不存在異常RI數據,穩定性較好,而且R2adj(0.664)-R2CV(0.634)=0.030<0.3,說明既沒有過擬合現象,也不存在“離域異常數據”。

圖1 Jackknifed相關系數R的雷達圖Fig.1 Radar map of Jackknifed correlation coefficientR

圖1 Jackknifed相關系數R的雷達圖Fig.1 Radar map of Jackknifed correlation coefficentR
2.3 神經網絡模型
在神經網絡法中,輸入參數的選擇是構建模型的重要工作,它直接關系到所建模型的預測性能,這里采用多元回歸分析中篩選的與保留指數相關性最優的9個結構指數,作為神經網絡法的輸入參數,以古井貢酒風味成分的保留指數作為輸出參數,按照許祿等[23]建議規則,尋找隱含層參數:

式中:N為總的樣本數,其中的M為權重,M的計算公式為:

式中:Im、Hi、Ou分別為神經網絡三層結構中輸入、隱含和輸出參數。
結構指數作為輸入參數Im=9,保留指數作為輸出參數Ou=1,根據式(3)計算,當Hi取9、10、11、12和13時,均符合對隱含層參數的選擇要求,經測試比較,當Hi取13時,所得模型的相關性最佳,故神經網絡采用9∶13∶1的拓撲結構方式,隱含層傳遞函數為tansig函數,輸出層傳遞函數為purelin函數,訓練函數采用trainlm函數,目標函數為1×10-10,學習速度為0.001,迭代次數為3 000次,通過運算,取得了較好的預測效果。
在數據運算測試中,將188個古井貢酒風味成分化合物分為訓練集、測試集和驗證集,構建的神經網絡模型總相關系數Rt=0.996 6,訓練集相關系數R1=0.996 2、測試集相關系數R2=0.997 5、驗證集相關系數R3=0.996 7,由此可知,訓練集、測試集和驗證集的相關系數與總相關系數較為接近,利用該模型預測的古井貢酒風味成分保留指數與文獻值基本吻合,兩者的平均相對誤差為1.88%,明顯優于多元回歸方法的預測,誤差縮小7倍,利用神經網絡模型預測結果更為精確,預測值與文獻[20-21]值的關系見圖2。由圖2可知,每個分子保留指數預測值與文獻值的交互點均在直線附近,沒有明顯偏離的點存在,在188個分子中,只有第21號己酸乙酯和第27號己酸丙酯2個分子的相對誤差偏大,這2個分子的保留指數文獻值明顯高于相似分子,可能與其結構中基團之間的影響有關。

圖2 保留指數文獻值與預測值關系Fig.2 Relationship between literature values and predicted values of retention index
通過計算古井貢酒風味成分的分子連接性指數、分子形狀指數、電性拓撲狀態指數和電性距離矢量四類結構指數,篩選了其中的9種指數:分子連接性指數的0X、1X、3X和5Xc,分別代表0價、1價、3價路徑指數和簇項指數;分子形狀指數的K1、K2和K3,則分別代表1至3階形狀特征參數;電性拓撲狀態指數的E1和電性距離矢量的m1,均代表-CH3基團的結構指數值;這9種指數代表的基團對模型貢獻最大,基團的數量及其連接方式均會影響保留指數的大小,特別是甲基的存在對分子的性質影響最大。通過其風味成分的分析,發現酯類化合物是古井貢酒濃香的主要貢獻成分,正是這些成分的存在,使該酒的香氣濃郁;其次是適量的酸類、醇類物質存在,使該酒濃厚滋味、醇厚綿甜。從188個古井貢酒風味成分的結構與保留指數的關系可以看出,隨著碳原子數的增加,分子體積逐漸增大,色散力增大,化合物分子的保留指數逐漸增大,碳原子數固定時,支化度增大,色散力減小,保留指數逐漸減小,甲基處于不同位置,由于受鄰近基團的影響,對保留指數的影響力較大。通過對能反映不同空間拓撲結構、電性結構的四類結構指數進行結合,建立了與古井貢酒風味成分保留指數有良好關系的神經網絡預測模型,所得預測值與文獻值吻合度較為理想,兩者的平均相對誤差為1.88%。
經優化篩選的9種結構指數0X、1X、3X、5Xc、K1、K2、K3、E1和m1,能充分反映古井貢酒風味成分分子的空間拓撲結構和電性結構信息。用多元回歸方法建立的QSRR模型的相關系數并不理想,相關系數只有0.825,預測結果的誤差也較大,而利用神經網絡方法所建模型的預測能力優于多元回歸方法,不僅可以預測研究古井貢酒樣本的色譜保留性質,對樣本外的化合物分子同樣具有預測能力。從多元回歸方程和神經網絡模型結果可以看出,分子結構指數與風味成分的保留指數之間具有良好的非線性關系,而非線性關系。根據模型的預測能力,可為快速檢測白酒的風味成分、更好地設計出白酒的獨特風味、研發新的產品提供理論指導。
[1]余乾偉.傳統白酒釀造技術[M].北京:中國輕工業出版社,2013:17,69.
[2]張明霞,趙旭娜,楊天佑,等.頂空固相微萃取分析白酒香氣物質的條件優化[J].食品科學,2011,32(12):49-53.
[3]吳文睿,李安軍,湯有宏,等.古井貢酒窖泥中芽孢桿菌發酵風味的研究[J].食品科技,2016,41(3):27-30.
[4]陳 彬,何宏魁,李安軍,等.不同糧食品種對清香型大曲酒風味的影響[J].中國釀造,2017,36(7):22-26.
[5]LI G H,ZHONG Q D,WANG D D,et al.Determination and formation of ethyl carbamate in Chinese spirits[J].Food Control,2015,56:169-176.
[6]曹江平,范盈盈,解啟龍,等.分散液液微萃取-高效液相色譜法測定白酒中的酞酸酯[J].食品科學,2013,34(24):233-237.
[7]LIU M,HAN X M,TU K,et al.Application of electronic nose in Chinese spirits quality control and flavour assessment[J].Food Control,2012,26(2):564-570.
[8]張 超,胡可萍,端裕樹,等.快速氣相色譜法分析白酒中的香味組分[J].色譜,2007,25(4):586-589.
[9]孫金沅,宮俐莉,劉國英,等.古井貢酒酒醅揮發性香氣成分的GC-MS與GC-O分析[J].食品科學,2016,37(24):87-93.
[10]李賀賀,胡蕭梅,李安軍,等.采用頂空固相微萃取和攪拌棒吸附萃取技術分析古井貢酒中香氣成分[J].食品科學,2017,38(4):155-164.
[11]張會敏,李天嬋,孫美青,等.利用非培養技術初步研究古井貢酒窖泥細菌群落結構[J].食品工業科技,2014,35(13):200-206,228
[12]劉晴川,陳 峰,劉 飛,等.頂空固相微萃取在古井貢酒香氣分析中的方法優化[J].安徽師范大學學報:自然科學版,2016,39(6):555-560,574.
[13]何 琴,王淑敏,易 成.基于神經網絡的硝基芳烴急性毒性QSAR研究[J].湖北農業科學,2013,52(5):1174-1176,1180.
[14]張虹艷,丁 武.基于fisher線性判別和BP神經網絡的電子鼻羊奶貯藏時間預測[J].中國食品學報,2012,12(6):166-173.
[15]PRADO-PRADO F J,GARCíA-MERA X,GONZáLEZ-DíAZ H.Multi-target spectral moment QSAR versus ANN for antiparasitic drugs against different parasite species[J].Bioorg Med Chem,2010,18:2225-2231.
[16]段俊杰,蔣美紅,王 嵐,等.基于化學成分的煙葉質量神經網絡預測[J].西南農業學報,2012,25(1):48-53.
[17]堵錫華.用新的路徑定位指數和神經網絡研究多溴聯苯醚理化性質[J].化工學報,2014,65(4):1169-1178.
[18]DU X H,ZHUANG W C,SHI X Q,et al.Research on thermodynamic properties of polybrominated diphenylamine by neural network[J].Chin J Chem Phys,2015,28(1):59-64.
[19]堵錫華,王 超.碳納米管吸附能力的神經網絡理論模型[J].環境化學,2016,35(7):1445-1451.
[20]李賀賀,柳金龍,梁金輝,等.2種古井貢酒中的揮發性成分的研究[J].食品科學技術學報,2016,34(1):55-65.
[21]REZAZADEHS,HAMEDANIMP,HADJIAKHOONDIA,et al.Chemical composition of the essential oils ofStachys athorecalyxC.Koch.collected from Arasbaran prospected region[J].J Med Plant,2006,5:56-62.
[22]張 婷,梁逸曾,趙晨曦,等.基于分子結構預測氣相色譜程序升溫保留指數[J].分析化學,2006,34(11):1607-1610.
[23]許 祿,邵學廣.化學計量學方法[M].北京:科學出版社,2004:287.

DU Xihua,ZHOU Jun,LI Jing,CHEN Yan,FENG Hui,TIAN Lin(School of Chemistry and Chemical Engineering,Xuzhou University of Technology,Xuzhou 221018,China)
TS262
0254-5071(2017)11-0122-08
10.11882/j.issn.0254-5071.2017.11.027
2017-09-16
國家自然科學基金(No.21472071);江蘇省自然科學基金(BK20171168);徐州市科技創新項目(KC16SG246)資助
堵錫華(1963-),教授,本科,研究方向為化合物構效學。