金建華,柳 詹,秦世榮
(青海民族大學 化學化工學院,青海 西寧810007)
自Wiener 提出第一個拓撲指數(shù)以來,拓撲指數(shù)在分子結構與性質(zhì)關系研究中發(fā)揮著重要作用[1-6]。分子連接性拓撲指數(shù)是在分子支化度拓撲指數(shù)基礎上發(fā)展起來的一種新的拓撲指數(shù),其以分子中原子數(shù)目、種類及周圍環(huán)境有關的數(shù)據(jù)為參數(shù),使之與分子的理化性質(zhì)和生物活性定量聯(lián)系起來,由于計算簡便、取值客觀且不受經(jīng)驗和實驗的限制,被廣泛應用。食品香味物質(zhì)是指具有一定結構,且在食品中產(chǎn)生揮發(fā)性香味的物質(zhì)[7],如酯類、酮類、醛類、酚類、酸類等,由于香味物質(zhì)種類繁多,結構復雜,有關食品香味物質(zhì)的色譜保留值、香味閾值與分子結構關系的研究甚少。本文根據(jù)食品香味物質(zhì)分子中成鍵原子數(shù)目、種類及周圍環(huán)境,定義了一個新的分子連接性拓撲指數(shù)mP,用其0、1 階拓撲指數(shù)0P、1P分別關聯(lián)食品香味酯、酮的色譜保留時間、閾值,考察相關性,采用“留一法”對模型交叉檢驗,以期獲得結構簡單、穩(wěn)定性好、預測能力強的優(yōu)良模型。
研究所采用的白酒中酯類物質(zhì)色譜保留時間實驗數(shù)據(jù)來自文獻[8],在402 色譜柱上分離測得。選取10 個樣本作為訓練集,用于構建模型,3 個樣本作為測試集,用于評價模型預測能力;茶香氣單體酮閾值的實驗數(shù)據(jù)來自文獻[9],選取6 個樣本作為訓練集,用于構建模型,1 個樣本作為測試集,用于評價模型預測能力。
根據(jù)食品香味物質(zhì)酯、酮性質(zhì)與其組成原子結構特征的關系,定義成鍵原子點價為δi、δj、δk,以分子圖的鄰接矩陣為基礎,新構建的分子連接性拓撲指數(shù)mP為

其中mP的0 階指數(shù)(0P)和1 階指數(shù)(1P)計算公式為

式(2)中“∑”是對分子中所有原子個數(shù)求和;式(3)中“∑”是對分子中所有化學鍵數(shù)求和。以乙酸乙酯1P為例
色譜分析中色譜保留值是有機化合物的一個重要參數(shù)。物質(zhì)組成、結構的差異可從色譜保留值反映,是物質(zhì)定性鑒別的依據(jù)。白酒組成復雜,除基本組成乙醇和水外,還含有呈香味的酯、酸、羰基、縮醛、酚、羧羰基等化合物,其中酯類種類最多,是白酒中最重要的一類芳香成分,決定著酒的香氣。酯類香味以其結構中含碳原子數(shù)的多少和周邊環(huán)境的不同,而呈現(xiàn)出強弱不同的氣味,各種酯的含量多少和比例關系是構成各種酒風格和香型的主要因素。然而酒中酯的成分分析是一項繁重工作。所以,探索出一種以最少數(shù)值能準確預測酯類物質(zhì)的色譜保留值方法很有必要。本文將白酒中13 種酯類物質(zhì)色譜保留時間(tR)與所構建的分子連接性拓撲指數(shù)(mP)進行線性回歸分析,并用“留一法”檢驗模型穩(wěn)定性及預測能力。所得回歸模型為

式中:1P為mP的1 階拓撲指數(shù);C為酯中碳原子個數(shù);N、r、S、F、rcv、Scv依次為樣本容量、相關系數(shù)、標準偏差、Fischer 檢驗值、交叉驗證相關系數(shù)及交叉驗證標準偏差,數(shù)值分別為N=13,r=0.998,S=0.020,F(xiàn)=718.741,rcv=0.997,Scv=0.022。上述模型相關系數(shù)(r)、交互檢驗的相關系數(shù)(rcv)均大于0.990,說明模型具有良好的預測能力、穩(wěn)健性和外部預測能力,同時該模型的S、Scv分別為0.020、0.022,色譜保留時間最大值與最小值之差為1.783,2 個標準偏差與之相比分別為1.12%、1.21%,均小于10%,說明模型預測結果準確(見表1)。由表1 可知,白酒中酯的預測色譜保留時間與實驗值相吻合,且較其他文獻[10-12]結果好。

表1 白酒中酯類物質(zhì)的1P 與tRTab.1 1P and tR of ester substances in liquor
茶葉香氣物質(zhì)是茶葉中由嗅覺感知有香味的物質(zhì)總稱,各種不同的茶類,都有它各自獨特的香氣,即“茶香”。任何一種茶葉的特有香氣都是所含芳香物質(zhì)的綜合表現(xiàn)。茶葉中含有的芳香物質(zhì)有醇、酚、醛、酮、酸、萜烯等。香氣閾值是指能用嗅覺辨別出在食品香氣中所起作用的物質(zhì)存在的最低濃度,香氣閾值越小,香氣越強;反之閾值越大,香氣越弱。本文將一組茶香單體酮閾值(T)與分子連接拓撲指數(shù)mP的0 階指數(shù)(0P)和1 階指數(shù)(1P)進行回歸分析,并用“留一法”檢驗模型穩(wěn)定性及預測能力。所得回歸模型為

上述模型相關系數(shù)(r)、交互檢驗的相關系數(shù)(rcv)均大于0.950,說明該模型具有良好的預測能力、穩(wěn)健性和外部預測能力。該模型的N、r、S、F、rcv、Scv分別為7、0.975、0.183、18.740、0.974、0.207,閾值最大值與最小值之差為72,2 個標準偏差與之相比分別為0.25% 、0.29%,均小于10%,說明模型預測結果準確(見表2)。由表2 可知,7 種茶香單體酮的實驗值與預測值基本吻合,且較其他文獻[10-11]結果好。

表2 茶香單體酮的0P 、1P 與香氣閾值Tab.2 0P、1P and aroma threshold (T) of tea monomer ketone
分子連接性拓撲指數(shù)0P、1P與食品香味物質(zhì)性質(zhì)回歸模型的相關系數(shù)r均大于0.950(r≥0.990 為優(yōu)級;0.950≤r<0.990 為良級),表明模型中自變量0P和1P與對應的性質(zhì)間有良好的相關性。拓撲指數(shù)0P、1P對食品香味物質(zhì)理化性質(zhì)的預測能力強,回歸模型能準確預測酯、酮類物質(zhì)色譜保留時間和閾值。食品香味物質(zhì)理化性質(zhì)實驗值與預測值相差非常小,建立的模型能較好地預測食品香味物質(zhì)的理化性質(zhì)。
通過食品香味物質(zhì)理化性質(zhì)殘差分布,由圖1 和圖2 可以看出,殘差值以0 為中心,呈左右對稱分布,殘差分布基本呈現(xiàn)正態(tài)分布,說明拓撲指數(shù)mP構建合理,實驗值與預測值誤差小,用線性回歸方法獲得的模型預測能力強,可以準確地對食品香味物質(zhì)的理化性質(zhì)進行預測。

圖1 白酒中酯類物質(zhì)色譜保留值殘差Fig.1 Residual chromatographic retention values of esters in liquor

圖2 茶葉香氣單體酮的閾值殘差Fig.2 Threshold residue of ketone,aroma monomer of tea
在無機化學、有機化學、生態(tài)環(huán)境及醫(yī)藥學研究領域,分子連接性拓撲指數(shù)在預測物質(zhì)的理化性質(zhì)和生物活性等方面已取得有效利用。本文采用分子連接性拓撲指數(shù)在食品科學領域進行了探索性研究,所構建的mP分子連接性拓撲指數(shù)對食品香味物質(zhì)具有良好的結構選擇性,能很好地反映食品香味物質(zhì)的結構信息。0P中的“∑”是對分子中所有原子個數(shù)求和,它反映了分子中原子對0P的貢獻,組成分子的原子越多,對0P的貢獻越大;1P中的“∑”是對分子中所有化學鍵數(shù)求和,化學鍵越多,原子間的作用越強。拓撲指數(shù)mP在原子和分子層次上多方面反映了原子和分子結構對食品香味物質(zhì)理化性質(zhì)的影響。由于每個分子的成鍵原子點價不同,mP具有良好的區(qū)分度,可使mP與食品香味物質(zhì)的理化性質(zhì)存在良好相關性,可以通過所構建的mP分子連接性拓撲指數(shù)建立的QSPR 模型,準確預測食品香味物質(zhì)酯、酮的色譜保留時間、閾值。所建模型用“留一法”交互檢驗證明,測試集酯、酮的色譜保留時間、閾值和實驗值非常接近,所建模型具有較高的可靠性和良好的預測能力,該法可為食品香味物質(zhì)結構與其理化性質(zhì)的研究提供參考。