李建鳳
(1.“果類廢棄物資源化”四川省高等學(xué)校重點(diǎn)實(shí)驗(yàn)室,四川內(nèi)江641199;2.內(nèi)江師范學(xué)院化學(xué)化工學(xué)院,四川內(nèi)江641199)
血橙屬于甜橙類[1],因果肉具紅色血絲或血斑而得名,風(fēng)味獨(dú)特、營(yíng)養(yǎng)豐富、富含VC,具有抗氧化活性、防止心血管疾病和抑制癌癥發(fā)生等保健作用[2],頗受消費(fèi)者的青睞。塔羅科血橙(Tarocco)被譽(yù)為血橙之王,是意大利重要的柑橘鮮食栽培品種,1976年引入我國(guó),其肉質(zhì)細(xì)嫩化渣、汁液多、味甜、有濃郁的玫瑰香味。四川、湖北等地區(qū)盛產(chǎn)血橙,血橙香氣成分是影響果汁質(zhì)量的重要因素。喬宇等[3]用頂空固相微萃取法提取湖北宜昌地區(qū)塔羅科血橙的香氣成分,使用氣相色譜-質(zhì)譜分析并鑒定了其中的45種化合物。定量結(jié)構(gòu)-色譜保留關(guān)系(quantitative structure-retention relationship,QSRR)的研究對(duì)預(yù)測(cè)保留值、選擇分離條件及探索色譜保留機(jī)理都具有重要意義[4-6]。分子電性距離矢量(MEDV)在預(yù)測(cè)化合物色譜保留時(shí)間、生物活性、粘度[7-10]等性質(zhì)方面取得較好的結(jié)果。作者采用MEDV對(duì)血橙中的45種化合物進(jìn)行了結(jié)構(gòu)表征,借助多元線性回歸(MLR)和逐步回歸(SMR)建立了化合物的氣相色譜保留指數(shù)的QSRR預(yù)測(cè)模型,取得較好的結(jié)果,有望對(duì)天然產(chǎn)物及精細(xì)化工產(chǎn)品的色譜行為提供有益參考。
45種血橙香氣成分的氣相色譜保留指數(shù)RI(Exp.)取自文獻(xiàn)[3](樣品處理:稱取 10g果肉放于20mL螺口樣品瓶中,加入3.6g NaCl,用聚四氟乙烯隔墊密封,于40℃磁力攪拌器上加熱平衡15min)。用DVB/CAR/PDMS 50/30μm(二乙烯基苯/碳分子篩/聚二甲基硅氧烷)萃取頭頂空吸附40min后,將萃取頭插入GC進(jìn)樣,解析5min;色譜條件:1:J&W DB-5石英毛細(xì)柱(30m×0.25mm×0.25m),升溫程序:30℃ 保持 2min,以 5℃/min升至 250℃,保持5min,載氣(He)流速1.0mL/min,進(jìn)樣口250℃,不分流進(jìn)樣;質(zhì)譜條件:電子轟擊(EI)離子源,電子能量70eV,傳輸線溫度250℃,離子源溫度200℃,四極桿溫度150℃,質(zhì)量掃描范圍m/z 40~400,列于表1。
采用分子電性距離矢量(MEDV)[7-10]為結(jié)構(gòu)描述子對(duì)化合物進(jìn)行結(jié)構(gòu)表征。MEDV原理簡(jiǎn)要敘述如下:分子的外在性質(zhì)與分子內(nèi)部處于骨架地位的非氫原子(即分子頂點(diǎn))之間的電性相互作用有關(guān),分子頂點(diǎn)依據(jù)其所連接的其它分子頂點(diǎn)數(shù)分為A1、A2、A3、A4 四類,分別表示與 1、2、3、4 個(gè)其它頂點(diǎn)原子相連,如與兩個(gè)分子頂點(diǎn)相連的仲碳原子屬于A2原子類型。化合物分子中四類分子頂點(diǎn)發(fā)生相互作用可以組合出以下類型:m11、m12、m13、m14、m22、m23、m24、m33、m34、m44,簡(jiǎn)寫成 x1、x2、x3、x4、x5、x6、x7、x8、x9、x10(共10個(gè)描述符),例如m11(即x1)表示第一類分子頂點(diǎn)之間的相互作用的加和,m12表示第一類分子頂點(diǎn)與第二類分子頂點(diǎn)之間的相互作用的加和。分子中MEDV各描述符按下式計(jì)算:

表1 化合物及保留指數(shù)Table 1 Compounds and retention indices(RI)

式中 n、l表示原子 i、j的原子類型,Zi、Zj表示原子i、j的相對(duì)電負(fù)性(即該原子的鮑林電負(fù)性Xi比上C原子的鮑林電負(fù)性XC,即qi=Xi/XC),rij表示原子i、j之間的相對(duì)距離(即所經(jīng)最短途徑相對(duì)于碳碳單鍵的相對(duì)鍵長(zhǎng)之和)。依據(jù)以上原理可得45個(gè)化合物的結(jié)構(gòu)描述符值。
首先以化合物色譜保留指數(shù)(RI)為因變量、10個(gè)描述符為自變量,采用多元線性回歸(MLR)建立模型,10變量模型(M1)如下:

模型擬合:N=45,R=0.952,SD=103.036,F(xiàn)=33.128;交互檢驗(yàn):RCV=0.925,SDCV=128.632,F(xiàn)CV=20.037。N為回歸點(diǎn)數(shù),R為復(fù)相關(guān)系數(shù),SD為估計(jì)標(biāo)準(zhǔn)誤差,F(xiàn)為Fischer檢驗(yàn)值;RCV為“留一法”交互檢驗(yàn)的復(fù)相關(guān)系數(shù),SDCV為“留一法”交互檢驗(yàn)的標(biāo)準(zhǔn)誤差,F(xiàn)CV為“留一法”交互檢驗(yàn)的Fischer檢驗(yàn)值。
上述模型復(fù)相關(guān)系數(shù)(R)、交互檢驗(yàn)的復(fù)相關(guān)系數(shù)(RCV)均較為理想,并且兩者相差不大,說(shuō)明模型具有良好的估計(jì)能力和預(yù)測(cè)能力。為了進(jìn)一步考察各描述符對(duì)QSRR建模過(guò)程的影響和對(duì)模型的貢獻(xiàn)大小,消除變量之間可能的共線性,對(duì)變量進(jìn)行了逐步回歸(SMR)分析,各變量按其顯著性大小逐一引入模型。復(fù)相關(guān)系數(shù)(R)及交互檢驗(yàn)的復(fù)相關(guān)系數(shù)(RCV)隨變量引入而變化的情況見(jiàn)圖1,標(biāo)準(zhǔn)誤差(SD)及交互檢驗(yàn)的標(biāo)準(zhǔn)誤差(SDCV)隨變量引入而變化的情況見(jiàn)圖2。

圖1 R、RCV隨逐步回歸的變化曲線Fig.1 Plot of R,RCVchange with SMR

圖2 SD、SDCV隨逐步回歸的變化曲線Fig.2 Plot of SD,SDCVchange with SMR
從圖1及圖2可以看出,應(yīng)該選擇8個(gè)變量的子集組合作為最優(yōu)子集,8個(gè)變量入選模型時(shí)R、RCV接近最大值,而SD、SDCV也接近最小值。繼續(xù)增加變量,R、RCV、SD、SDCV變化較小,沒(méi)有必要繼續(xù)增加變量建模。用8個(gè)變量進(jìn)行建模,所得模型(M2)如下:

模型擬合:N=45,R=0.947,SD=105.039,F(xiàn)=39.435;交互檢驗(yàn):RCV=0.923,SDCV=126.394,F(xiàn)CV=25.843。
M2的R及SD比M1略差,但是交互檢驗(yàn)的RCV及SDCV要優(yōu)于M1,并且M2的顯著性檢驗(yàn)F及FCV均優(yōu)于M1。綜合各方面因素,認(rèn)為M2的建模效果優(yōu)于M1,M2對(duì)所有樣本保留指數(shù)的計(jì)算值見(jiàn)表1中的Cal.欄,實(shí)驗(yàn)值與計(jì)算值(Cal.)及交互檢驗(yàn)值(Pre.)相關(guān)圖見(jiàn)圖3,誤差分布見(jiàn)圖4。

圖3 實(shí)驗(yàn)值與計(jì)算值相關(guān)圖Fig.3 Calculated vs.experimental values

圖4 計(jì)算值殘差分布Fig.4 Comparative residuals vs.compounds
從圖3可以發(fā)現(xiàn)絕大多數(shù)樣本點(diǎn)緊靠45°對(duì)角線,說(shuō)明模型的預(yù)測(cè)值與實(shí)驗(yàn)值接近,預(yù)測(cè)誤差較小。同時(shí),圖4顯示模型具有較好的預(yù)測(cè)準(zhǔn)確性,大部分樣本點(diǎn)誤差分布于中間直線周圍并處于±2SD線內(nèi),只有3個(gè)樣本點(diǎn)的預(yù)測(cè)誤差超出±2SD線范圍。以上說(shuō)明模型具有良好的預(yù)測(cè)能力,預(yù)測(cè)誤差小。另外本研究的樣本體系化合物結(jié)構(gòu)跨度也較大(直鏈、支鏈、帶環(huán)、含雜原子等),這也正是天然產(chǎn)物中揮發(fā)性成分的特點(diǎn),對(duì)于這樣復(fù)雜的樣本體系,模型所得的結(jié)果是滿意的。
本文采用分子電性距離矢量(MEDV)為描述符,對(duì)血橙中45個(gè)揮發(fā)性化合物進(jìn)行了結(jié)構(gòu)表征,采用多元線性回歸和逐步回歸建立了該類化合物定量結(jié)構(gòu)色譜保留指數(shù)(RI)的預(yù)測(cè)模型。模型具有良好的預(yù)測(cè)能力和穩(wěn)定性。結(jié)果表明,MEDV描述符可用于該類化合物的結(jié)構(gòu)表征,所得結(jié)果滿意。描述符可以直接從分子二維結(jié)構(gòu)計(jì)算得到,無(wú)須考慮構(gòu)象優(yōu)化與重疊的問(wèn)題,計(jì)算簡(jiǎn)單、方便、易懂。本文對(duì)于天然產(chǎn)物中揮發(fā)性有機(jī)化合物的定量結(jié)構(gòu)色譜保留關(guān)系研究具有一定的參考價(jià)值。
[1]陳竹生,萬(wàn)良珍.中國(guó)柑橘良種彩色圖譜[M].成都:四川科學(xué)技術(shù)出版社,1993.
[2]沈德培,王元欲,陳力耕.柑橘遺傳育種學(xué)[M].北京:科學(xué)出版社,1998,57.
[3]喬宇,謝筆鈞,柴倩,等.血橙果實(shí)香氣成分的氣相色譜-質(zhì)譜分析[J].質(zhì)譜學(xué)報(bào),2008,29(1):1-5,9.
[4]Liao Limin,Zhu Jun,Li Jianfeng,et al.QSRR Study on Components of Styrax Japonicus Sieb Flowers Using Improved Molecular Electronegativity-distance Vector(I-MEDV)[J].Chinese J Struct Chem,2011,30(1):105-110.
[5]Akbar Jamshed,Iqbal Shahid,Batool Fozia,et al.Predicting retention times of naturally occurring phenolic compounds in reversed-phase liquid chromatography:A quantitative structureretention relationship(QSRR)approach[J].International Journal of Molecular Sciences,2012,3(11):15387-15400.
[6]Hadi Noorizadeh,Mehrab Noorizadeh.QSRR-based estimation ofthe retention time ofopiate and sedative drugs by comprehensive two- dimensional gas chromatography[J].Medicinal Chemistry Research,2012,21(8):1997-2005.
[7]Limin Liao,Hu Mei,Jianfeng Li,et al.Estimation and prediction on retention times of components from essential oil of paulownia tomentosa flowers by molecular electronegativity distance vector[J].Journal of Molecular Structure(THEOCHEM),2008,850(1-3):1-8.
[8]Yuan Zhou,Lili Sun,Hu Mei,et al.Estimation and prediction of relative retention indices of polychlorinated naphthalenes in GC with molecular electronegativity distance vector[J].Chromatogr,2006,64(9-10):565-570.
[9]Lili Sun,Liping Zhou,Yu Yu,et al.QSPR study of polychlorinated diphenyl ethers by molecular electronegativity distance vector(MEDV-4)[J].Chemosphere,2007,66(6):1039-1051.
[10]張鶯.醋類液體粘度的定量結(jié)構(gòu)一性質(zhì)相關(guān)性研究[J].計(jì)算機(jī)與應(yīng)用化學(xué),2013,30(2):195-198.