馮長君,石春玲,李鳴建
蚌蘭花揮發油化學成分色譜保留值的構效關系研究
馮長君,石春玲,李鳴建
(徐州工程學院化學化工學院,江蘇 徐州 221008)
基于著名的Kier連接性指數(mXtV)及電性距離矢量(Md),使用最佳變量集回歸(LBR)建立蚌蘭花中20種有機成分的氣相色譜保留時間(tR)的四元數學模型,其傳統相關系數(R2)為0.963,逐一剔除法(LOO)交叉驗證系數(Q)為0.832。該模型具有高度穩健性與良好的預測能力,影響有機物氣相色譜保留時間的主要因素是分子大小與空間形狀。結果表明,Kier逆指數對有機物氣相色譜保留時間的表征是合理的、有效的,所建模型能較好解釋其遞變規律。
蚌蘭花;保留時間;連接性指數;電性距離矢量;定量結構-保留相關(QSRR)
蚌蘭花為多年生的肉質草本植物,屬鴨跖草科。其花味甘淡、性涼、入肺、脾經。有清熱潤肺、止咳化痰、涼血止痢的功效,主治內傷肺癆、淋巴結核、支氣管炎、肺熱燥咳以及吐血、衄血、血痢、便血等癥,故有“血見愁”俗名。黃麗莎等[1]采用水蒸氣蒸餾法提取蚌蘭花鮮花的揮發油,并通過GC-MS聯用技術對其化學成分進行分析研究,鑒定出了相對含量大于0.3%的20種化學成分(表1),主要成分為天竺葵醛、棕櫚酸、壬酸、月桂酸、異香蘭醛、葡萄花酸、羊脂酸、亞油酸等。現代醫學研究表明,不飽和脂肪酸(如亞油酸等)不但具有營養腦細胞、調節交感神經、顯著的降血脂作用及抗炎效果,而且對于降低血液中膽固醇的含量、預防高血壓和動脈粥狀硬化具有明顯效果[2]。因此,長期食用,利于人體生理平衡調節,益于身體健康。

表1 蚌蘭花揮發油中20種有機組分的拓撲指數及其保留時間Table 1 Topological indices and retention time (tR) of 20 organic components in volatile oil from Rhoeo spathacea (Sw.) Stearn flowers
Randic[3]最早將分子連接性指數(mXt)用于醇類氣相色譜保留指數(RI)的研究,隨后許多學者相繼建立了烴及其衍生物的定量結構-色譜保留指數相關性模型(QSRR)[4-8],現已成為色譜科學領域中十分活躍的課題。本實驗依據Kier等[9]的分子連接性指數(mXtV)及Liu等[10-12]的電性距離矢量(MEDV,以Md表示),20種蚌蘭花揮發油化學成分的氣相色譜保留時間(tR)[1]擬合,經最佳變量子集回歸(Leaps- and-Bounds regression,LBR)得四元QSRR模型,其復相關系數(R2)為0.963,逐一剔除法(leave-oneout,LOO)交互校驗復相關系數(Q2)為0.832。結果表明所建模型具有良好的預測能力與總體穩健性。
1.1 材料
蚌蘭花揮發油中20種化學成分的保留時間(tR/min)取自文獻[1]。
1.2 拓撲指數構建方法
常用的QSAR方法有辛醇-水分配系數法、線性溶劑化能法及拓撲指數法等,但以后者最為簡便,因它幾乎不需查找任何化學參數。拓撲指數是以分子的二維結構為基礎,通過圖論的方法構建結構參數,以反映分子中原子間的連接方式與次序。迄今已報道了400余種拓撲指數,其中以Kier等[9]的價連接性指數(mXtv)的應用最為廣泛。Kier等[9]在分子隱氫圖的鄰接矩陣基礎上,定義分子的價連接性指數(mXtv)。

式中:mXtv是一個指數體系,由(m+1)個指數組成;m表示相應指數的階數,m=0,1,2,……;t代表子圖的類型,常用4種子圖為鏈、星、星-鏈、環狀子圖,依次對應t為p、c、pc及ch。δiv為原子點價,表征原子結構信息,定義式為:

式中:Mi、mi為非氫原子i的電子總數及價電子數,hi為與非氫原子i直接鍵合的氫原子數。本研究利用MATLAB軟件計算了11種。
Liu等[10-12]考察了多種著名拓撲指數的局限,提出能夠較為全面反映分子的拓撲、幾何及電性特征的電性距離矢量。電性距離矢量的具體計算方法見文獻[10-12],例如,1,2-二氯乙烷的Md計算過程如下:
首先計算此分子中二種非氫原子的原子屬性(Ii,i代表非氫原子類型):-C-(第二類原子),-Cl(第十三類原子)的Ii值依次為1.5000、1.9108。其次是計算相應的電性狀態指數(Ei)為:0.9865、2.4243。第三步是計算電性距離矢量(Md,d為電性距離矢量的序數):這兩種非氫原子兩兩組合共有3種Md:M14(即M2-2)、M25(即M2-13) 及M91(即M13-13),其值依次為0.9732、5.9789、0.6530。
本研究化合物分子中共有6種原子類型:n=1,2,3,4, 9,10,它們兩兩組合構成21個Md指數。利用程序計算了蚌蘭花20種化學成分的Md指數。
1.3 多元統計回歸方法
將每個揮發性化學成分分子的33種結構描述符(12種連接性指數與21種電性距離矢量)作為自變量,相應的tR為因變量輸入Mintab14。首先采用其中最佳子集回歸(Leaps-and-Bounds regression)程序選擇最佳變量組合,建立相應定量結構-保留指數相關性(QSRR)模型, 然后應用逐一剔除法對模型的預測能力及穩健度進行檢驗,以交叉驗證相關系數(Q2)予以評價。
2.1 蚌蘭花揮發性成分的QSRR模型
20個蚌蘭花揮發性成分的色譜保留時間(tR)數據來自文獻[1],將其和11種分子價連接性指數(mXtv)、21種電性距離矢量(Md)一起輸入Minitab軟件系統,經最佳變量子集回歸建立的QSRR模型見表2。其中R2、、Q2、S、F分別為相關系數、校正判定系數(以消除自變量個數及樣本容量對判定系數的影響)、逐一剔除法的交叉驗證系數、估計標準誤差、Fischer檢驗值。
表2 tR與mXtv,Md的最佳變量子集回歸結果Table 2 Leaps-and-bounds regression for tRas a function ofm, and Md

表2 tR與mXtv,Md的最佳變量子集回歸結果Table 2 Leaps-and-bounds regression for tRas a function ofm, and Md
試驗號R2RAdjQ2SF變量10.5510.5260.3204.43022.0730Xpv20.7370.7060.0003.49023.7890Xpv, M8230.8500.8220.4532.71930.1331Xpv, M82, M2240.9630.9530.8321.39197.8970Xpv, M82, M22, M14 50.9800.9730.7941.122122.0391Xpv, M82, M33, M77, Xchv 2
由表2可見,隨著模型中變量數增多,其Q2呈鋸齒狀變化,先是增大至0.832,而后下降,說明該四元數學模型具有最好的穩定性及預測能力,相應模型參數為:

按式(3)給出的計算值與相應實驗值(表1) 基本吻合。用變異膨脹因子(variance inflation factors,VIF)[13]評價模型(3)中各自變量之間是否存在多重相關性。VIF的定義式為:

式中:R2為自變量集中某一變量與余下變量的判定系數。如VIF=1,表明各自變量間完全不相關;當VIF<5時,說明變量間沒有明顯的自相關性,所建模型是穩定的;當VIF>5時,說明變量間存在明顯的共線性,所建模型不能用于估算與預測。模型(3)中0Xpv、M82、M22、M14的VIF依次為2.076、5.043、4.548、1.725,它們的VIF大都小于或非常接近5,證明該模型中變量間沒有明顯的自相關性,具有良好的穩健度及預測能力。另外,模型(3)的與Q2相差為0.121,小于0.3,說明該模型沒有過擬合、不存在不相關的其他變量或數據中存在離域點.
化合物的色譜保留時間受固定相與溶質分子間的作用力控制,其間作用力越大,tR越大。蚌蘭花中所含20種揮發性化合物均為弱極性分子,它們與固定相之間的作用力包括取向力、誘導力、色散力和氫鍵,但以色散力為主[7]。影響色散力的主要結構因素是分子的大小與空間形狀。化合物分子的體積越大,其變形性越大,相應瞬間偶極越強,其與固定相之間的色散力越大。分子中所含碳原子支化度越大,分子中各個原子與固定相距離較近,其間作用力較大。因此,它們的色譜保留時間隨之增長。根據進入模型(3)的分子描述符可知,0Xpv主要反映分子的大小,M14(反映第二類原子間相互作用),M22(反映第二類原子與第九類原子間相互作用),M82(反映第十類原子與第十類原子間相互作用)則與分子形狀相關。因此,式(3)的削減誤差比例(即R2)為96.3%,只有近3.7%的影響tR的其他因素未被揭示。可以認為式(3)中的0Xpv、M14、M22、M82及常數項較好地表征了影響tR的本質因素。
綜上所述,所建模型具有良好的相關性與穩健性,表明連接性指數、電性距離矢量對蚌蘭花中所含揮發性化學成分的分子結構表征是合理的,確實揭示了影響本質因素,并較好解釋了tR的遞變規律。
[1]黃麗莎, 朱峰. 蚌蘭花揮發油化學成分的GC-MS分析[J]. 中藥材, 2009, 32(1): 65-66.
[2]白成科, 張媛, 王喆之. 萊菔子脂肪酸成分的GC-MS分析[J]. 熱帶亞熱帶植物學報, 2006, 14(5): 409-412.
[3]RANDIC M. On characterization of molecular branching[J]. J Amer Chem Soc, 1975, 97(23): 6609-6615.
[4]陳艷, 堵錫華. 紅莓發酵酒香氣成分定量結構-色譜保留值構效關系研究[J]. 食品科學, 2009, 30(21): 39-42.
[5]馮長君. 用分子形狀指數估算氯代羥基苯甲醛的氣相色譜保留指數[J]. 化工科技, 2007, 15(4): 9-12.
[6]陳艷, 堵錫華. 天然山楂香料揮發性組分分子定量結構-色譜保留研究[J]. 食品科學, 2009, 30(18): 270-273.
[7]馮長君, 堵錫華. 胺類化合物Kováts指數的拓撲研究[J]. 色譜, 2001, 19(2): 124-127.
[8]郭宗儒. 藥物分子設計[M]. 北京: 科學出版社, 2006: 477.
[9]KIER L B, HALL L H. Molecular connectivity in structure-activity analysis[M]. England: Research Studies Press, 1986: 82.
[10]LIU Shushen, YIN Chunsheng, WANG Liansheng. Combined MEDVGA-MLR METHOD for QSAR of three panels of steroids, dipeptides, and COX-2 inhibitors[J]. J Chem Inf Comput Sci, 2002, 42: 749-756.
[11]LIU Shushen, LIU Hailing, YIN Chunsheng, et al. VSMP: A novel variable selection and modeling method based on the prediction[J]. J Chem Inf Comput Sci, 2003, 43(8): 964-969.
[12]LIU Shushen, YIN Chunsheng, LI Zhiliang, et al. QSAR study of steroid benchmark and dipeptides based on MEDV-13[J]. J Chem Inf Comput Sci, 2001, 41(2): 321-329.
[13]馮長君. 手性有機酸保留指數的手性指數及原子類型電拓撲指數模型[J]. 物理化學學報, 2010, 26(1): 193-198.
Quantitative Structure-retention Relationship Studies of Chemical Constituents in Volatile Oil from Rhoeo spathacea (Sw.) Stearn Flowers
FENG Chang-jun,SHI Chun-ling,LI Ming-jian
(School of Chemistry and Chemical Engineering, Xuzhou Institute of Technology, Xuzhou 221008, China)
On the basis of Kier s molecular connectivity index (mXtV) and electronegativity distance vector (Md), the retention time of 20 organic components in volatile oil from Rhoeo spathacea (Sw.) Stearn flowers was determined and a four-variable model (QSRR) of gas chromatographic retention time (tR/min) for 20 chemical components was established frommXtV, Mdby leaps-andbounds regression (LBR). Traditional correlation coefficient (R) and cross-validation correlation coefficient (Q) of leave-one-out (LOO) were 0.963 and 0.832, respectively. The model was highly reliable and had favorable prediction capability. The dominant factors for retention time were molecular size and spatial shape of organic molecules. The Kier s converse indices and electronegativity distance vector exhibited a good rationality and efficiency in characterizing retention time of organic compounds. This model could elucidate the change trend of retention indices for organic components.
Rhoeo spathacea (Sw.) Stearn;gas chromatographic retention time;connectivity index;electronegativity distance vector;quantitative structure-retention relationship (QSRR)
R284.1
A
1002-6630(2010)19-0042-03
2010-01-13
國家自然科學基金項目(20776149);環境模擬與污染控制國家重點聯合實驗室基金項目(KJ2007001);徐州工程學院培育課題(XKY2008313)
馮長君(1954—),男,教授,本科,主要從事有機物構效關系研究。E-mail:fengcj@xzit.edu.cn