李梅蘭, 李 仲( .青海大學 化工學院,青海 西寧 8006; .青海民族大學 物理與電子信息工程學院,青海 西寧 80007)
?
有機羧酸pKa的定量結(jié)構(gòu)—性質(zhì)關系
李梅蘭1, 李 仲2
( 1.青海大學 化工學院,青海 西寧 810016; 2.青海民族大學 物理與電子信息工程學院,青海 西寧 810007)

應用物質(zhì)結(jié)構(gòu)-性質(zhì)關系(QSPR)方法研究了 34 種羧酸pKa與分子描述符之間的定量關系,采用DRAGON 5.4軟件和HyerChem7計算了34種羧酸分子的568種結(jié)構(gòu)類參數(shù)和12種量子化學參數(shù)。根據(jù)偏差權重法篩選出61種結(jié)構(gòu)描述符,采用多元逐步回歸分析建立了34種羧酸結(jié)構(gòu)-性質(zhì)關系,得到最佳方程。方程相關系數(shù)R=0.990,標準偏差S=0.170。且有F>Fα,表明方程回歸效果顯著;對回歸系數(shù)的t檢驗結(jié)果均有Sig<0.05,表明6個參數(shù)對pKa影響顯著。“逐一剔除”交叉驗證的結(jié)果證明模型具有良好的穩(wěn)定性和較強的預測能力。6個參數(shù)物理意義及其對pKa影響的深入分析表明,其中羧基中氫原子凈電荷(QH)和羧基中非羥基氧原子凈電荷(Q=O)是影響羧酸強度的關鍵因素。
羧酸; pKa; DRAGON; 密度泛函; 定量結(jié)構(gòu)性質(zhì)關系
1.1 分子結(jié)構(gòu)類參數(shù)的計算、刪減與合并
采用DRAGON5.4(2006)軟件計算34種羧酸化合物分子結(jié)構(gòu)類參數(shù)[11]。根據(jù)羧酸分子結(jié)構(gòu)信息特點,本文選定結(jié)構(gòu)組成描述符、拓撲描述符、連接性指數(shù)、特征值指數(shù)、徑向分布函數(shù)描述符、3D-MoRSE描述符及電荷描述符7類568種結(jié)構(gòu)類參數(shù)。計算方法步驟:首先將34種樣本羧酸化合物結(jié)構(gòu)輸入Hyperchem 7程序中,采用分子力學方法MM+進行初步優(yōu)化,在此基礎上用半經(jīng)驗量子化學方法AM 1繼續(xù)優(yōu)化,用HF/6-31*進一步進行兒何優(yōu)化,最后將優(yōu)化好的分子結(jié)構(gòu)輸入Dragon 5.4程序中計算化合物的各種結(jié)構(gòu)參數(shù)。通過計算,每個化合物均得到568種結(jié)構(gòu)參數(shù)。
如此眾多的分子結(jié)構(gòu)參數(shù),在進行變量篩選之前要事先進行刪減,剔除那些不能為模型提供有用信息的參數(shù),通常采用偏差權重法,即根據(jù)標準偏差大小來作為剔除的依據(jù)。例如,有些參數(shù)對所有化合物來說數(shù)值為常數(shù)(包括為零)或者變化較小,即標準偏差很小,顯然無法有效表征結(jié)構(gòu)的差異性,因此被刪除。另外,對于參數(shù)間相關系數(shù)大于0.90以上的任意2個結(jié)構(gòu)參數(shù),由于存在“共線性”,因此其中之一也應被刪除。值得指出的是,還有一些結(jié)構(gòu)參數(shù),如結(jié)構(gòu)組成描述符中的MW(molecular weight)、nAT(number of atoms) 、nSK(number of non-H atoms) 、nBT(number of bonds) 、nBO(number of non-H bonds)等,這些參數(shù)顯然不能區(qū)分異構(gòu)體,不能為模型提供有用信息,因而也必須刪減。
最后,經(jīng)過刪減合并壓縮,7類61種結(jié)構(gòu)參數(shù)進行下一步的特征變量篩選。
1.2 量子化學參數(shù)計算
在用HF/6-31*對羧酸分子進一步進行兒何構(gòu)型全優(yōu)化的基礎上,利用Hyperchem 7中的密度泛函程序在DFT-B3LYP/6-31G*水平下進行羧酸化合物分子電子結(jié)構(gòu)和QSAR模塊計算。獲得分子總能量ET、分子最高占據(jù)軌道能(HOMO)、分子最低空軌道能(LUMO)、羧基中非羥基氧原子凈電荷(Q=O)、羧基中氫原子凈電荷(QH)、羧基碳原子凈電荷(QC)、分子偶極矩、水合能、分子平均極化率、脂水分配系數(shù)、分子表面積及分子體積共計12種量子化學參數(shù)數(shù)據(jù)。
由于Hyperchem 7對原子序數(shù)35號以上重原子(含Br)不能進行DFT-B3LYP/6-31G*水平計算,因此這里只對34種取代羧酸進行了電子結(jié)構(gòu)和QSAR模塊計算。
1.3 特征變量的篩選與預測模型的建立
傳統(tǒng)史觀認為,人民群眾是歷史的創(chuàng)造者,歷史大勢是不可遏制的,不被個人左右的。但在《午夜的孩子》里,個人的行動改變了歷史走向。薩里姆的介入影響甚至左右了巴基斯坦的歷史進程。《胡椒瓶演練的行動》一章中,薩利姆參加扎菲爾姨父的晚宴,并幫助姨父用辣椒罐等器皿來代替各種勢力,進行策劃1958年的軍事政變事的布陣。之后,陪同姨父逮捕了米爾扎總統(tǒng)并將其趕出巴基斯坦,得到后來出任巴基斯坦總統(tǒng)的阿尤布·汗將軍的賞識,從而使薩利姆認識到了自己對民族歷史的影響“我不僅顛覆了一個政府,而且將一個總統(tǒng)送到了流亡之鄉(xiāng)”。
QSPR建模的關鍵就是要選擇出與預測性質(zhì)關聯(lián)程度高的分子描述符,因此必須對候選特征變量進行篩選。將已經(jīng)選出的61種結(jié)構(gòu)參數(shù)和12種量子化學參數(shù),即共計73種候選特征變量數(shù)值與34種羧酸的pKa實驗值進行逐步回歸分析[12],據(jù)此篩選出6個特征變量,并建立了預測羧酸強度的多元線性回歸方程。34種羧酸的6個特征變量值及實驗值pKa,obs.參見表1。逐步回歸分析是采用SPSS13.0統(tǒng)計分析軟件包計算完成的[13]。
2.1 預測模型與結(jié)果
預測羧酸強度的多元線性回歸方程如下:
pKa=69.074-35.333Q=O-199.723QH-2.5×10-6ET-1.761RDF20V+0.076SS-.548X3

(15.608-17.628-16.697-7.752-8.1373.816-5.5950.0000.0000.0000.0000.0000.0010.000-0.714?-1.198?-0.400?-0.414?0.241?-0.291?)
R=0.990(R2=0.979)S=0.170602F=212.324 (Sig=0.000)n=34
式中:R表示相關系數(shù);S表示標準偏差;F是Fisher檢驗值(α=0.05,Sig為檢驗概率);n是樣本容量。方程下括號的內(nèi)容,按行計依次為t檢驗值、檢驗概率及標準回歸系數(shù)(星號*表示)。
從方程給出的統(tǒng)計檢驗參數(shù)來看,F(xiàn)=212.324≥Fα(6/27)=2.46,F檢驗通過(Sig<0.05),說明總體上看方程有意義;所有系數(shù)t檢驗通過(Sig<0.05),說明方程中所有系數(shù)有意義,對pKa的影響是顯著的,顯然這正是逐步回歸分析的必然結(jié)果。
從方程給出的相關系數(shù)和標準偏差來看,相關系數(shù)高達0.990,且S僅為0.170,說明進入模型中的6個特征參變量與羧酸酸強度關聯(lián)程度很高,方程可以用于羧酸強度的預測。由方程預測的pKa,cal.值與偏差Δ見表1。圖1給出了預測pKa,cal.的非標準化數(shù)值和實驗值pKa,obs.的關系圖,由圖可以看出,兩者符合得很好。經(jīng)計算,預測平均絕對差僅為0.117,預測精度是很高的。與文獻中的類似研究工作相比,本文方法的預測精度比拓撲指數(shù)提取羧酸分子結(jié)構(gòu)特征建立關聯(lián)其強度預測方程的精度要高一些[7-9]。例如,文獻[9]中利用電拓撲狀態(tài)指數(shù)En及價分子連接性指數(shù)mXv,建立了有機羧酸pKa與拓撲指數(shù)的7元指數(shù)的7元回歸數(shù)學模型,其相關系數(shù)僅為0.967;自定義分子樹拓撲指數(shù)建立羧酸化合物pKa值的7元回歸定量模型[7],其相關系數(shù)也只是達到0.9871。與文獻[4]中使用拓撲參數(shù)、量子化學電子參數(shù)等20種變量建立的7元回歸方程(R=0.957,F=46.49,S=0.305)相比, 本文方法的預測精度明顯地高一些。

表1 34種羧酸的部分結(jié)構(gòu)參數(shù)、pKa和預測誤差

圖1 pKa的實驗值與預測值的線性關系
2.2 模型檢驗
從殘差分布圖2可以看出,基本呈正態(tài)分布,表明參與回歸建模的多元數(shù)據(jù)滿足正態(tài)性經(jīng)典統(tǒng)計學的基本假定。由于研究的樣本容量較小(34個),進一步還可以采用“逐一剔除”的方法[14]驗證模型穩(wěn)定性。即每次剔除一個化合物,剩余的33個化合物建模,求其相關系數(shù),結(jié)果為等于0.992的有1個,0.991有3個,0.990有13個,0.989有15個,0.988有2個,平均值為0.989 6,與0.990十分接近,所以該模型中不存在有顯著影響的異常值,模型中不存在隨機相關,有可以被接受的總體穩(wěn)定性,所建回歸模型是穩(wěn)定有效的,6個特征變量可以用于羧酸強度變化規(guī)律解析。

圖2 34種羧酸的pKa殘差分布圖
2.3 影響羧酸強度因素分析
比較標準回歸系數(shù)大小可以得出預測34種羧酸強度各個因素的重要程度。方程中,標準回歸系數(shù)大小(取絕對值)依次為1.198(QH)、0.714(Q=O)、0.414(RDF20V)、0.400(ET)、0.291(X3)、0.241(SS)。表明對于34種羧酸強度預測,量子化學參數(shù)中的羧基中氫原子凈電荷(QH)和羧基中非羥基氧原子凈電荷(Q=O),標準回歸系數(shù)最大,是影響羧酸強度的關鍵因素。這不難理解。羧酸的酸性受取代基多種電子效應的影響,如誘導效應、共軛效應及場效應等,最后反映到QH和Q=O上。顯然,Q=O較低,而QH較高,則意味著—O—H鍵極性加大 ,氫原子也就容易離解,羧酸酸性也就強(pKa低)一些了。這與文獻[1]中得出的羧酸的酸性可用QH來衡量,是羧酸酸性變化的主要因素的結(jié)論是完全一致的。當然作為與分子穩(wěn)定性有關的量子化學參數(shù)總能量ET,顯然也是影響羧酸酸性的一個因素。3個結(jié)構(gòu)類參數(shù)RDF020V、X3及SS在逐步回歸建模時順利進入方程,表明它們也是影響羧酸強度的因素,只是標準回歸系數(shù)小一些,說明結(jié)構(gòu)參數(shù)的重要性低一些。但正是這3個結(jié)構(gòu)參數(shù),包含羧酸分子中各取代基的電負性、電拓撲狀態(tài)及分子空間結(jié)構(gòu)等重要結(jié)構(gòu)組成信息,它們體現(xiàn)出的空間結(jié)構(gòu)因素,和量子化學參數(shù)體現(xiàn)出的電子效應因素共同作用的結(jié)果決定羧酸強度。因此從物理意義來講,篩選出的3個量子化學參數(shù)和3個結(jié)構(gòu)類參數(shù)能很好地關聯(lián)羧酸強度,從而可以建立高精度的預測羧酸強度方程。
其實在羧酸強度的 QSPR研究中,已經(jīng)看到單一的量子化學法或分子拓撲指數(shù)法提取羧酸分子結(jié)構(gòu)特征,往往得不到精度高的預測模型。這是因為量子化學參數(shù)注重分子局部電子結(jié)構(gòu)特征細節(jié),如各取代基復雜的電子效應的描述,不能直接概括出分子幾何結(jié)構(gòu)特征,缺乏對分子整體的描述;而以分子結(jié)構(gòu)和價態(tài)理論為基礎的拓撲指數(shù)類參數(shù),注重原子價態(tài)、結(jié)合順序、分枝及分子形狀等分子空間結(jié)構(gòu)的描述,對分子局部電子結(jié)構(gòu)特征細節(jié)不能表征。正是由于表征分子各取代基復雜的電子效應與空間結(jié)構(gòu)因素分開考慮,即沒有考慮影響性質(zhì)的電子效應和空間結(jié)構(gòu)因素的共同作用,從而導致建立的預測羧酸強度模型精度不高。
應用QSPR原理研究 34 種羧酸pKa與分子描述符之間的定量關系。采用DRAGON 5.4軟件和HyerChem7計算了34種羧酸分子的568種結(jié)構(gòu)類參數(shù)和12種量子化學參數(shù)。根據(jù)偏差權重法等篩選出61種結(jié)構(gòu)描述符。采用多元逐步回歸分析建立了預測34種羧酸pKa的最佳方程。模型經(jīng)多種方法驗證,表明具有良好的穩(wěn)定性和較強的預測能力。進入方程中的6個參數(shù),經(jīng)物理意義及其對 pKa影響的深入分析表明,其中的量子化學參數(shù)QH和Q=O標準回歸系數(shù)最大,是影響羧酸強度的關鍵因素,而3個結(jié)構(gòu)類參數(shù)體現(xiàn)出的空間結(jié)構(gòu)因素和量子化學參數(shù)體現(xiàn)出的電子效應因素共同作用的結(jié)果決定羧酸強度。
[1] 李 仲. 硝基苯化合物生物毒性的定量構(gòu)效關系研究[J].河南師范大學學報(自然科學版),2010,38(5):135-138.
[2] Karelson M, Lobanov V S, Katritzky A R. Quantum-chemical descriptors in QSAR/QSPR studies[J].Chem Rev, 1996,96:1027-1043.
[3] 舒元梯. 飽和一元羧酸物理化學性質(zhì)的定量探討[J]. 樂山師范學院報,2002,17(4):26-29.
有顯著的差異。同時,選用化學惰性的全氟代的溶劑對樣品以及質(zhì)譜結(jié)果的影響能降到最低。由此可見,在用MALDI TOF質(zhì)譜進行聚合物分析時,溶劑的選擇原則盡可能選用樣品和基質(zhì)都能溶的溶劑,若無此類溶劑,則選用兩者分別的良溶劑。
參考文獻(References):
[1] Till G, Steffen W, Jana F,etal. Mass spectrometry in polymer chemistry: a state-of-the-art up-date [J]. Polymer Chemistry, 2010(1)1: 599-617.
[2] Walterová Z, Horsk J. Quantification in MALDI-TOF mass spectrometry of modified polymers [J]. Analytica Chimica Acta, 2011, 693(1-2): 82-88.
[3] Lallana E, Ferreri T, Carroccio S C,etal. End-group rearrangements in poly(propylene sulfide) matrixassisted laser desorption/ionization time-of-flight analysis.Experimental evidence and possible mechanisms [J]. Rapid Communications in Mass Spectrometry, 2012, 26(18): 2158-2164.
[4] Peacock P M and. McEwen C N. Mass Spectrometry of Synthetic Polymers [J].Analytical Chemistry, 2004, 76(13): 3417-3428.
[5] Kim K, Hasneen A, Paik H J,etal. MALDI-TOF MS characterization of polystyrene synthesized by ATRP [J]. Polymer, 2013, 54(22): 6133-6139.
[6] Arnould M A,Wesdemiotis C, Geiger R J,etal. Structural characterization of polyester copolymers by MALDI mass spectrometry [J]. Progress in Organic Coatings, 2002, 45: 305-312.
[7] 何美玉,何江濤. MALDI-TOF MS分析研究合成高分子的綜述 [J]. 質(zhì)譜學報, 2002, 23(1): 43-55.
[8] Ute B, Andreas D, Michae Kl,etal. Mass spectrometry of synthetic polymers by UV-matrix-assisted laser desorption/ionization [J]. Analytical Chemistry, 1992, 64(22): 2866-2869.
[9] Danis P O, Karr D E, Mayer F,etal. The analysis of water-soluble polymers by matrix-assisted laser desorption time-of-flight mass spectrometry [J]. Organic Mass Spectrometry, 1992, 27(7): 843-846.
[10] Wu T, Hu H L, Jiang D,etal. Identification of two polyamides (PA11 and PA1012) using pyrolysis-GC/MS and MALDI-TOF MS [J]. Polymer Testing, 2013, 32(2): 426-431.
[11] Janus L, Carbonnier B, Morcellet M,etal. Mass spectrometric characterization of a new 2-hydroxypropyl-beta-cyclodextrin derivative bearing methacrylic moieties and its copolymerization with 1-vinyl-2-pyrrolidone [J]. Macromolecular Bioscience, 2003, 3(3-4): 198-209.
[12] Yol A M, Dabney D, Wang S F,etal. Differentiation of Linear and Cyclic Polymer Architectures by MALDI Tandem Mass Spectrometry (MALDI-MS2) [J]. Journal of the American Society for Mass Spectrometry, 2013, 24(1): 74-82.
[13] Lallana E, Ferreri T, Carroccio S C,etal. End-group rearrangements in poly(propylene sulfide) matrix-assisted laser desorption/ionization time-of-flight analysis. Experimental evidence and possible mechanisms [J]. Rapid Communications in Mass Spectrometry, 2012, 26(18): 2158-2164.
[14] Sharma M, Yameen H S, Tumanskii B,etal. Bis(1,3-di-tert-butylimidazolin-2-iminato) Titanium Complexes as Effective Catalysts for the Monodisperse Polymerization of Propylene [J]. Journal of the American Chemical Society, 2012, 134(41): 17234-17244.
[15] Zagorevskii D V, Nasrullah M J, Raghunadh V,etal. The effect of tetrahydrofuran as solvent on matrix-assisted laser desorption/ionization and electrospray ionization mass spectra of functional polystyrenes [J]. Rapid Communications in Mass Spectrometry, 2006, 20(2): 178-180.
Quantitative Structure—Property Relationship Study on pKaValues of Substituted Carboxylic Acids
LIMei-lan1,LIZhong2
(1. College of Chemical Engineering, Qinghai University, Xining 810008, China; 2. College of Physics & Electronic Information Engineering, Qinghai University for Nationalities, Xining 810007, China)
Quantitative structure-property relationship (QSPR) method is performed to study the relationship between Pkavalues and molecular descriptors of 34 sorts of substituted carboxylic acids. With the DRAGON 5.4 software and HyerChem 7, 568 structural parameters and 12 quantum chemistry parameters for 34 sorts of substituted carboxylic acids are calculated. 61 structural descriptors are chosen by using the variable selection method of weighted deviation. Through stepwise regress, a equation of QSAR of 34 sorts of substituted carboxylic acids has been successfully proposed. TheR(correlation) andS(standard error) are 0.990 and 0.170, respectively. Furthermore, the two-sidedt-test was used to validate the significance of the 6 descriptors. With the statistically significance (<0.05), correlation coefficients of descriptors show that the 6 descriptors have important impaction the pKavalues. Furthermore, leave-one-out cross validation as performed, the results confirmed the good stability and powerful prediction of this model. The physical meaning and the influence of the 6 parameters on pKaof substituted carboxylic acids were investigated. The two parameters, net charge of the hydrogen atoms in carboxyl (QH) and net charge of the oxygen atom in non-hydroxyl (Q=O) are the key factors affecting the acid intensity of substituted carboxylic acids.
carboxylic acid; DRAGON; DFT; quantitative structure-property relationship (QSPR)
2014-04-08
國家教育部春暉計劃(Z2012108)
李梅蘭(1969-),女,青海西寧人,副教授,現(xiàn)主要從事應用化學研究。Tel.:18797373976;E-mail: youjiezi2008@163.com
O 658.0
A
1006-7167(2015)02-0020-04