李美萍,張生萬
(山西大學生命科學學院,太原030006)
磺胺類藥物是一種典型的作為飼料添加劑和疾病防治的獸藥,在國內外養殖業中廣泛使用.在動物養殖的應用過程中很大部分會隨糞便排出體外而進入環境. 磺胺類藥物一旦進入環境會分布到土壤、水和空氣中,即開始在水體、懸浮物、土壤等環境介質中發生遷移、轉化、吸附等一系列過程[1]. 而在環境介質中的吸附和遷移行為是決定環境中磺胺類藥物分布和殘留的重要過程,其吸附行為與其電離常數pKa 有關,盡管常見磺胺類藥物的pKa 值可以通過實驗確定或從相關手冊上查到,但是通常實驗得到的pKa 值的方法比較繁瑣,不僅如此,在某些情況下,實驗測定值還存在較大不確定性. 因此,研究磺胺類化合物的結構和pKa 值之間的定量關系以及從理論和計算上尋找有效和可靠的預測pKa 值的方法十分重要. 李玉琴[2]曾報道了基于啟發式和基因表達式編程法預測磺胺類藥物的pKa 值,但關于三維全息原子場作用矢量(three-dimensional holographic vector of atomic interaction field,3D-HoVAIF)描述子用于磺胺類藥物的pKa 值預測還未見有關文獻報道. 最近,我們從磺胺類藥物的分子結構出發,提出了一個簡單而有效的方法來計算其pKa 值.通過使用定量結構- 性質相關(quantative-structure property relationonship,QSPR)方法,并結合三維全息原子場作用矢量參數,對31 個磺胺類化合物的pKa 值進行了預測,獲得比較滿意的結果.此研究不但可以對該類化合物的pKa 值進行預測,還有助于對其在環境中的作用機理的研究.
三維全息原子場作用矢量(three-dimensional holographic vector of atomic interaction field,3DHoVAIF)[3]從原子之間相對距離和原子的自身性質出發,基于三種原子間非鍵作用方式—靜電、立體和疏水作用,將有機分子中常見的氫、碳、氮、磷、氧、硫、氟、氯、溴、碘原子分別按其所處元素周期表中不同主族劃分為5 大類,為了能充分表達分子的細微結構特征,又將不同主族中原子按其雜化狀態分為10 類,這樣分類后一個分子內部不同類別的原子之間,相互作用情況就有55 種. 由于3D-HoVAIF 分別采用靜電、立體和疏水三種勢能來表達原子間不同的作用形式,所以,對于一個有機分子而言,用于表征分子結構信息的原子作用項就有3 ×55 =165 個. 這些三維矢量描述子可以不借助任何實驗參數得到. 其具體的描述公式參見文獻[3-6],在此不再贅述.
本文研究的31 種磺胺類藥物及其pKa 值來自于文獻[2],其名稱見表1. 使用Chemoffice8.0 繪制31 種磺胺類藥物的分子結構圖,用Chem3D 自帶的MOPAC 半經驗量子化學軟件在AM1 水平上最終優化得到分子空間結構(截斷值0.001KJ/mol),并采用Mulliken 布居分析法以單點(singlepoint)形式計算出原子的凈電荷數量,將分子中每個原子的空間位置及電荷分別以笛卡兒坐標和凈電子數目的形式輸入 C 語言應用程序3DHoVAIF. exe 加以處理,得到分子的3D-HoVAIF 描述子.

表1 磺胺類藥物名稱及pKa 值Table 1 Name and pKa values of sulfonamides
本文以R (建模相關系數),Rcv (交互檢驗相關系數),RMSEF (擬合誤差)和RMSEP (預測誤差)作為衡量模型預測能力的標準. 關于模型建立過程中訓練集和測試集的樣本選取,我們按照參考文獻[2]從31 個樣本中選取10 個樣本作為測試集,其余的21 個樣本作為訓練集,選取的測試集在表1 中用“* ”號標出.
為了研究3D-HoVAIF 描述子與磺胺類藥物pKa 值的內在聯系,本文使用三維全息原子場作用矢量165 個描述子進行逐步回歸 (Stepwise Multiple Regression,SMR),選出顯著性變量,分別采用多元線性回歸(Multiple Lines Regression,MLR)和偏最小二乘回歸 (Partial Least Square Regression,PLS)進行建模. 并采用留一法交互檢驗對模型的穩定性和預測能力進行評估.
2.2.1 多元線性回歸
在多元線性回歸過程中,為了消除變量間偶然相關的影響,剔除影響模型穩定性的自變量,使回歸方程始終顯著,需要在多元回歸分析中引入逐步回歸的方法. 本文采用SPSS 統計學軟件對變量進行逐步回歸分析,得到如下方程:

其中,E 表示靜電作用. 如,E5-9表示第5 類N 原子與第9 類S 原子的靜電作用項,即sp3雜化的N原子與sp2雜化的S 原子之間的靜電作用;E8-8表示第8 類S 原子與第8 類S 原子的靜電作用項,即sp3雜化的S 原子與sp3雜化的S 原子之間的靜電作用;以此類推. 根據本實驗建立的模型能夠看出,sp3雜化的N 原子與sp2雜化的S 原子之間的靜電作用對磺胺類藥物的pKa 影響較大,且呈負相關. 使用上述模型對31 個磺胺類化合物的pKa值進行估計與預測,并將計算結果與實驗值相關情況繪于圖1 中.
2.2.2 偏最小二乘回歸
為了檢驗模型的穩定性,繼而用偏最小二乘回歸方法進行建模. 為保證變量單位空間尺度一致,首先采用自定標法對原始變量標準化處理,隨后用化學計量學軟件Simca -p10.0 對訓練集樣本建模,并以交叉檢驗最高值(交叉檢驗Y 的解釋方差)所對應的主成分數2 作為模型的復雜程度. 由4 個變量提取2 個主成分解釋了Y 變量89.6%方差,交叉檢驗解釋Y 的方差為78.3%,其結果見表2. 同時將pKa 值實驗值與預測值對比結果繪于圖1 中. 從圖1 和表2 可見PLS 計算結果與多元線性回歸結果基本吻合,說明所選模型具有較好的穩定性和預測能力.

圖1 pKa 實驗值與預測值相關Fig.1 Plot of calculated value and experimental value
文獻1 運用啟發式方法(HM)和基因表達式編程(GEP)方法建立了磺胺類藥物pKa 值預測模型,為了便于比較將其結果與本文基于3D -HoVAIF 描述子建模的相關數據列表2.

表2 磺胺類藥物pKa 值QSPR 模型比較Table 2 Contrast of QSPR models for pKa values of sulfonamides
從表2 可看出,采用3D-HoVAIF 所建模型和文獻2 建模所得相關系數和交互檢驗復相關系數相當,但3D-HoVAIF 計算簡便,結構參數的取值完全來自分子本身的結構,描述子的物理意義明確且所建的線性模型可以識別和提供對這些化合物的pKa 值起作用的描述符.
研究結果表明了靜電作用是影響磺胺類藥物pKa 值的主要因素,尤其是sp3雜化的N 原子與sp2雜化的S 原子之間的靜電作用對磺胺類藥物的pKa 值影響較大,且呈負相關. 同時從本文的結果看出3D-HoVAIF 能夠較好地表征磺胺類藥物分子的結構信息,具有計算簡便、物理意義明確的優點,并且避免了當今大多3D 分子設計技術在應用前需要對分子進行疊合操作等方面缺點,將其應用在其他抗癌藥物活性[7-10]研究方面也取得了一定的效果,顯示出3D-HoVAIF 較為廣闊的應用前景.
[1] He J H,Qiu J R,He D C,et al. Environmental behavior and related control technologies of sulfonamides[J]. Guangdong Agri. Sci.,2012,7:225(in Chinese)[何金華,丘錦榮,賀德春,等. 磺胺類藥物的環境行為及其控制技術研究進展[J]. 廣東農業科學,2012,7:225][2] Li Y Q,Si H Z,Xiao Y L,et al. Quantitative structure activity relationship models based on heuristic method and gene expression programming for the prediction of the pKa values of sulfa drugs[J]. Acta Pharm. Sin.,2009,44(5):486(in Chinese)[李玉琴,司宏宗,肖玉良,等.基于啟發式和基因表達式編程法預測磺胺類藥物的pKa 值[J]. 藥學學報,2009,44 (5):486]
[3] Zhou P,Tian F F,Li Z L. Three dimensional holographic vector of atomic interaction field(3D - HoVAIF)[J]. Chem. Intell. Lab. Syst.,2007,87:88.
[4] Tong J B,Zhou P,Zhang S W,et al. QSAR studies of anti-HIV drug HEPT using (3D -HoVAIF)[J].Acta Phys. Chim. Sin.,2006,22:721(in Chinese)[仝建波,周鵬,張生萬,等.三維全息原子場作用矢量用于HEPT 類抗艾滋病藥物的QSAR 研究[J].物理化學學報,2006,22:721]
[5] Zhou P,Mei H,Tian F F,et al. Applying novel three dimensional holographic vector of atomic interaction field to QSAR studies for several classical drug systems[J]. Chem. J. Chin. Univ.,2007,28(6):1027(in Chinese)[周鵬,梅虎,田菲菲,等. 新型三維原子場全息相互作用矢量用于幾類典型藥物體系的QSAR 研究[J]. 高等學校化學學報,2007,28(6):1027]
[6] Li M P,Zhang S W. QSAR studies of 5'-methylthioadenosine nucleosidase inhibitors using three -dimensional holographic vector of atomic interaction field[J]. J. Anal. Sci.,2011,27(5):566 (in Chinese)[李美萍,張生萬. 三維全息原子場作用矢量用于5' -甲硫腺苷核苷酶抑制劑的QSAR 研究[J]. 分析科學學報,2011,27(5):566]
[7] Tong J B,Wang P,Li Y F,et al. Quantitative structure activity relationship studies of 5 -pheny-1 -phebylamino-1H - imidazole of Anti - HIV drug using three-dimensional descriptors[J]. J.At.Mol.Phys.,2011,28(1):41(in Chinese)[仝建波,王平,李云飛,等. 咪唑衍生物類抗艾滋病藥物3D -QSSR 研究[J]. 原子與分子物理學報,2011,28(1):41]
[8] Tong J B,Chen Y,Che T,et al. Quantitative structure activity relationship studies of anti - tuberculosis drug using three - dimensional structure descriptors[J]. J. At. Mol. Phys.,2012,29(3):382(in Chinese)[仝建波,陳洋,車挺,等. 酰肼類抗結核病藥物的3D - QSAR 研究[J]. 原子與分子物理學報,2012,29(3):382]
[9] Xu L N,Liang G Z,Li Z L,et al. Three-dimensional holographic vector of atomic interaction field for quantitative structure - activity relationship of Aza -bioisosteres of anthrapyrazoles (Aza - APs)[J]. J.Mol. Graph. Model.,2008,26:1252.
[10] Zhu W P,Liang G Z,Liao L M,et al. Chemical structural characterization and design of influenza neuram inidase inhibitors using three - dimensional holographic vector of atomic interaction field through quantitative structure-activity relationship studies[J]. Chinese J.Anal.Chem.,2008,36(6):799(in Chinese)[朱萬平,梁桂兆,廖立敏,等. 三維全息原子場作用矢量(3D-HoVAIF)用于神經氨酸酶抑制劑的結構表征與設計及定量構效關系(QSAR)研究[J]. 分析化學,2008,36(6):799]