堵錫華,宋 明,李 靖,吳 瓊,陳 艷,石春玲
(徐州工程學院 化學化工學院, 江蘇 徐州 221018)
喹諾酮類衍生物屬于人工合成抗菌藥物,其中一部分甚至具有一定的抗腫瘤活性,能直接有效作用于細菌拓撲異構酶,對DNA旋轉酶起到抑制阻礙作用,從而導致細菌DNA不可逆的破壞,迅速達到抗菌殺菌、抗腫瘤的作用[1],正是由于喹諾酮具有廣譜抗菌、抗菌力強、療效顯著等優勢,目前被廣泛應用于人類和動物多種感染性疾病的治療,但該類藥物對人的中樞神經系統、消化系統、肌肉或骨骼等有一定毒性,對食用者健康會造成一定的危害[2],故為了提高該藥物的使用效率,避免濫用誤用,目前對該類藥物的合成、分析檢測、藥理和臨床合理應用等研究越來越受到研究工作者的重視。高留州等人[3]用芳腙類作為環丙沙星C-7哌嗪基的等排體,設計合成了15個喹諾酮羧酸類化合物,并對其抗菌抗腫瘤活性進行了分析研究,取得了令人滿意的結果;楊家強等人[4]通過喹諾酮化合物與α-羥基膦酸酯拼合,設計合成了8個喹諾酮羧酸酯衍生物,通過測試表明,該類衍生物對腫瘤細胞有一定抑制作用;李鳳麗[5]針對采用喹諾酮類抗菌藥物與用其他藥物進行治療同樣病癥的患者進行了分析和對比,并對喹諾酮類抗菌藥物具有的藥理作用進行了評價,研究了在臨床上的合理應用及其安全性。此外測定環境中殘留此類藥物的研究成果也較多[6-8]。但是,所有這些研究方法均需通過大量的實驗,不但費時耗力,而且研究過程較長。為此,近年來利用計算機輔助藥物設計的定量構效關系(QSAR)方法[9]對喹諾酮類衍生物進行研究逐漸受到重視,并有少量的相關研究成果[10-11],而利用神經網絡法對喹諾酮類衍生物研究卻較少。
神經網絡是一個集計算機科學、化學、環境科學、建筑學、農學、食品科學等眾多學科的一種前沿方法,具有交叉性,該方法在諸多領域已有廣泛應用[12-14]。根據以前工作[15-17]基礎,對48個喹諾酮羧酸衍生物的活性pIC50[11],按照文獻方法[18-19]自編計算程序,計算了電性拓撲狀態指數和電性距離矢量兩類分子結構參數,用最佳變量子集回歸法篩選了電性拓撲狀態指數的E1和E8,電性距離矢量的M26,M32,M36和M81,共6種結構參數作為神經網絡輸入層神經元,將衍生物的活性作為輸出層神經元,得到預測喹諾酮羧酸衍生物活性的神經網絡QSAR模型,其總相關系數R=0.992 5,計算得到的活性預測值與文獻實驗值高度吻合,相對平均誤差僅為0.87%。本研究解決了對新型藥物需要進行大量實驗費時耗資耗力、并需漫長等待的缺陷,具有預測精度高、快速簡便的優點,而且利用模型可以設計活性高、毒性低的新型抗菌抗腫瘤藥物分子,故在藥物分子設計方面具有重要的現實意義。
喹諾酮羧酸衍生物母環結構見圖1,48種喹諾酮羧酸衍生物分子相應基團見表1,活性數據pIC50(IC50的負對數)來源于前期研究[11]。
這48種喹諾酮羧酸衍生物分子的活性數據采用數據庫文獻中的相關數據,以pIC50作為分子的活性標度(IC50為達到50%抑制效果時抑制劑的濃度),使用Topomer CoMFA技術,對系列喹諾酮羧酸類衍生物進行三維構效關系的計算理論研究,建立了預測模型并進行了分子設計,取得了較好的結果。

圖1 喹諾酮羧酸衍生物的母體結構Fig.1 The matrix structure of quinolone carboxylic acid derivatives

化合物編號R1R2R3R4/R6化合物編號R1R2R5 R7 R8/R9 A1----D27ClClH F H B2HHHH28ClClF H H 3HClHH29ClClH H F 4ClHHH30ClClOMe H H 5FHHH31ClClCl H H 6MeHHH32ClClMe H H 7OMeHHH33ClClCF3 H H 8CF3HHH34ClCl CN HH 9ClHHCl35FCl OMe HH 10HClHClE36-- H -(S)-Me 11ClClHH37-- H -(R)-Me C12HH-Me38-- H -(S)-Et 13ClCl-Me39--H -(S)-Pr 14ClCl-Et40-- H -(S)-iPr 15ClCl-Pr41--H -(S)-tBu 16ClCl-iPr42-- H -(S)-Cyclohexyl 17ClCl-Bu43--H -(S)-ph 18ClCl-CH2CO2H44-- OMe -(S)-Pr 19ClCl-CH2CH2CO2H45-- OMe -(S)-iPr 20ClCl-CH2CONH246--OMe -(R)-iPr 21ClCl-CH2CH2CONH247--OMe -(S)-tBu 22ClCl-CH2CH2NH248--OMe -(S)-Cyclohexyl 23ClCl-CH2CH2OH24ClCl-CH2CH2CH2OH25ClF-CH2CH2OH26FCl-CH2CH2OH
采用Chemoffice Chem3D畫圖軟件,繪制前期研究[11]中所列48種喹諾酮羧酸衍生物的分子結構,根據Hall和Kier[20-21]提出的電性拓撲狀態指數,劉樹深等人[22]提出的電性距離矢量的定義方法,在Matlab中調用畫好的結構,計算得到電性拓撲狀態指數的46個、電性距離矢量的91個,兩類結構參數共137個,去除兩類137個參數中全部為0的數組,剩余的數組用最佳變量子集回歸方法優化篩選,所得結果見表2。

表2 pIC50與參數的最佳變量子集回歸結果Tab.2 The results of parameters and pIC50 of quinolone carboxylic acid derivatives with best subsets regression
表中R,Radj2,R2,S,F,FIT分別為相關系數、調整的判定系數、決定系數、Fischer檢驗值、標準誤差、Kubinyi函數
表2中FIT的計算方程式[23]為

(1)
式(1)中n為喹諾酮羧酸衍生物分子的個數,b為建立模型使用的變量數,R2為建立模型的決定系數。
當選擇兩類結構參數中的E1,E8,M26,M32,M36,M81共6個參數時,活性pIC50與結構參數之間的相關性最好、標準誤差也最小,這48種喹諾酮羧酸衍生物的結構參數如表3。

表3 喹諾酮羧酸衍生物的6種結構參數Tab.3 Six structural parameters of quinolone carboxylic acid derivatives
續表3

No.E1 E8 M26M32M36M81pIC50 Exp.Pre.Err.15 2.000-1.2185.7205.6476.8580.7857.267.330.91 16 3.879-1.2274.9754.7066.7670.7847.597.48-1.41 17 2.065-1.2135.8565.9376.8880.7907.197.210.29 18 0-2.5604.310-7.2976.5401.1597.507.500.02 19 0-2.3794.861-5.8286.6321.1037.427.420.02 20 0-2.0194.453-2.1546.5711.0417.467.42-0.60 21 0-1.8484.964-0.9026.6581.0036.946.950.21 22 0-1.2585.6195.4516.8330.7846.676.771.45 23 0-1.2995.5286.1126.8110.9217.687.47-2.72 24 0-1.2755.7176.2666.8500.9047.117.201.20 25 0-1.3313.9475.5895.2931.3337.367.390.37 26 0-1.3383.4855.4346.0811.4597.627.690.87 27 0-1.4625.9526.31412.0214.5877.087.090.19 28 0-1.3915.5775.96010.1342.8777.607.610.11 290-1.4195.7066.02310.3983.6337.477.45-0.31 301.504-1.3257.4967.1547.0750.9347.927.89-0.37 310-1.3317.6327.22610.5581.8547.377.36-0.16 321.909-1.2987.3647.0727.0710.9307.397.400.20 330-1.5206.3316.02114.4575.5566.176.15-0.25 340-1.3593.4773.8105.9770.8997.307.330.42 351.444-1.3645.2406.4526.5021.4848.057.99-0.78 361.713-1.3413.1014.3596.0191.4737.837.68-1.94 371.713-1.3413.1014.3596.0191.4737.427.683.48 381.863-1.3343.4895.3816.1031.4888.058.03-0.31 391.961-1.3293.6445.7746.1501.4998.098.090.06 403.809-1.3363.5284.8036.0531.4988.097.99-1.29 415.776-1.3403.3875.1936.0681.5068.228.321.16 420-1.3084.2447.3836.3551.5368.258.260.12 430-1.3602.2504.5535.9681.5078.017.95-0.76 443.409-1.3555.4296.7936.5761.5258.248.300.71 455.233-1.3625.2565.7956.4741.5248.147.93-2.54 465.233-1.3625.2565.7956.4741.5247.847.931.19 477.184-1.3665.1116.2026.4901.5328.248.250.09 481.484-1.3346.1508.4336.7911.5628.178.200.36
將48種喹諾酮羧酸衍生物的抑制活性pIC50,與優化篩選得到的6種結構參數E1,E8,M26,M32,M36和M81進行線性回歸分析,得到方程為
pIC50=0.141E1-4.832E8-0.487M26+0.482M32+0.361M36-0.890M81-0.582
(2)
利用式(2)對喹諾酮羧酸衍生物的活性值進行預測,所得預測值與實驗值之間的相對平均誤差為2.69%,可以看出,多元回歸模型的預測誤差稍大。

為檢驗是否存在“離域”的異常數據,可使用形象直觀的雷達圖定性評價,對以上建立的預測喹諾酮羧酸衍生物活性的48個模型Jackknifed相關系數R作雷達圖(見圖2),以檢驗的R值0.925作為圓心,相隔0.005為間距,48個模型的Jackknifed相關系數R值全部落在0.925~0.960之間,波動性很小,只有剔除33號分子所得模型的相關系數為0.959稍大外,其他模型的R值基本在0.944左右,說明這里所建構的模型不存在“異常離域數據”。

圖2 Jackknifed相關系數R的雷達圖Fig.2 Radar map of Jackknifed correlation coefficent R
用膨脹系數(VIF)來檢驗模型中各變量的相關程度,VIF定義為:VIF=1/(1-R2),這里的R為方程中某一個自變量與其他變量之間的相關系數,當VIF>10,則表示方程不穩定,這里計算得到的VIF 值分別為1,10,5,10,9,5,基本滿足要求。

表4 Jackknifed R的檢驗Tab.4 Inspection of jackknifed R
為提高預測喹諾酮羧酸類衍生物活性的預測精度,結合BP神經網絡法更深入研究。將多元回歸建模分析中篩選的E1,E8,M26,M32,M36和M81共6個參數作為神經網絡的輸入層神經元,將48種喹諾酮羧酸衍生物活性作為輸出層節點,綜合Andrea[25]及許祿等[26]學者對隱含層節點取值的建議規則可得
2.2>n/M≥1.4
(3)
式中:n為樣本的分子個數,M為神經網絡的總權重,M的取值為
M=(L+1)×Y+(Y+1)C
(4)
式(4)中,L,Y,C分別為神經網絡中輸入層節點、隱含層節點及輸出層節點。這里6個結構參數作為輸入層節點L=6; 喹諾酮羧酸衍生物活性作為輸出層神經元C=1; 根據式(3)和式(4)計算得到隱含層節點Y可取3或4,經測試,當Y取4時,所得結果更優,因此網絡結構采用6-4-1方式。將樣本分為三個組別:第一組為訓練集,選擇每5個數據中的第1,3,5個數據;第二組為測試集,選擇每5個數據中的第2個;第三組為驗證集,選擇每5個數據中的第4個。在Matlab環境運行中計算得到預測喹諾酮羧酸衍生物活性的神經網絡模型的總相關系數為0.992 5,訓練集、測試集和驗證集的相關系數分別為R1=0.990 0,R2=0.995 8,R3=0.997 9,利用該模型預測的喹諾酮羧酸衍生物活性值與實驗值較為吻合,平均相對誤差只有0.87%,該誤差比使用多元回歸法模型的平均相對誤差2.69%明顯要小,將兩種方法所得預測值與實驗值作關系圖(見圖3和圖4),可以看出,神經網絡法的預測精度明顯優于多元回歸法。神經網絡模型的權重和偏置見表5。

表5 神經網絡模型的權重和偏置Tab.5 Weights and bias of neural network model

圖3 神經網絡法預測值和實驗值關系圖Fig.3 Relationship between prediction value and experimental value by neural network method

圖4 多元回歸法預測值和實驗值關系圖Fig.4 Relationship between prediction value and experimental value by multivariate regressive method
