堵錫華,陳艷,宋明,田林,徐艷
徐州工程學院材料與化學工程學院,徐州 221018
肉桂酸是從肉桂皮分離出的一種天然有機酸,有微量的桂皮氣味,安全無毒[1],它不但具有抗腫瘤、抗炎及抗氧化作用[2-3],還具有良好的抑菌和保鮮作用,故常被用作食品添加劑[4-5],由于它具有抑制過氧化物酶的生物活性并誘導類脂的過氧化作用[6],能抑制形成黑色酪氨酸酶、可隔絕紫外線,故又常用于高級防曬霜的生產;此外它還用于香精香料、醫藥、農藥以及有機合成等工業生產行業[7-8]。鹵代肉桂酸則是基于肉桂酸得到一種鹵代芳烴化合物,由于具有類似的特性,故也廣泛應用于醫藥、化妝品和農藥等生產行業[9],隨著近年來該化合物使用量的增加,對環境造成的影響也越來越為嚴重。
藻類是水生生態系統的初級生物,它維持著水生生態系統結構和功能的穩定[10],羊角月牙藻是淡水水體中常見的一種藻類,因其細胞特征明顯而且易于培養[11],對污染脅迫敏感性很強,故常常用作水生生態毒理研究的一種重要的指示生物[12]。
定量結構-活性關系(quantitative structure-activity relationship, QSAR)研究最初是應用于藥物設計中的一種方法[13-14],近年來該法在化學[15]、環境科學[16]和毒理學[17]等領域得到推廣應用。由于目前對鹵代肉桂酸的相關研究并不多見,特別是利用神經網絡方法對鹵代肉桂酸相關急性毒性的QSAR研究未見有報道,故筆者在前期研究[18-19]基礎上,根據文獻[9]檢測分析鹵代肉桂酸對羊角月牙藻急性毒性半數效應濃度(EC50)值,利用計算應用程序軟件,計算了14種鹵代肉桂酸化合物分子的4類分子結構參數,并篩選了其中2種參數,構建了用于預測鹵代肉桂酸對羊角月牙藻急性毒性的神經網絡模型,本研究對評估鹵代肉桂酸殘留的生物毒性及其生態風險具有指導意義。
李敏等[9]選擇了14種鹵代肉桂酸,測定了這些化合物對羊角月牙藻急性毒性的72 h-EC50值,鹵代肉桂酸(序號1~14)的分子結構及其對羊角月牙藻的EC50實驗值列于表1中。

表1 鹵代肉桂酸的分子結構參數及其毒性Table 1 Molecular structure parameter and toxicity of halogenated cinnamic acid
根據表1中所列的序號為1~14共14種鹵代肉桂酸的分子結構,應用Chemoffice2005畫圖軟件勾畫這些分子的3D分子結構圖,利用MATLAB自編程序[20]相關軟件,計算了分子連接性指數、分子形狀指數、電性拓撲狀態指數和電性距離矢量4類分子結構參數,按照分子樣本總數/變量數需>5這一規則[21],經過反復分析試驗,發現只有選用電性拓撲狀態指數(E13)和電性距離矢量(M15)這2個結構參數時,所得回歸分析結果相對最好,故這里選用E13和M15作為建立模型的自變量,相關數據也列于表1中。
將選擇的E13和M15這2個結構參數作為自變量,將鹵代肉桂酸對羊角月牙藻的急性毒性值(72 h-EC50)作為因變量,進行多元回歸分析,得到對羊角月牙藻毒性預測的多元回歸方程為:
EC50=1267.772E13-32.493M15-9962.357
(1)

神經網絡方法是集計算機技術、統計學方法和化學技術等多學科交叉又較為前沿的一種研究方法,它能模擬生物神經網絡行為特征,進行分布式并行信息處理,具有強大的非線性映射能力,該法在眾多學科領域得到了廣泛的應用[22-26]。由于前述多元線性回歸法預測結果并不理想,這里進一步采用神經網絡非線性方法對鹵代肉桂酸對羊角月牙藻毒性進行研究。將式(1)多元回歸模型中的E13和M15作為神經網絡法中的輸入層參數,14種鹵代肉桂酸化合物對羊角月牙藻急性毒性作為輸出層參數,綜合許祿[27]和Andrea等[28]建議規則,得出下式:
2.2>n/[(Si+2)Y+1]≥1.4
(2)
式中:n、Si和Y分別為樣本總數、神經網絡輸入層參數和隱含層參數。根據該式計算得到Y應取2,為此神經網絡結構采用2-2-1的結構方式。為防止建模過程中有過擬合現象,將14個鹵代肉桂酸分子隨機分為3組:取每5個分子的第1、3、5個分子作為訓練集、第2個分子作為測試集、第4個分子作為驗證集,將本法建立的神經網絡模型計算得到的EC50預測值也列入表1中,神經網絡模型的權重與偏置相關數據列于表2中。

表2 BP-ANN模型的權重和偏置Table 2 Weights and bias of BP-ANN model
通過計算14個鹵代肉桂酸的4類分子結構參數,篩選了其中E13和M15這2種指數,與這些化合物分子對羊角月牙藻急性毒性進行相關性分析,建立的多元回歸模型的相關系數為0.911,根據該模型得到的預測值與實驗值的相對平均誤差為7.16%,而在此基礎上建立預測毒性的神經網絡法模型,模型的總相關系數R總=0.951,訓練集R訓練=0.956、測試集R測試=0.996、驗證集R驗證=0.999,從這些相關系數可以看出,神經網絡非線性模型的相關系數明顯得到提高,利用該模型預測鹵代肉桂酸對羊角月牙藻急性毒性,預測值與文獻實驗值的吻合度較為理想(圖1),兩者的相對平均誤差為4.49%,對相對誤差作控制圖(圖2)可以看出,所有相對誤差均在可控范圍之內,說明預測結果較為可靠,分子結構參數與毒性值之間存在較好的非線性關系,而不是線性關系。對神經網絡法與多元回歸法所得預測誤差進行比較可以看出,神經網絡法的預測誤差值明顯小于多元回歸法的預測誤差值。

圖1 EC50的實驗值(Exp.)與預測值(Pre.)關系Fig. 1 Relationship between experimental (Exp.) and predicted (Pre.) values of EC50

圖2 相對誤差的控制圖注:UCL為控制上限,LCL為控制下限。Fig. 2 Control chart of relative errorNote: UCL stands for upper control limit; LCL stands for lower control limit.
根據建構的神經網絡模型,對另外12種可能結構的鹵代肉桂酸化合物分子(表1中打*的15~26號分子)的EC50進行了預測,所得預測結果也列于表1中。根據表1中1~14號鹵代肉桂酸的分子結構與EC50實驗值的關系可以看出,肉桂酸苯環上連接半徑越大、電負性越小的鹵素原子,其毒性越大,如F的電負性>Cl的電負性>Br的電負性,而半徑大小相反,故連接Br的毒性>Cl>F;如基團相同,則連接在2位的毒性<3位<4位。對照預測的15~26號分子所得毒性值,基本符合該變化規律,說明本法建構的模型具有一定的合理性和應用型,當然這還需要通過實驗來進行確證,故本模型的建構,可以在理論上指導設計低毒性、高活性的類似化合物分子。
綜上所述,本研究表明:
(1)優化篩選電性拓撲狀態指數和電性距離矢量作為分子結構描述子,與鹵代肉桂酸對羊角月牙藻急性毒性具有較好的非線性關系,建構的毒性預測神經網絡模型相關系數達0.951,預測結果明顯優于多元回歸法,說明鹵代肉桂酸的分子結構參數與其對羊角月牙藻急性毒性(EC50)之間具有好的非線性關系,而不是線性關系。
(2)鹵代肉桂酸對羊角月牙藻急性毒性的大小,與其苯環上連接的鹵素基團的原子半徑、電負性大小及基團連接的位置有較大的相關性。