999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于MLP-ANN和SVM方法的多氯代二苯并呋喃光解半衰期QSPR比較研究

2020-11-13 08:46:16于海英李美萍郝俊生
生態毒理學報 2020年4期
關鍵詞:方法模型

于海英,李美萍,郝俊生

1. 山西大學化學化工學院,太原 030006 2. 山西大學生命科學學院,太原 030006

多氯代二苯并呋喃(polychlorinated dibenzofurans, PCDFs)屬二惡英(PCDD/Fs)類化合物,是一種典型的持久性有機污染物(POPs),也是首批列入《斯德哥爾摩公約》的12種POPs之一,具有較強的穩定性,在自然條件下很難發生生物和化學降解,光降解是其在環境中轉化的主要途徑[1-5]。植物表面光解過程對于有機污染物從大氣到食物鏈的遷移有重要的影響。PCDD/Fs在植物表面上的光解主要發生在植物葉面角質層中,其中,光解半衰期(t1/2)對于考察此類污染物的環境行為并進行環境風險評價有重要的意義。由于氯原子的取代數目和取代位置的不同,PCDFs共有135種分子結構。實驗測定PCDD/Fs的光解半衰期需要特殊設備,消耗大量的時間和財力,因此,發展PCDD/Fs光解行為的定量結構-性質關系模型十分必要。研究表明,定量結構-性質關系(quantitative structure-property relationship, QSPR)[6-9]在預測化合物生物性質方面已成為化學、環境等學科的一個重要方法。Chen等[10-11]采用量子化學參數分別對PCDD/Fs在水和乙腈中的光量子產率以及櫻桃樹葉表面的光降解速率進行了QSPR研究;王蕾等[12]采用電性拓撲指數對PCDFs在云杉針葉和飛灰表面的光解半衰期進行了QSPR模擬分析;Niu等[3-4,13]和牛軍峰等[14]先后采用量子化學參數應用遺傳算法對PCDD/Fs在云杉針葉和飛灰表面的光降解行為進行了QSPR研究,趙繼穎等[15]采用分子空間坐標參數對PCDFs在云杉針葉和飛灰表面的光降解行為進行了QSPR研究,這些分析結果都從不同方面揭示了影響PCDFs光解速率的因素,但存在有些參數較抽象或者所建模型用的參數較多,本文在課題組前期研究的基礎上[16],以具有明確物理-化學意義的分子電性距離矢量(MEDV)描述子[17]為自變量,應用多層感知器神經網絡(MLP-ANN)和支持向量機(SVM)建模方法對PCDFs在云杉針葉和飛灰表面的光解半衰期(t1/2)進行定量構效關系分析,建立了具有較強預測能力和穩定性的QSPR模型,有助于對PCDD/Fs光解機理的研究。

1 數據來源(Data source)

2,3,7,8-PCDF的結構如圖1所示,當氯在不同的取代位置時,就得到不同的PCDFs。云杉針葉表面和飛灰表面的48個PCDF的光解半衰期值取自文獻[16],在此用光解半衰期的對數值(lgt1/2)進行QSPR建模分析。

圖1 2,3,7,8-PCDF結構圖Fig. 1 The generic structure of 2,3,7,8-PCDF

2 研究方法(Research method)

2.1 MEDV的計算

48個PCDF的10個MEDV描述子按文獻[17]計算,其原理已有詳細介紹,在此不再贅述。由于PCDFs分子中不含有第四類型的原子,所以M14、M24、M34和M44均為零向量,剩余向量依次為M11、M12、M13、M22、M23和M33,48個PCDF的MEDV描述子及其光解半衰期(lgt1/2)詳見文獻[1]。

為深入研究PCDFs的6個MEDV與光解半衰期的QSPR隱含關系,使用MLP-ANN和SVM建立模型。

2.2 基于MEDV的QSPR預測模型

基于MEDV計算方法和高維非線性模型人工神經網絡(ANN)和SVM,提出一種基于MEDV的QSPR預測模型用于描述分析PCDFs的6個MEDV與光解半衰期的QSPR的高維非線性關系,具體步驟如下。

輸出:yi(i=43,…,47)的估計結果f(xi)。

第二步:依據平均絕對誤差(MAE)最小的原則分別最優化模型y1=f1(x)和y2=f2(x)中的參數。

第三步:將測試集輸入向量xi(i=43,…,47)輸入以上訓練好的模型y1=f1(x)和y2=f2(x),得到QSPR的預測結果f(xi)(i=43,…,47)。

ANN及SVM模型的具體構建過程為:

(1) MLP-ANN

ANN是一種通過模擬生物神經信號處理系統發展起來的機器學習方法,廣泛用于模式識別、函數擬合、過程控制和圖形映射等領域。多層感知器(MLP)是一種前向結構的人工神經網絡,映射一組輸入向量到另一組輸出向量。MLP可以被看做是一個有向圖,由多個節點層組成,每一層全連接到下一層。除了輸入節點,每個節點都是一個帶有非線性激活函數的神經元(或稱處理單元)。MLP已被證明是一種通用的函數近似方法,可以被用來擬合復雜的函數,或解決分類問題[18-21]。該建模過程的技術框架如圖2所示,主要用Weka完成。

(2) SVM

SVM是一種以VC維(Vapnik-Chervonenkis dimension)理論、SRM(structural risk minimization)準則為基礎建立的機器學習方法。主要用途是按監督學習對樣本進行分類,適用于非線性、小樣本和高維度等問題,可以有效避免“過度協調”。同時,與傳統的機器學習方法相比,該方法具有較強的魯棒性,特別適合分類、時間序列預測等[22-23]。

在支持向量回歸(support vector regression, SVR)中,學習機(learning machine)將處于低維空間的數據投射到高維特征空間,然后,在高維特征空間里,超平面(包含松弛變量)可以在訓練數據和輸出數據之間形成非線性關系,稱為SVR函數,也可以表示為凸優化問題:

(1)

(2)

式中:b表示超平面截距。

本文分別用線性Linear、多項式poly、徑向基RBF、sigmoid核函數進行SVM建模,發現poly核函數建模結果較優。

圖2 Weka建模Fig. 2 Weka modeling

3 結果與討論(Results and discussion)

為尋找影響PCDFs對光解半衰期與各參數之間的QSPR關系,將全部樣本分為2個組,云杉針葉表面37個樣本作訓練集(training set),飛灰表面42個樣本作訓練集,兩者均選取5個相同的樣本作為測試集(test set),且測試集選取方法相同,即在全部樣本的每種取代物中隨機選取一個樣本作為測試集,選取方法同文獻[1]。訓練集樣本用于建立QSPR模型,測試集樣本用于檢驗QSPR模型的預測能力。它們的建模結果如下。

3.1 MLP-ANN模型擬合結果

MLP-ANN模型對訓練集樣本擬合結果及對測試集樣本預測值的相關統計參數如表1和圖3所示。

圖3 多層感知器神經網絡(MLP-ANN)模型中PCDFs在云杉針葉(a)和飛灰(b)表面光解半衰期預測值與實驗值的相關性Fig. 3 Correlation between predicted value and experimental value of PCDFs photolysis half-life on the surface of spruce needles (a) and fly ash (b) by multi-layer perceptron-artificial neural network (MLP-ANN)

由圖3和表1可知,用MLP-ANN方法分別對PCDFs訓練集和測試集進行擬合,得到光解半衰期的MAE分別為0.0290、0.0994(云杉針葉)和0.0387、0.0464(飛灰表面),其均方根誤差(RMSE)分別為0.0381、0.1199(云杉針葉)和0.0464、0.0518(飛灰表面),由此說明,MLP-ANN模型優于文獻[15-16]的線性模型,這可能是由于MLP-ANN模型所選描述子基本與PCDFs光解半衰期呈非線性關系,MLP-ANN法使其擬合精度進一步提高。

3.2 SVM模型擬合結果

SVM模型對訓練集樣本擬合結果及對測試集樣本預測值的相關統計參數如表1和圖4所示。

圖4 支持向量機(SVM)模型中PCDFs在云杉針葉(a)和飛灰(b)表面光解半衰期預測值與實驗值的相關性Fig. 4 Correlation between predicted value and experimental value of PCDFs photolysis half-life on the surface of spruce needles and fly ash by support vector machine (SVM)

表1 本工作與文獻的比較Table 1 Comparison between this work andsome literature

由圖4和表1可知,用SVM方法分別對PCDFs訓練集和測試集進行擬合,得到光解半衰期的MAE分別為0.0329、0.0794(云杉針葉)和0.0400、0.0531(飛灰表面),RMSE分別為0.0444、0.0954(云杉針葉)和0.0395、0.0507(飛灰表面),SVM模型優于文獻[15-16]的線性模型,原因可能是SVM模型所選描述子MEDV基本與PCDFs光解半衰期呈非線性關系,且SVM建模方法更適合其相關性。

3.3 模型評價

采用MAE、RMSE和決定系數(R2),以留一法交互檢驗相關系數(RLOO)以及外部樣本相關系數(Qext)對各模型的預測精度進行了評價,其相應的計算公式如式(3)、(4)、(5)和(6)所示。

(3)

(4)

(5)

(6)

MAE和RMSE值越低,表示模型的預測誤差越小,預測結果越優。R2的值表示所解釋的ESS在TSS中的比例,該值介于0和1之間。R2的值越大,則擬合效果越好,R2同時也可作為回歸方程擬合優度的度量指標。以交互檢驗的R2為標準判斷所建模型的穩定性和內部預測能力,Qext評價模型對外部樣本的預測能力,RLOO和Qext越接近,表明所建模型的預測結果好,亦即說明該模型并非是偶然相關得到的,進一步說明所建模型的泛化能力較好。

3.4 與文獻的比較

本研究與文獻比較,評價指標更為全面。與文獻[16]相比可以看出,同樣使用MEDV描述子,本文采用非線性方法建立的模型更加穩定,外部預測能力也優于文獻。與文獻[15]相比,所用描述子數量少,建模結果和文獻相當。文獻[12]和[14]中,雖建模相關系數優于本工作,但未將模型進行外部檢驗。為便于理解,表1列出了本文與文獻模型的比較。

綜上所述,對PCDFs類化合物采用非線性方法建立其光解半衰期的QSPR模型,所建模型穩健且預測能力強。與線性方法相比,本文采用的非線性方法擬合精度更好,適合處理復雜的非線性問題。但若要提供PCDFs類化合物對光解半衰期的影響因素及其機理,筆者認為線性模型是較好的選擇。同時,MEDV不僅能反映分子的大小、形狀等整體,蘊含有化合物豐富的結構信息,能很好地區分化合物的結構,同時其計算簡單,取值完全來自分子本身的結構,不需要加入任何經驗性的性質參數或校正參數,較為客觀。同時,大量文獻也表明,MEDV能用于多種化合物結構參數的表征。運用QSPR方法為環境中POPs光降解行為的研究提供了一種便捷的評價方法。后期可以考慮將本文的非線性方法應用于其他類型化合物的環境中分配行為與其結構之間的關系分析。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲天堂网在线播放| 国产黄在线免费观看| 四虎国产永久在线观看| 亚洲第一福利视频导航| 欧美性猛交xxxx乱大交极品| 91精品啪在线观看国产| 亚洲欧美日韩另类在线一| 亚洲综合一区国产精品| 亚洲最大在线观看| 国模私拍一区二区三区| 成人在线观看不卡| 东京热高清无码精品| 999国内精品久久免费视频| 亚洲午夜片| 亚洲综合片| 任我操在线视频| 国产毛片片精品天天看视频| 韩国v欧美v亚洲v日本v| 国产91色| 婷婷丁香在线观看| 欧美高清三区| 视频一本大道香蕉久在线播放| 内射人妻无码色AV天堂| 色婷婷成人| 国产玖玖玖精品视频| 高清无码手机在线观看| 2021国产精品自拍| 久久黄色小视频| 久久久久国产精品熟女影院| 午夜毛片福利| 一本视频精品中文字幕| 欧美日韩中文国产va另类| 91精品情国产情侣高潮对白蜜| 婷婷色一二三区波多野衣| 无码精品国产VA在线观看DVD| 欧美一区中文字幕| 亚洲91精品视频| 日韩精品成人在线| 国产麻豆永久视频| 国产91精品最新在线播放| 亚洲第一成年免费网站| AV不卡无码免费一区二区三区| 亚洲第一成年免费网站| 国产在线一区视频| 欧美日韩一区二区在线播放| 国产一区二区精品高清在线观看| 91色国产在线| 啪啪永久免费av| 免费在线视频a| 亚洲综合经典在线一区二区| 永久免费精品视频| 高清码无在线看| 波多野结衣第一页| 色精品视频| 国产网友愉拍精品| 午夜小视频在线| 最新精品国偷自产在线| 亚洲精品麻豆| 美女扒开下面流白浆在线试听| 特级做a爰片毛片免费69| 香蕉蕉亚亚洲aav综合| 一级高清毛片免费a级高清毛片| 91免费精品国偷自产在线在线| 99免费在线观看视频| 国产成人免费视频精品一区二区| 97人人模人人爽人人喊小说| 波多野结衣无码AV在线| 中国一级特黄视频| 麻豆AV网站免费进入| 秋霞一区二区三区| 亚洲v日韩v欧美在线观看| 国产在线精品人成导航| 国产精品福利一区二区久久| 午夜啪啪网| 中文国产成人久久精品小说| 亚洲午夜福利在线| 狠狠色婷婷丁香综合久久韩国| 伊人色综合久久天天| 久久99久久无码毛片一区二区 | 99精品国产高清一区二区| 8090成人午夜精品| 91网址在线播放|