999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量回歸的非線性變量篩選用于酚類化合物QSAR建模的研究

2014-04-29 00:44:03徐鏡善王凱袁哲明
安徽農(nóng)業(yè)科學(xué) 2014年13期

徐鏡善 王凱 袁哲明

摘要 首先基于支持向量回歸(SVR)依均方根誤差最小原則確定最優(yōu)核函數(shù),再以最優(yōu)核函數(shù)為基礎(chǔ),進(jìn)行SVR非線性自變量篩選,最后以所選自變量進(jìn)行建模預(yù)測(cè)。將該方法應(yīng)用于酚類化合物的QSAR研究,最優(yōu)核函數(shù)確定為徑向基核,最終保留自變量為疏水性參數(shù)(lgP)與拓?fù)渲笖?shù)(Am3)。結(jié)果表明:基于SVR進(jìn)行變量篩選能有效地剔除無關(guān)自變量,進(jìn)一步改進(jìn)SVR對(duì)小樣本數(shù)據(jù)的建模預(yù)測(cè)能力。該方法在農(nóng)業(yè)環(huán)境毒性污染物的QSAR研究領(lǐng)域有較廣泛的應(yīng)用前景。

關(guān)鍵詞 支持向量回歸;自變量篩選;定量構(gòu)效關(guān)系;酚類化合物

中圖分類號(hào) S11+1 文獻(xiàn)標(biāo)識(shí)碼

A 文章編號(hào) 0517-6611(2014)13-03799-03

Abstract Firstly,the optimal kernel function was determined in accordance with the minimum root mean square error based on support vector regression (SVR),and then on the basis of the optimal kernel function,the independent variables were screened nonlinearly using SVR.Finally,modeling was conducted on the training set and prediction was performed on the test set using the selected independent variables.The method was applied to QSAR study of phenolic compounds,the optimal kernel function was determined as RBF kernel,the retained independent variables as hydrophobic parameter (lgP) and topological index Am3.The results show that irrelevant variables can be effectively eliminate using SVR to screen variables and prediction ability was further improved for SVR modeling on small sample data,this method has a potential application prospect in the QSAR research field of environmental toxic pollutants of agriculture.

Key words Support vector regression; Independent variable screening; Quantitative structureactivity relationships; Phenol compounds

據(jù)統(tǒng)計(jì),當(dāng)今人類50%的財(cái)富來自于化學(xué)品。隨著工業(yè)的高速發(fā)展,10萬多種化學(xué)制品被投入環(huán)境中。由于人們無限制地生產(chǎn)和濫用化學(xué)制品,一些有毒化學(xué)品必會(huì)被大量投放到環(huán)境中。酚類化合物是有機(jī)化學(xué)工業(yè)的基本原料,被廣泛用于工業(yè)制造如酚醛樹脂、合成纖維、炸藥、農(nóng)藥、石料及染料等[1]。與之相關(guān)的各類工業(yè)廢水、廢氣被大量地排放到生活環(huán)境中,給農(nóng)業(yè)生產(chǎn)、人類生活帶來極大的傷害。所以,正確評(píng)價(jià)酚類化合物等有機(jī)化合物的毒性效應(yīng)是十分必要的。

化合物的分子結(jié)構(gòu)可決定其性質(zhì)。怎樣由化合物的分子結(jié)構(gòu)預(yù)知其性質(zhì),并且確立其結(jié)構(gòu)和性質(zhì)之間定量化關(guān)系是一個(gè)關(guān)鍵問題。定量構(gòu)效關(guān)系[2](Quantitative structure activity relationship,QSAR)是解決這一難題的途徑,可用來預(yù)測(cè)化合物的生物活性。酚類化合物種類繁多且分布廣泛,開展實(shí)地試驗(yàn)費(fèi)力、費(fèi)時(shí),而QSAR方法可以有效地估算這些化合物在環(huán)境中的毒性。

應(yīng)用特征篩選方法選擇包含豐富信息的描述符是定量構(gòu)效關(guān)系研究的重要步驟。常用方法有回歸分析、主成分分析(Principal component analysis,PCA)、逐步判別分析、偏最小二乘法分析(PLS)、遺傳算法(Genetic algorithm,GA)和人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)等[3]。以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ)的支持向量機(jī)(Support vector machine,SVM)基于結(jié)構(gòu)風(fēng)險(xiǎn)最小,較好地解決了局極小、非線性、過學(xué)習(xí)等問題,具有優(yōu)異泛化推廣能力[4-6]。QSAR方法首先利用理論計(jì)算計(jì)算得到化合物分子的結(jié)構(gòu)參數(shù)或理化性質(zhì),再利用這些參數(shù)或性質(zhì)對(duì)化合物進(jìn)行分析,比傳統(tǒng)實(shí)驗(yàn)測(cè)定省時(shí)、省力,甚至能對(duì)一些無法實(shí)驗(yàn)測(cè)定的化合物進(jìn)行分析[7-9]。結(jié)合SVM,筆者對(duì)酚類化合物進(jìn)行了QSAR分析,以揭示對(duì)環(huán)境的影響。

1 材料與方法

1.1 數(shù)據(jù)來源

3 結(jié)論

采用SVR不同核函數(shù)對(duì)酚類化合物進(jìn)行QSAR建模,再以最優(yōu)核函數(shù)基于SVR進(jìn)行非線性變量篩選。對(duì)于該酚類化合物,首先SVR的最優(yōu)核函數(shù)確定為徑向基核,徑向基核函數(shù)也被其他研究者認(rèn)可,并且得到廣泛使用;其次,保留的自變量為lgP與Am3,而V和V2均未保留,表明分子的拓?fù)浣Y(jié)構(gòu)與疏水性影響酚類化合物的麻醉毒性;最后,以保留自變量進(jìn)行建模預(yù)測(cè),其預(yù)測(cè)精度(Q2pred=0.934)優(yōu)于不經(jīng)變量篩選的SVR預(yù)測(cè)精度(Q2pred=0.898),亦優(yōu)于PLS與MLR的預(yù)測(cè)精度(Q2pred分別為0.894與0.895),其中PLS與MLR的建模效果相當(dāng)。將不同的建模方法用于該酚類化合物的QSAR分析,結(jié)果表明SVR基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,使得其對(duì)獨(dú)立測(cè)試樣本表現(xiàn)出較好的預(yù)測(cè)效果,泛化能力優(yōu)異;基于SVR的非線性變量篩選方法可有效地去除了冗余、不相關(guān)自變量,提升SVR的建模預(yù)測(cè)能力。該方法在環(huán)境毒性污染物(如酚類化合物)等的QSAR研究領(lǐng)域有較廣泛應(yīng)用前景。然而,SVR也存在許多問題有待解決,例如最優(yōu)核函數(shù)的選取及核函數(shù)參數(shù)的優(yōu)化均需要理論、應(yīng)用上的改進(jìn)。

參考文獻(xiàn)

[1] 金相燦.有機(jī)化合物污染化學(xué)[M].北京:清華大學(xué)出版社,1990:49-73.

[2] 王連生,韓朔瞪,支正良.有機(jī)物定量結(jié)構(gòu)-活性相關(guān)[M].北京:中國環(huán)境科學(xué)出版社,1993.

[3] 許祿,邵學(xué)廣.化學(xué)計(jì)量學(xué)方法[M].北京:科學(xué)出版社,1995.

[4] VAPNIK V.The nature of statistical learning theory[M].NY:Springer,2000.

[5] 鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法:支持向量機(jī)[M].北京:科學(xué)出版社,2004.

[6] 馬曉光,胡非.利用支撐向量機(jī)預(yù)報(bào)大氣污染物濃度[J].自然科學(xué)進(jìn)展,2004,14(3):349-353.

[7] 鐘國華,胡美英.QSAR 及其在農(nóng)藥設(shè)計(jì)中的應(yīng)用和進(jìn)展[J].農(nóng)藥學(xué)學(xué)報(bào),2001,3(2):1-11.

[8] 印家健,李夢(mèng)龍,文志寧,等.支持向量回歸用于氨基酸描述符在肽 QSAR 建模中的性能評(píng)價(jià)[J].四川大學(xué)學(xué)報(bào):自然科學(xué)版,2006(2):30.

[9] XIAO M,ZHENG G,YU T,et al.Quantitative structure and activity relationship studies on the toxicity of polychlorinated naphthalenes using support vector machines[J].Journal of Analytical Science,2007,23(2):143.

[10] 李劍,陳德釗,吳曉華,等.優(yōu)化的徑向基-循環(huán)子空間網(wǎng)絡(luò)為藥物定量構(gòu)效關(guān)系建模[J].分析化學(xué),2005,33(6):28-32.

[11] 郭明,許祿.酚類化合物的QSAR研究[J].環(huán)境科學(xué)學(xué)報(bào),1998,18(12):122-127.

[12] TROPSHA A,GRAMATICA P,GOMBAR V K.The importance of being earnest:validation is the absolute essential for successful application and interpretation of QSPR models[J].QSAR & Combinatorial Science,2003,22(1):69-77.

主站蜘蛛池模板: 国产精品丝袜视频| 18禁黄无遮挡免费动漫网站| 亚洲无限乱码一二三四区| 91视频国产高清| 欧美人与牲动交a欧美精品| 国产精品吹潮在线观看中文| 五月天福利视频| 永久毛片在线播| 欧美综合在线观看| 999国产精品永久免费视频精品久久| 久久久久人妻精品一区三寸蜜桃| 亚洲资源站av无码网址| 亚洲手机在线| 亚洲最大在线观看| 久久人搡人人玩人妻精品| 成人小视频在线观看免费| 国产农村1级毛片| 国产免费羞羞视频| 老司机精品一区在线视频| 亚洲三级片在线看| 国产第三区| 91亚瑟视频| 综合网天天| 福利视频一区| 爱色欧美亚洲综合图区| 无码一区18禁| 99在线观看国产| 亚洲三级电影在线播放| 91在线免费公开视频| 日本免费a视频| 国产剧情伊人| 日韩福利在线观看| 一本大道在线一本久道| 久久毛片网| 国产午夜人做人免费视频中文| 国产素人在线| 国产精品无码AV中文| 久久www视频| 国内精自视频品线一二区| 在线日韩一区二区| 成人国产免费| 男女男免费视频网站国产| 国产97视频在线| 中文无码精品A∨在线观看不卡| 91欧美亚洲国产五月天| 国产成人在线无码免费视频| 日本三级精品| 无码精品国产VA在线观看DVD| 999精品免费视频| 丝袜美女被出水视频一区| 亚洲无码高清免费视频亚洲| 成人一级免费视频| 免费又爽又刺激高潮网址| 国产精品分类视频分类一区| 国产精品美女网站| 亚洲国产日韩视频观看| 婷婷成人综合| 久久久久久久蜜桃| AV不卡在线永久免费观看| 亚洲欧美另类色图| 成人免费一级片| 国产在线自揄拍揄视频网站| 精品国产网| 午夜高清国产拍精品| 亚洲欧洲自拍拍偷午夜色| 国产伦片中文免费观看| 亚洲一级毛片| 91无码人妻精品一区| 成人毛片免费观看| 老司机精品99在线播放| 国产一区免费在线观看| 波多野结衣国产精品| 国产精品男人的天堂| 亚洲国产亚洲综合在线尤物| 久久一日本道色综合久久| 日韩精品一区二区三区免费在线观看| 玖玖精品视频在线观看| 欧美成人a∨视频免费观看 | 欧美啪啪精品| 凹凸精品免费精品视频| 动漫精品啪啪一区二区三区| 久久人人妻人人爽人人卡片av|