999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Hedgehog信號通路抑制劑的構效關系研究

2015-09-26 02:01:50魯鵬薇張明
現代計算機 2015年17期
關鍵詞:分類實驗方法

魯鵬薇,張明

(上海海事大學信息工程學院,上海 201306)

Hedgehog信號通路抑制劑的構效關系研究

魯鵬薇,張明

(上海海事大學信息工程學院,上海201306)

0 引言

Hedgehog信號通路在細胞的分化、生長以及細胞的發育中扮演著一個很重要的角色[1],持續激活此通路能使成年人致癌,誘發基底細胞癌、成神經管細胞瘤、橫紋肌肉瘤、乳腺癌和前列腺癌、胰腺癌[2~5]。而在上世紀90年代人們發現一種異甾體類生物堿——環巴胺,它能抑制該通路并能誘導多種腫瘤細胞死亡,而對正常細胞無影響[6~7]。但是其在自然界中含量很低,人工合成方法不僅耗費財力和物力,而且效率極低。因此對環巴胺衍生物進行有效的定量構效關系(Quantitative Structure-Activity Relationship,QSAR)建模,利用計算機技術對其進行研究就具有極大地意義[8],不但降低了巨大的成本消費,而且減少了大量的人力。

本文在前人研究的二進制分類方法比線性擬合的方法在進行QSAR研究要好的基礎上,通過對相同實驗數據進行試驗,最后比較得出一種較好的機器學習分類方法來對環巴胺衍生物的QSAR進行建模。QSAR模型是一種借助分子的理化性質參數或結構參數,以數學和統計學手段定量研究有機小分子與生物大分子相互作用、有機小分子在生物體內吸收、分布、代謝、排泄等生理相關性質的方法[9]。

環巴胺的結構如圖1所示。

圖1 環巴胺的結構

1 研究現狀

在對Hedgehog信號通路抑制劑研究的發展與過程中,癌癥研究者致力于找到多種Hedgehog信號通路抑制劑,從而對一系列的惡性腫瘤進行有效的治療[10~12],但到現在,發現的種類還是很少;此外,在對環巴胺進行合成的研究過程中,由于環巴胺在水中或者其他極性溶劑中溶解度低,因而也就沒有有效的方法去合成環巴胺[13~14];Janardanannair等[15]在研究環巴胺衍生物的QSAR中起到了帶頭的作用,采用羥基對二級胺和氧化銅進行修飾,研究結果定量地表明了此方法能對環巴胺衍生物的活性產生影響,但是其試驗樣本總共不到30個,因此對于QSAR的研究遠遠沒有產生令人滿意的效果;朱瑞新等[16]對環巴胺衍生物的QSAR進行了研究,表明在對環巴胺衍生物進行QSAR的研究中,機器學習方法比線性回歸方法好,但并沒有對機器學習方法進行比較研究。本文研究重點在于,在樣本較大的情況下得到較好的QSAR建模方法。

2 實驗流程及方法介紹

在本實驗中,主要是利用已合成的93種環巴胺衍生物以及四組靶點活性細胞系 (BxPC-3、NCI-H446、SW1990和NCI-H157)為實驗數據,依據不同方法進行實驗數據分類,然后再采用不同特征描述符對環巴胺衍生物進行描述,最后利用不同機器學習方法進行QSAR實驗,圖2所示為算法的流程圖。對93種環巴胺衍生物分別用通用描述符和類藥性指數描述符進行特征描述,然后在不同特征描述符下分別采用兩種分類方法進行訓練集與測試集的劃分,最后在每種分類結果中,再分別利用兩種機器學習算法進行建模。

圖2 算法流程圖

(1)訓練集與測試集分類方法

首先是對數據進行分類,分為訓練集與測試集。在本文中,選取訓練集與測試集的比例65%:35%。在分子操作環境(Molecular Operating Environment,MOE)中,多樣性子集分類[17]對化合物進行排列的方法是依據多樣性的性質,為了比較機器學習分類方法對QSAR研究的影響,本文又采用了聚簇多樣性子集分類方法,也就是在進行多樣性子集分類之前先進行聚類,然后在每一類中再進行多樣性子集分類。在MOE中有基于指紋的聚類方法以及基于描述的聚類方法,在本文研究中,采用基于描述的聚類方法,因為此算法時間復雜度較小。

(2)特征描述符方法

描述符方法有很多,包括電子描述符、拓撲指數、量子化學描述符等,描述符間沒有一種描述符更優于另一種描述符,因此本文采用最常用的通用描述符[16],為了對比,在實驗中加入了類藥性指數描述符[18]。通用描述符對于QSAR模型的建立有很大的作用。而類藥性指數描述符剛開始是用于衡量類藥性化合物的,后來則在MOE中進行使用成為一套描述符的[19]。前者傾向描述化合物的物理特性,而后者傾向描述化合物的拓撲指數性質,因而兩者有一定的互補作用。

(3)采用機器學習方法的QSAR研究

①機器學習方法介紹

在本文中,采用支持向量機(Support Vector Ma chine,SVM)算法[20]和人工神經網絡(Artifical Neural Network,ANN)算法兩種方法,主要目的是對Hed-gehog信號通路抑制劑進行QSAR的研究中比較兩者的性能,找到合適的統計建模方法。SVM是建立在統計學習理論中的機器學習技術,已應用到科學研究的各個領域中,例如文本識別、圖像分類以及語音識別等。本文利用其進行QSAR研究,把訓練數據通過核函數映射到一個特征空間,并利用最優超平面對數據進行分類,下圖即為最優線性超平面:

SVM解決非線性可分問題的基本思想是將非線性不可分問題通過核函數映射到高維空間,使其在高維空間可分,通過在高維空間尋找最優超平面進行數據分類。本文采用徑向基核函數:

圖3 最優線性超平面

ANN是由大量簡單的基本元件——神經元件相互連接,模擬人的大腦信息處理方式,進行信息并行處理和非線性轉換的復雜網絡系統。主要包括輸入端、隱含層以及輸出端,其結構如圖4所示:

圖4 人工神經算法結構圖

其算法的數學表達式為:

其中,wij為神經元i與神經元j間的結強,即結加權值,xi為從神經元i傳來的輸入訊號,茲j為神經元j的門檻值,f為轉換函數,通常為一個階梯函數。

其定義如下:

(2)實驗過程介紹

在本文試驗中分別把93種環巴胺衍生物的通用描述符結果以及類藥性描述符結果作為機器學習方法的輸入,這兩種描述符結果可以通過MOE 2008軟件來實現,然后對訓練集中的數據進行機器學習,以93種環巴胺衍生物的活性或者非活性作為輸出,此過程采用MATLAB 2010b實現,最后把機器學習得出的數學模型再應用到測試集中,通過對93種環巴胺衍生物的總的準確率數值進行比較 (包括活性數據的準確率以及非活性的準確率)來判斷兩種機器學習方法中哪種較優。

3 實驗結果與討論

采用93種環巴胺衍生物以及四組靶點活性細胞系,采用四種細胞系的原因是:NCI-H157(人非小細胞肺腺癌)是對Hedgehog信號通路低表達的細胞,而NCI-H446(人小細胞肺癌細胞)是對Hedgehog信號通路高表達的細胞。BxPC-3(人原位胰腺腺癌細胞)和SW1990(人胰腺癌細胞)也分別是低、高表達的細胞。

表1中列出了本次實驗所采用的環境以及所用到的編程工具。

表1 實驗平臺及環境

表2中At代表訓練數據集的自擬合結果的準確率,Av代表訓練數據集的交叉驗證擬合結果的準確率,Ap代表測試數據集的自擬合結果的準確率,δ是類藥性指數描述符準確率與通用描述符下的準確率之差。

(1)訓練集與測試集分類方法比較

研究看來,提供一個魯棒性好的、偏差小的以及足夠大的訓練集數據對于模型的構建是很重要的。在本文中,提出采用兩種分類方法來對實驗數據進行分類。為了比較兩種分類方法對實驗數據進行分類的影響,提出利用t檢驗法來計算得到兩表間的p_value值是0.88>(0.05),這表明對于QSAR的研究中,兩種分類方法沒有統計上的差異。也就是說,兩種分類方法對訓練集以及測試集的分布結果的影響是不大的,差異性很小。

(2)兩種特征描述符方法比較

在本文中,提出采用兩種特征描述符,分別對93種化合物衍生物進行描述。由實驗數據可以知道,在QSAR建模中,對于訓練集的自擬合結果,物理性質描述符比拓撲指數描述符效果要好,因為我們可以看到差值結果是負值(紅色);而對于測試集的數據,則類藥性描述符的魯棒性要比普通描述符好,因為差值結果是正值(藍色);在交叉驗證結果中,有正值也有負值。總之,類藥性描述符在訓練集或者測試集中都能保持較好的穩定性,而普通描述符在獨立的測試集數據中則不能保證穩定性。

(3)統計數據分類方法比較

在此前已有研究者們得出結論,二值分類效果相對于線性擬合結果較好,在連續的活性數據中,采用閾值標準來將其轉化為二值數值,其研究采用藥物化合物的IC50值作為截止數值,IC50值是使癌細胞死亡一半時所對應的抑制劑的濃度,也就是說這個值越小越好。本文采用SVM算法與ANN算法兩種機器學習分類方法來對QSAR進行研究。實驗結果表明SVM算法比ANN算法對于這些實驗數據的QSAR研究更好一些,原因是ANN算法實驗不太穩定,需要大量的數據,而SVM算法有嚴格的計算基礎,算法具有全局最優性,在小樣本下能達到很好的計算結果。

表2 多樣性子集分類的定量構效關系實驗結果

表3 聚簇多樣性子集分類的定量構效關系實驗結果

4 結語

在本文研究中,采用不同的特征描述符,不同的訓練集以及測試集的分類方法,并利用不同的二值分類方法來對種環巴胺衍生物的QSAR進行研究,通過實驗結果的比較,我們得出了較好的機器學習分類方法。在四種細胞系中,NCI-H446是Hedgehog信號通路抑制劑進行活性測試的最適合的細胞系,因為在此細胞系的研究中,實驗結果準確率很高,其他細胞系準確率都在左右。最后的研究結果表明,本文所采用的兩種分類實驗數據方法對數據的分類結果影響不是很大;兩種描述符中,類藥性描述符較普通描述符來說魯棒性要好;對QSAR進行建模的研究過程中,SVM算法比ANN算法要好。

[1]Ingham PW,McMahon AP.Hedgehog Signaling in Animal Development:Paradigms and Principles[J].Genes Dev 2001,15:3059~3087

[2]Oro AE,Higgins KM,Hu Z,et al.Basal Cell Carcinomas in Mice over Expressing Sonic Hedgehog[J].Science,1997,276:817~821

[3]Kinzler KW,Bigner SH,Bigner DD,et al.Identification of an Amplified,Highly Expressed Gene in a Human Glioma[J].Science 1987,236:70~73

[4]Dahmane N,Lee J,Robins P,et al.Activation of the Transcription Factor Gli1 and the Sonic Hedgehog Signalling pathway in Skin Tumours[J].Nature,1997,389:876~881

[5]Grachtchouk M,Mo R,Yu S,et al.Basal Cell Carcinomas in Mice Overexpressing Gli2 in Skin[J].Nature Genet 2000;24:216~217

[6]周劍俠,康露,畢京博等.異甾體類生物堿——環巴胺的研究進展[J].中國天然藥物,2006,4(6):468~472

[7]Lee J,Wu X,et al.A Small-Molecule Antagonist of Hedgehog Signaling Pathway[J].Biochemstry,2007,8(16):1916~1919

[8]Zhang J,Garrossian M,Gardner D,et al.Synthesis and Anticancer Activity Studies of Cyclopamine Derivatives[J].Bioorg Med Chem Lett,2008,18:1359~1363

[9]定量構效關系.http://baike.so.com/doc/6609150.html

[10]Reifenberger J,Wolter M,Weber RG,et al.Missense Mutations in SMOH in Sporadic Basal Cell Carcinomas of the Skin and Primitive neuroectodermal tumors of the central nervous system[J].Cancer Res 1998;58:1798-1803.

[11]Dahmane N,Sánchez P,Gitton Y,et al.The Sonic Hedgeho-Gli pathway Regulates Dorsal Brain Growth and Tumorigenesis[J]. Development,2001,128:5201~5212

[12]Chen JK,Taipale J,Young KE,et al.Small Molecule Modulation of Smoothened Activity[J].Proc.Natl.Acad.Sci.USA,2002,99:14071~14076

[13]For example:Beachy et al[D].U.S.Patent No.6911528,2005

[14]Taipale J,Chen JK,Cooper MK,et al.Effects of Oncogenic Mutations in Smoothened and Patched can be Reversed by Cyclopamine [J].Nature,2000,406:1005~1009

[15]Janardanannair S,Adams J,Ripka AS,et al.Methods for Preparation Cyclopamine Analogs and Use Thereof in Treating Cancers[J]. 2005,-US30406;2006026430,20050826,2006

[16]Ruixin Zhu,Qi Liu,Jian Tang,Huiliang,ZW Cao.Investigations on Inhibitors of Hedgehog Signal Pathway:A QSAR Study[J].Int.J. Mol.Sci.,2011(12):3018~3033

[17]Labute P.A Widely Applicable Set of Descriptors[J].J Mol Graph Model 2000;18:464~477

[18]Xu J,Stevenson J.Drug-like index:A New Approach To Measure Drug-like Compounds and Their Diversity[J].J Chem.Inf.Comput. Sci.2000;40:1177~1187

[19]q_dli.svl.Small Molecule Drug-Like Index Descriptors.www.chemcomp.com

[20]Vapnik.The Nature of Statistical Learning Theory[M].New York:Springer,1995

Cyclopamine;Inhibitors of Hedgehog Signaling Pathway;Quantitative Structure-Activity Relationship

Research on the Structure-Activity Relationship of the Hedgehog Signaling Pathway Inhibitor

LU Peng-wei,ZHANG Ming
(College of Information Engineering,Shanghai Maritime University,Shanghai 201306)

1007-1423(2015)17-0022-06

10.3969/j.issn.1007-1423.2015.17.005

魯鵬薇(1989-),女,河南焦作人,碩士,研究方向為模式識別、多媒體信息處理、蛋白質分子反向對接,Email:zhyzhaihuiyan@163.com

張明(1957-),男,博士,教授,研究方向為多媒體信息處理、分布式多媒體技術、多媒體數據庫、視覺信息檢索與分析、網絡信息安全、人工智能、航運信息化技術等

2015-04-17

2015-05-21

研究表明環巴胺是一種Hedgehog信號通路抑制劑,對多種腫瘤有良好的抑制作用。提出一種可靠的定量構效關系模型,對93種環巴胺衍生物(共四組靶點活性數據:BxPC-3、NCI-H446、SW1990和NCI-H157)采用不同方式劃分訓練集與測試集,以及采用不同特征描述符和使用不同機器學習分類方法來建模,從而得到建立定量構效關系模型較好的機器學習分類方法。研究表明,支持向量機的統計分類方法是對Hedgehog信號通路抑制劑建立定量構效關系模型的一個較好的選擇。

環巴胺;Hedgehog信號通路抑制劑;定量構效關系

The study has shown that cyclopamine is a kind of inhibitors of Hedgehog signal pathway and has a good effect on a wide variety of tumor.Proposes a solid QSAR model.The data contains 93 cyclopamine derivatives as well as their activities against four different cell lines (NCI-H446,BxPC-3,SW1990 and NCI-H157).And proposes different machine learning ways in order to get a better way to build a good Quantitative Structure-Activity Relationship.The testing indicates that the SVM is a better choice for building the QSAR model of inhibitors of Hedgehog signaling pathway.

猜你喜歡
分類實驗方法
記一次有趣的實驗
分類算一算
做個怪怪長實驗
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 69综合网| 丰满少妇αⅴ无码区| 狠狠操夜夜爽| 国产一二三区视频| 国产成人精品一区二区三区| 丁香五月激情图片| 8090成人午夜精品| 久久窝窝国产精品午夜看片| 久久国产乱子| 久久黄色小视频| 99re热精品视频国产免费| 日本久久久久久免费网络| 精品欧美视频| 视频二区欧美| 免费毛片在线| 激情综合婷婷丁香五月尤物| 久久成人免费| 国产精品亚洲专区一区| 中文字幕免费视频| jizz国产在线| 亚洲制服中文字幕一区二区| 无码不卡的中文字幕视频| 国产黄在线观看| 中文字幕天无码久久精品视频免费 | 国产另类视频| 国产精品久久自在自2021| 亚洲精品在线91| 国产青榴视频| av无码一区二区三区在线| 人妻中文字幕无码久久一区| 97精品伊人久久大香线蕉| 亚洲精品在线91| 欧美日本在线| 一级毛片免费观看不卡视频| 欧美特黄一级大黄录像| 人与鲁专区| 99精品免费在线| 欧美日韩中文国产va另类| 国产成人久久777777| 精品亚洲国产成人AV| 欧美日在线观看| www.精品国产| 亚洲中文无码h在线观看| 台湾AV国片精品女同性| 日本三区视频| 波多野结衣在线一区二区| 国产精品真实对白精彩久久| 国产麻豆永久视频| 色噜噜中文网| 伊人精品成人久久综合| 日本不卡视频在线| 精品视频在线一区| 欧美色图久久| 免费一看一级毛片| 国产清纯在线一区二区WWW| 国产一区成人| 亚洲无码视频一区二区三区| av性天堂网| 欧美全免费aaaaaa特黄在线| 精品国产成人三级在线观看| 婷婷五月在线| 亚洲成年人片| 国产精品免费p区| 一级片免费网站| 一级全免费视频播放| 欧美午夜一区| 国产凹凸一区在线观看视频| 色综合天天操| 免费无码又爽又黄又刺激网站 | 久久香蕉国产线看观看精品蕉| 婷婷综合色| 69免费在线视频| 日本人妻丰满熟妇区| 亚洲国产欧洲精品路线久久| 美女毛片在线| 精品人妻无码中字系列| 无码丝袜人妻| 亚洲激情99| 一区二区三区四区日韩| 日韩精品亚洲精品第一页| 国产又色又爽又黄| 美女免费精品高清毛片在线视|