999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于一致性學習預測藥物-靶標相互作用

2020-11-27 03:06:48
湖南工業大學學報 2020年6期
關鍵詞:方法模型

(湖南工業大學 計算機學院,湖南 株洲 412007)

1 研究背景

藥物研發是現代社會中的一個重要課題[1]。通常情況下,新藥研發從確定思路到投入市場大約需要花費12~15 a 的時間,成本約10 億美元,且成功率低于10%[2]。據統計,美國食品藥品監督管理局(food and drug administration,FDA)每年批準能作為新藥的分子大約只有20 種[3]。諾貝爾獎獲得者James Black 認為,從舊藥研發新藥可能是研發新藥的有效途徑[4]。

藥物重定位又稱“老藥新用”,是一種比較好的研發新藥方法,可節約研發時間,降低研發成本,減少研發失敗帶來的風險,因而受到越來越多的關注。藥物重定位是指發現現有藥物的新用途,其生物學基礎是一藥多靶和一靶多藥[5]?;谟嬎惴椒▽λ幬?靶標相互作用進行預測,以發現某個藥物的多個潛在靶標或某個靶標的多個藥物,從而實現對現有藥物的重定位,可以顯著減少后期過程(如臨床試驗)的負荷,節省大量資源和時間。

藥物-靶標相互作用預測方法可以分為基于網絡的方法和基于機器學習的方法。其中,基于網絡的方法把藥物-靶標相互作用矩陣看成是一個網絡,基于網絡模型預測其潛在關聯。Y.Yamanishi 等[6]把藥物和靶標整合成統一的“藥理空間”,提出一種二分圖學習模型,用于推測靶標與藥物之間的相互作用;M.Campillos 等[7]在“不相關藥物的相似脫靶效應可導致藥物的相似副作用”這一理論基礎上,根據一體化醫學語言系統(unified medical language system,UMLS)術語對藥物的副作用進行了分類,提出衡量藥物副作用相似性的方法,預測共享相同靶標的藥物;K.Bleakley 等[8]基于藥物的化學結構預測藥物的藥理相似性,然后利用局部二分圖模型預測未知的藥物-靶標相互作用;M.G?nen[9]使用全概率模型進行預測,把藥物和靶標投影進統一空間,在此基礎上整合貝葉斯模型,得到了KBMF2K(Kernelized Bayesian matrix factorization),再利用協方差計算中的變分近似進行推斷。Cheng F.X.等[10]提出了3 種基于網絡的推斷方法,即基于靶標相似性的推斷 方 法(target-based similarity inferrence,TBSI)、基于藥物相似性的推斷方法(drug-based similarity inferrence,DBSI)和基于網絡的推斷方法(networkbased inferrence,NBI),以預測可能的藥物-靶標相互作用。

基于機器學習的方法提出機器學習相關模型,在確定模型性能后對藥物與靶標之間潛在的關聯進行預測。Y.Yamanishi等[11]基于藥物的理化性質和藥物-靶標相互作用網絡的拓撲性質,提出了基于支持向量機的方法(supervised bipartite graph ingerrence,SBGI)挖掘可能的藥物-靶標相互作用。S.Mizutani等[12]基于藥物-靶標相互作用譜和副作用譜,定義稀疏典型相關分析進行預測。L.Jacob 等[13]利用核函數和支持向量機(support vector machine,SVM),研究了藥物-靶標的相互作用。Xia Z.等[14]提出了一種基于流形正則化的半監督學習模型,以挖掘藥物與靶標之間的潛在關聯。T.Van Laarhoven 等[15]首先使用藥物核函數和靶標核函數對相互作用數據進行稀疏化,然后定義藥物相互作用譜和靶標相互作用譜,根據這些相互作用譜向量定義高斯核函數,并把高斯相互作用譜核與藥物核和靶標核結合起來,利用正則化最小二乘法尋找能作用于已知靶標的新藥。Chen H.L.等[16]根據與靶標的相關性對藥物進行排序打分,提出采用網絡一致性方法(network consistency-based prediction method,NetCBP), 推測藥物-靶標的相互作用。T.VAN Laarhoven 等[17]首先定義了藥物和靶標的相似性核,然后在正則化最小二乘法的基礎上提出帶權最近鄰方法(weighted nearest neighbor-gaussian interaction profile,WNNGIP)。M.A.Heiskanen 等[18]對目前的預測方法進行了評估,發現基于排序的打分方法效果較好。Wang L.等[19]利用深度學習中的堆疊自動編碼器,充分提取藥物分子的化學子結構和靶標的蛋白序列特征,以識別藥物-靶標相互作用半監督學習模型,有效識別了藥物-靶標相互作用數據。機器學習方法有效預測了藥物與靶標之間存在的關聯,然而,由于缺少負樣本數據,使得監督學習方法預測效果不夠理想,而且大部分有監督預測方法的時間復雜度較高[13];同時,這些方法都嚴重依賴于藥物的化學結構相似性和靶標的序列相似性[19-24]。

為了緩解這個問題,本文基于局部全局一致性學習方法(learning with local and global consistency,LLGC)[25],綜合考慮靶標蛋白的序列特征和藥物-靶標相互作用網絡的拓撲性質,提出藥物-靶標相互作用挖掘方法的LLGC,通過分析比較,發現所提LLGC 方法獲得了較好的預測性能。

2 數據和模型

2.1 數據

本文使用的數據由Y.Yamanishi 等[6]提供,可從http://web.kuicr.kyoto-u.ac.jp/supp/yoshi/drugtarget/下載,具體包括藥物相似性矩陣、靶標蛋白相似性矩陣及藥物-靶標相互作用矩陣。通過KEGG GENES數據庫[26]提取靶標的序列信息,基于正則化打分函數以度量其序列相似性:對于兩個靶標t1與t2,假設SW(t1,t2)表示其Smith-Waterman 分值,則其序列相似性可用以下公式計算:

從而得到靶標之間的相似性矩陣Ssp。

Y.Yamanishi 等[6]分析DrugBank[27]、KEGG[28]和SuperTarget[29]等數據庫發現,已知藥物靶標的人類核受體、G 蛋白偶聯受體(GPCRs)、離子通道和酶的數量分別是54,223,210,445 個,相對應的靶標蛋白分別為26,95,204,664 個,它們已知的相互作用數分別為90,635,1 476,2 926[6,10,13-18],詳細情況如表1所示。在本實驗中,使用Y.Yamanishi 等[6]提供的數據作為標準數據集,以評估模型的優劣。

表1 藥物-靶標相互作用數據集Table 1 Drug-target interaction data set

2.2 模型

給定n個靶標和m個藥物,若靶標i靶向藥物j,則yij=1,否則yij=0,用矩陣Y=[y1,y2,…,yn]T表示靶標靶向藥物的情況,即藥物-靶標相互作用網絡。如果多個靶標蛋白與藥物相互作用,則靶標相似性程度可以由其共享藥物數量來度量。因此,可以基于藥物-靶標相互作用網絡中靶標共享藥物數,來度量其相似性:

綜合序列相似性和藥物-靶標網絡的拓撲結構相似性,可計算如下靶標相似性矩陣:

式(1)(2)中:Snp為網絡拓撲結構相似性矩陣;Ssp為序列相似性矩陣;參數μ用于衡量兩者間的重要程度,且

對Sp′進行歸一化后得到:

用F∈{0,1}n×m表示預測到的藥物-靶標相互作用矩陣。fij∈{0,1}表示經過學習后,模型預測到的靶標i與藥物j的關聯情況,若值為1,表示靶標i靶向藥物j,否則靶標i與藥物j沒有關聯。如果藥物i與藥物j非常相似,且靶標靶向藥物i,則此靶標更有可能靶向藥物j,F=[f1,f2,…,fn]T。

LLGC 學習認為:鄰近的結點更有可能有相同的標簽,這是數據的局部性問題;在流形結構或聚類中的結點更有可能具有相同的標簽,這是數據的全局性問題。為探究新的藥物-靶標相互作用,綜合考慮靶標和藥物數據的全局和局部特征,提出一致性藥物-靶標相互作用預測算法LLGC,把已知的藥物-靶標相互作用信息傳播至其鄰接點結點,從而獲得新的藥物-靶標相互作用。

算法1用迭代法挖掘藥物-靶標相互作用

輸入:靶標序列相似性矩陣,藥物-靶標相互作用網絡。

輸出:新的藥物-靶標相互作用矩陣F*。

Step 1 由公式(1)~(3)獲得靶標相似性矩陣Sp,并令,以避免在標簽學習過程中對結點進行了自增強處理。

Step 2 對靶標相似性矩陣進行正則化,得到拉普拉斯矩陣L=D-Sp,其中D是對角矩陣,第i個對角元素值為。

Step 3 對F(t+1)=αLF(t)+(1-α)Y迭代求解,直至收斂。α為介于0 和1 之間的參數。

Step 4 假設F*表示解集{F(t)}的權限,則F*為所求問題的解。

Step 5 輸出預測的藥物-靶標關聯網絡,預測藥物-靶標相互作用。

考慮算法1 中第t步的迭代模型的收斂性。模型第一部分接收來處鄰接點的標簽信息,第二部分用于保存初始標簽信息。L=D-Sp,參數α∈(0,1),用于平衡來自鄰接點的標簽信息和初始標簽信息之間的重要程度。

由公式(4)得

由0<α<1,L與矩陣相似,因而L的特征值在[-1,1]。從而

假設F(t)收斂于F*,對于藥物-靶標相互作用預測問題,可以對其求極限,F*=limF(t),綜合公式(5)~(7),可得:

其中:I為n×n的單位矩陣;

不失一般性,公式(8)等價于下式:

根據公式(10),無需迭代,可直接計算出藥物-靶標相互作用矩陣為

若用MT代替L,則可得到如下公式(11)的另一種形式:

結合M的定義,可得到另一藥物-靶標相互作用矩陣:

綜合公式(11)和(13),可得到如下發現藥物-靶標相互作用的模型

從而在算法1 的基礎上進行改進,得到算法2。

算法2基于LLGC 發現藥物-靶標相互作用

輸入:靶標序列相似性矩陣,藥物-靶標相互作用網絡。

輸出:藥物-靶標相互作用矩陣。

Step 1 根據公式(1)~(3),計算靶標相似性矩陣Sp,并令,以避免在標簽學習過程中對結點進行了自增強處理。

Step 2 對靶標相似性矩陣進行正則化,得到拉普拉斯矩陣L=D-Sp,其中D是對角矩陣,第i個對角元素值為。

Step 3 根據Step 2 的計算結果求解和。

Step 4 根據公式(14)得到靶標的標簽矩陣。

Step 5 輸出藥物-靶標相互作用矩陣。

3 實驗結果和討論

實驗中,把藥物-靶標相互作用數據以隨機形式分成大小相等的5 份,依次選擇1 份用作測試集,剩下的4 份用作訓練集,實驗重復20 次,取20 次實驗的平均值作為最終結果。參數α取值0.9。

3.1 與其他方法分析比較

把預測方法LLGC 與SBGI、KBMF2K、NetCBP和WNN-GIP 進行分析比較,所得結果如表2所示。

表2 各方法的預測結果匯總表Table 2 Prediction performance of different DTI prediction methods

分析表2所示預測結果可以得知,LLGC 方法基于AUC(area under curve)的性能要好于SBGI 和KBMF2K 方法的。與SBGI 方法相比,4 個數據集中AUC 值分別提高了6.70%,17.49%,8.88%,1.60%;與KBMF2K 方法相比,4 個數據集中AUC 值分別提高了5.29%,1.75%,3.03%,0.36%;與WNN-GIP 和NetCBP 相比,除在核受體中AUC 值比WNN-GIP和NetCBP 稍低(低1.43%)之外,在AUC 上均好于其他4 種方法或與其他方法基本持平。

3.2 預測藥物-靶標相互作用

課題組基于一致性學習,考慮靶標相似性和藥物-靶標相互作用網絡的拓撲性質,提出一種靶標相似性度量方法。在此基礎上,考慮藥物和靶標數據的全局一致性和局部一致性特征,提出LLGC 方法尋找藥物-靶標相互作用。LLGC 方法將對每個藥物與靶標之間的關系進行打分,并且根據得分對每一個藥物-靶標對進行排序,從而預測藥物-靶標的相互作用;然后,在DrugBank 數據庫[27]、KEGG 數據庫[28]和SuperTarget[29]數據庫中,對預測到的藥物-靶標相互作用進行分析驗證。

表3~6 分別列出了核受體中、GPCRs 中、離子通道中和酶中預測到的分值最高的5 個藥物-靶標相互作用對。

表3 核受體中預測到的排序前5 的藥物-靶標相互作用對Table 3 Predicted top 5 drug-target interaction pairs in nuclear receptor

表3所示為核受體中預測到的排序前5 位的藥物-靶標相互作用對,以靶標hsa2099 為例,預測到核受體中,靶標hsa2099 靶向藥物D00182。在UniProt 數據庫[30]中,靶標hsa2099 為核激素受體,調節真核細胞的基因表達,影響細胞的繁殖和目標組織的分化,調節涉及各種激酶的雌激素的信號傳導。在SuperTarget、DrugBank 和KEGG 數據庫中,檢索到hsa2099 靶向藥物D00066、D00067、D00105和D00554,其中D00066 是主要的孕激素類固醇,主要由黃體和胎盤分泌。孕激素作用于子宮、乳腺和大腦,有助于胚胎移植、妊娠維護和乳腺組織的發展。D00067 是哺乳動物的主要雌激素,雌激素酮是一種類固醇,主要產生于卵巢、胎盤和外圍組織。D00105 是哺乳動物雌激素類固醇的一種形式,主要由卵巢和胎盤產生,可以合成各種同分異構體。D00554 也是一種具有較高的雌激素效能的口服藥物。而D00182 可以合成孕激素,可用于治療月經不調與子宮內膜異位等疾病。這說明靶標hsa2099 靶向藥物D00182 有一定的根據。

運用LLGC 方法對核受體中的標準數據集進行預測,發現在90 個已知的藥物-靶標相互作用 對中,有48 個藥物-靶標相互作用對出現在預測集的前5%中,約占所有已知數據對的53.33%;69 個藥物-靶標相互作用對在預測集的前10%中,約占所有已知數據對的76.67%;75 個藥物-靶標相互作用對在預測集的前20%中,約占所有已知數據對的83.33%;所有90 個已知藥物-靶標相互作用對在預測集的前50%中。

表4 GPCRs 中預測到的排序前5 的藥物-靶標相互作用對Table 4 Predicted top 5 drug-target interaction pairs in GPCRs

表4為GPCRs 中預測到的排序前5 的藥物-靶標相互作用對,同時在運用LLGC 方法對GPCRs 中的標準數據集進行預測過程中,發現在223 個已知藥物-靶標相互作用對中,有93 個藥物-靶標相互作用對出現在預測集的前5%中,約占所有已知數據對的41.70%;153 個藥物-靶標相互作用對在預測集的前10%中,約占所有已知數據對的68.61%;172個藥物-靶標相互作用對在預測集的前20%中,約占所有已知數據對的77.13%;203 個藥物-靶標相互作用對在預測集中的前50%,約占所有已知數據對的91.03%。

表5 離子通道中預測到的排序前5 的藥物-靶標相互作用對Table 5 Predicted top 5 drug-target interaction pairs in ion channel

表5為離子通道中預測到的排序前5 的藥物-靶標相互作用對,同時在運用LLGC 方法對離子通道中的標準數據集進行預測過程中,發現在1 476 個已知藥物-靶標相互作用對中,有514 個藥物-靶標相互作用對出現在預測集的前5%中,約占所有已知數據對的34.82%;826 個藥物-靶標相互作用對在預測集的前10% 中,約占所有已知數據對的55.96%;1 059 個藥物-靶標相互作用對在預測集的前20%中,約占所有已知數據對的71.75%;1 344個藥物-靶標相互作用對在預測集的前50%中,約占所有已知數據對的91.06%。

表6 酶中預測到的排序前5 的藥物-靶標相互作用對Table 6 Predicted top 5 drug-target interaction pairs in enzyme

表6給出了酶中預測到的排序前5 的藥物-靶標相互作用對,同時在運用LLGC 方法對酶中的標準數據集進行預測過程中,發現在2 926 個已知藥物-靶標相互作用對中,有1 624 個藥物-靶標相互作用對出現在預測集的前5%中,約占所有已知數據對的55.50%;有2 117 個藥物-靶標相互作用對在預測集的前10%中,約占所有已知數據對的72.35%;2 489個藥物-靶標相互作用對在預測集的前20%中,約占所有已知數據對的85.06%;2 926 個藥物-靶標相互作用對在預測集的前50%中,即所有已知藥物-靶標相互作用對都出現在預測集的前50%中。

4 結語

藥物-靶標相互作用預測是現代藥物研發中的一個重要課題?;跐駥嶒炌诰蛩幬锱c靶標之間的相互作用耗時耗力,故需要開發相應的計算方法以發現這種潛在關聯。因而本文基于一致性學習,融合靶標序列相似性和藥物-靶標相互作用網絡的拓撲性質,考慮數據的局部特性和全局特性,提出一致性藥物-靶標相互作用預測方法LLGC,以預測來自人類核受體、GPCRs、離子通道和酶中的藥物-靶標相互作用。與其他方法相比,LLGC 在AUC 上優于其他方法或與其他方法持平。同時,標準數據集中絕大部分已知的藥物-靶標相互作用預測出現在預測集的前20%中,91%以上出現在預測集的前50%中。今后,課題組將結合深度學習相關模型和各種生物特征,以改進藥物-靶標相互作用的預測性能。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 日本亚洲国产一区二区三区| 久久婷婷五月综合97色| 香蕉在线视频网站| av手机版在线播放| 国产剧情伊人| 最新痴汉在线无码AV| 亚洲日韩高清在线亚洲专区| 嫩草国产在线| 青青草原国产| 久久国产精品77777| 久久国产亚洲欧美日韩精品| 无码aaa视频| 亚洲Aⅴ无码专区在线观看q| 又黄又湿又爽的视频| 97超碰精品成人国产| 天天综合色网| 91丝袜在线观看| 香蕉eeww99国产精选播放| 尤物成AV人片在线观看| 视频二区国产精品职场同事| 午夜少妇精品视频小电影| 欧美一区国产| 中文天堂在线视频| 91色在线视频| 波多野结衣在线一区二区| 久久久久人妻精品一区三寸蜜桃| 国产呦精品一区二区三区网站| 国产精品视频3p| 日韩第一页在线| 国产美女在线免费观看| 日本一区二区三区精品国产| 国产精品成| 国产不卡在线看| 日本影院一区| 精品一区二区无码av| 日韩天堂视频| AV不卡在线永久免费观看| 九九九久久国产精品| a级毛片免费网站| 毛片大全免费观看| 久久久亚洲色| 欧美在线视频不卡| 国产精品视频观看裸模| 粗大猛烈进出高潮视频无码| 国产福利2021最新在线观看| 一级全免费视频播放| 最新国产精品第1页| 色精品视频| 好紧好深好大乳无码中文字幕| 国产精彩视频在线观看| 国产女同自拍视频| 欧美精品v| 亚洲国产精品VA在线看黑人| 69av在线| 国产美女丝袜高潮| 亚洲欧美一级一级a| 欧美日本在线播放| 一级毛片在线播放免费| 国产乱视频网站| 免费国产无遮挡又黄又爽| 国产真实乱人视频| 黄色国产在线| 国产精品欧美在线观看| 中文字幕在线日本| 2021国产在线视频| 精品欧美视频| 国产尤物jk自慰制服喷水| 日韩第一页在线| 国产精品观看视频免费完整版| 国产网站免费看| 亚洲无码日韩一区| 国产女人综合久久精品视| 国产高清自拍视频| 日本精品视频一区二区| 日本欧美一二三区色视频| 免费国产福利| 日本在线免费网站| 国产日本欧美在线观看| 亚洲三级a| 亚洲黄网视频| 拍国产真实乱人偷精品| 午夜国产大片免费观看|