999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于半監(jiān)督符號(hào)圖神經(jīng)網(wǎng)絡(luò)聚類的藥物社區(qū)發(fā)現(xiàn)

2023-10-20 15:51:38艾邵斌馬天明
現(xiàn)代計(jì)算機(jī) 2023年15期
關(guān)鍵詞:符號(hào)實(shí)驗(yàn)

艾邵斌,楊 順,文 龍,馬天明

(湖南師范大學(xué)信息科學(xué)與工程學(xué)院,長(zhǎng)沙 410000)

0 引言

近數(shù)十年來(lái),藥物研發(fā)技術(shù)得到了迅速的發(fā)展,基因組法、基因芯片法、蛋白質(zhì)組學(xué)法等多種方法已被廣泛應(yīng)用于創(chuàng)新藥物的發(fā)現(xiàn)[1]。但是,新藥物的研發(fā)周期長(zhǎng)、資金需求大,而且風(fēng)險(xiǎn)較高、成功率偏低。截至2019 年,成功開(kāi)發(fā)一種獲批罕見(jiàn)病用藥物和非罕見(jiàn)病用藥物的資本化臨床成本估計(jì)分別為20.91 億美元和32.12 億美元[2]。為了降低新藥物研發(fā)的時(shí)間成本、經(jīng)濟(jì)成本和風(fēng)險(xiǎn)成本,專家學(xué)者提出了將計(jì)算機(jī)科學(xué)與藥物的生物化學(xué)信息相結(jié)合的方法,通過(guò)計(jì)算機(jī)來(lái)輔助藥物設(shè)計(jì)。通過(guò)這種方法對(duì)藥物進(jìn)行配對(duì),可以為大規(guī)模試驗(yàn)篩選提供線索,進(jìn)一步降低研發(fā)成本。

當(dāng)兩種或多種藥物一起使用時(shí),它們的藥理作用會(huì)受到彼此的影響,這種影響被稱為藥物相互作用(drug-drug interaction, DDI)[3],它會(huì)為藥物組合的效果帶來(lái)難以預(yù)料的影響,如增強(qiáng)藥物組合療效、降低藥物組合療效、出現(xiàn)額外的正面效果或負(fù)面效果等。不明DDI 在現(xiàn)實(shí)的臨床用藥與新藥物的研發(fā)中經(jīng)常出現(xiàn),Drug-Bank 數(shù)據(jù)庫(kù)的小分子藥物中,平均每個(gè)藥物會(huì)與15 個(gè)其他藥物產(chǎn)生不同DDI 反應(yīng),這大大增加了臨床用藥與新藥物研發(fā)的困難程度。

藥物社區(qū)發(fā)現(xiàn)在當(dāng)今的新藥物研發(fā)中具有重要的意義。藥物社區(qū)指的是:在藥物網(wǎng)絡(luò)中的某組節(jié)點(diǎn)內(nèi)部具有較大的相似性,從而形成的一種內(nèi)部連接緊密,而外部稀疏的結(jié)構(gòu)[4]。其反映了若干藥物組成的網(wǎng)絡(luò)中個(gè)體藥物的局部性特征以及藥物相互之間的關(guān)聯(lián)關(guān)系,研究藥物網(wǎng)絡(luò)中的社區(qū)對(duì)理解整個(gè)藥物網(wǎng)絡(luò)的結(jié)構(gòu)和功能有著重要的作用,并且可以幫助相關(guān)人員更好地分析及預(yù)測(cè)整個(gè)藥物網(wǎng)絡(luò)各元素的相互關(guān)系。目前大多數(shù)圖神經(jīng)方法僅局限于挖掘單一藥物之間的互作用,而忽略了多種藥物共同作用對(duì)藥理的強(qiáng)化或抑制。

傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法通常使用DDI 以及藥物本身的化學(xué)特征與結(jié)構(gòu)特征作為劃分藥物社區(qū)的依據(jù),主要有圖分割算法、層次聚類算法、分割式聚類和譜聚類等。隨著深度學(xué)習(xí)的發(fā)展,人們逐漸傾向于使用圖神經(jīng)網(wǎng)絡(luò)來(lái)解決社區(qū)發(fā)現(xiàn)問(wèn)題。符號(hào)圖卷積神經(jīng)網(wǎng)絡(luò)(signed graph convolutional network,SGCN)[5]是第一個(gè)適用于符號(hào)網(wǎng)絡(luò)的圖神經(jīng)網(wǎng)絡(luò)模型,它基于平衡理論[6],為之后眾多圖神經(jīng)網(wǎng)絡(luò)方法打下基礎(chǔ),其弊端則是幾乎只適用于無(wú)向圖。2019 年Huang 等[7]研發(fā)的符號(hào)圖注意力神經(jīng)網(wǎng)絡(luò)(signed graph attention networks, SiGAT)利用圖注意力機(jī)制[8],使用基于平衡理論的新型圖神經(jīng)網(wǎng)絡(luò)架構(gòu),使其可以學(xué)習(xí)帶符號(hào)的有向圖的節(jié)點(diǎn)嵌入。2020年,Li 等[9]通過(guò)圖注意力學(xué)習(xí)符號(hào)圖神經(jīng)網(wǎng)絡(luò)嵌入(learning signed network embedding via graph attention,SNEA)提出了一種基于新目標(biāo)函數(shù)的符號(hào)圖神經(jīng)網(wǎng)絡(luò),用于鏈路符號(hào)預(yù)測(cè)。隨后,Huang 等[10]的有向符號(hào)網(wǎng)絡(luò)的學(xué)習(xí)節(jié)點(diǎn)表示(learning node representation for signed directed network,SDGNN)、He等[11]的基于新型磁符號(hào)拉普拉斯算子的圖神經(jīng)網(wǎng)絡(luò)(graph neural network based on a novel magnetic signed laplacian,MSGNN)等多種多樣的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在目標(biāo)函數(shù)、架構(gòu)方式、鏈路處理等多種角度上拓展延伸該項(xiàng)課題。

本文利用符號(hào)網(wǎng)絡(luò)將藥物社區(qū)發(fā)現(xiàn)問(wèn)題轉(zhuǎn)化為符號(hào)圖上的半監(jiān)督聚類問(wèn)題,預(yù)測(cè)節(jié)點(diǎn)的歸屬,依據(jù)藥物社區(qū)推斷出潛在的藥物特性。引入基于半監(jiān)督符號(hào)神經(jīng)網(wǎng)絡(luò)來(lái)解決這種問(wèn)題,該項(xiàng)技術(shù)在測(cè)試實(shí)驗(yàn)中呈現(xiàn)良好的反應(yīng),對(duì)該思路給出了進(jìn)一步肯定。

1 符號(hào)網(wǎng)絡(luò)中的藥物社區(qū)發(fā)現(xiàn)問(wèn)題

藥物社區(qū)發(fā)現(xiàn)問(wèn)題依賴于藥物-藥物相互作用組成的同構(gòu)符號(hào)圖結(jié)構(gòu)以及其中各個(gè)藥物自身的特征信息。藥物互作用被分為積極作用(Positive)、消極作用(Negative)、無(wú)相互作用(Not Interaction)三種方式[12]。本文考慮了藥物互作用的具體模式,根據(jù)它們的類型定義符號(hào)網(wǎng)絡(luò)并給出藥物社區(qū)發(fā)現(xiàn)的符號(hào)化定義。

我們從DrugBank[13]中搜集所需DDI 數(shù)據(jù),構(gòu)建帶符號(hào)的有向DDI網(wǎng)絡(luò):

首先,我們的數(shù)據(jù)集來(lái)源于Shi 團(tuán)隊(duì)[14]于2019 發(fā)布的兩個(gè)數(shù)據(jù)集,它們分別包含1562 個(gè)藥物節(jié)點(diǎn)和1935 個(gè)藥物節(jié)點(diǎn)。然后,我們將其組織成為一個(gè)符號(hào)DDI網(wǎng)絡(luò)G(V,E,w,XV),其中網(wǎng)絡(luò)節(jié)點(diǎn)為藥物;邊E=表示藥物互作用。Drug-Bank 中的“increase”和“decrease”信息,分別標(biāo)記兩藥物之間連邊符號(hào)為“+”和“-”;表示邊權(quán);表示各藥物節(jié)點(diǎn)的特征向量。

對(duì)于上述的有向符號(hào)圖,很容易給出如下定義表示藥物社區(qū)[15](C1,C2,…,Ck):

(2)在C1,C2,C3,…,Ck各自的內(nèi)部,有較多符號(hào)為“+”的邊;

(3)連接C1,C2,C3,…,Ck的邊中,有較多符號(hào)為“-”的邊;

(4)從C1,C2,C3,…,Ck各自出發(fā),到圖的其他部分只有較少的邊。

如圖1所示,藥物社區(qū)發(fā)現(xiàn)問(wèn)題即為根據(jù)上述的一個(gè)帶符號(hào)的有向DDI 網(wǎng)絡(luò),分割或聚類出數(shù)個(gè)藥物社區(qū),各個(gè)藥物社區(qū)內(nèi)部連接緊密,外部連接稀疏。

圖1 藥物社區(qū)發(fā)現(xiàn)問(wèn)題示意圖

2 基于半監(jiān)督符號(hào)圖聚類的藥物社區(qū)發(fā)現(xiàn)

本文選用了2022年He等[16]提出的一種有別于平衡理論的藥物社區(qū)發(fā)現(xiàn)方法:半監(jiān)督符號(hào)圖聚類(semi-supervised signed network clustering,SSSNET)。該方法不基于平衡理論地處理有向網(wǎng)絡(luò)中的問(wèn)題,端到端地結(jié)合了嵌入生成和聚類,沒(méi)有中間步驟,以節(jié)點(diǎn)聚類為主要焦點(diǎn),側(cè)重于網(wǎng)絡(luò)中出現(xiàn)的極化效應(yīng),具有良好的效應(yīng)。

2.1 算法目標(biāo)

算法建立于一張表示為G(V,E,w,XV)的有向符號(hào)網(wǎng)絡(luò)上,其中V為節(jié)點(diǎn)集,E為有向邊集,w為邊的權(quán)重集,XV表示各節(jié)點(diǎn)的特征向量,節(jié)點(diǎn)的總數(shù)為n= |V|。在此基礎(chǔ)上,定義鄰接矩陣A:若節(jié)點(diǎn)Vi和Vj之間存在邊,則Aij=wij,即為邊權(quán);否則Aij= 0。

將有向符號(hào)網(wǎng)絡(luò)G聚類為k個(gè)簇是將節(jié)點(diǎn)集劃分為k個(gè)不相交的集合V=C0∪C1∪… ∪Ck-1。在半監(jiān)督設(shè)置中,對(duì)于k個(gè)簇的每一個(gè),選擇一部分訓(xùn)練節(jié)點(diǎn)作為種子點(diǎn),在訓(xùn)練之前已知種子點(diǎn)標(biāo)簽。種子節(jié)點(diǎn)的集合表示為Vseed?Vtrain?V,其中Vtrain是所有訓(xùn)練節(jié)點(diǎn)的集合。

在上述的基礎(chǔ)上,SSSNET 算法的目標(biāo)可以表示為:已知部分種子點(diǎn)的標(biāo)簽Vseed與簇總數(shù)k,將其余各個(gè)節(jié)點(diǎn)分配至與之最匹配的簇。

2.2 基于路徑的節(jié)點(diǎn)關(guān)系定義

與平衡理論不同,SSSNET 對(duì)“朋友”和“敵人”的定義是基于源節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)之間給定長(zhǎng)度內(nèi)的一組路徑。

如圖2所示,若源節(jié)點(diǎn)Vi沿著從Vi到Vj的長(zhǎng)度為h的給定路徑上的所有邊均為“正”,則稱目標(biāo)節(jié)點(diǎn)Vj是源節(jié)點(diǎn)Vi沿著從Vi到Vj的長(zhǎng)度為h的給定路徑的“朋友”鄰居節(jié)點(diǎn);反之,若源節(jié)點(diǎn)Vi沿著從Vi到Vj的長(zhǎng)度為h的給定路徑上的邊有且僅有一條為“負(fù)”,則稱目標(biāo)節(jié)點(diǎn)Vj是源節(jié)點(diǎn)Vi沿著從Vi到Vj的長(zhǎng)度為h的給定路徑的“敵人”鄰居節(jié)點(diǎn)。否則,Vi和Vj在此路徑上彼此中立。對(duì)于有向符號(hào)網(wǎng)絡(luò),只考慮有向路徑,因此節(jié)點(diǎn)之間的“友誼”關(guān)系不再對(duì)稱。

圖2 基于路徑的節(jié)點(diǎn)關(guān)系定義例圖

2.3 SSSNET算法過(guò)程

我們將鄰接矩陣A分解為正和負(fù)部分A+與A-,其中。然后,分別對(duì)其進(jìn)行如下歸一化操作,得到四個(gè)特殊的鄰接矩陣:

再對(duì)各個(gè)部分計(jì)算特征映射函數(shù),以為例:

其中:,M均為可學(xué)習(xí)參數(shù),d為節(jié)點(diǎn)嵌入的維度。同理可以得到:四個(gè)特征映射函數(shù)。將其拼接可得到一個(gè)n× 4d的矩陣ZV,其中,節(jié)點(diǎn)Vi的嵌入向量Zi是ZV的第i行。

最后,我們對(duì)ZV進(jìn)行線性變換,使得生成的矩陣變換至與聚類數(shù)k相同的列數(shù)。再對(duì)其應(yīng)用softmax 函數(shù)激活,即可將每一行映射到長(zhǎng)度等于聚類數(shù)k的概率向量Pi,由此最終可以得到各個(gè)節(jié)點(diǎn)的簇歸屬。

3 實(shí)驗(yàn)

表1 說(shuō)明了本文所使用的數(shù)據(jù)集詳細(xì)情況,本文將在此基礎(chǔ)上進(jìn)行實(shí)驗(yàn)以驗(yàn)證本文方法的有效性。實(shí)驗(yàn)結(jié)果以調(diào)整蘭德系數(shù)(Adjusted Rand Index, ARI)、準(zhǔn)確率precision值、召回率recall值、F1值為判定標(biāo)準(zhǔn)。

表1 藥物互作用數(shù)據(jù)說(shuō)明

本文將數(shù)據(jù)集采用十折交叉驗(yàn)證的方式進(jìn)行實(shí)驗(yàn),即:將數(shù)據(jù)集隨機(jī)劃分為十等份樣本,共計(jì)進(jìn)行十次實(shí)驗(yàn),每次實(shí)驗(yàn)取其中九份為訓(xùn)練集,一份為測(cè)試集,十次實(shí)驗(yàn)后取平均指標(biāo)評(píng)估模型性能。

本文采用聚類評(píng)價(jià)指標(biāo)調(diào)整蘭德系數(shù)ARI、precision值、recall值、F1 值進(jìn)行評(píng)估,指標(biāo)定義如下:

其中:TP表示兩個(gè)同類樣本點(diǎn)在同一個(gè)簇中的情況數(shù)量;FP表示兩個(gè)非同類樣本點(diǎn)在同一個(gè)簇中的情況數(shù)量;TN表示兩個(gè)非同類樣本點(diǎn)分別在兩個(gè)簇中的情況數(shù)量;FN表示兩個(gè)同類樣本點(diǎn)分別在兩個(gè)簇中的情況數(shù)量。調(diào)整蘭德系數(shù)ARI可以去掉隨機(jī)標(biāo)簽對(duì)于評(píng)估結(jié)果的影響,其取值范圍是[-1, +1 ]。

本文將傳統(tǒng)種子點(diǎn)半監(jiān)督k-means 方法與SSSNET進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如圖3所示。

圖3 實(shí)驗(yàn)結(jié)果展示

實(shí)驗(yàn)結(jié)果表明,SSSNET 算法在藥物社區(qū)發(fā)現(xiàn)方面的聚類評(píng)價(jià)指標(biāo)均超過(guò)傳統(tǒng)的半監(jiān)督聚類方法,說(shuō)明基于半監(jiān)督符號(hào)圖神經(jīng)網(wǎng)絡(luò)聚類SSSNET 算法在藥物社區(qū)發(fā)現(xiàn)方面具有一定的可行性。

4 結(jié)語(yǔ)

將藥物關(guān)系網(wǎng)絡(luò)視作符號(hào)網(wǎng)絡(luò)并使用圖神經(jīng)網(wǎng)絡(luò)方法進(jìn)行藥物社區(qū)發(fā)現(xiàn),在幫助加速理解整個(gè)藥物網(wǎng)絡(luò)的結(jié)構(gòu)和功能這一方面具有較好的作用,對(duì)現(xiàn)代醫(yī)學(xué)具有重要意義。基于半監(jiān)督的符號(hào)圖神經(jīng)網(wǎng)絡(luò)聚類方法經(jīng)過(guò)實(shí)驗(yàn),在藥物數(shù)據(jù)方面具有良好的效果,具有可行性。

猜你喜歡
符號(hào)實(shí)驗(yàn)
記一次有趣的實(shí)驗(yàn)
微型實(shí)驗(yàn)里看“燃燒”
學(xué)符號(hào),比多少
幼兒園(2021年6期)2021-07-28 07:42:14
“+”“-”符號(hào)的由來(lái)
做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
變符號(hào)
NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
太空探索(2016年5期)2016-07-12 15:17:55
倍圖的全符號(hào)點(diǎn)控制數(shù)
圖的有效符號(hào)邊控制數(shù)
主站蜘蛛池模板: 熟女视频91| 日韩国产亚洲一区二区在线观看| 亚洲日韩精品无码专区97| 国产精品欧美激情| 99人妻碰碰碰久久久久禁片| 亚洲无码日韩一区| 草逼视频国产| 国产传媒一区二区三区四区五区| 在线精品亚洲一区二区古装| 国产伦片中文免费观看| 国产福利2021最新在线观看| 久久国产亚洲偷自| 日本尹人综合香蕉在线观看| 99这里只有精品6| 国产成人精品在线| 国内精品视频区在线2021| 久久久久久久久18禁秘| 日本午夜精品一本在线观看| 精品一区二区三区视频免费观看| 亚洲精品高清视频| 成人日韩视频| 国产欧美高清| 97在线免费视频| 日韩一级二级三级| 中文字幕波多野不卡一区| 91在线播放国产| 伊人大杳蕉中文无码| 欧美日韩中文国产va另类| 97综合久久| 国产精品香蕉在线| av天堂最新版在线| 亚洲国产精品人久久电影| 亚洲区第一页| 成人精品午夜福利在线播放| 亚洲日韩精品伊甸| 中文字幕av无码不卡免费| 最新国产网站| 亚洲AV无码一区二区三区牲色| 一区二区理伦视频| 成人午夜精品一级毛片| 91啦中文字幕| 欧洲免费精品视频在线| 亚洲精品老司机| 欧美三级视频网站| 91麻豆国产视频| 欧美一区二区人人喊爽| 国产va免费精品观看| 9cao视频精品| 亚洲中文字幕久久无码精品A| …亚洲 欧洲 另类 春色| 亚洲中文字幕久久无码精品A| 在线欧美日韩| 亚洲色图欧美激情| 国产精品流白浆在线观看| 91精品久久久久久无码人妻| 蜜芽一区二区国产精品| 黄色在线不卡| 欧美一道本| 亚洲精品无码av中文字幕| 久久性视频| 国产91特黄特色A级毛片| 激情影院内射美女| 最新国产你懂的在线网址| 免费国产好深啊好涨好硬视频| 免费女人18毛片a级毛片视频| 中文字幕久久亚洲一区| 91青草视频| 免费看美女毛片| 日韩黄色精品| yjizz国产在线视频网| 全部无卡免费的毛片在线看| 国产欧美精品午夜在线播放| 日韩无码视频播放| 亚洲综合色区在线播放2019| 天天色天天综合| 国产高清在线精品一区二区三区| 黄色网页在线观看| 欧美成人精品在线| 中文字幕在线免费看| 亚洲熟妇AV日韩熟妇在线| 亚洲一级毛片免费看| 一区二区三区四区精品视频 |