999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于重啟隨機游走算法的生物信息學關聯預測模型

2021-07-05 12:00:14張銘文劉志豪盧星辰
電子技術與軟件工程 2021年10期
關鍵詞:關聯語義模型

張銘文 劉志豪 盧星辰

(曲阜師范大學網絡空間安全學院 山東省濟寧市 273100)

1 引言

miRNA 是在真核生物中發現的一類內源性的具有調控功能的非編碼 RNA, 其大小長約 20~25 個核苷酸。在醫學界,研究人員主要利用生物實驗的相關方法去探究 miRNA 和疾病之間的關系。但是,生物實驗方法通常具有耗時長、費用高和盲目性大等缺點。因此,借助預測疾病‐miRNA 之間潛在關聯的計算模型,利用各種已經驗證的生物學數據,可以挖掘出二者之間關聯概率得分最高的疾病‐miRNA 對,再針對性地進行生物實驗,便可以有效降低實驗時間和實驗成本。因此,探究更為準確的疾‐miRNA 之間的關聯關系,將不僅有利于人類理解疾病的發病機制,為預防和診治疾病提供新的思路[1],而且可以反哺醫學研究,為準確開展生物實驗提供可靠指引。科學研究表明,功能相似的 miRNA 在調控疾病方面也比較相似,反之亦然。通過測量相似度的方法來預測 miRNA‐疾病的關聯,作為較早的預測思路之一, 現如今依然有著良好的發展[2‐6]。2009年,Jiang 等人[7]通過構建疾病的表型相似網絡、miRNA功能相關網絡 和疾病的表型‐miRNA 網絡,預測得到了疾病‐miRNA之間關聯關系。該方法首次基于miRNA 的相關信息和疾病的表型信息,構建了能夠預測疾病和 miRNA 之間關聯關系的網絡模型,為生物信息學的未來研究工作提供了新的思路。然而,該方法也存在一些不足之處,為了改進不足之處,Jiang 等人[8]在2010年再次提出了一種融合基因組數據的預測方法,利用樸素貝葉斯模型實現了多種來源數據的融合,構建了基于基因之間功能關系的信息模型,實驗取得了較好的預測結果。2013年,在疾病相似性網絡上,Chen 等人[9]應用隨機游走算法實現了 miRNA‐疾病關聯預測,此后,Liu 等人[10]融合疾病的語義相似信息、miRNA 的功能相似信息和 miRNA 與疾病之間已知的關聯信息,構 建了多源異構網絡,繼而利用隨機游走算法預測疾病‐miRNA 之間的關聯關系。實驗表明,該方法可以預測未知miRNA 關聯信息的新疾病。值得介紹的是,多 源異構網絡的應用對后續 miRNA‐疾病關聯的預測研究具有巨大的借鑒價值。2018年,Chen 等人[5]提出了一種基于歸納矩陣填充的算法來預測 miRNA‐疾病之間的關聯。首先利用 miRNA的功能相似性、疾病語義相似性和高斯相似 性來計算 miRNA 和疾病各自的集成相似性,然后采用歸納矩陣填充的方法從中歸納出miRNA 和疾病的有效特征信息,并用來填充 miRNA‐疾病關聯矩陣中的缺失信息。2019年,Chen 等人[4]提出一種基于二分異構網絡聯合近鄰的 miRNA‐疾病關聯預測算法,根據網絡上簡單路徑的數量計算出來 miRNA 和疾病各個結點的初始關聯分數,而疾病和miRNA 各自的次級空間關聯得分則由其自身的相似性 網絡和初始關聯得分計算得出,最后將二者的次級空間得分加以整合得到了最終的 miRNA‐疾病關聯預測得分。2020年,Wang 等人[6]提出了一種基于數據融合的miRNA‐疾病關聯預測算法,通過將miRNA功能相似性網絡、基因功能相似性網絡和疾病語義相似性網絡融合在一起來對 miRNA 和疾病之間的關聯關系進行預測,彌補了以往因為使用蛋白質之間相互作用網絡而造成假陽性結果的不足。但以往的研究都忽略了數據自身的拓撲結構,因此本文采用重啟隨機游走的算法充分挖掘了數據的拓撲網絡相似性,使得預測模型的準確性得到進一步的提高。RWRCMF 模型流程圖如圖1所示。

圖1:RWRCMF 模型流程圖

2 數據獲取及預處理

2.1 已知的miRNA-疾病關聯

現有的HMDDv2.0[11]數據庫中包含了383 個疾病和495 個miRNA 之間5430 已被驗證的關聯信息。本文利用5430 個已知關聯構建出一個鄰接矩陣用來存儲這些數據,其中n 表示miRNA 的個數,m 表示疾病的個數。經實驗驗證后的miRNA mi如果和疾病dj有關聯,則矩陣元素Yij為1,否則為0。

2.2 miRNA的功能相似性

研究發現,那些功能相似性的miRNA 往往更可能與相似的疾病有關聯,反之亦然[12‐13]。借助Wang 等人[14]的研究,本文得到了miRNA 之間的功能相似性分數,并以此為據構造出了miRNA的功能相似性矩陣矩陣中的各個元素值代表了miRNA mi和mj二者的功能相似性得分。

2.3 疾病語義相似性

本文根據Wang 等人[14]提出的層級有向無環圖(DAG)計算得出了疾病的語義相似性。疾病之間的DAG 圖從MeSH 數據庫中下載。DAGd=(d, Td, Ed)表示疾病d 的DAG 圖,其中Td表示疾病的集合,Ed表示DAG 圖中互相連接關系的結合。由此,本文將根據DAG 圖按照以下公式計算疾病D 的語義值:

其中,DD(d)表示疾病d’對疾病d 的語義貢獻值,如公式(2)所示,表示語義貢獻因子,由Wang 等人[14]文獻可知=0.5。

因此,根據兩個疾病在DAG 圖上重復越多,則其彼此之間相似性更大的理論假設,本文由公式(3)計算得到疾病di和dj之間的語義相似性,并構建出了疾病的語義相似性矩陣其中矩陣的每個元素SD(di, dj)表示為疾病di和dj之間的語義相似性得分。

2.4 miRNA和疾病的拓撲相似性

為了提高預測結果的準確性,本文借助公式(4)和(5)在相似網絡上運用重啟隨機游走算法(RWR)得到了miRNA 和疾病各自的拓撲相似性。

在經過數次迭代后,我們得到了一個穩態矩陣S∞,當Sim 的值為矩陣SM 時,所得的S∞=SRM,表示miRNA 的拓撲網絡相似性矩陣;當Sim 的值為矩陣SD 時,所得的S∞=SRD,表示疾病的拓撲網絡相似性矩陣。

2.5 高斯核相互作用譜相似性

以往許多對miRNA‐疾病之間關聯預測的模型都運用了高斯核相互作用譜相似性來度量疾病和miRNA 各自的相似性,并達到了較好的預測結果,本文用IP(di)和IP(mj)分別表示疾病di和miRNA mj的相互作用譜,并根據公式(6)計算疾病di和dj之間的高斯核相互作用譜相似性。

類似的,本文借助公式(7)計算miRNA mi和mj的高斯核相互作用譜相似性。

其中的核帶寬βm、βd由如下公式定義,和為原始帶寬。

因此,疾病和miRNA 的高斯核相互作用譜相似性分別用矩陣GD、GM 來表示。

2.6 此疾病語義相似性

根據上述各種方法完成了miRNA 和疾病相似性度量,并將這些相似性進行整合得到了最終的miRNA 相似性和疾病相似性,其中miRNA 的功能相似性矩陣SMM 由公式(10)計算得來,疾病的語義相似性矩陣SDD 由公式(11)計算得來,元素SMM(mi, mj)表示miRNA mi和mj的相似性,元素SDD(di, dj)表示疾病di和dj的相似性。

2.7 加權K近鄰(WKNKN)預處理

將n 個miRNA 和m 個疾病分別用集合M={m1,m2,…mn}和D={d1,d2,…dn}來表示。已知鄰接矩陣表示現有數據庫中的miRNA 和人類之間的疾病關聯,但矩陣Y 中的元素過于稀疏,因此利用加權K 近鄰(WKNKN)算法對矩陣Y 進行預處理,使得矩陣中的0 元素會被一個0 到1 之間的約數所替換。WKNKN 的具體步驟如下:

首先,根據miRNA mq與其他K 個最近鄰miRNA 的相似性和所對應的K 相互作用關系,得到下列相互作用譜:

公式中,m1到mk是將與mq相似性進行降序排列之后所得的miRNA。表示權重參數,且mi和mq之間相似的分越高,權重參數值越大。是衰減控制項,是用來歸一化的參數。

同理可得,疾病dp和其K 個近鄰疾病的相似性以及對應的K相互作用譜,得到了如下疾病作用譜。

二公式中dl到dk是由各自與dp的相似性按照降序排列之后的疾病,表示權重參數,且dj和dp之間相似性得分越高則權重就越大。類似的,是歸一化參數。

最后,將關聯矩陣Y 中的0 元素用Ym和Yd的平均值替換下來,并按照公式(12)對原始矩陣Y 進行更新。

3 改進協同矩陣分解

3.1 標準協同矩陣分解

此Shen 等人[15]將協同矩陣分解模型用在了miRNA‐疾病關聯預測問題上,并達到了預期效果。CMF 目標函數如下:

3.2 基于圖拉普拉斯正則化的協同矩陣分解

處為了降低數據的過擬合問題,提升模型在預測miRNA‐疾病關聯過程中的準確性,本文在原有矩陣分解的基礎上引入圖拉普拉斯正則化,并構造出了如下目標函數:

3.2.1 初始化A、B

在miRNA‐疾病關聯矩陣Y 進行預處理的過程中,本文采用奇異值分解(SVD)的方式初始化矩陣A、B,過程如下:

3.2.2 優化過程

本文采用最小二乘法對矩陣A、B 進行迭代求解。首先,將目標函數用L 來表示,然后令求得更新之后的迭代規則,此時A、B 將按如下公式迭代更新直到收斂。

4 實驗結果分析

4.1 性能評估

為了進一步對重啟隨機游走算法改進后的協同矩陣矩陣分解預測模型(RWRCMF)進行預測性能的評估,本文將RWRCMF 與三個主流模型ICFMDA[16]、SACMDA[17]、IMCMDA[18]進行對比,模型的評估標準使用機器學習方法中的五折交叉驗證和留一交叉驗證。

降根據留一交叉驗證的結果,本文繪制了對應的接收器操作特性(ROC)曲線,因此可以通過計算得出ROC曲線下的面積(AUC值)來評估預測模型的性能。AUC 值的大小介于0 到1 之間,并且模型的預測性能和AUC 值的高低成正比。由圖2 可知,RWRCMF、IMCMDA、ICFMDA 和SACMDA 所對應的AUC 值分別為:0.9506、0.8384、0.9072、和.8777,顯然RWRCMF 預測模型在上述方法中獲得了最佳的預測表現。

圖2:RWRCMF、IMDMDA、ICFMDA 和SACMDA 的留一交叉驗證ROC曲線以及對應的AUC 值

在對模型的五折交叉驗證過程中,首先將已知的miRNA‐疾病關聯樣本任意分成五部分,然后選擇其中的四部分作為模型在學習過程中的訓練樣本,余下的作為評價模型的測試樣本。類似于留一交叉驗證,所有未知關聯的miRNA‐疾病關聯樣本來作為候選樣本。同時因為考慮到樣本在劃分過程中因為隨機性而導致的偏差,本文進行了100 次的劃分,也就是執行了100 次的五折交叉驗證,最終得到了各個模型的ROC 曲線和對應的AUC 值。圖3 結果表明RWRCMF 模型的預測效果最好,其AUC 值為0.9468,而IMCMDA、ICFMDA 和SACMDA 的AUC 值分別為0.8330、0.9046和0.8773。

圖3:RWRCMF、IMDMDA、ICFMDA 和SACMDA 的五折交叉驗證ROC曲線以及對應的AUC 值

5 總結

越來越多的研究發現miRNA 的異常表達影響著人類復雜疾病的產生和發展,傳統實驗的方法探究miRNA 和疾病之間的關聯有著耗時長、成本高的缺點,因此開發更高效的計算模型用于miRNA‐疾病的潛在關聯識別顯得尤為重要。在本文中,我們提出了一個基于重啟隨機游走算法改進后的協同矩陣分解預測模型(RWRCMF)用于識別miRNA‐疾病之間的新關聯,通過重啟隨機游走算法處理疾病和miRNA 的相似性數據,并整合高斯核譜相似性來作為最終的數據集。借助協同矩陣分解中的目標函數獲得了miRNA‐疾病的關聯得分矩陣,并在實驗評估環節采用留一交叉驗證和五折交叉驗證橫向對比了RWRCMF 與以往模型的預測準確性,證實了RWRCMF 在miRNA‐疾病關聯預測方面有著較為出色的表現。

猜你喜歡
關聯語義模型
一半模型
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
語言與語義
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
3D打印中的模型分割與打包
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
主站蜘蛛池模板: 天堂网亚洲系列亚洲系列| 亚洲精品第一在线观看视频| 国产国模一区二区三区四区| 欧美日韩成人在线观看| 国产精品成人免费视频99| 无码国产偷倩在线播放老年人| 欧美区日韩区| 中文字幕精品一区二区三区视频| 久久香蕉国产线看精品| 91久久偷偷做嫩草影院免费看 | 天堂亚洲网| 欧美日韩导航| 亚瑟天堂久久一区二区影院| 国产va视频| www.av男人.com| 她的性爱视频| 国产精品第页| 成人中文字幕在线| 久久亚洲国产一区二区| 国产亚洲视频播放9000| 四虎成人在线视频| 久久精品娱乐亚洲领先| 精品国产成人av免费| 国产视频 第一页| 五月激激激综合网色播免费| 一本综合久久| 国产精品刺激对白在线| 日韩国产高清无码| 久久久久人妻精品一区三寸蜜桃| 欧美日韩91| 亚洲一区二区三区中文字幕5566| 久久伊人操| 国内毛片视频| 亚洲男人的天堂网| 亚洲欧美自拍视频| 新SSS无码手机在线观看| 精品三级网站| 亚洲天堂成人| 97影院午夜在线观看视频| 亚洲精品图区| 欧美日韩在线成人| 国产午夜无码片在线观看网站| 欧美不卡二区| 又粗又大又爽又紧免费视频| 欧美a在线| 亚洲欧美不卡中文字幕| 国产在线八区| 国产va免费精品观看| 国产精品毛片一区| 在线观看91精品国产剧情免费| 不卡无码网| 亚洲欧美一区二区三区蜜芽| 日韩视频福利| 精久久久久无码区中文字幕| 男女精品视频| 久久人人爽人人爽人人片aV东京热| 久久久成年黄色视频| 欧美国产日韩在线| 国产第八页| 国内精品久久久久久久久久影视| 中文无码精品A∨在线观看不卡| 久久人人妻人人爽人人卡片av| 激情视频综合网| 青青草久久伊人| 日韩小视频在线播放| 久久女人网| 精品人妻一区无码视频| 中文纯内无码H| 午夜不卡福利| 毛片久久网站小视频| 久久久久无码精品| 国产精品欧美激情| 免费毛片视频| 久久久久无码精品| 久久夜夜视频| 色偷偷男人的天堂亚洲av| 福利视频一区| 亚洲欧洲自拍拍偷午夜色| 国产欧美精品一区二区| 手机永久AV在线播放| 色老头综合网| 日韩精品久久久久久久电影蜜臀|