999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的數據分類預測及應用

2022-06-23 06:09:08吳貴軍范鵬生陳浩辰楊振興
無線互聯科技 2022年8期
關鍵詞:分類模型

吳貴軍,范鵬生,陳浩辰,楊振興,吳 英

(重慶科技學院智能技術與工程學院,重慶 401331)

0 引言

隨著深度學習的快速發展,數據分類預測算法已經被廣泛應用于社會中的各個領域。 通過深度學習對大數據進行處理分析,人們可以快速、高效地獲取有用的信息。 本文通過深度學習算法對1 974 個樣本中的729 的信息特征進行處理分析,預測出50 個樣本的ADMET(Absorption,Distribution,Metabolism,Excretion,Toxicity)數據。 這些預測數據可以作為治療ERα 類乳腺癌化合物是否適用于人體的一個標準。

1 數據分類預測算法

1.1 決策樹算法

利用決策樹模型算法中的CART(Classification And Regression Tree)分為兩個過程,第一個過程進行遞歸建立二叉樹,第二個過程用驗證數據進行剪枝[1]。假設K個類別,第k個類別的概率為pk,概率分布的基尼系數表達式:

本文中所需要的結果是一個二分類[2],在面對二分類時第一個樣本輸出概率為p,概率分布的基尼系數表達式為:

1.2 SVM 算法

支持向量機 (Support Vector Mac,SVM)是一種二分類的模型。 支持向量機通過在兩個不同類之間尋找一個超平面,使類之間的分離邊界最大化,從而建立分類預測模型。 公式如下:

其中,x表示特征,y表示類標,n為樣本的個數,m為特征的個數。 假設樣本數據是線性可分的,支持向量機通過訓練,尋找一個超平面將數據劃分為兩類,其主要思想為找到空間中的一個能夠將所有數據樣本劃開的超平面,并且使得樣本集中所有數據到這個超平面的距離最短,點到超平面的距離d就可以用如下公式進行計算:

通過上述公式可以將所有數據變量看成一個樣本,把每個樣本點按照支持向量機的方法在高維數據中找出一個超平面,計算出每個點到這個平面的距離,通過距離對樣本點進行逐個分類。

1.3 KNN 算法

使用KNN 算法時,需要對KNN 選擇最佳K值和權重,同時需要了解KNN 的基本原理,構建訓練樣本集和測試樣本集,計算測試樣本集里的樣本與所有訓練樣本集里的樣本的距離。 訓練樣本集 A ={y1,…yn},測試樣本集 B ={x1,…,xn}。 計算樣本距離公式如下:

計算出距離后,需要比較所有訓練樣本點到某個測試樣本點的距離,選出K個距離最小的訓練樣本點。

1.4 貝葉斯算法

貝葉斯模型算法原理是基于貝葉斯定理的一組監督學習算法,即假設每對特征之間相互獨立。 給定一個類別y和一個從x1到xn的相關的特征向量,貝葉斯定理[3]闡述了以下關系:

使用簡單(naive)的假設:每對特征之間都相互獨立:

對于所有的math:i,這個關系式可以簡化為:

由于在給定的輸入中p(y/x1….xn) 是一個常量,使用下面的分類規則:

可以使用最大后驗概率(Maximum A Posteriori,MAP)來估計p(y)和p(xi/y),樸素貝葉斯分類器的差異大部分來自于處理p(xi/y)分布時的所做的假設不同,假設不一樣最后獲得的結果也不一樣。

1.5 多層感知分類器

多層感知器也叫作人工神經網絡(Artificial Neural Network,ANN)。 多層感知器分類器(MLPC)是基于前饋人工神經網絡(ANN)的分類器。 MLPC 由多個節點層組成,每個層連接到網絡中的下一層。 輸入層中的節點表示輸入數。 所有其他節點,通過輸入與節點的權重w和偏置b的線性組合,并應用激活函數,將輸入映射到輸出。 對于具有K+ 1 層的MLPC,這可以以矩陣形式寫成如下:

中間層中的節點一般使用sigmoid(logistic)函數,公式如下:

輸出層中的節點使用softmax 函數:

2 應用實驗及結果

本文主要對Erα(Estrogen receptors alpha)具有活性影響的化合物進行ADMET(Absorption,Distribution,Metabolism,Excretion,Toxicity)性質數據預測分類,構建了5 個預測分類模型分別對文中所給的5 個性質進行了預測分類。 5 個預測分類模型分別是KNN 算法、CART 算法、VM 算法、貝葉斯算法、MLPC 算法。 每個模型的預測精度如表1 所示。

表1 5 種化合物預測精度

3 結語

本文利用5 種分類預測模型對化合物的ADMET性質進行分類預測,通過預測結果顯示,使用決策樹模型進行預測時精準度最高,達到了90%,即表示在CYP3A4 性質預測數據中有90%的化合物可用于治療乳腺癌。 ADMET 性質數據對于乳腺癌治療有著重要的作用,可以用來驗證ERα 拮抗劑具有高活性的化合物是否適用于人體的標準。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 激情综合网激情综合| 国产精品三级av及在线观看| 国产内射在线观看| 九色视频最新网址| 久久人与动人物A级毛片| 国产在线观看第二页| av在线5g无码天天| 国产AV毛片| 国产成人一区二区| h网站在线播放| 亚洲精品高清视频| 久久午夜影院| 成人国产一区二区三区| 亚洲成人播放| 亚洲第一网站男人都懂| 欧美精品1区2区| 欧美一级爱操视频| 国产综合日韩另类一区二区| 日韩人妻少妇一区二区| 激情午夜婷婷| 免费观看男人免费桶女人视频| 国产人免费人成免费视频| 国产成人欧美| 欧美不卡视频一区发布| 欧美中文字幕在线视频| 天天操天天噜| 直接黄91麻豆网站| 日韩在线永久免费播放| 免费a级毛片视频| 亚洲欧美日韩成人在线| 中文字幕亚洲精品2页| 国产va免费精品观看| 色久综合在线| 欧美一级黄片一区2区| 国产视频一区二区在线观看| 免费全部高H视频无码无遮掩| 国产视频大全| 男女男免费视频网站国产| 香蕉蕉亚亚洲aav综合| 黄色网在线免费观看| 亚洲美女高潮久久久久久久| 日韩欧美高清视频| 国内毛片视频| 伊人精品成人久久综合| 亚洲成人免费在线| 久久精品亚洲专区| 亚洲人精品亚洲人成在线| 伊人福利视频| 久久精品丝袜| jizz国产视频| 无码 在线 在线| 亚洲三级视频在线观看| 伊人久久大香线蕉成人综合网| 国产一区三区二区中文在线| 欧美影院久久| 欧美成人精品高清在线下载| 久久久精品久久久久三级| 国产精品久久久久鬼色| 中文字幕在线永久在线视频2020| 人妻精品久久无码区| 无码高清专区| 色妺妺在线视频喷水| www成人国产在线观看网站| 日本高清有码人妻| 自拍偷拍欧美日韩| 成人字幕网视频在线观看| 国内精品九九久久久精品| 国产精品欧美日本韩免费一区二区三区不卡 | 18禁高潮出水呻吟娇喘蜜芽| 亚洲欧美精品一中文字幕| 国产欧美视频在线| 无码中文AⅤ在线观看| 国产经典免费播放视频| 亚洲高清日韩heyzo| 日韩 欧美 小说 综合网 另类| 国产免费久久精品99re丫丫一| 91福利免费| 日本成人精品视频| 国产97视频在线| 国产三级视频网站| 国产青青操| 欧美精品导航|