999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

卷積神經(jīng)網(wǎng)絡(luò)中SPReLU激活函數(shù)的優(yōu)化研究*

2021-09-15 08:34:56吳婷婷許曉東吳云龍
計算機與數(shù)字工程 2021年8期
關(guān)鍵詞:文本實驗模型

吳婷婷 許曉東 吳云龍

(江蘇大學(xué)計算機科學(xué)與通信工程學(xué)院 鎮(zhèn)江 212013)

1 引言

隨著信息爆炸引發(fā)“大數(shù)據(jù)”時代的到來,海量的文本信息也隨之而來,如何從這些浩瀚的文本信息中提取出有價值的文本信息并分類,以及如何提高這些文本信息分類的準(zhǔn)確性已成為目前的研究熱點和難點。

傳統(tǒng)文本分類模型聚焦在特征提取和選擇[1]上,常用方法有TF-IDF、詞頻、互信息等。也有學(xué)者認為利用文本的語義信息可以更好地進行文本分類,于是使用語義詞典來提取特征并分類[2]。近年來,深度學(xué)習(xí)(Deep Learning,DL)逐漸發(fā)展,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network)尤其是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[3~4]作為近幾年來圖像處理和語音識別中的研究熱點[5],在自然語言處理(Natural Language Processing,NLP)的各個任務(wù)中也都取得了顯著效果[6]。因此,學(xué)者們的研究重心轉(zhuǎn)移到了基于深度神經(jīng)網(wǎng)絡(luò)的分類模型上[7]。

深度神經(jīng)網(wǎng)絡(luò)文本分類模型[8~9]的性能優(yōu)越,CNN模型的研究工作受到了學(xué)者的高度重視。隨著研究的不斷深入,學(xué)者們發(fā)現(xiàn)CNN模型中存在一些問題,例如,CNN模型本身比較復(fù)雜,建模過程存在一定難度;由于某些激活函數(shù)具有特殊的性質(zhì),導(dǎo)致了CNN模型在訓(xùn)練過程中容易出現(xiàn)梯度消失[10]、神經(jīng)元死亡[11]、均值偏移[12]、收斂速度慢、稀疏表達能力弱等問題[13]。

為了解決上述問題,本文分析研究了幾種常用激活函數(shù)的特性,并綜合ReLU、PReLU、Softplus三種激活函數(shù)的優(yōu)缺點,提出了一種新型激活函數(shù)SPReLU。最后,建立基于CNN的文本分類模型,在MR數(shù)據(jù)集上進行實驗,對比這幾種激活函數(shù)對文本分類模型的準(zhǔn)確率和損失函數(shù)的影響。

2 常用激活函數(shù)及其特性

激活函數(shù)是深度神經(jīng)網(wǎng)絡(luò)的一個重要特征,它為神經(jīng)網(wǎng)絡(luò)提供了非線性建模能力,使網(wǎng)絡(luò)能夠更好地模擬數(shù)據(jù)特征,從而解決較為復(fù)雜的問題;同時,在反向傳播過程中,通過激活函數(shù)的誤差梯度來調(diào)整權(quán)重和偏置。神經(jīng)網(wǎng)絡(luò)中單個神經(jīng)元的工作機制[15]如圖1所示。計算公式為

圖1 單個神經(jīng)元的工作機制

其中,f為激活函數(shù),w為權(quán)重,b為偏置。

2.1 Sigmoid激活函數(shù)

Sigmoid[14]激活函數(shù)是一種光滑連續(xù)并且單調(diào)遞增的S型函數(shù),其數(shù)學(xué)形式為

Sigmoid函數(shù)具有以下特性:首先,函數(shù)的值域為0到1,其輸出范圍有限,輸出結(jié)果更加穩(wěn)定,可以用作模型的輸出層;其次,該函數(shù)的數(shù)學(xué)表達式簡單,求導(dǎo)更加容易。然而,由于Sigmoid函數(shù)具有軟飽和性,在定義域內(nèi)處處可導(dǎo),當(dāng)x軸無限趨向于正無窮或負無窮時,函數(shù)的斜率幾乎為0,這種特性造成了梯度的消失;由于該函數(shù)是非零均值,影響了梯度的下降,導(dǎo)致了CNN模型在訓(xùn)練時不收斂。

Sigmoid函數(shù)圖像如圖2所示。

圖2 Sigmoid函數(shù)圖像

2.2 Tanh激活函數(shù)

Tanh[16]激活函數(shù)是對Sigmoid函數(shù)非零均值缺點的改進,輸出結(jié)果以0為中心,使得模型的收斂更加快速。其數(shù)學(xué)形式為

Tanh激活函數(shù)雖然對Sigmoid進行了一定的改進,提高了其收斂速度,但是卻沒有改變Sigmoid函數(shù)中由于軟飽和性而造成的梯度消失問題。

Tanh函數(shù)圖像如圖3所示。

圖3 Tanh函數(shù)圖像

2.3 ReLU激活函數(shù)

ReLU[17]激活函數(shù)是目前最受學(xué)者們歡迎的一種修正型激活函數(shù),它有效地緩解了“S”型激活函數(shù)梯度消失的問題,然而卻依然存在均值偏移的缺點。其數(shù)學(xué)形式為

當(dāng)x≥0時,ReLU函數(shù)的輸出結(jié)果與輸入相同,其斜率始終為1,有效地解決了梯度消失的問題;當(dāng)x<0時,函數(shù)硬包和[18],輸出結(jié)果強制變?yōu)?,梯度也始終為0,一定程度上給CNN模型帶來了稀疏特性,緩解了過擬合問題;然而,正是由于這種特性,也導(dǎo)致了神經(jīng)元死亡現(xiàn)象的出現(xiàn),使得計算的結(jié)果不收斂,權(quán)重?zé)o法更新。

ReLU函數(shù)圖像如圖4所示。

圖4 ReLU函數(shù)圖像

2.4 PReLU激活函數(shù)

PReLU[19]激活函數(shù)是對ReLU函數(shù)的改進,它對負半軸進行修正,有效緩解了神經(jīng)元壞死問題。其數(shù)學(xué)形式為

在大于0部分,輸出保持與輸入相同;小于0部分,其輸出結(jié)果隨參數(shù)a的變化而變化。然而,由于其的線性修正特性,使得模型在表達能力上有所欠缺。

PReLU函數(shù)圖像如圖5所示。

圖5 PReLU函數(shù)圖像

2.5 Softplus激活函數(shù)

Softplus[20]激活函數(shù)的數(shù)學(xué)形式為

Softplus激活函數(shù)與Sigmoid和Tanh函數(shù)相比,能夠快速收斂;其次,該函數(shù)圖像光滑,符合生物神經(jīng)元特征,可以更好地模擬神經(jīng)元工作特性。然而,與ReLU和PReLU相比,該函數(shù)欠缺稀疏表達能力。

Softplus函數(shù)圖像如圖6所示。

圖6 Softplus函數(shù)圖像

3 改進后的激活函數(shù)SPReLU

3.1 SPReLU改進方法

綜合ReLU、PReLU和Softplus的特性,本文提出了一種新的激活函數(shù)SPReLu,其數(shù)學(xué)形式為

其中,a為隨機參數(shù),根據(jù)模型實時訓(xùn)練發(fā)生變化,最終收斂為適宜的常數(shù)。

該函數(shù)具有以下特性,當(dāng)x≥0時,保留了Re-LU的線性特點,輸出結(jié)果與輸入數(shù)據(jù)保持不變;當(dāng)x<0時,將Softplus函數(shù)的曲線下移ln2個單位,取負半軸曲線并乘上參數(shù)a。

SPReLU函數(shù)的圖像如圖7所示。

圖7 SPReLU激活函數(shù)圖像

其中,參數(shù)a有效地控制了函數(shù)的飽和范圍,它可以通過反向傳播進行訓(xùn)練,并與其他層同時進行優(yōu)化。某一層ai的梯度為

更新ai時采用動量法:

其中,μ是動量系數(shù),α是學(xué)習(xí)率。

3.2 SPReLU函數(shù)性能分析

改進后的SPReLU函數(shù),同時繼承了ReLU、PReLU和Softplus函數(shù)的優(yōu)點,主要包含以下幾個方面。

1)正半軸繼承了ReLU函數(shù),保留了ReLU函數(shù)快速收斂的特點,解決了梯度消失的問題。

2)負半軸繼承了Softplus的光滑的特性,非線性修正了負半軸數(shù)據(jù),增強了CNN模型對樣本數(shù)據(jù)的表達能力;一些負軸的值得以保存,較好地解決了ReLU函數(shù)神經(jīng)元死亡的問題;負半軸增加了參數(shù)a,用參數(shù)激活函數(shù)代替無參數(shù)激活函數(shù),有效地控制了函數(shù)的飽和范圍。

3)最后,與PReLU函數(shù)相比,SPReLU函數(shù)增加了指數(shù)函數(shù),增強了模型的抗噪聲能力。

任何改進都不可能做到完全沒有缺陷,改進后的SPReLU函數(shù)也存在一些不足:

1)相比ReLU函數(shù),SPReLU函數(shù)稀疏表達能力在一定程度上降低了。

2)負半軸的指數(shù)函數(shù)雖然增強了抗噪聲能力,但是,與ReLU和PReLU函數(shù)相比,增加了模型計算的復(fù)雜度。

4 實驗結(jié)果和分析

4.1 實驗環(huán)境及數(shù)據(jù)集

在實驗中,采用64位的Windows 8操作系統(tǒng),基于TensorFlow 1.11.0框架,在PyCharm上進行編碼和調(diào)試,最后在TensorBoard中展示結(jié)果。

為了驗證采用SPReLU激活函數(shù)的卷積神經(jīng)網(wǎng)絡(luò)模型在文本分類中的效果,本文在MR數(shù)據(jù)集上進行實驗。MR數(shù)據(jù)集是Rotten Tomatoes的Movie Review數(shù)據(jù),文件大小為20k,包含10662個句子,一半正面評論一半負面評論,本文使用其中90%的句子進行模型訓(xùn)練,并使用10%的句子模型驗證。實驗重復(fù)進行三次,最終取三次實驗結(jié)果的平均值作為分析對比的數(shù)據(jù)。

4.2 實驗結(jié)果分析

本實驗分別使用Sigmoid、Tanh、Softplus、Re-LU、PReLU和SRPeLU幾種激活函數(shù)進行訓(xùn)練和驗證,對比分析各個激活函數(shù)對CNN模型分類的準(zhǔn)確率和損失函數(shù)的影響。

實驗結(jié)果的準(zhǔn)確率曲線和損失函數(shù)曲線分別如圖8和圖9所示。

圖8 準(zhǔn)確率曲線圖

圖9 損失函數(shù)曲線圖

幾種激活函數(shù)最大準(zhǔn)確率和最低誤差結(jié)果如表1所示。

表1 最大準(zhǔn)確率和最低誤差結(jié)果

從圖8和圖9和表1可以看出,隨著Step的不斷增加,幾種激活函數(shù)的準(zhǔn)確率逐漸增大,損失函數(shù)逐漸減小,最后趨于平緩,準(zhǔn)確率基本保持在0.70~0.75之間,損失函數(shù)在0.6~0.55之間。由于Sigmoid和Tanh函數(shù)本身的飽和特性,導(dǎo)致?lián)p失的特征較多,使得這兩種函數(shù)在準(zhǔn)確率和損失函數(shù)上都不如其他幾種激活函數(shù);Softplus、ReLU和PRe-LU三種激活函數(shù)的準(zhǔn)確率和損失函數(shù)都相差不多;而改進后的SPReLU激活函數(shù)在實驗中的準(zhǔn)確率最高為0.751407,損失函數(shù)結(jié)果最低為0.559。

在實驗過程中,Sigmoid和Tanh函數(shù)收斂最慢,前500步左右,PReLU函數(shù)的收斂速度相對較快,500步之后,SRPeLU函數(shù)的收斂速度逐漸提高,說明負半軸增加的指數(shù)函數(shù),提高了模型的抗噪聲能力,使得收斂速度加快,最終使得SRPeLU函數(shù)收斂最快。因此,相較于常用激活函數(shù),改進后的SRPeLU激活函數(shù)結(jié)合了幾種常用函數(shù)的優(yōu)點,在文本分類中取得了較好的結(jié)果。

5 結(jié)語

本文針對卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)的梯度消失、均值偏移、稀疏表達能力差等問題,分析常用激活函數(shù)特性,并結(jié)合ReLU、PReLU、Softplus三種激活函數(shù)的特性,構(gòu)造了一種新型分段函數(shù)SPReLU作為激活函數(shù),該函數(shù)有效地緩解了梯度消失和神經(jīng)元死亡等問題,收斂速度快,抗噪聲能力強,對樣本數(shù)據(jù)的表達能力更好。實驗結(jié)果表明,改進后的SPRe-LU函數(shù)在性能上優(yōu)于其他函數(shù),對文本分類模型的準(zhǔn)確性有一定的提高。下一步研究工作將對數(shù)據(jù)集的大小、收斂速度與準(zhǔn)確率之間的關(guān)聯(lián)性進行研究,在不同的數(shù)據(jù)集上進行實驗,驗證其關(guān)聯(lián)性。

猜你喜歡
文本實驗模型
一半模型
記一次有趣的實驗
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
在808DA上文本顯示的改善
做個怪怪長實驗
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
3D打印中的模型分割與打包
NO與NO2相互轉(zhuǎn)化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 亚洲国产精品无码AV| 国产成人盗摄精品| 少妇精品在线| 国产剧情一区二区| 亚洲成人播放| 国产麻豆精品久久一二三| 免费看久久精品99| 国产91小视频在线观看| a毛片免费在线观看| 97视频免费看| 国产美女视频黄a视频全免费网站| 国产精品真实对白精彩久久| 激情视频综合网| 婷婷色狠狠干| 日本五区在线不卡精品| 一级黄色片网| 亚洲最猛黑人xxxx黑人猛交| 日韩成人在线网站| 国产激爽大片在线播放| 精品人妻AV区| 在线另类稀缺国产呦| 亚洲一本大道在线| 欧美激情第一区| 久久久精品无码一区二区三区| 全部无卡免费的毛片在线看| 亚洲男人的天堂久久香蕉| 中文字幕色在线| 99九九成人免费视频精品| 精品国产自在现线看久久| 亚洲国产91人成在线| 日韩福利在线观看| 亚洲一区二区约美女探花| 欧美综合成人| 一级黄色欧美| 激情五月婷婷综合网| 77777亚洲午夜久久多人| 一级全黄毛片| 日韩精品无码免费一区二区三区| 亚洲无码视频图片| 国产在线观看第二页| av在线手机播放| 白浆免费视频国产精品视频| 国外欧美一区另类中文字幕| 欧美日韩一区二区在线免费观看| 亚洲综合久久一本伊一区| 日韩av无码精品专区| 免费观看国产小粉嫩喷水| 国产精品亚洲片在线va| 午夜毛片免费看| 免费一级毛片完整版在线看| 2021国产精品自产拍在线观看| 中日韩一区二区三区中文免费视频| 女人天堂av免费| 久久香蕉国产线看观看亚洲片| 麻豆精品久久久久久久99蜜桃| 日韩中文欧美| 国产丝袜丝视频在线观看| 国产一区亚洲一区| 久久美女精品国产精品亚洲| 一级片一区| 91激情视频| 午夜三级在线| 99国产精品国产高清一区二区| 日本国产一区在线观看| 99热这里只有精品2| 无码中文字幕精品推荐| 亚洲免费三区| 91色国产在线| 亚洲最黄视频| 国产精品成人免费视频99| 在线色国产| 欧美中日韩在线| 国产精品视频猛进猛出| 久久香蕉国产线看观看精品蕉| 日韩美毛片| 无套av在线| 波多野结衣AV无码久久一区| 亚洲中文字幕久久无码精品A| 午夜小视频在线| 日本在线亚洲| 天天躁夜夜躁狠狠躁图片| 无码免费视频|