999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于pytorch的神經網絡優化算法研究

2020-12-31 08:54:36姬壯偉
關鍵詞:優化

姬壯偉

(長治學院計算機系,山西長治 046011)

深度學習是近年來發展十分迅速的研究領域,并且在人工智能的很多子領域都取得了巨大的成功,從移動端的人臉識別,到alphago機器人擊敗人類職業圍棋選手,現代人的生活已經和人工智能密切相關。

人工神經網絡是人工智能研究領域最熱的深度學習模型,由早期的神經科學家受到人腦神經系統的啟發構造而成,該網絡是指由很多人工神經元構成的網絡結構模型,這些人工神經元之間的連接強度便是可學習的參數。隨著人工神經網絡越來越復雜,數據越來越多,計算量急劇增加,我們需要在神經網絡參數學習上花費的時間也就越來越多,可是現實中往往為了解決復雜的問題,復雜的網絡結構和大數據又是不可避免的,神經網絡的優化器便由此而生,通過優化算法加速神經網絡的訓練,加速參數的學習。

1 神經網絡優化器發展

Gradient Descent,即梯度下降算法,由Cauchy,Augustin 于1847 年首次提出,依據數學理論解決了神經網絡中參數學習的方向問題,基于此算法,往后的科研人員做出了許多優化。在1951 年,SGD 算法的早期形式被提出,隨機梯度下降的參數學習方法被廣泛應用,由于SGD 學習效率的局限,在1964 年,由Polyak 提出了Momentum 的優化算法,此算法利用給學習參數附加慣性值,大大提高了參數學習的效率。在神經網絡興起的這幾年中,優化算法也從沒停止發展,2011 年John Duchi 提出了通過優化學習率參數來提高學習效率的AdaGrad 優化算法,2015年Diederik P.Kingma 和Jimmy Lei Ba 提出的Adam 優化算法集合了Momentum 和AdaGrad 算法的優點,進一步提高了學習效率。在接下來的幾年中,相繼提出了AdaMax、Nadam、SGDW、Adabound、RAdam 等優化算法。

總體來說,目前的優化算法皆是從調整學習率和調整梯度方向兩方面來優化訓練速度,各優化算法匯總如表1所示。

表1 神經網絡常用優化算法匯總

2 神經網絡優化算法

2.1 Stochastic Gradient Descent (SGD)

SGD[1-2]即隨機梯度下降,是梯度下降算法的變種。批量梯度下降算法在梯度下降時,每次迭代都要計算整個訓練數據上的梯度,當遇到大規模訓練數據時,計算資源需求多,數據通常也會非常冗余。隨機梯度下降算法則把數據拆成幾個小批次樣本,每次只隨機選擇一個樣本來更新神經網絡參數,如圖1所示。

圖1 SGD優化算法示意圖

實驗表明,每次使用小批量樣本,雖然不足夠反應整體數據的情況,但卻很大程度上加速了神經網絡的參數學習過程,并且還不會丟失太多準確率。

2.2 Momentum

動量是物理學中的概念,是指物體在它運動方向上保持運動的一種趨勢,Momentum 方法[3-4]則將其運用到神經網絡的優化中,用之前累計的動量來替代真正的梯度,計算負梯度的“加權移動平均”來作為參數的更新方向,其參數更新表達式為

其中ρ為動量因子,通常設為0.9,α 為學習率。這樣,每個參數的實際更新差值取決于最近一段時間內梯度的加權平均值,當某個參數在最近一段時間內的梯度方向不一致時,其真是的參數更新幅度變小;相反,當在最近一段時間內的梯度方向都一致時,其真實的參數更新幅度變大,起到加速作用,相比SGD,能更快的到達最優點。

2.3 AdaGrad

在標準的梯度下降算法中,每個參數在每次迭代時都使用相同的學習率,AdaGrad 算法[5]則改變這一傳統思想,由于每個參數維度上收斂速度都不相同,因此根據不同參數的收斂情況分別設置學習率。

AdaGrad 算法借鑒正則化思想,每次迭代時自適應的調整每個參數的學習率,在進行第t次迭代時,先計算每個參數梯度平方的累計值,其表達式為

其中⊙為按元素乘積,gt是第t次迭代時的梯度。然后再計算參數的更新差值,表達式為

其中α 是初始的學習率,ε 是為了保持數值穩定性而設置的非常小的常數。

在Adagrad 算法中,如果某個參數的偏導數累積比較大,其學習率相對較小;相反,如果其偏導數累積較小,其學習率相對較大。但整體是隨著迭代次數的增加,學習率逐漸縮小。

2.4 RMSProp

RMSprop 算法[6-7]對AdaGrad 算法進行改進,在AdaGrad 算法中由于學習率逐漸減小,在經過一定次數的迭代依然沒有找到最優點時,便很難再繼續找到最優點,RMSprop算法則可在有些情況下避免這種缺點。

RMSprop 算法首先計算每次迭代梯度gt平方的指數衰減移動平均,

其中β為衰減率,然后用和AdaGrad 同樣的方法計算參數更新差值,從表達式中可以看出,RMSprop算法的每個學習參數不是呈衰減趨勢,既可以變小也可以變大。

2.5 Adam

Adam算法[8-9]即自適應動量估計算法,是Momentum 算法和RMSprop 算法的結合,不但使用動量作為參數更新方向,而且可以自適應調整學習率。

Adam 算法一方面計算梯度平方的指數加權平均(和RMSprop 類似),另一方面計算梯度的指數加權平均(和Momentum法類似),其表達式為

其中β1和β2分別為兩個移動平均的衰減率,Adam算法的參數更新差值為

Adam 算法集合了Momentum 算法和RMSprop 算法的優點,因此相比之下,Adam 能更快更好的找到最優點,迅速收斂。

3 優化性能實驗設計及結果分析

使用由Facebook 開源的Pytroch[10]神經網絡框架,該框架是基于Python 的張量庫,近幾年和Tensorflow 成為該研究領域的主流框架,并且通過Python 的Matplotlib 可視化工具包將實驗結果展示出來。用神經網絡領域典型的回歸問題來測試我們不同優化算法的參數學習效率和收斂速度。

3.1 生成訓練數據

訓練數據為5000 個偽數據點,由平方曲線的正太上下浮動生成,訓練時的批量大小為64,學習率為0.01,如圖2所示。

圖2 實驗數據展示圖

3.2 創建與訓練神經網絡

每個優化算法使用的都是同一個神經網絡,本實驗中搭建的神經網絡的輸入層包含1 個輸入神經元,共兩層隱藏層,每層隱藏層包含20 個神經元,輸出層包含1 個輸出神經元,每層神經網絡這件用RELU激活函數進行激活,神經網絡搭建好后,用不同的神經網絡優化算法對同一神經網絡進行參數優化,對比不同優化算法的參數收斂速度,以及訓練誤差,并通過Matplotlib 可視化工具對結果進行可視化展示,如圖3所示。

圖3 不同優化算法收斂展示圖

圖3 中橫軸為訓練時間線,縱軸為誤差率,在同一圖中展示了不同的優化算法在同一神經網絡的參數收斂速度,以及不同優化算法的誤差率。

3.3 測試及結果分析

通過用不同優化算法對同一神經網絡的多次訓練,可以看出,幾乎沒有任何加速效果的SGD 優化算法參數收斂速度最慢,且誤差率最高,而將SGD 改良后Momentum 則由于動量的存在,相比之下參數更快的收斂,誤差達到一個穩定的低值,而RMSprop 和Adam 是進一步優化算法升級,明顯收斂速度逐步增加,誤差率更早達到穩定狀態。

4 結論

優化算法對神經網絡的學習效率影響很大,如今的優化算法從調整學習率和調整梯度兩個方向,來優化訓練速度,在神經網絡處理的不同數據中,要多次嘗試選擇合適的優化器才能讓神經網絡的性能最大化。

猜你喜歡
優化
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
PEMFC流道的多目標優化
能源工程(2022年1期)2022-03-29 01:06:28
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
由“形”啟“數”優化運算——以2021年解析幾何高考題為例
圍繞“地、業、人”優化產業扶貧
今日農業(2020年16期)2020-12-14 15:04:59
事業單位中固定資產會計處理的優化
消費導刊(2018年8期)2018-05-25 13:20:08
4K HDR性能大幅度優化 JVC DLA-X8 18 BC
幾種常見的負載均衡算法的優化
電子制作(2017年20期)2017-04-26 06:57:45
主站蜘蛛池模板: 一区二区三区国产| 亚洲免费福利视频| 波多野结衣无码视频在线观看| 中文字幕伦视频| 九九九久久国产精品| 国产swag在线观看| 91精品国产丝袜| 国产成人区在线观看视频| 青青久久91| 18禁黄无遮挡免费动漫网站| 国产av剧情无码精品色午夜| 人妻无码AⅤ中文字| 四虎影视8848永久精品| 精品少妇人妻av无码久久| 黄色一级视频欧美| 亚洲国产AV无码综合原创| 片在线无码观看| 午夜欧美理论2019理论| 日韩无码黄色| 午夜国产小视频| 99热这里只有精品5| 熟妇人妻无乱码中文字幕真矢织江| 久久久久中文字幕精品视频| 波多野结衣视频一区二区| 又爽又大又光又色的午夜视频| 国产一级毛片高清完整视频版| 国产成人精品无码一区二| 欧美一区二区三区国产精品| 国产成人精品亚洲77美色| 日韩第九页| 国产在线精品香蕉麻豆| 丁香六月激情婷婷| 日韩av电影一区二区三区四区 | 亚洲成人免费在线| 免费一级成人毛片| 成人看片欧美一区二区| 久久美女精品| 国产男女免费完整版视频| 国产午夜无码片在线观看网站 | 日韩A∨精品日韩精品无码| 激情综合激情| 亚洲资源在线视频| 喷潮白浆直流在线播放| 国产xx在线观看| 国产精品成人观看视频国产| 亚洲无码91视频| 国产精品视频第一专区| 777国产精品永久免费观看| 国产成人综合网| 久久久久久午夜精品| 天天干天天色综合网| 高清亚洲欧美在线看| 综1合AV在线播放| 精品国产自在在线在线观看| 亚洲国产天堂久久综合| 另类综合视频| 亚洲欧美日韩天堂| 日本在线欧美在线| 欧美国产成人在线| 国产男女XX00免费观看| 成人福利在线免费观看| 成人在线观看一区| 久久亚洲高清国产| 一级毛片免费不卡在线| 亚洲成a人在线播放www| 国产哺乳奶水91在线播放| 亚洲女同欧美在线| 狠狠ⅴ日韩v欧美v天堂| 丰满人妻久久中文字幕| 好吊色国产欧美日韩免费观看| a亚洲天堂| 国产精品女同一区三区五区| AV老司机AV天堂| 久久久久无码国产精品不卡| av尤物免费在线观看| 国产成人综合日韩精品无码不卡| 国产精品欧美亚洲韩国日本不卡| 97成人在线观看| 国产jizz| 亚洲人成网站在线播放2019| 亚洲网综合| 婷婷亚洲天堂|