翟龍飛 陳迎春 楊沖 閆心寶

摘 要:人工神經網絡是一種新型的信息處理技術,具有先進的建模技術,但網絡自身存在的不足影響了其進一步的發展和應用。本文詳細研究了標準BP神經網絡,并提出了網絡性能的改進著眼點。
關鍵詞:BP神經網絡 網絡模型 網絡訓練
中圖分類號: TP183 文獻標識碼:A 文章編號:1003-9082(2016)03-0004-01
人工神經網絡是一個由簡單數據處理單元相互連接組成的龐大信息處理計算模型,該網絡通過歷史知識的不斷輸入和人工網絡對于運算的自適應調整來實現有用運算。
一、神經網絡
神經網絡具有自主學習性質,對于特定運算具有高效運算能力。因此,人們以信息在神經系統處理過程為啟發,利用計算機系統構建了類似的分級計算層次結構,即人工神經網絡。
神經網絡構造可分為神經元模型、網絡模型構造兩部分。
1.神經元模型
神經元(神經細胞)是神經網絡的基本信息處理單元,它是神經網絡的設計基礎
2.網絡結構模型
網絡結構模型由逐個神經元連接構成,其能對信息的多神經元融合處理傳輸,因此使得信息處理具有一定的魯棒性。從網絡結構連接方式上,可將人工神經網絡分為前饋型網絡和反饋型網絡。
二、網絡模型構建
1.BP網絡的結構分析
將BP神經元組合就構成了多層BP神經網絡,圖3給出了一個單隱層的三層神經網絡模型。
2.BP網絡的算法分析
2.1神經網絡的性能函數
神經網絡的網絡性能是以均方誤差MSE作為評價標準,同時兼顧網絡訓練時間。以下為網絡輸出誤差數學表達:
(6)
2.2神經網絡中神經元權值與輸出誤差關系
由(8)可以看出,網絡輸出誤差E是各層權值 、 的函數,因此通過調整權值來得到較小E的值,從而實現數據擬合精度提高。
三、影響BP網絡性能的關鍵因素
1.網絡訓練的擬合性能分析
眾多研究表明,網絡的泛化能力主要與隱層數以及各隱層神經元個數,樣本大小和訓練次數有關。本文研究針對短波數據進行的擬合預測分析,訓練目標是最好的接近實際數據。因此,本文以訓練得到最低均方誤差為目的。
2.數據集的選定
訓練樣本集的選取以及處理對于神經網絡的擬合結果有著重要的影響。在選取輸入樣本變量時,變量應具有以下特點:
①樣本數據大,即擁有較大的置信空間;
②輸入變量之間相關性要低。
需要對選定的樣本進行預處理,以便進一步優化網絡性能[2]。
3.網絡初始化
網絡初始化包括對于權值和閾值的初始化,其初始值決定著網絡訓練過程中在誤差曲面上的初始移動點,由于誤差曲面的不均勻性質,一個好的網絡初始值能夠使得網絡收斂速度更快,網絡收斂目標更優,一般BP網絡初始化是隨機的,從而導致了網絡差異化大,網絡容易陷入局部最優不能達到最終收斂的目的,同時也造成網絡訓練的不穩定。因此在實際應用中,可以多次訓練選擇最終誤差性能最小的網絡初始值,保證了網絡的訓練結果。
4.網絡的訓練速度
影響網絡訓練速度的主要因素在網絡結構、網絡訓練算法以及網絡參數。
為了保證較短的訓練時間,選取隱含層和隱層節點數盡量少,但若設計網絡是結構過于簡單會造成網絡學習樣本的能力不足。然而過大的話,則導致網絡學習的時間加長,學習出現過適配現象[3]。目前可以采取試湊和對比的方法確定適合于該模型的網絡結構。
網絡訓練算法體現了訓練點在誤差曲面的移動路線和方式上,是網絡擬合性能的關鍵因素。
5.網絡性能的檢驗
在標準BP神經網絡中,當輸出誤差穩定到網絡誤差性能函數以下時,認為是網絡訓練成功。通過對和訓練數據同一來源的檢驗樣本進行仿真預測,用預測值與期望值求得誤差性能函數MSE來反映性能分析。對于一個網絡的評價指標主要在網絡的訓練速度和網絡的擬合精度上。
參考文獻
[1] Simon Haykin著. 神經網絡原理[M]. 葉世偉等譯.第二版.北京:機械工業出版社,2004.1: 1~8.
[2] 施顏,韓立群,廉小親編著.神經網絡設計方法與實例分析[M] 北京:北京郵電大學出版社, 2009,12:23~36.