張晉雁,陶宏才
(西南交通大學信息科學與技術學院,四川成都611756)
回聲狀態網絡(echo state network,ESN)由 Jaeger[1]于2001年提出,在模型構建與學習算法方面較傳統的遞歸神經網絡有較大差別,其相應的學習算法為遞歸神經網絡的研究開啟了新紀元。回聲狀態網絡采用“儲備池”代替傳統神經網絡中的隱層。儲備池由大量稀疏連接的神經元組成,并將輸入信號從低維空間映射到高維空間,唯一需要訓練的參數即為輸出權值矩陣[2]。這些特點大大簡化了回聲狀態網絡的訓練算法和求解過程。
回聲狀態網絡在時間序列預測[3-4]、非線性系統識別[5]、圖像檢測[6]等領域有廣泛應用。針對不同應用領域對回聲狀態網絡的優化改進算法研究也日益倍增,研究方向主要針對儲備池的優化。標準回聲狀態網絡的儲備池是隨機生成的,但是這并不代表隨機生成的即為最優儲備池。所以,針對不同的應用問題,提出不同的儲備池優化方法。文獻[7]提出一種最簡儲備池回聲狀態網絡,構造出僅包含單個節點的儲備池網絡,簡化儲備池的拓撲結構。韓敏等[8]提出一種多儲備池回聲狀態網絡,構建出一種多儲備池ESN層次結構模型,每一層的核心組成是ESN,ESN的核心組成又是儲備池,由此形成的多儲備池ESN具有強大的非線性系統建模能力。文獻[9]將小波神經元引入回聲狀態網絡,并利用粒子群優化算法對儲備池參數進行優化。
羅熊等[10]總結了回聲狀態網絡的研究進展,主要介紹回聲狀態網絡儲備池的改進方向、ESN的研究熱點以及未來研究方向。文中將從目前回聲狀態網絡中比較典型的改進算法、回聲狀態網絡的應用、在典型應用領域回聲狀態網絡模型與其他網絡模型對比以及回聲狀態網絡未來的改進與研究方向等方面來系統、全面地總結回聲狀態網絡,以期引起學者更廣泛的關注和深入的研究。
回聲狀態網絡是一種典型的3層遞歸神經網絡,由輸入層、儲備池、輸出層組成,其網絡結構如圖1所示。

圖1 回聲狀態網絡結構圖
回聲狀態網絡的基本方程如下:

其中,u(n)=(u1(n),u2(n),…,uK(n))T和y(n)=(y1(n),y2(n),…,yL(n))T分別表示K個輸入單元和L個輸出單元,x(n)=(x1(n),x2(n),…,xN(n))T表示儲備池N個內部神經元的狀態,Win為輸入單元與儲備池內部連接權值矩陣,W為儲備池內部神經元連接權值矩陣,Wout為儲備池與輸出單元連接權值矩陣,Wback為輸出單元與儲備池的連接權值矩陣。f和fout分別為儲備池單元和輸出單元的激活函數。
在回聲狀態網絡中,Win、W、Wback是預先生成并且在訓練過程中保持不變,Wout是唯一需要訓練的權值矩陣。由于儲備池中的神經元是稀疏連接的,所以其內部連接數遠小于N2,W一般保持1%~5%的稀疏連接。
儲備池是回聲狀態網絡的核心組成部分,所以回聲狀態網絡性能的好壞與儲備池主要的參數選擇有很大關系。儲備池的主要參數包括[11]:儲備池規模N、儲備池譜半徑SR、儲備池稀疏程度SD和儲備池輸入單元尺度IS。
1.2.1 儲備池規模N
儲備池中神經元的個數決定了儲備池的規模,N即為儲備池中神經元的個數,通常是幾十到上千。N值越大,預測的精度越高,但同時也會導致訓練效率低下,且容易出現過擬合現象。
1.2.2 儲備池譜半徑SR
SR是儲備池內部連接權值矩陣W最大特征值的絕對值,是影響儲備池記憶能力的主要因素。一般情況下,當SR<1時,ESN才有回聲狀態性質。
1.2.3 儲備池稀疏程度SD
SD指儲備池中神經元的連接情況,表示儲備池中相互連接的神經元占所有神經元總數的比例。在回聲狀態網絡中,只有部分神經元相互連接。SD通常的取值為1%~5%。
1.2.4 儲備池輸入單元尺度IS
IS是輸入連接至儲備池之前需要相乘的一個尺度因子。輸入信號一般不會直接送入儲備池,通過與尺度因子相乘,可以將輸入信號變換至神經元激活函數相應的范圍內。
回聲狀態網絡唯一需要訓練的就是輸出連接權值矩陣Wout。在網絡訓練之前,假設已有一些學習樣本{(u(1),d(1)),…,(u(T),d(T))},樣本數據也稱教師數據,u(k)、d(k)(k=1,2,…,T)分別表示樣本輸入與樣本輸出(期望輸出)。訓練過程如下:
1.3.1 樣本訓練
設在t=0時刻,內部狀態向量x(0)=0。在tk(k=1,2,…,T)時刻,依次將樣本輸入與樣本輸出注入到網絡輸入單元和輸出單元,通過式(1)不斷更新整個網絡的內部狀態。由于儲備池受初始因素的干擾,所以不從第一步開始收集內部狀態和期望輸出。假設從tm(m<T)時刻開始,系統達到穩定狀態,不再被初始狀態干擾。所以,從tm時刻開始,收集內部狀態和期望輸出,以每個時刻的狀態向量x(n)為行形成矩陣B,其對應的樣本輸出d(n)經tanh-1(d)后構成矩陣M。
1.3.2 輸出權值計算Wout
因訓練的目的是使系統輸出y(n)盡可能逼近期望輸出d(n),即

故最終可將問題轉化為最優問題,利用矩陣求解得:(Wout)T=B-1M。將求得的輸出權值矩陣置入到回聲狀態網絡,至此,回聲狀態網絡學習完畢。
盡管從不同的角度對回聲狀態網絡的研究取得了一些進步,但仍處于初始階段,還有很多理論和實際問題有待深入研究[12]。目前,已有的對回聲狀態網絡的改進主要從儲備池內部結構、網絡拓撲結構以及儲備池參數等方面進行。
文獻[13-17]均采是對儲備池內部神經元的優化。其中,泄漏積分型回聲狀態網絡(Leaky ESN)是一種比較常用的優化方法,Leaky ESN的網絡結構和ESN結構相同。泄漏積分型ESN的內部網絡狀態方程及輸出方程分別為:

式(4)中,α表示泄漏率,控制前一時刻內部神經元的保持程度。α越小,則較上一時刻內部神經元狀態變化越慢,從而網絡的短期記憶能力越強。與式(1)對比可見,Leaky ESN較ESN多了參數(1-α)x(n),當α=1時,即為ESN,故Leaky ESN是ESN的改進模型。
文獻[16]將Leaky ESN方法用于實際化工過程的軟測量動態建模中,并給出嶺回歸離線算法和遞推最小二乘在線學習算法,通過實驗對比,證明Leaky ESN較ESN具有更高的計算精度和預測性能。
文獻[17-20]均是對回聲狀態網絡拓撲結構的改進,通過引入其他網絡拓撲結構,提高ESN的預測精度。文獻[18]將規則網絡、小世界網絡和無尺度網絡引入回聲狀態網絡,實驗結果表明,具有小世界網絡結構的ESN表現出更好的計算性能,但典型的ESN穩定性較好。
文獻[17]提出一種改進的小世界網絡,并將其引入Leaky ESN。傳統的NW(Newman-Watts)模型小世界網絡中,根據隨機數是否小于加邊概率p判斷非鄰近節點是否相連,并用0、1分別表示不相連和相連的連接權值。文獻[17]利用加邊概率p直接表示2個節點之間的連接權值,建立加邊概率與節點間距離的函數關系:p=α×e(-β×d)。其中,加邊概率p取值范圍為[0,1],d表示節點間的歐氏距離,α表示調節距離靈敏度,β表示調整網絡的整體密度。最后將改進小世界網絡的動態鄰接矩陣作為Leaky ESN的儲備池稀疏連接矩陣,對Leaky ESN進行訓練,避免了連接權值矩陣的隨機性。實驗表明,采用改進的小世界網絡,并將其用于Leaky ESN,比傳統的Leaky ESN具有更好的預測精度和更快的誤差收斂速度。
文獻[21-25]主要對回聲狀態網絡的參數進行優化,如:輸出權值矩陣、儲備池規模、儲備池譜半徑、儲備池稀疏程度、儲備池輸入單元尺度等。
文獻[25]提出一種基于遺傳算法(GA)儲備池參數的方法,利用遺傳算法的全局搜索能力,在較短時間內搜索到全局最優解,進而對網絡流量進行預測。
首先,ESN參數編碼與GA參數設置,并隨機產生一組儲備池參數的值;然后,通過ESN對網絡流量進行預測,通過個體適應度函數fitness(i)=RMSE(i)=衡量參數的優劣;最后,利用遺傳算法對參數尋優直至找到最優解。實驗表明,GA優化的ESN網絡流量預測方法具有更高的預測精度和更小的預測誤差。
ESN較傳統的神經網絡遞歸算法有訓練算法簡單、計算方便等優點,而且克服了傳統神經網絡普遍存在的訓練易陷入局部極小值等缺點,一經提出,就得到了許多學者的關注。目前,ESN算法的應用已經涉及到時間序列預測、非線性系統預測與控制、語音處理、圖像識別等領域。
文獻[23]將一種基于貝葉斯回歸的回聲狀態網絡應用于小型水電站的短期電力預測,克服傳統神經網絡中存在的病態解降低模型泛化能力的缺陷,通過與基于最小二乘法的前饋神經網絡對比,證明模型的優越性。文獻[26]將回聲狀態網絡運用于特定區域的話務量的預測,并且在模型中加入外源變量,所謂外源變量即為該移動網絡區域包含的其他有效信息,并將其送入輸入網絡中,提高了預測結果的準確性。文獻[27]提出一種多層的回聲狀態網絡結構,用于預測特定時刻的電力負荷。模型可預測一天24小時每個整點時刻的電力負荷,使預測結果更加精準且符合實際應用的要求。文獻[28]運用回聲狀態網絡設計了動態控制器,將其用于機器人的軌跡跟蹤控制中。實驗表明,ESN網絡較BP網絡的控制精度更高,證明ESN方法在機器人動力學控制中的可行性和有效性。文獻[29]針對污水處理過程的非線性、大時變等特點,提出一種基于回聲狀態網絡的多變量自適應預測控制策略,實現了優化控制。在文獻[30]中,將回聲狀態網絡運用于語音信號的處理,進而通過語音信號來進行情感識別。文獻[6]將回聲狀態網絡用于圖像邊緣檢測,用ESN對圖像的統計向量進行邊緣檢測,可直接判斷邊緣點,并增強抗噪性,較傳統的圖像邊緣檢測方法具有更好的抗噪性。
回聲狀態網絡、BP神經網絡和支持向量機(SVM)等都是在時間序列預測方面應用比較廣泛的網絡模型。在預測問題中,不同的算法有不同的優缺點[31-33]。文中對幾種模型進行比較,得出表1所示的結果。

表1 ESN與BP神經網絡、SVM比較
由表1可見,從復雜度、性能和適用范圍來看,ESN較BP神經網絡和SVM都有較大優勢,這將有利于其解決更多領域的復雜問題。
回聲狀態網絡作為一種新型的遞歸神經網絡,在保持傳統神經網絡動態特性的同時簡化了訓練算法,目前已被應用在很多領域。不過,回聲狀態網絡仍然存在一些不足。例如輸入權值矩陣、儲備池內神經元連接權值矩陣以及輸出單元與儲備池連接矩陣等都是隨機值,而隨機生成的并不意味著最優,這可以通過尋找最優儲備池對它進行優化。還有,目前對儲備池參數的選取仍是通過經驗取值或者實驗去驗證取值是否合理,不一定能夠取到最優值,存在一定的局限性。因此,儲備池參數的最優值也是將來研究的重點方向。此外,將儲備池內部結構、網絡拓撲結構和參數相結合進行改進,也是研究的另一個方向。但是,如果將多種改進結合,有可能使網絡結構復雜化,此時就應該尋找復雜結構與實際優化效果的平衡點。
總之,系統地總結回聲狀態網絡的研究現狀,發現目前所存在的不足,有助于促進ESN的進一步完善與發展,也將拓展其應用領域,以期可以解決更多的實際問題。
[1] Jaeger H.The echo state approach to analyzing and training recurrent neural networks[R].German National Research Center for Information Technology,2001.
[2] Jaeger H.Adaptive Nonlinear System Identification with Echo State Networks[J].Nips,2003:609-616.
[3] Herbert J,Harald H.Harnessing nonlinearity:predicting chaotic systems and saving energy in wireless communication[J].Science,2004,304(5667):78-80.
[4] Ongenae F,Looy S V,Verstraeten D,et al.Time series classification for the prediction of dialysis in critically ill patients using echo state networks[J].Engineering Applications of Artificial Intelligence,2013,26(3):984-996.
[5] Han S I,Lee J M.Fuzzy Echo State Neural Networks and Funnel Dynamic Surface Control for Prescribed Performance of a Nonlinear Dynamic System[J].IEEE Transactions on Industrial E-lectronics,2014,61(2):1099-1112.
[6] 裴承丹.回聲狀態網絡及其在圖像邊緣檢測中的應用[J].計算機工程與應用,2009,44(19):172-174.
[7] 馬濤.最簡儲備池回聲狀態網絡及其應用研究[D].蘭州:蘭州大學,2013.
[8] 韓敏,穆大蕓.基于貝葉斯回歸的多核回聲狀態網絡研究[J].控制與決策,2010,25(4):531-534.
[9] 王瑟.基于改進的回聲狀態神經網絡的非線性預測[D].南京:南京工業大學,2006.
[10] 羅熊,黎江,孫增圻.回聲狀態網絡的研究進展[J].北京科技大學學報,2012,34(2):217-222.
[11] Jaeger H.Tutorial on training recurrent neural networks,covering BPPT,RTRL,EKF and the echo state network approach[R].Bremen,German National Research Center for InformationTechnology.2002.
[12] 王建民.基于回聲狀態網絡的非線性時間序列預測方法研究[D].哈爾濱:哈爾濱工業大學,2011.
[13] Jaeger H,Luko?evicius M,Dan P,et al.2007 Special Issue:Optimization and applications of echo state networks with leaky-integrator neurons[J].Neural Networks,2007,20(3):335-352.
[14] Lun S X,Yao X S,Qi H Y,et al.A novel model of leaky integrator echo state network for time- series prediction [J].Neuro computing,2015,159(C):58-66.
[15] Ayyagari S S D P,Jones R D,Weddell S J.EEG-based event detection using optimized echo state networks with leaky integrator neurons[C]//International Conference of the IEEE Engineering in Medicine& Biology Society.Conf Proc IEEE Eng Med Biol Soc,2014:5856-5859.
[16] 李軍,岳文琦.基于泄漏積分型回聲狀態網絡的軟測量動態建模方法及應用[J].化工學報,2014,65(10):4004-4014.
[17] 倫淑嫻,林健,姚顯雙.基于小世界回聲狀態網的時間序列預測[J].自動化學報,2015,41(9):1669-1679.
[18] 王娟.回聲狀態網絡的拓撲結構研究[D].重慶:重慶大學,2013.
[19] NajibiE,RostamiH. SCESN,SPESN,SWESN:Three recurrent neural echo state networks with clustered reservoirs for prediction of nonlinear and chaotic time series[J].Applied Intelligence,2015,43(2):460-472.
[20] 李丁園,劉富,喬俊飛.一種基于腦網絡的分層模塊化回聲狀態網絡[J].機械工程學報,2015,51(22):128-134.
[21] Han M,Xu M.Predicting Multivariate Time Series Using Subspace Echo State Network [J].Neural Processing Letters,2013,41(2):201-209.
[22] 劉長年.基于螢火蟲優化算法的回聲狀態網絡預測控制研究[D].蘭州:蘭州大學,2014.
[23] Li G,Li B J,Yu X G,et al.Echo State Network with Bayesian Regularization for Forecasting Short-Term Power Production of Small Hydropower Plants[J].Energies,2015,8:12228-12241.
[24] Wang H,Yan X.Optimizing the echo state network with a binary particle swarm optimization algorithm [J].Knowledge-Based Systems,2015,86:182-193.
[25] 田中大,高憲文,李樹江,等.遺傳算法優化回聲狀態網絡的網絡流量預測[J].計算機研究與發展,2015,52(5):1137-1145.
[26] Bianchi F M,Scardapane S,Uncini A,et al.Prediction of telephone calls load using Echo State Network with exogenous variables [J].Neural Networks,2015,71(C):204-213.
[27] Deihimi A,Showkati H.Application of echo state networks in short-term electric load forecasting[J].Energy,2012,39(1):327–340.
[28] 杜佩君.ESN網絡在機器人軌跡跟蹤控制中的應用[J].自動化儀表,2013,34(6):4-8.
[29] 王莉莉.基于ESN的污水處理過程優化控制方法研究[D].北京:北京工業大學,2014.
[30] Trentin E,Scherer S,Schwenker F.Emotion recognition from speech signals via a probabilistic echo-state network [J].Pattern Recognition Letters,2014,66(C):4-12.
[31] 韓敏.基于儲備池的非線性系統預測理論與分析方法[M].北京:中國水利水電出版社,2011.
[32] 邱仕坦.基于CS-SVM的網絡熱點話題變化趨勢預測[J].福州大學學報:自然科學版,2014,42(3):381-386.
[33] 顧亞祥,丁世飛.支持向量機研究進展[J].計算機科學,2011,38(2):14-17.