呂季杰,楊俊安,桂云川
(1.解放軍電子工程學院,安徽 合肥 230037;2.安徽省電子制約技術重點實驗室,安徽 合肥 230037)
?
回聲狀態網絡混沌跳頻碼預測方法
呂季杰1,2,楊俊安1,2,桂云川1,2
(1.解放軍電子工程學院,安徽 合肥230037;2.安徽省電子制約技術重點實驗室,安徽 合肥230037)
0引言
跳頻通信系統因其較強的抗偵察、抗截獲能力而被廣泛運用于軍事通信。跳頻通信系統的核心就是跳頻碼序列,常見跳頻碼序列一般由移位寄存器產生,例如m序列、RS序列等。近幾年,隨著對混沌理論的不斷深入研究,利用混沌序列構造性能更加優良的跳頻碼成為業內首選。文獻[1]研究指出,m序列、RS序列和混沌序列一樣都具有混沌特性,即非周期、連續寬帶頻譜、類似噪聲等特性。雖然具有混沌特性的跳頻碼多變復雜,但其本質上仍按照特定的規律產生,這也為跳頻碼預測奠定了理論基礎。
為了準確地預測跳頻碼,人們構造了許多數學模型。支持向量機(Support Vector Machine)模型[2]建立在統計學理論和結構風險最小的基礎上,根據樣本數據尋求唯一的全局最優解,但其網絡不具備反饋結構,缺乏記憶能力,降低了預測性能。貝葉斯網絡(Bayesian Network)[3]是基于概率推理的圖形化網絡,通過一些變量的信息來獲取其他變量的概率信息,達到預測的目的,但是貝葉斯網絡中各個狀態之間的概率關系較難獲取,且訓練過程復雜,增大了預測的難度。人工神經網絡(Artificial Neural Networks)也被廣泛運用在混沌時間序列領域,其中徑向基網絡(Radial Basis Function Network)[4]是一種前向神經網絡,結構簡單,且在全局和局部都能很好的逼近最優點,然而如果網絡隱節點較多,則會導致過擬合現象,網絡泛化性能變差;如果隱節點較少,則會導致欠擬合現象,網絡泛化能力同樣降低。傳統遞歸神經網絡(Recurrent Neural Network)[5]也比較適合用于跳頻碼預測,但是其運算量大,在預測過程中初始訓練記憶也會逐漸消失,導致其在跳頻碼預測時出現準確率低、預測時間長等不足,限制了其在跳頻碼預測上的應用。本文針對上述問題,提出了回聲狀態網絡混沌跳頻碼預測方法。
1回聲狀態網絡
2001年Jager教授提出了回聲狀態網絡[6](Echo State Network),克服了傳統遞歸神經網絡的記憶減退、訓練量大等問題,只訓練輸出連接權,大大減少了計算量,同時由于網絡內部存在一個由成百上千個神經元稀疏連接的大型動態儲備池,在數據訓練過程中,通過改變網絡各權值矩陣的數值大小,達到記憶數據的目的,對于時間序列預測有更好的效果。
1.1回聲狀態網絡的數學模型

儲備池是網絡最重要的部分,由眾多神經元稀疏連接而成,儲備池內部狀態向量按式(1)進行更新。
z(n+1)=f(Winx(n)+Wresz(n)+Wbacky(n))
(1)
回聲狀態網絡共有E個輸出,通過輸出連接權矩陣與網絡的內部狀態、輸入以及輸出反饋相連接,令
q(n)=(zT(n),x(n),y(n))T∈RF+D+E
(2)
因此,網絡的輸出可以按式(3)給出的輸出方程計算
y(t+1)=Woutq(n)
(3)
式(3)中,Wout為輸出連接權矩陣。回聲狀態網絡中Win、Wres、Wback全部在網絡初始化階段產生,并在訓練過程中保持不變,且網絡最終只需訓練Wout,克服了傳統RNN網絡需要求時序偏微分所導致的計算復雜、運算量大等問題,還有效地解決了前饋神經網絡使用梯度下降法學習所導致的局部極小問題。
1.2回聲狀態網絡的訓練算法
回聲狀態網絡具有大型動態儲備池結構,因此網絡有極強的構建復雜動力系統的能力。針對問題不同的需要,回聲狀態網絡訓練算法分為離線算法和在線算法兩種。本文主要針對離線算法進行研究,下面將離線算法介紹如下。
第一步:構建一個儲備池網絡,并確保其符合“回聲狀態屬性”。
首先應該確定內部連接權、輸入連接權和反饋連接權矩陣。一旦這3個矩陣確定后,在整個網絡訓練進程中,這3個矩陣都會保持不變。
回聲狀態屬性跟內部連接權矩陣Wres有關,然而直到現在仍沒有系統的理論體系確保網絡具有回聲狀態屬性。但是經過反復研究實驗,人們發現可以通過特定的方法產生內部連接權矩陣,進而提高網絡具有回聲狀態屬性的幾率。具體方法如下:
1)隨機產生一個稀疏矩陣W0,并確保這個矩陣所有權值的均值在0附近。

3)對W1進行一定的縮放,得到最后的內部連接權矩陣W,即W=αW1,在這里α<1。
第二步:將訓練輸入和輸出樣本輸入加載到回聲狀態網絡中。
訓練輸入、輸出樣本表示為(x(n),y(n),n=1,2,…,T),當訓練樣本加載到網絡中去后,儲備池的動力特性被激發出來,儲備池內部狀態會依照式(1)不斷變化。但在n=0時,網絡各狀態通常不是確定的,本文選取時z(0)=0,y(0)=0為初始狀態。
第三步:淘汰儲備池初始的狀態記憶。
網絡剛開始運轉時,網絡內部的狀態可能并不是由網絡的輸入和輸出引發的,所以n=1,2,…,T0這段時間內的網絡狀態記憶需要被淘汰掉,以便更好地反映輸入和輸出之間的關系。在T0之后,網絡基本達到穩定狀態,將網絡輸入、內部狀態和輸出以行向量形式(x(n),z(n),y(n))一并收集至矩陣H中。最終得到大小為(T-T0+1)×(D+F+E)的矩陣H;同時還需收集期望輸出的sigmoid轉置tanh-1d(n),以行向量的形式保存到矩陣G中,最終得到的矩陣G大小為(T-T0+1)×E。
第四步:計算輸出連接權矩陣
在回聲狀態網絡中,系統輸出向量可以用儲備池內部狀態向量和輸出連接權矩陣線性表示。網絡對數據進行學習,通過訓練最終使系統輸出y(n)盡可能逼近期望輸出d(n),如式(4)所示。
(4)
將上述逼近問題轉化為最小化問題,即求解最小化系統的均方誤差:
(5)
該最優化問題最終轉化成求解逆矩陣。如式(6)所示。
(Wout)T=H-1G
(6)
將矩陣H的逆與矩陣G相乘,得到一個大小為(D+E+F)×E的矩陣(Wout)T,其第i列包含網絡中所有神經元節點至第i個輸出單元的輸出連接權值。
經過以上步驟即可完成對回聲狀態網絡的訓練。當利用回聲狀態網絡進行預測時,先用訓練數據對網絡進行訓練并將訓練好的網絡保存。進行預測時,將訓練數據加載到訓練好的網絡中,得到預測結果。
1.3儲備池的重要參數
儲備池是回聲狀態網絡最重要的組成部分,其參數選擇對網絡最終性能影響較大,需提前設定好。如何針對具體問題構建一個優良性能的儲備池是學術界一直研究的問題,但到現在為止,學術界仍沒有形成一個系統的方法。本文采用實驗對比的方法對參數選取就行了研究,下面首先對儲備池的一些關鍵參數作簡要介紹。
1)儲備池內部連接權矩陣譜半徑SR
SR指的是儲備池內部連接權矩陣Wres所有特征值中的絕對值的最大值,記為δmax。上文的訓練算法已提到,當δmax<1時,網絡才具有回聲狀態屬性,確保網絡能正常運行。
2)儲備池神經元數量N
一般情況下,儲備池神經元數量越多,網絡對非線性系統的逼近能力越強。然而如果神經元數量過多,網絡可能產生過擬合問題,進而導致網絡泛化能力下降。
3)儲備池輸入單元尺度IS
IS指儲備池的輸入數據連接到儲備池內部神經元之前需要相乘的一個系數。在處理實際問題中,樣本數據往往不能直接作為輸入信號直接加到儲備池,需要通過IS對樣本數據進行適當的縮放滿足網絡輸入的需求。
4)儲備池稀疏程度SD
儲備池中神經元數量眾多,關系復雜,然而并不是所有的神經元之間都有聯系。SD指的就是相互之間有聯系的神經元占總神經元數(N)的百分比。
2基于回聲狀態網絡的跳頻碼預測方法
本文同時考慮到跳頻碼的混沌特性和回聲狀態網絡良好的逼近非線性系統的能力,將回聲狀態網絡引入到跳頻碼預測領域。通過上文的闡述可以知道,在利用回聲狀態網絡對跳頻碼進行預測之前,有三個問題必須要考慮:第一是網絡的輸入輸出數據如何選取;第二是儲備池參數的確定,即構造適合于特定數據的儲備池;第三是如何衡量預測性能的優劣。本節重點介紹網絡輸入輸出數據選取、預測性能的衡量標準以及基于回聲狀態網絡的跳頻碼預測算法流程。關于儲備池參數選取的問題,因為一直沒有系統的解決方法,本文在4.2節處會根據仿真數據進行實驗比較,最終確定適合仿真數據的儲備池參數。
2.1網絡輸入輸出數據確定

(7)

本文使用改進的C-C算法[7]對跳頻碼求解其最佳嵌入維數m和時間延遲τ,得到m和τ后,根據Takens嵌入定理,對整個跳頻碼進行相空間重構,即:
Gj=[yj,yj-τ,…,yj-(m-1)τ]
(8)
式(8)中,j=1,2,…,l,l=N-(m-1)τ。
根據Takens嵌入定理,如果選擇了合適的嵌入維數m和時間延遲τ,重構相空間在嵌入空間的“軌線”就是微分同胚意義上的原系統的動力學等價。即存在映射F,使得
yj+h=F(Gj)=F(yj,yj-τ,…yj-(m-1)τ)
(9)
這里的映射關系F就反映了從Gj到yj+h的一個變化的過程。通過網絡對數據的訓練,最終確定映射關系F。本文對跳頻碼進行單步預測,則h=1,即網絡訓練的目標就是盡量去逼近Gj和yj+1之間的映射關系。
通過上文的描述可以知道,在網絡訓練時的輸入數據為相空間重構后的跳頻碼矩陣,大小為1×m,輸出數據為預測目標向量,大小為1×1。
2.2性能評估
本文中,使用預測準確率和有效預測率兩個指標對跳頻碼序列的預測性能做評測。
預測準確率的均方根誤差RMSE表達式如下:
(10)
在歸一化的條件下,如果預測值和真實值偏差的絕對值在0.025以內,則認為對該點的預測是有效的,則有效預測率P[8]的表達式如下:
(11)
式(11)中,N為預測跳頻碼總點數,E為跳頻碼有效預測點數。
2.3基于回聲狀態網絡的跳頻碼預測流程
1)確定網絡的訓練輸入和輸出矩陣。
通過2.1可以知道,根據具體的跳頻碼數據,利用C-C算法求得相應的最佳嵌入維數m和時間延遲τ,對跳頻碼進行相空間重構。跳頻碼訓練樣本長度以及預測步長需依照目標任務要求來確定,最終得到網絡的輸入和輸出矩陣。
2)構建網絡,確定儲備池參數。
經過多次實驗仿真,并將實驗結果進行對比。在一定范圍內,選取能產生最優儲備池的4個參數,構建回聲狀態網絡。
3)利用訓練數據激活儲備池,求取網絡的輸出連接權矩陣。
網絡構建之后,將訓練輸入輸出數據加載到網絡中,激活儲備池,并按照2.2節介紹的訓練算法運轉網絡,收集相關數據,并最終求得輸出連接權矩陣,保存訓練完畢的網絡。
4)測試跳頻碼的預測。
選取預測任務所要預測原點前的一段跳頻碼數據,按照流程1)的方法重新確定測試輸入矩陣,并將數據加載到流程3)已訓練好的網絡中去,得到相應的預測結果。
具體預測流程框圖如圖2所示。

圖2 基于回聲狀態網絡的跳頻碼預測流程框圖Fig.2 The prediction process of frequency hopping codebased on echo state network
3仿真實驗和算法評估
本實驗使用的計算機CPU主頻4.6GHz,內存1.5G,仿真平臺為MATLAB2009a。
3.1實驗數據集
本文采用Logistic-Kent映射[9]、Lorenz系統中的x分量和MackeyGlass系統產生實驗所需的跳頻碼。
3.1.1Logistic-Kent映射跳頻碼
Logistic-map表達式為:
x(k+1)=μx(k)(1-x(k))
(12)
式(12)中,3.75<μ≤4.0,0 Kent-map表達式為: 式(13)中,0<α<1,0≤y(l)≤1。 首先利用Logistic映射產生長度為X1的混沌序列Y1,接著再用Y1為Kent映射的初值產生X1個長度為X2的混沌序列,最后把X1個長度為X2的混沌序列連接在一起組成長度為X1×X2的混沌序列。通過級聯混沌映射可以產生更長的混沌序列。 按照文獻[9]方法產生碼長為100×1 000的跳頻碼,取初始參數μ=4.0,α=0.2,x(0)=0.3。將所得跳頻碼序列進行歸一化處理,為防止初始值過于接近,舍棄初始的2 000個點,然后再取4 000個點,其中3 000個點用于訓練,后1 000個點用于測試。 通過C-C算法求的跳頻碼序列延遲時間τ=1,嵌入維數m=3。對上述數據進行相空間重構,得到如下規模的數據樣本:訓練輸入矩陣大小為2 998×3,訓練輸出矩陣大小為2 998×1,測試輸入矩陣大小為998×3,測試輸出矩陣,即預測值矩陣大小為998×1。 3.1.2Lorenz系統跳頻碼 (14) 取參數σ=10,R=28,b=8/3,初始值向量為(-0.3,0.3,0.3)。用四階Runge-Kutta算法,步長h=0.01,共求解x分量10 000點數據,并對其進行歸一化處理,舍棄初始的2 000個點,然后再取1 000個點作為仿真數據,其中前500點用于訓練,后500點用于測試。 通過C-C算法求得跳頻碼序列延遲時間τ=12,嵌入維數m=3。對上述數據進行相空間重構,得到如下規模的數據樣本:訓練輸入矩陣大小為476×3,訓練輸出矩陣大小為476×1,測試輸入矩陣大小為476×3,測試輸出矩陣大小為476×1。 3.1.3Mackey Glass系統跳頻碼 (15) 取參數α=0.1,β=0.2,γ=10,初始值x(0)=1.2。用四階Runge-Kutta算法,步長h=0.01,共求解x分量10 000點數據,并對其進行歸一化處理,舍棄初始的2 000個點,然后再取1 000個點作為仿真數據,其中前500點用于訓練,后500點用于測試。 通過C-C算法求得跳頻碼序列延遲時間τ=6,嵌入維數m=3。對上述數據進行相空間重構,得到如下規模的數據樣本:訓練輸入矩陣大小為488×3,訓練輸出矩陣大小為488×1,測試輸入矩陣大小為488×3,測試輸出矩陣大小為488×1。 3.2儲備池參數選取 回聲狀態網絡性能的優劣跟參數選取直接相關,根據特定的數據樣本挑選適合的儲備池參數也一直是回聲狀態網絡領域重難點問題。然而,人們到現在都未能研究出系統的理論分析解決這方面問題。本文以上述Lorenz系統的x分量為實驗數據,研究儲備池參數如何選取。 3.2.1神經元數量和譜半徑對網絡性能的影響 圖3為SD=0.125,IS=0.1的條件下,不同神經元數量和譜半徑下均方根誤差比較。神經元數量的取值范圍為[30,80],步長為5,譜半徑的取值范圍為[0.1,0.9],步長為0.1。從圖中可以看出,當譜半徑一定時,隨著神經元數量增加,均方根誤差基本上也在降低。所以神經元數量越多,預測準確度肯定會提高,然而這也會導致網絡訓練速度變慢,運行時間增長等問題,違背了回聲狀態網絡設計的初衷,神經元數量可以進行折中選擇。當神經元一定時,從圖中可以看出均方根誤差沒有特別大的起伏,所以針對這組數據,譜半徑的增減對預測誤差影響不大。 圖3 不同神經元數量和譜半徑下預測性能的比較Fig.3 The comparison of prediction performance betweendifferent neuron and spectral radius value 3.2.2儲備池稀疏程度和輸入單元尺度對網絡性能的影響 圖4為SR=0.5,N=30的條件下,不同儲備池稀疏程度和輸入單元尺度下均方根誤差比較。儲備池單元尺度的取值范圍為[0.1,0.9],儲備池稀疏度為[0.1,0.9],兩者步長都為0.1。從圖中可以看出,當輸入單元長度大于0.6后,無論稀疏度如何變化,均方根誤差基本都處于一個較低的水平。所以針對該數據,輸入單元尺度的取值只要大于0.6,稀疏度影響不大。 本文對Logistic-Kent映射和Mackey Glass系統跳頻碼作了同樣的實驗分析,在這里就不一一贅述。 圖4 不同儲備池稀疏程度和輸入單元尺度下預測性能的比較Fig.4 The comparison of prediction performance betweendifferentsparsity degree and input scaling value 3.3實驗結果和分析 根據上述實驗結果,本文針對三種跳頻碼預測使用不同結構的回聲狀態網絡。對于Logistic-Kent映射跳頻碼采用的網絡參數為SR=0.05,N=500,SD=0.02,IS=0.1。對于Lorenz系統跳頻碼采用的網絡參數為SR=0.9,N=80,SD=0.1,IS=0.7。對于Mackey-Glass系統跳頻碼采用的網絡參數為SR=0.85,N=90,SD=0.1,IS=0.5。 圖5至圖7分別表示三種跳頻碼實際序列和預測序列,從圖中可以看出,回聲狀態網絡能夠較好地預測出跳頻碼。 圖5 Logistic-Kent原始序列和預測序列Fig.5 The prediction results of logistic-kent mappingfrequency hopping codes 圖6 Lorenz原始序列和預測序列Fig.6 The prediction results of Lorenz system frequencyhopping codes 圖7 Mackey-Glass原始序列和預測序列Fig.7 The prediction results of Mackey-Glass systemfrequency hopping codes 為了進一步凸顯本文所構造回聲狀態網絡模型的預測效果,從預測均方誤差的角度做了對比分析,表1分別給出了不同方法RMSE預測對比結果。可見,回聲狀態網絡的預測效果相比較更有優勢,預測均方根誤差最小。同時在有效預測率方面,Logistic-Kent映射跳頻碼有效預測率為99.2%,Lorenz系統和Mackey-Glass系統跳頻碼預有效預測率均為100%。 表1 三種跳頻碼的不同預測方法RMSE比較 跳頻碼序列預測不僅要注重準確度,對時效性也有極高的要求。本文實驗中,將訓練好的網絡用于預測,Logistic-Kent映射跳頻碼平均每點預測耗時約為1.58 ms,Lorenz系統跳頻碼平均每點預測耗時約為0.72 ms,Mackey-Glass系統跳頻碼平均每點預測耗時約為0.66 ms。通過預測所耗時間可以看出,回聲狀態網絡能滿足500~1 000 h/s的中高速跳頻碼預測。 4結論 本文提出了回聲狀態網絡混沌跳頻碼預測方法。該方法在對跳頻碼相空間重構的基礎上,利用回聲狀態網絡內部動態儲備池的循環記憶功能,通過調整各權值矩陣的數值大小達到記憶數據的目的,解決了混沌跳頻碼預測問題。仿真實驗表明該方法對Logistic-Kent映射、Lorenz系統和Mackey-Glass系統三種混沌跳頻碼都有較好的預測效果,并與其他方法的實驗結果進行了比較,證明回聲狀態網絡在混沌跳頻碼預測方面的可行性及優越性。本文還結合混沌跳頻碼預測問題,以具體仿真數據為切入口,討論了儲備池參數的選擇問題。在下一步的研究中,將會把重點放在如何選取儲備池參數上,尋求更一般的系統方法解決參數選擇問題,以便進一步提高預測精度。 參考文獻: [1]郭雙冰,肖先賜.幾種跳頻碼的混沌動力學特性及預測分析[J].系統工程與電子技術,2000,22(12):29-32. [2]黨建亮,張家樹.基于支持向量機的混沌跳頻碼預測[J]. 信號處理,2005,21(4A):122-125. [3]Wang Wensheng, Yang Youlong,Li Yanying.Multi-step prediction of frequency hopping sequences based on Bayesian inference[C]//Information and Communications Technologies (IETICT 2013),Beijing:IET,2013:94-99. [4]范越非,盧宏濤. 跳頻碼序列混沌預測的性能研究[J].計算機應用與軟件,2011,28(8):83-86. [5]WangYi, GuoWei.Frequency-hopping prediction based on the chaotic neural network[C]//Communication Technology, 2006. ICCT ′06.Guilin:ICCT,2006:1-4. [6]HJaeger,The “ echo state” Approach to Analyzing and Training Recurrent Neural Networks[R].German:GMD German National Research Institute for Computer Science,2001. [7]陸振波,蔡志明,姜可宇.基于改進的C-C方法的相空間重構參數選擇[J].系統仿真學報, 2007, 19(11):2527-2530. [8]霍思宇,混沌時間序列的預測方法研究[D].成都:電子科技大學,2010. [9]李文華,王智順,何振亞.用于跳頻多址通信的混沌跳頻碼[J].通信學報,1996,17(6):12-16. [10]黨建亮,張家樹.基于支持向量機的混沌跳頻碼預測[J].信號處理,2005,21(4A):122-125. [11]張家樹,郭雙冰.混沌跳頻通信的非線性自適應預測對抗[J].信號處理,2001,17(3):205-209. [12]Takashi Kuremoto,Masanao Obayashi,Kunikazu Kobayashi,Takaomi Hirata,Shingo Mabu.Forecast Chaotic Time Series Data by DBNs[C]//Image and Signal Processing(CISP).Dalian:CISP,2014:1130-1135. [13]Zhang Sichao,Liu Ping.Prediction of chaotic time series based on the relevance vector machine[C]//Advanced Computational Intelligence(ICACI). IEEE,2012:314-318. [14]Gu Hong,Wang Hongwei.Fuzzy prediction of chaotic time series based on sigular value decomposition[J]. Applied Mathematics and Computation,2007,185(2):1171-1185. 摘要:針對現有跳頻碼預測方法存在的缺乏記憶能力、運算量大、訓練過程復雜等問題,提出了基于回聲狀態網絡的混沌跳頻碼預測方法。該方法在跳頻碼相空間重構的基礎上,利用回聲狀態網絡內部動態儲備池的循環記憶功能,通過調整各權值矩陣的數值大小達到記憶數據的目的, 解決了跳頻碼預測的問題。仿真實驗表明該方法對Logistic-Kent映射、Lorenz系統和Mackey-Glass系統三種混沌跳頻碼都有較好的預測效果,并與其他方法的實驗結果進行了比較,證明回聲狀態網絡在混沌跳頻碼預測方面的可行性及優越性。 關鍵詞:跳頻碼預測;回聲狀態網絡;混沌跳頻碼 Chaotic Frequency Hopping Code Prediction Method Based on Echo State NetworkLü Jijie1,2, YANG Junan1,2, GUI Yunchuan1,2 (1. Electronic Engineering Institute of PLA, Hefei 230037, China; 2.Key Laboratory of Electronic Restriction, Hefei 230037, China) Abstract:As for the problem of frequency hopping prediction such as the incapability of memorization, vast computation and complex training procedure, a new method for chaotic frequency hopping codes prediction based on the echo state network was proposed. The method, which was under the premise of the phase space reconstruction, solved the problem by taking the advantage of the cyclic memory function of dynamic reservoir and adjusting the numerical size of each weight matrix to achieve the purpose of memorizing data. The simulation experiments showed that the method achieved great prediction performance for the three chaotic frequency hopping codes generated by Logistic-Kent mapping, Lorenz and Mackey-Glass system respectively. Key words:frequency hopping code prediction;echo state network; chaotic frequency hopping code 中圖分類號:TN914.4 文獻標志碼:A 文章編號:1008-1194(2015)06-0092-07 作者簡介:呂季杰(1991—),男,安徽郎溪人,碩士研究生,研究方向:信號處理,混沌預測。E-mail:Ljj615315@163.com。 *收稿日期:2015-05-26





