摘 要: 使用經(jīng)典回歸分析對信號處理時通常假定噪聲服從高斯過程,然而現(xiàn)實中許多信號呈現(xiàn)噪聲自相關等非平穩(wěn)特性。常用的廣義差分法對噪聲自相關做差分處理時,固定了連續(xù)兩個樣本間的相關系數(shù),但是現(xiàn)實中相鄰兩個時間點樣本的相關程度往往不是確定的。將矢量三角形加減法法則與廣義差分相結合,開創(chuàng)性地提出具有無機自適應性的矢量差分算法,其相關系數(shù)根據(jù)信號自身的規(guī)律自動調整。最后,將該方法應用于噪聲自相關實例,結果表明矢量差分算法比廣義差分法的無機自適應能力更強,能夠更好地刻畫信號的變化規(guī)律。
關鍵詞: 無機自適應算法; 噪聲自相關; 矢量差分; 系數(shù)自動調整
中圖分類號: TN911?34; TP18 文獻標識碼: A 文章編號: 1004?373X(2015)14?0016?04
一個離散的時間序列就是一個離散的時間信號。在兩個時間序列數(shù)據(jù)的回歸分析中,通常假設殘差噪聲在不同時點之間是不相關的。然而在現(xiàn)實問題的研究中,不少時間序列隨著時間的推移有一種長期趨勢,呈現(xiàn)信號不平穩(wěn)的特性。對這樣的兩列信號建立回歸模型時,殘差之間的相互獨立性就會遭到破壞,噪聲之間存在依賴性,用此模型進行預測和結構分析就會有較大的誤差。這時就需要用一定的方法對其進行補救,國內外學者對噪聲自相關問題的處理和研究主要是差分法。當自相關系數(shù)已知時,通常采用廣義差分法對信號進行處理,消除噪聲序列的自相關性。但在實際數(shù)據(jù)中,自相關系數(shù)一般是未知的,所以需要對其進行估計。Cochrane和Orcutt于1949年提出了Cochrane?Orcutt迭代法,通過逐步迭代,提高自相關系數(shù)的近似估計精度直到滿意為止,再采用廣義差分法[1]。1960年Durbin提出了Durbin兩步法,即將數(shù)據(jù)進行兩次廣義差分變換處理,再使用OLS法估計參數(shù),其優(yōu)點是只要樣本容許,可以修正任意階自相關[2]。張荷觀提出根據(jù)自回歸分布滯后模型直接建立樣本回歸方程的方法[3?4],并給出自相關系數(shù)的估計,改進了估計量的統(tǒng)計性質并提高了擬合優(yōu)度。無論是差分法還是迭代法,它們都將信號樣本點間的相關系數(shù)固定,然而現(xiàn)實中相鄰兩期樣本點的相關程度往往不是固定的。為克服廣義差分法固定相關系導致構建的模型泛化能力較弱的缺點,本文將矢量三角形加減法法則與廣義差分方法相結合,開創(chuàng)性地提出了基于相關系數(shù)可自動調整的無機自適應算法——矢量差分方法。這種無機自適應算法與有機智能算法是不同的,現(xiàn)有的智能算法處理的大多是多變量、非線性的復雜系統(tǒng),對單變量、線性信號系統(tǒng)的建模效果較差[5]。智能算法在對目標函數(shù)進行優(yōu)化搜索時強調整體最優(yōu),這樣就會造成瞻前顧后,不能保證預測效果最優(yōu),而人們往往希望用于預測和分析的后期時間點最優(yōu)。本文提出的矢量差分算法是對輸入信號進行優(yōu)化搜索,在強調當期對近期依賴性的同時保證了當期與遠期的相互關聯(lián)性。
本文介紹了矢量差分的方法原理、矢量差分的一般公式和矢量差分算法的無機自適應性;最后用噪聲自相關的離散時間序列做實驗,結果表明矢量差分算法模型比廣義差分法的無機自適應能力更強,能夠更好地刻畫信號的變化規(guī)律。
1 矢量差分的方法原理
矢量差分是按照三角形減法法則進行的。在圓里面將矢量由最低點出發(fā)依次排列,連續(xù)兩期樣本點之間根據(jù)矢量模的大小就形成了不同的夾角。這樣在圓里面就實現(xiàn)了信號樣本點自相關系數(shù)在各點的自動調整。
1.1 矢量差分的原理
在三角形[OA1A2]中,矢量減法法則為:[A1A2=OA2-OA1],其中[A1A2]反映了矢量差,如圖1所示。
圖1 圓中三角形的矢量差分方法
下面按照張昴等提出的在直徑為1的圓中進行矢量差分推導的方法,給出矢量差分[A1A2]的數(shù)值[6]。在圓[M]中,取直徑[OO′=1],令從點[O]出發(fā)任意一條弦[OA]的弦切角(與水平線的夾角)為[α]。根據(jù)弦切角定理:弦所對的圓周角的大小等于弦切角,則有[∠OO′A=α];即可得出,在直角[ΔOO′A]中,[OA=sin α],即任意圓周角[α]對應弦的弦長為[sinα]。于是標準化轉換到[0,1]區(qū)間兩期數(shù)據(jù)間的矢量差為[A1A2=sin(α2-α1)]。下面結合廣義差分法給出矢量差分的一般形式。
1.2 矢量差分公式推導
在消除殘差噪聲自相關時,由于廣義差分法將相關系數(shù)固定,所以扭曲了信號的變化規(guī)律。本文將矢量差分算法可以自動調整相關系數(shù)的特性運用到廣義差分法上,從而實現(xiàn)兩個連續(xù)樣本點相關系數(shù)的調整。
在圓里的矢量差分的代數(shù)形式為:
[At-1At=sin(αt-αt-1)]
而廣義差分的代數(shù)本質如下式所示:
[xt-ρxt-1=sinαt-ρsinαt-1 =sin(arcsinxt)-ρsin(arcsinxt-1)]
本文提出一般矢量差分公式:
[xt-xt-1=sin(arcsinxt)-sin(ρ(arcsinxt-1))]
比較廣義差分法[xt-ρxt-1],矢量差分的一般公式為:
[xt-ρsin(arcsinxt-1)=xt-ρtxt-1]
進而,在實現(xiàn)廣義差分的同時,保證了相關系數(shù)的自動調整。根據(jù)線性系統(tǒng)輸入輸出信號響應分析的一般步驟[7],其原理圖如圖2所示。
圖2 矢量差分處理器
1.3 矢量差分的優(yōu)點:相關系數(shù)的自適應調整
由于[xn-ρxn-1=OAn-ρOAn-1=An-1An],則有[ρ=OAn-An-1AnOAn-1=sinαn-sinΔαnsinαn-1],其幾何形式見圖3。
圖3 自相關系數(shù)的自適應調整
首先,對其進行極限分析。當兩期指標非常接近時,[limΔαn→0ρ=sinαnsinαn-1=1]。 然后,任取[OAn-1=][sinαn-1,][ρ∝OAn-An-1An=sinαn-sinΔαn=sinαn-][sinαn-αn-1]。令[OAn]增大角度[θ],則有[ρ′∝sin(αn+θ)-sin[(αn+θ)-αn-1]=sin(αn+θ)-][sin[(αn-αn-1)+θ]]。注意到,正弦函數(shù)[y=sinx]在區(qū)間[(0,π2)]的二階導數(shù)小于0,隨著自變量[x]的增加[y]的增加越來越緩慢。那么當角[αn]和[(αn-αn-1)]同時增加[θ]時,[(αn-αn-1)]對應的函數(shù)值增加的更大,即有[sin(αn+θ)-sinαn 2 實驗研究 2.1 一階殘差噪聲自相關 例1:在研究我國城鎮(zhèn)人均支出和人均收入兩列離散信號之間關系的問題中,記輸出信號城鎮(zhèn)家庭平均每人全年消費性支出(元)為y,輸入信號城鎮(zhèn)家庭平均每人可支配收入(元)為x。 這里收集到1990—2009年20年的信號樣本點[8]如表1所示,試檢驗殘差噪聲是否存在一階自相關,建立相應的線性映射方程并做響應分析。 表1 我國城鎮(zhèn)人均收支表 2.1.1 直接對輸入信號和輸出信號做線性映射回歸 根據(jù)歸一化公式: [x′=x-xminxmax-xmin] (1) 將兩列信號樣本數(shù)據(jù)映射到[0,1]區(qū)間進行標準化處理。將輸入信號x和輸出信號y進行線性映射回歸擬合,得映射回歸為:[y=0.021+0.996x]。 此方程的調整R2為0.998。經(jīng)檢驗[DW=0.300],[dL=1.200],[dU=1.410],[0.300 2.1.2 對輸入信號和輸出信號做廣義差分處理 分別對輸入信號x和輸出信號y的原始樣本點進行轉換,即[xt′=xt-0.85xt-1],[yt′=yt-0.85yt-1]。再次進行回歸擬合,得到:[yt′=0.009+0.954xt′]。 新回歸方程的調整R2為0.990,殘差的[DW=2.327],[dL=1.18],[dU=1.40],[dU<2.327<4-dU],因而[DW]落入無自相關區(qū)域[10]。 2.1.3 對輸入信號和輸出信號做矢量差分處理 對輸入信號x和輸出信號y分別進行矢量差分,差分得到的信號分別表示為[x*]和[y*],則為[y*]對[x*]的線性映射為:[y*t=0.007+0.975x*t]。此時調整R2為0.996,殘差的[DW=2.301],[dU<2.301<4-dU],殘差噪聲已經(jīng)消除了自相關。 2.1.4 信號間響應分析 經(jīng)過一階廣義差分法處理后有效數(shù)據(jù)樣本點是19個,基于[DW]檢驗要求數(shù)據(jù)樣本量大于15,對信號進行4步預測,并作響應分析。以用前16個樣本值構線性映射,預測第17個樣本值為例進行詳細說明。本文使用[w=y-yy]作為預測誤差計算公式。 (1) 用前16個樣本量進行廣義差分構建的滯后回歸方程為: [yt-0.624 0yt-1=0.005 8+1.038 9(xt-0.624 0xt-1)] 還原線性映射為: [yt-0.624 0yt-1=130.731+0.728 6(xt-0.624 0xt-1)] 帶入樣本預測2006年城鎮(zhèn)家庭平均每人全年消費性支出為8 884.42 726元,實際值為8 696.55元,誤差[w]為2.16%。 (2) 用前16個樣本量進行矢量差分構建的滯后回歸方程為: [sin(arcsinyt-0.624 0arcsinyt-1)=0.005 3+ 1.048 9sin(arcsinxt-0.624 0arcsinxt-1)] 還原線性映射為: [sin(arcsiny-yminΔy-0.624 0arcsinyt-1-yminΔy)=0.005 3+1.048 9sin(arcsinx-xminΔx-0.624 0arcsinxt-1-xminΔx)] 輸入信號x在2006年的數(shù)值,輸出2006年城鎮(zhèn)家庭平均每人全年消費性支出為8 858.609 67元,實際為8 696.55元,誤差[w]為1.86%。按照這種方法,2007年,2008年和2009年的城鎮(zhèn)家庭平均每人全年消費性輸出值可以依次求得,誤差結果見表2。 表2 一階噪聲自相關預測誤差 % 可見矢量差分算法的預測值全部顯著高于廣義差分法,凸顯其具有可自動調整的無機適應性的優(yōu)越性,較好地刻畫了信號變化規(guī)律。 2.2 高階殘差噪聲自相關 例2:在研究我國人均消費水平的問題中,記輸出信號全國人均消費金額(元)為y,輸入信號人均國民收入(元)為x。收集到1980—1998年19年間的信號樣本點[8]如表3所示,試檢驗殘差噪聲是否存在一階殘差噪聲自相關,建立相應的線性映射方程并做響應分析。
表3 全國人均收支表
2.2.1 直接對輸入信號和輸出信號做線性映射回歸
將兩列信號樣本數(shù)據(jù)按照式(1)標準化到[0,1]區(qū)間。建立映射回歸如下所示:
[y=0.013+0.984x]
調整R2為0.999。計算出[DW=0.873,][dL=1.18 , 0.873
2.2.2 對輸入信號和輸出信號做廣義差分處理
對輸入信號x和輸出信號y廣義差分法處理后進行回歸擬合,新回歸方程殘差的[DW=1.372]。此時[dL=1.16],[dU=1.39],[dL<1.372 [y″=0.001+0.995x″] 2.2.3 對輸入信號和輸出信號做矢量差分處理 一階矢量差分處理[DW]值為1.400,發(fā)現(xiàn)[dL<1.400 [y**]對[x**]的映射回歸如下: [y**=0.04+1.005x**] 由此可見矢量差分算法改進估計量的統(tǒng)計性質,提高映射回歸的擬合優(yōu)度及系數(shù)檢驗的顯著性。 2.2.4 信號間響應分析 二次差分處理后有效數(shù)據(jù)樣本量是17,基于[DW]檢驗要求數(shù)據(jù)樣本量大于15,對模型進行2步預測,并做相應分析,誤差結果如表4所示。 表4 高階噪聲自相關預測誤差 % 由表4可以看出兩年的矢量差分預測誤差均明顯低于廣義差分。進一步論證了矢量差分在高階殘差噪聲自相關無機適應性能力的優(yōu)越性,較好地刻畫了信號變化規(guī)律。 2.3 結果分析 通過一階殘差噪聲自相關和高階殘差噪聲自相關實例,分別利用廣義差分法和矢量差分法消除序列自相關并進行響應分析??梢园l(fā)現(xiàn),無論是在擬合優(yōu)度,還是在預測效果上,矢量差分方法都遠遠好于一般的廣義差分方法。從而論證了相關系數(shù)可以自動調整這一無機適應性能力的優(yōu)越性。 3 結 語 本文提出將矢量三角形加減法法則與差分相結合所構建的矢量差分方法在處理殘差噪聲自相關異常問題時,基于其自相關系數(shù)可以自動調整的無機適應性,對輸入信號數(shù)值間進行優(yōu)化搜索,在強調當期對近期依賴性的同時滿足當期與遠期的關聯(lián)關系。對單變量、線性信號系統(tǒng)的實驗表明通過矢量差分算法得出的映射回歸方程,其統(tǒng)計特性更加優(yōu)良,比廣義差分法泛化能力更強,在響應分析時凸顯了預測最優(yōu)的特性,能夠更好地刻畫信號的變化規(guī)律。 參考文獻 [1] COCHRANE D, ORCUTT G H. Application of least squares regression to relationships containing auto?correlated error terms [J]. Journal of the American Statistical Association, 1949, 44 (245): 32?61. [2] DURBIN J. Estimation of parameters in time?series regression models [J]. Journal of the Royal Statistical Society B, 1960, 22(1): 139?153. [3] 張荷觀.存在自相關時檢驗和估計方法的改進—基于自回歸分布滯后模型的自相關檢驗和參數(shù)估計[J].統(tǒng)計與信息論壇,2012,27(4):44?49. [4] 張荷觀.存在自相關時估計方法的改進[J].數(shù)量經(jīng)濟技術經(jīng)濟研究,2010(11):155?160. [5] 徐守時.信號與系統(tǒng):理論、方法和應用[M].合肥:中國科技大學出版社,2003. [6] 張昴,郭琨.基于等時圓矢量差分的ARVMA模型及其實證研究[J].系統(tǒng)科學與數(shù)學,2015,35(2):193?205. [7] 崔本亮.線性時不變(LTI)系統(tǒng)分析方法討論[J].現(xiàn)代電子技術,2009,32(3):127?129. [8] 何曉群,劉文卿.應用回歸分析[M].北京:中國人民大學出版社,2011. [9] WOOLDRIDGE J. Introductory econometrics: A modern approach [M]. USA: South Western, Division of Thomson Learning, 2012. [10] 高鐵梅.計量經(jīng)濟分析方法與建模[M].北京:清華大學出版社,2006.