田紅麗,李成群,閆會強,陳 昕
(1.河北工業大學 人工智能與數據科學學院,天津 300130;2.河北工業大學 經濟管理學院, 天津 300130;3.哈爾濱工業大學 電氣工程及自動化學院,黑龍江 哈爾濱 150001)
灰色模型(grey model,GM)在振蕩變化時間序列的預測研究一直是大家關注的熱點問題,雖有很多研究成果呈現[1-4],但預測結果仍然不夠理想。預測結果或導致病態結果出現,或得到的包絡、區間形式,只能給出預測的大致區域。此外,現有的灰色模型在預測建模時,較少利用歷史數據或完全舍棄歷史數據[5,6]。實際上,隨著數據的積累,振蕩序列數據中的波動特性存在著一定的相似性。隨著時間周期的積累,振蕩序列也將呈現一定的周期性。
本文嘗試充分利用歷史數據信息,針對當前預測數據,利用本文提出的殘差相關系數,在歷史數據中尋找其相似數據段,在該相似數據段中利用遺傳算法尋優得到灰色模型的權重系數。然后,利用最優權重系數灰色模型對當前數據進行預測,得到的預測結果再與歷史數據結合,得到最終的預測結果。
文獻[7]提出了一種綜合考慮縱向偏差和橫向殘差的相關系數,相比其它相關系數可以更好地反映數據之間的相關性。但是該相關系數計算得到的相關系數數值普遍偏大,使得數據之間的區分性不明顯。因此,本文提出一種新的殘差相關系數(residual correlation coefficient,RCC)。該相關系數考慮了兩個數據序列之間的空間距離及每個序列內橫向殘差之間的相似度。
給定兩組數據X和Y, 它們之間的歐氏距離表示為
(1)
式中: T為轉置運算符。
則二者之間的空間距離度量表示為
D(X,Y)=exp(-Δ(X,Y))
(2)
在式(2)中,利用指數運算可保證X和Y之間的距離呈現平穩過渡趨勢,且0 在單一數據序列內,殘差定義為 (3) (4) 因此,可以得到殘差相關系數表示為 (5) 所以, 0 灰色預測模型是灰色系統理論的核心和基礎,是一種客觀的基于不確定性描述的預測模型。該模型巧妙地運用累加累減計算而放寬了對數據的苛刻要求,即該模型無需大量歷史數據和數據序列的平穩性特征即可實現快速的中短期預測。但是,該模型及推廣模型也普遍存在以下不足:①預測精度對模型參數選取比較敏感;②振蕩數據的預測效果不理想。這也是本文主要解決的兩個重點問題。 最常用的灰色預測模型為GM(1,1)模型。建立GM(1,1) 模型的基本流程和方法如下:給定X(0)={x(0)(1),x(0)(2),…,x(0)(t),…,x(0)(n)} 為一個時間序列模型,t=1,2,…,n,n稱為歷史數據維度。對其元素迭代累加后得到累加序列 X(1)={x(1)(1),x(1)(2),…,x(1)(T),…,x(1)(n)} (6) 由此得到緊鄰加權值生成序列為 z(1)={z(1)(2),z(1)(3),…,z(1)(n)} (7) 式中:z(1)(k)=μx(1)(t-1)+(1-μ)x(1)(t),t≥2,μ為緊鄰權重系數, 1>μ>0。 建立白化微分方程 x(0)(t)+az(1)(t)=u (8) 式中:a為發展系數,代表數據的發展態勢;u為灰作用量,代表數據的不確定性。兩個參數可按最小二乘法進行辨識獲取 (9) 式中 (10) (11) (12) 則可解得離散時間響應函數為 (13) 然后利用累減運算求解預測結果為 x(0)(t+1)=x(1)(T+1)-x(1)(T) (14) 在最相似歷史數據段Xh中,根據歷史預測結果,以最小相對誤差為目標函數,利用遺傳算法尋找最佳的緊鄰權重系數μ。 相對誤差公式為 (15) 結合歷史預測結果和當前預測結果,則可以得到最終的預測結果表示為 (16) 因此,可設計基于遺傳算法尋優的組合預測模型一般過程如下: 步驟1 截取當前預測所需的訓練數據序列Xc; 步驟2 在所有歷史數據序列XA中,遍歷計算每個等長序列與Xc的相關系數,找到具有最大相關系數的歷史序列段Xh; 步驟3 在歷史數據段Xh中,對緊鄰權重系數μ通過選擇、交叉、變異操作,在最大進化代數范圍內找到使得相對誤差最小的緊鄰權重系數; 步驟4 利用最優緊鄰權重系數對當前數據序列進行預測,包括累加序列生成、緊鄰生成、白化微分方程參數求解、方程求解和累減運算輸出結果; 步驟5 根據式(16)得到最終的預測結果。 為驗證本文所提模型的有效性,選取美國天然氣數據作為研究對象,截取2010年1月1日至2018年11月30日期間每周的天然氣價格,單位為美元/Btu(British Thermal Unit)。原始數據如圖1所示。 圖1 天然氣價格原始走勢 通過圖1可以看出,所使用的天然氣數據序列為典型的振蕩數據。 對比實驗包括兩部分,第一部分為殘差相關系數的驗證實驗,第二部分為預測驗證實驗。在殘差相關系數驗證實驗中,對比的相關系數包括余弦相似度(cosine similarity,CS)、廣義雅可比相關系數(generalized Jaccarb coef-ficient,GJC)、皮爾遜相關系數(Pearson correlation coef-ficient,PCC)和橫向殘差與縱向相關系數(longitudinal and transverse correlation coefficient,LTCC)[7]。在預測驗證中,選取的對比方法包括向前滾動灰色模型(forward rolling grey model,FRGM)[8]、新陳代謝灰色模型(metabolism grey model,MGM)[9]和改進灰色模型(revised grey model,RGM)[10]。其中,本文簡記為GARGM(genetic algorithm based residual grey model)。 在本文的組合預測模型中,初始歷史數據個數為60,當前歷史數據個數n為10,遺傳算法進化代數為100,初始種群數為100,二進制編碼長度為10,交叉概率為0.6,變異概率為0.001,緊鄰權重系數變化范圍為0<μ<1。 3.2.1 相關系數對比實驗 在本部分實驗中,同樣選取文獻[7]中所用的人工數據作為測試對象,其分布如圖2所示。 圖2 人工數據走勢 在計算相關系數時,以x1為參考基準,分別計算序列x2至x7與x1的相關系數。可以得到各種方法的相關系數結果見表1。 表1 相似灰色模型預測結果 3.2.2 預測對比實驗 各種對比方法得到的預測結果如圖3-圖6所示,所得的平均相對誤差見表2。 圖3 FRGM預測結果 圖4 MGM預測結果 圖5 RGM預測結果 圖3-圖6的預測結果表明,向前滾動灰色預測模型由于不恰當地使用了歷史數據,導致其預測結果只能大致跟蹤數據的走勢,但無法實現較為精準的預測;新陳代謝灰色模型通過舍棄歷史數據對新數據進行更新,而得到了相對較好的趨勢保持結果;改進的灰色模型,通過在歷史數 圖6 GARGM預測結果 FRGMMGMRGMGARGM平均相對誤差18.182110.64115.10814.5900 據中尋找較優的訓練數據維度,而實現了較好的預測效果;而圖6中本文所提方法則通過合理地利用歷史數據信息,使得預測結果與真實結果具有更好的貼合效果。表2中的平均相對誤差結果再次驗證了上述分析結果。 針對灰色模型在振蕩序列中預測的不足,提出一種基于殘差相關系數和灰色模型組合的預測方法。首先,根據時間序列特點,提出殘差相關系數。然后,將殘差相關系數和灰色模型結合,利用遺傳算法對灰色模型參數進行尋優。最后,得到一種加權預測結果。基于人工數據的對比實驗結果表明,殘差相關系數更符合人們的自然認知,更適用于時間序列間的相似關系計算。基于天然氣價格預測的對比實驗結果表明,本文所提的組合預測方法預測精度更高,適用于振蕩序列的預測。


1.2 灰色預測模型

2 組合預測模型


3 數值實驗
3.1 數據來源及實驗設定

3.2 對比實驗與結果分析








4 結束語