單文廣
摘 要: 窗口的長度是一個非常關鍵的調整參數的奇異譜分析(SSA)技術。為在SSA應用中找到窗口長度的最佳值,可使用周期譜圖分析法進行SSA窗口長度的選擇。佛羅里達州的降水數據含有一些潛在的周期性,使用周期譜分析方法的應用方法確定窗口長度,提取降水時間序列的潛在降雨周期,能有效進行降水預報分析,結果成功確認周期譜分析可以在SSA應用中選擇窗口長度提供有效的幫助。
關鍵詞: 奇異譜分析(SSA) 窗口長度 線性遞推公式(LRFS) 周期譜分析
奇異譜分析(SSA)是在許多科學研究領域進行時間序列分析的可靠的技術創新。SSA技術由Broomhead和King(1986a,1986b)首次提出,其已經成為應用不同的單一和多變量時間序列分析領域的一個有效的工具。Allen和Smith(1996)闡明了SSA的基本格式與調節振蕩的研究,探索了在蒙特卡羅算法和記錄的變化。Yiou(2000)等人應用擴展的方法,對非平穩時間序列包括間歇性使用小波分析的多尺度方差發散的概念進行研究。Marques(2006)等人應用SSA方法和水文時間序列,研究單一時間序列其主要信息的分解能力及相關的預報技巧。Baratta(2003)等人提出SSA新的發展技術應用于臺伯河流域的降雨時間序列的預報。目前,SSA技術已運用于各應用領域。
根據SSA算法的一般結構,其有兩個基本的和重要的參數:窗口長度L和SSA特征值數r,參數L和R的選擇取決于所要分析的數據。L和R的正確的選擇影響著時間序列的有效的分解。Elsner和Tsonis(1996)做了一些關于SSA應用中常規參數選擇的探討。Mahmoudvand和Zokaei(2012)研究了Hankel矩陣的奇異值的性能,獲得了最佳的結果參數值。
值得注意的是,L的變化會影響SSA方法中重建組分的可分特性。為找到應用中窗口長度L最優值,我們用周期譜分析的方法進行SSA窗口長度L選擇研究,通過使用周期譜分析方法應用于佛羅里達州的降水數據獲得潛在的周期,然后應用SSA技術提取降雨時間序列的周期,比較在不同的窗口長度L的預測結果。
1.方法和數據
1.1奇異譜分析
SSA的主要目的是分解幾個組件系列組,算法主要描述遵循Golyandina(2001)等人的方法。若對于一時間序列X=(x■,x■,…,x■),窗口長度為L,且1 Y=[Y■,Y■,…,Y■]=x■ x■ … x■x■ x■ … x■x■ x■ … x■… … ?塤 …x■ x■ … x■(1) 然后對其進行經驗正交展開,得出前幾個特性向量即可表示序列周期振蕩的主要模態和趨勢,可用來識別和描述序列中蘊含的各種線性或非線性振蕩信號,而相對應的時間系數則表示相應周期的長期變化特征。由于經過奇異譜分解,序列的頻域信號被分解為具有單一循環周期的時域信號,因此可按下式重建各個振蕩分量序列。 f■=■■e■■ for 1≤k 由此表明,SSA算法的應用需要選擇兩個參數:窗口的長度L和特征向量數量r。 1.2周期譜分析 周期譜是一個信號的譜密度估計,周期譜分析能夠找出哪些頻率包括在系列中。一個序列(x■,x■,…,x■),周期譜的定義可以描述為: P(T)=■■x(n)e■■(3) 方程表明譜密度估計和嵌入式周期之間的關系,可以表明哪些期間應視為主要周期。 1.3線性遞歸公式 線性遞歸公式的理論和相關的特征多項式是眾所周知、廣泛使用的。根據定義,一個非零序列X■=(x■,x■,…,x■)可由一個線性遞推公式(LRF)表示為: x■=■a■x■(3) LRF的特點是可應用于各種廣泛的模型并依賴于不同的滯后變量。 1.4數據 在目前的研究中,使用的數據是某地的月平均降水資料,從1981年1月到2012年12月。如圖1所示,32年(1981-2012)月降水的奇異的時間序列數據,其中28年的記錄是用來分析的,最近4年的記錄用來驗證預測的。 圖1 月降水量 2.結果與討論 本研究中使用月降水資料,28年(N=336)。為了描述降水時間序列特性,研究了不同的窗口長度L的奇異譜分析。長度為N的測試數據,以N/2=168和N/3=112作為窗口長度。為了找到可能的嵌入式周期,周期譜分析法被應用到的原始數據,如圖2所示,有四個明顯的周期譜峰,對應于周期T■=12、T■=21、T■=44和T■=81。 圖2 降水時間序列的周期譜圖 這些可能的固有周期為可選的窗口長度的值?;谶@些選擇的窗口長度L對時滯排列矩陣進行奇異譜,得到有序的主成分。圖3顯示了第一主成分和相關的貢獻率分析:從波動趨勢平穩隨L的變化,以及相應的貢獻率下降。 圖3 觀察值和第一主成分及 SSA方法的主要特點是能夠很好地分離不同的組件。在大多數情況下,所占百分數小的成分通常對應噪聲成分,所以這些主成分都能正確地描述該系列的總趨勢。在不同的窗口長度下,重建這些主成分和原來的時間序列進行對比,如圖4所示。 圖4 觀測值與擬合值 在圖4中,模擬的時間序列很好地擬合了原始時間序列,結果如表1所示。 表1 擬合序列各項參數 基于這些主要成分的時間序列分析中,LRF分別應用到主成分的時間序列并對主成分進行了預測,然后這些新的主成分形成了4年的降水預報(2009-2012)。圖5顯示了觀測值與預測值的對比分析。 圖5 降雨觀察和預測對比圖 圖5充分表明,此方法能夠很好地預測降水的變化隨著季節趨勢性的演化特征。為了評估并比較預測的性能,使用以下定量驗證方法:根均方誤差(RMSE)、決定系數(R2)和平均絕對誤差(MAE)。統計驗證對比結果如表2所示。 表2 預測結果對比 從以上數據和驗證的標準可發現,窗口長度L=81的預測,表現出更好的性能。 3.結語 以上應用SSA和LRF方法對降水時間序列進行了預測。降水時間序列的周期譜分析表明,一些可能的固有周期可作為可選的窗口長度,并且這些主要成分很好地擬合了原始時間序列。圖形的對比和預測結果的比較表明,窗口的長度L=81的預測為最好的參數選擇。結果表明在SSA應用中,周期譜分析法能夠很好地選擇窗口長度,并進行復雜的時間序列預測。