


【摘要】匯率在國際金融市場以及對外貿易中扮演著重要角色。由于匯率變動趨勢的不確定性及復雜性,傳統的匯率預測方法無法達到更好的預測效果。為了達到更好的預測效果,我們提出基于壓縮感知去噪和支持向量回歸(SVR)的匯率預測模型。壓縮感知去噪是對原始的匯率數據進行預處理降噪的過程,支持向量回歸作為預測工具用于已降噪的數據的預測。我們采用中國人民銀行發布的人民幣兌美元匯率數據作為樣本數據,對我們新提出的方法進行數值模擬,同時與小波去噪等預處理方法進行對比,結果顯示基于壓縮感知去噪的支持向量回歸匯率預測方法具有較好的預測效果。
【關鍵詞】壓縮感知 匯率預測 支持向量回歸 時間序列 去噪
一、引言
匯率的變化是一個復雜的過程,它與一個國家的經濟水平、物價水平、通貨膨脹率、利率和政府干預等因素息息相關。另一方面來說,匯率對于國際經濟和金融市場的影響巨大,同時對各國社會經濟與生活也有著重要影響。因此,對于匯率的預測是十分必要的。
現階段來說,由于國際金融經濟形勢的多變以及經濟全球化的趨勢,匯率的變化波動趨勢復雜多變。隨著對其研究的深入,匯率預測的模型也在不斷的發展。在眾多的預測模型中,通常可以分為傳統模型和人工智能模型。其中傳統模型有GARCH模型和ARIMA模型,它們本質上是線性模型,由于匯率的變化不只是簡單的線性變化,其中還受很多非線性因素影響,所以線性的模型還存在許多不足和改進的空間。
隨著人工智能領域的發展,支持向量回歸(SVR)等該領域的模型和算法所具備的自適應和非線性性質,已經被證明在金融時間序列預測領域,面對更加復雜、非線性的數據時比傳統的線性模型有更好的預測效果。另外,在傳統模型中需要的數據的統計性假設,如穩定性,規則性和線性在人工智能模型中并不需要。比如,Liu和Wang(2008)[1]使用最小二乘支持向量回歸和網格參數尋優方法來進行匯率預測。Sermpinis G等(2015)[2]使用了SVR模型結合遺傳算法來預測歐元兌美元匯率的交易變化。人工智能模型已經廣泛用于其他時間序列預測中,并且取得了很好的效果。然而,從一方面來看,人工智能模型也存在一定的缺陷,如過擬合問題及對參數變化的過于敏感等問題;此外,由于匯率受金融市場、國家經濟等因素影響比較大,其產生的時間序列的變化十分復雜,由其產生的高噪聲對匯率的預測造成較大的影響。
因此我們提出結合去噪算法與人工智能模型、對原始匯率數據去噪以后進行預測的設想,以達到提高模型預測能力的目標。
當前,在去噪方法還有提升的空間,目前常用的去噪方法主要有傅里葉變換、離散余弦變換、小波變換、卡爾曼濾波及中值濾波等方法。對數據去噪帶來的優勢,使得越來越多的學者將去噪應用到實際的預測中。如He等(2010)[3]提出了一個基于slantlet去噪的最小二乘支持向量回歸模型來預測匯率。Faria(2009)[4]提出了一個基于指數平巧去噪的神經網絡模型來預測股市價格。
相對上面提到的幾種去噪方法,最近流行的基于壓縮感知去噪方法,通過合適的稀疏基轉換,能夠最大程度的保留數據信息,在此情況下,結合壓縮感知去噪方法和智能預測算法能夠提高對匯率的預測精度。目前來說,壓縮感知去噪應用的領域還不是很多,大多數是集中在圖像去噪方面。應用于一維信號的去噪處理的相關工作比較少,如Yu(2014)[8]應用壓縮感知去噪基于人工智能模型預測國際油價變化。
本文的創新點在于將壓縮感知理論應用于數據去噪,然后使用ε-SVR模型對去噪數據進行匯率的建模預測。并使用人民幣兌美元匯率數據進行模型仿真,并與傳統的去噪方法進行對比,結果證明壓縮感知去噪在匯率預測問題上相對來說有著更好的效果。
二、理論知識
(一)壓縮感知理論
壓縮感知理論首先是由Donoho在2004年提出的,它提供了一種新的信號采樣方式。壓縮感知理論指出:當信號在某個變換域是稀疏的或可壓縮的,可以利用與變換矩陣非相干的測量矩陣將變換系數線性投影為低維觀測向量,同時這種投影保持了重建信號所需的信息,通過進一步求解稀疏最優化問題就能夠從低維觀測向量精確地或高概率精確地重建原始高維信號。
壓縮感知理論主要涉及3個核心問題:1)稀疏表示。2)隨機采樣。3)信號恢復。
就稀疏表示而言,信號能被精確地通過一些基函數如傅里葉基和小波基表達出來。從數學的角度來說,有限長實質信號向量X∈Rn,假設■是Rn的一個正交基,則信號X∈Rn可以線性表示為:
■ (式2.1)
si是X的第i個系數:
■ (式2.2)
通過這種方法,X能被表達為ψs,ψ是一個n×n的矩陣,其中ψ1,……,ψn是它的列向量。如果si的大部分元素為0,則系數S是稀疏的。如果信號X∈Rn在一個正交基ψ下是稀疏的,那么稀疏系數S能被表達為
S=ψTX (式2.3)
就隨機采樣而言,定義一個和轉換基ψ不相干的m×n(m Y=ΦψTX (式2.4) 在信號恢復方面,在壓縮感知理論中,由于觀測數量m遠小于信號長度n,因此不得不面對求解欠定方程組Y=ΦψTX的問題。針對優化問題中的NP難情況,因此實際上可以將問題轉化為求解問題: ■ (式2.5) 其中,||x||1表示向量x的l1范數。 如果信號X被污染,上述問題還可以寫成: ■ (式2.6) 目前為止出現的重構算法都可歸入以下三大類:貪婪追蹤算法;凸松弛法;組合算法。通過上述的重構算法,信號可以被精確地從壓縮后的信號恢復過來。
(二)支持向量回歸
支持向量回歸,通過引入核函數的概念,將輸入向量映射到一個高維的特征向量空間,并在高維特征空間構造最優回歸函數,解決非線性回歸問題。在支持向量回歸模型中,核函數的選擇十分重要。核函數種類有很多,主要有:多項式函數k(xi,xj)=[(xi+x)+1]q,高斯徑向基函數k(xi,xj)=exp(-||xi-x||2/(2g)2),sigmiod函數k(xi,xj)=tanh(v(xi·x)+c)等。通過引入核函數巧妙地解決了維數災難問題,使得算法的復雜度與樣本維數無關。
三、壓縮感知去噪預測模型
根據上面提到的相關算法與技術,我們設計了壓縮感知去噪預測模型。該模型包括兩個步驟,即數據去噪和預測兩部分。
步驟一:用壓縮感知算法對數據進行去噪
首先,原始數據X包含有趨勢T和噪聲Z,它通過一個合適的轉換基表示出來,比如小波基。然后用一個高斯白噪聲矩陣對稀疏系數進行采樣。最后,通過正交匹配追蹤算法來恢復趨勢T,以便進行后續的分析。
步驟二:用支持向量回歸模型預測
在進行數據去噪之后,用支持向量回歸模型來對去噪后的數據T進行建模,來獲得原始數據X的預測結果■。
(一)數據描述
在模型仿真中,我們采用中國人民銀行(所有數據均來源于中國人民銀行網站:www.pbc.gov.cn)每日公布的人民幣兌美元匯率中間價的數據作為實證研究對象。因為中央政府在2005年年中由以往的固定匯率制度轉為實行以市場供求為基礎的、單一的、有管理的浮動匯率制,所以2005年前的數據不具備參考。綜合考慮,實驗選取2010年8月2日到2012年9月6日共512個數據用來作為研究對象。其中前462個數據作為訓練數據來訓練模型,后50個數據作為測試數據。
樣本數據的設定基于兩個原因。首先,相比于周度數據和月度數據,日度數據中包含的噪聲更多,數據特征更復雜。其次,訓練數據的長度應當為2n(n>0),以便于用來創造一個正交稀疏轉換矩陣。
(二)數據處理
匯率屬于一種時間序列,對于時間序列的預測需要對時間序列進行平穩性檢驗,對于非平穩序列無法進行更好的預測。對數據進行平穩性檢驗發現數據是非平穩序列,因此我們對其進行差分處理,具體處理如下:
Yt=100×(logyt-logyt-1) (式3.1)
其中{yt}為原始匯率序列,{Yt}為匯率自然對數一階差分序列。用支持向量回歸做完預測后,再通過下面的公式將預測的公式將其轉換為匯率形式:
■ (式3.2)
處理后的數據經檢驗為平穩序列,可以進行后續的步驟。
在進行支持向量回歸模型仿真的時候,采用直接預測策略。即給定一個時間序列xt,(t=1,2,..,T),向前預測第m步的值xt+m由如下式子計算所得:
■ (式3.3)
其中■t代表第t期的預測值,xt是第t期的實際值,l代表滯后階數。
(三)評價指標
對于最終預測出來的結果要進行評估,檢驗模型的效果的好壞,我們采取統計分析中常用的幾個評價指標。
(1)絕對偏差均值(MAD)
■ (式3.4)
(2)均方誤差估計(MSE)
■ (式3.5)
(3)方向性統計量Dstat
■ (式3.6)
at=1 如果(xt+1-xt)(■t+1-xt)≥0不然at=0
MAD、MSE越小,回歸決定系數越接近0,說明模型預測精確度越高。
四、實驗結果
在壓縮感知去噪步驟中,最重要的是選取合適的稀疏基做稀疏變換。我們采用離散余弦變換作為稀疏基,采樣數目設為200。為了研究壓縮感知去噪方法與其他去噪方法效果的不同,我們選取中值濾波、小波變換兩種常見的去噪方法作為對比。其中小波變換采用symlet6來構建小波基。在支持向量回歸算法的仿真中,采用網格參數尋優,確定合適的參數C=400,ε=0.05。
首先,通過壓縮感知去噪,能夠對數據中的噪聲進行減弱,同時相對其他傳統去噪方法來說,壓縮感知去噪可以保留更多的細節,而其他去噪方法去噪效果過于明顯,將部分的重要細節也一同抹去。如圖所示,可以看出壓縮感知去噪效果明顯。
(一)壓縮感知去噪的有效性
將去噪后的數據運用支持向量回歸進行樣本訓練,使用通過訓練得到的模型對驗證數據集即后50個數據進行驗證,發現該模型在驗證集上的表現還是不錯的。其中描點之后的趨勢代表預測結果。
除了單純的從該模型本身來看,我們將其與未去噪的模型的效果作對比,主要是從MAD、MSE和Dstat三個方面來做對比,發現經過壓縮感知去噪過程的預測還是改進明顯的。
通過圖3可以得出結論:壓縮感知去噪預測模型提高了預測結果的精確度。從MAD和MSE的角度來看,兩種模型的值都比較小,而且經過壓縮感知去噪的預測模型的MAD與MSE相比未去噪模型更小;從Dstat的角度來看,經過壓縮感知去噪的模型的Dstat更高,而且達到了0.6以上,說明預測的方向性更好。
(二)壓縮感知去噪的優勢
通過上面的程序仿真模擬,可以發現在針對匯率預測問題時,通過壓縮感知去噪確實可以提高模型的預測能力。結合傳統的去噪方法,壓縮感知去噪具備比其他去噪方法更好的效果。對同樣的數據分別運用不同方法進行去噪再進行預測,目前來說壓縮感知去噪方法使得后續的預測能力更加優越。
從表1可以看出未去噪的預測模型的MAD最大,壓縮感知去噪預測模型的MAD最小,并且其他兩種去噪模型的MAD均比未去噪模型要小,說明對數據預先去噪確實提高了預測能力;相比其他幾種去噪模型來看,壓縮感知去噪模型擁有更好的效果。此外由圖中可以看出針對方向性統計量,壓縮感知去噪預測模型的Dstat最大,未去噪模型的Dstat最小,說明經過壓縮感知去噪的預測方向性更好,進而說明其預測效果更好;同時與其他兩種去噪手段相比較而言,壓縮感知去噪的預測模型預測的準確度更高。
(三)穩定性分析
為了避免選取的訓練數據的特殊性,特地選取2013年3月1日到2015年4月10日共512個數據做同樣的模型仿真,以便測試壓縮感知模型的穩定性,證明與選取的訓練集無關。
由圖6我們可以看出對兩組不同時間的數據,通過壓縮感知去噪的支持向量回歸模型MAD、MSE都比其他三種模型更小,Dstat都比其他三種模型要大。在不同的數據樣本下,最終得到的結果相符,一定程度上證明了基于壓縮感知去噪的支持向量回歸模型的穩定性。
五、結論
考慮到國際匯率的多變性、復雜性及包含的高噪聲情況,提出基于壓縮感知去噪的支持向量回歸的預測模型。選取人民幣兌美元匯率作為研究對象,先對原始數據進行壓縮感知去噪,然后對去噪后的數據進行訓練預測。通過進行模型仿真、數據分析可以得出結論。
在針對匯率預測問題上時通過壓縮感知去噪再進行預測的方法是可行的,并且去噪后預測效果變得更好;與其他傳統去噪方法比較來看,壓縮感知去噪方法在匯率預測領域更加出色。此外,穩定性分析說明該方法的普適性。
通過以上研究,今后我們可以將該方法推廣到其他時間序列的預測上來。對于壓縮感知去噪理論,選取合適的稀疏基是下一步工作的重點;對于預測模型來說,可以將線性模型與人工智能模型相結合進行更準確的預測。
參考文獻
[1]Liu L,Wang W.Exchange Rates Forecasting with Least Squares Support Vector Machine[C].International Conference on Computer Science and Software Engineering.IEEE,2008:1017-1019.
[2]Sermpinis G,Stasinakis C,Theofilatos K,et al.Modeling,forecasting and trading the EUR exchange rates with hybrid rolling genetic algorithms—Support vectorregression forecast combinations[J].European Journal of Operational Research,2015,247(3):831-846.
[3]He K,Lai K K,Yen J.A hybrid slantlet denoising least squares support vector regression model for exchange rate prediction[J].Procedia Computer Science,2010,1(1):2397-2405.
[4]Faria E L D,Albuquerque M P,Gonzalez J L,et al.Predicting the Brazilian stock market through neural networks and adaptive exponential smoothing methods[J].Expert Systems with Applications,2009,36(10):12506-12509.
[5]Sang Y F.Improved Wavelet Modeling Framework for Hydrologic Time Series Forecasting[J].Water Resources Management,2013,27(8):2807-2821.
[6]Xin Z,Ming G U.Complicated financial data time series forecasting analysis based on least square support vector machine[J].Qinghua Daxue Xuebao/journal of Tsinghua University,2008,48(7):1147-1149.
[7]Zhu L,Zhu Y,Mao H,et al.A New Method for Sparse Signal Denoising Based on Compressed Sensing[C].International Symposium on Knowledge Acquisition and Modeling.IEEE Computer Society,2009:35-38.
[8]Yu L,Zhao Y,Tang L.A compressed sensing based AI learning paradigm for crude oil price forecasting[J].Energy Economics,2014,46(C):236-245.
作者簡介:孟建釗(1992-),男,山東鄒城人,華南理工大學數學學院碩士研究生在讀,研究方向:數據挖掘與機器學習。