崔金鑫,鄒輝文
(1.福州大學經濟與管理學院,福建 福州 350116; 2.福州大學投資與風險管理研究所,福建 福州 350116)
隨著中國互聯網金融行業的持續發展,互聯網金融市場的規范性和有效性正在逐步地提升.P2P(peer to peer lending)網貸市場作為中國互聯網金融市場的重要組成部分,其高效穩定運行對于整個互聯網金融市場的運轉起到至關重要的作用,同時也已成為金融市場的新業態和學術研究中最受關注的前沿性領域之一[1].截止2019 年8 月底,中國P2P 貸款余額已經達到了6 094.88 億元,正常運營的平臺數量為658 家,累計問題平臺數量高達7 458 家1數據來源于第一網貸——中國P2P 網貸行業概況:http://www.p2p001.com/.可以看出,近些年P2P 網貸市場發展十分迅猛,同時大量問題也隨之產生.為了加強中國P2P 網貸市場的規范性,政府及監管部門相繼出臺了一系列監管法案,尤其是近期《關于加強P2P 網貸領域征信體系建設的通知》的發布,使得P2P 網貸領域借款人失信懲戒力度得到進一步增強,對于中國P2P 網貸行業的長期健康穩定發展具有相當深遠的意義.已有的關于P2P 網貸市場的研究多集中于探討“羊群效應”[2]、“經營效率差異”[3]、“監管制度”[4]、“違約預測”[5]、“風險溢出效應”[6]、“信用風險評估”[7]和“網絡借貸拍賣機制”[8]等方面的問題,目前還鮮有文獻對P2P 網貸市場的收益率預測問題展開研究.然而,P2P 網貸市場收益率反映了P2P 網貸市場的整體運行狀況,對其作出精準的預測不僅可以為P2P 網貸市場參與者和監管當局提供有力的決策參考,還可以為P2P 網貸市場風險預警模型的構建奠定前期基礎.因此,對P2P 網貸市場收益率的預測問題展開研究就顯得尤為緊迫和必要.
P2P 網貸市場收益率的預測問題本質上仍然屬于金融市場收益率預測范疇,鑒于目前鮮有單獨針對P2P 網貸市場收益率預測的研究,因此可以借鑒已有的金融市場收益率預測方法.綜合已有的文獻,金融市場收益率序列預測模型主要包括兩類:經典的金融計量模型和新興的機器學習預測模型.相關學者已經基于經典的金融計量模型對金融市場收益率預測問題展開了研究,例如,郭存芝[9]引入了馬爾科夫過程模型預測中國股市的收益率并取得良好的預測效果; 張銀雪等[10]基于ARMA(autoregressive moving average)和GARCH(generalized autoregressive conditional heteroskedasticity)模型對滬深300 指數收益率序列進行了擬合和預測,研究表明ARMA 模型的長期預測效果較好而GARCH 模型的短期預測效果較優; 姜富偉等[11]通過研究發現傳統的經濟變量可以用來預測中國股票市場的收益率.除了傳統的經濟變量以外,Bail 等[12]、Galsband[13]和Huang 等[14]研究發現股票收益的尾部風險對于收益率同樣具備一定的預測能力.同樣的,陳堅[15]通過研究表明基于極值理論的VaR(value at risk)模型相較于Copula-VaR 模型對中國股票市場未來收益率具有更強的預測性能.在此之后,楊婉茜等[16]又基于貝葉斯向量自回歸模型對中國國債收益率展開了預測研究.然而,金融市場收益率序列并不具備線性特征,且不服從正態分布,已有的金融計量收益率預測模型難以獲得較高的預測精度.因此,伴隨著計算機系統科學和人工智能前沿技術的發展,大量的學者開始基于新興的機器學習智能預測模型對金融市場收益率展開預測研究,例如,Qiu 等[17]基于人工神經網絡(artificial neural network,ANN)對日經225 指數收益率展開預測研究;Fu 等[18]、Peng 等[19]基于支持向量機(support vector regression,SVR)模型對股市收益率進行預測; Nilmet 等[20]實證對比了極限學習機(extreme learning machine,ELM)模型和ARMA 以及ARMA-GARCH 模型在匯率收益率預測中的性能,發現ELM模型預測性能最佳; Melek 等[21]基于自適應神經模糊推理系統(adaptive network-based fuzzy inference system,ANFIS)對伊斯坦布爾股票市場收益率序列展開預測并取得了良好效果;Zhao 等[22]采用小波神經網絡(wavelet neural network,WNN) 對上海股票市場收益率進行預測,發現WNN模型預測效果優于BPNN(back propagation neural network)模型; 于志軍等[23]基于灰色神經網絡模型(grey neural network,GNN)并引入EGARCH(exponential generalized autoregressive conditional heteroskedasticity)誤差校正方法對中國股市收益率展開預測研究.其中在ELM 極限學習機模型的訓練過程中,并不需要調整輸入層和隱含層間的連接權值以及隱含層神經元的閾值,只需要對隱含層神經元的個數進行設定.因此,ELM 模型的訓練過程高效快捷,且預測性能較優,已經被廣泛應用于風速預測[24]、風電功率預測[25]、空氣質量指數預測[26]、原油價格預測[27]等領域.基于此,本文將ELM 極限學習機模型作為基準預測模型對P2P 網貸市場收益率進行預測,并采用粒子群優化算法[28](particle swarm optimization,PSO)對ELM 模型的參數進行尋優操作,以期提升ELM 模型的預測性能.
隨著金融時間序列預測研究的不斷深入,學者們發現單一機器學習模型的預測性能還有較大的提升空間,一種結合數據分解技術和機器學習算法的組合預測模型由于其簡單明晰的建模思路以及優越的預測性能開始受到大量學者的青睞,例如:Cheng 等[29]將經驗模態分解算法(empirical mode decomposition,EMD)與SVR相結合進而構造EMD-SVR 模型對股票市場展開預測研究,并發現該模型顯著優于單一預測模型,與之類似的還有EMD-ELM 模型[30]、EMD-BPNN模型[31]和EMD-ANFIS 模型[32].然而,EMD 算法容易導致模態混疊,因而Wu 等[33]提出了一種集合經驗模態分解算法(ensemble empirical mode decomposition,EEMD),它的關鍵步驟是把高斯白噪聲加入原始序列中進行多次經驗模態分解,最后再將多次分解的本征模態函數(intrinsic mode function,IMF) 總體平均定義為最終的IMF.然而,在一定次數實驗的集成平均后,所得到的重構分量中依然包含著一定幅值的殘留噪聲.在集合經驗模態分解算法的已有基礎上,Torres 等[34]提出了一種帶有自適應白噪聲的完全集成經驗模態分解方法(complementary ensemble empirical mode decomposition with adaptive noise,CEEMDAN),該方法在分解過程的每一個階段均添加自適應的白噪聲,通過算出單一的余量信號從而得到各個模態分量[35].遺憾的是,無論是EEMD 還是CEEMDAN 算法,它們均是基于EMD 算法改進得來,缺乏嚴格的理論支撐及證明,且計算效率較低.基于此,Gilles[36]提出了一種基于小波分析理論架構的新型自適應信號處理方法:經驗小波分解算法(empirical wavelet transform,EWT),其具有計算量小且魯棒性強等優點,在風電功率及風速預測領域已經取得了顯著的研究成果[37-40].然而,目前還未曾發現EWT 方法在收益率預測領域的應用研究.EWT 算法在預測領域相較于以往的分解算法是否具有優越性值得探討,因而本文采用EWT 分解算法對P2P網貸市場原始收益率綜指序列進行分解處理.
綜合已有的文獻可以看出,組合預測模型大多遵循“分解”、“重構”、“預測”和“集成”的基本建模架構,本文的P2P 網貸市場收益率預測模型總體上同樣遵循該建模流程.然而,現實中高頻重構分量的預測效果往往不及中頻和低頻重構分量,因而需要對高頻分量再次進行分解,也即“兩階段分解”.Mi 等[41]和Kim等[42]的研究也已證明了該種方法的有效性,因此本文也將“兩階段分解”方法引入預測模型的構建流程.在具體的分解算法選取上,奇異譜分析方法(singular spectrum analysis,SSA)具有較強的降噪能力和較優的魯棒性,且也已被應用于預測研究[41,43,44].然而,SSA 降噪算法目前多被應用于理工科領域而較少被應用于人文社科領域.基于此,本文將SSA 降噪算法引進預測模型的構建流程,利用其對高頻重構分量進行降噪,以期進一步提升高頻分量的預測效果.
基于以上認識,將EWT 分解算法、SSA 降噪算法和PSO-ELM 預測模型相結合,構建了一種P2P 網貸市場收益率預測模型,即EWT-SSA-PSO-ELM 預測模型.本文的特色及創新點主要包括以下幾點:第一,對P2P 網貸市場收益率進行精準預測,對于P2P 網貸市場投資及風險管理策略的構建均具備一定的現實意義.然而,目前鮮有文獻探討該問題,本文則對此展開深入研究,以期進一步豐富P2P 網貸市場的研究視角;第二,已有的收益率預測模型在分解算法、預測算法等方面均存在不足,本文首次將EWT 和SSA 分解算法引入收益率預測領域,并將其與PSO-ELM 模型相結合,構建了EWT-SSA-PSO-ELM 預測模型,以期提升P2P 網貸市場收益率的預測精度;第三,在模型的預測效果對比部分,本文不僅給出了各個預測模型的損失函數計算數值,還進一步對預測結果進行了MCS(model confidence set)檢驗和DM(diebold-mariano)檢驗,以期更加科學穩健地體現本文所構建的預測模型性能的優越性.
EWT 分解算法是由Gilles[36]提出的一種新型自適應信號處理方法,其通過對信號頻譜進行自適應的分割,基于每一個頻譜構建適當的正交小波濾波器,進而提取Fourier 頻譜的調頻和調幅成分,然后再利用Hilbert變換處理不同的調頻和調幅模態,進而得到瞬時頻率和瞬時幅值[36,38].從傅里葉變換(Fourier transform)的角度來看,這種構造方法類似于構建了一組帶通濾波器[37].
EWT 算法的理論架構如下[36-38]:首先,將Fourier 支撐定義為[0,π],假設其被分割為N個連續的成分,各個分割片段的邊界可以被表示為Λn=[ωn-1,ωn],進而可以有在分割區間Λn上,經驗小波被定義為每個Λn上的帶通濾波器.經驗小波構造方法可參照Meyer 小波,Gilles[36]構造的經驗小波函數為

經驗尺度函數可表示為


奇異譜分析法是由Broomhead 等[45]提出的一種廣義功率譜分析方法,首先根據時間序列的周期特征以及所處的時間區間,構造出相應的軌跡矩陣,然后再對其進行分解和重構,進而提取出能夠表征原時間序列的多組分解量.SSA 算法主要包含四個步驟:嵌入、奇異值分解(singular value decomposition,SVD)、分組以及對角平均.前兩個步驟屬于數據分解,后兩個步驟屬于重構,SSA 算法流程如下[41]:
步驟1先將原始P2P 網貸市場收益率綜指序列的高頻重構分量轉換成軌跡矩陣Y=(Y1,Y2,...,YL),該矩陣中的每一個元素被定義為因而矩陣Y可表示為

步驟2SVD 奇異值分解,矩陣Y可以被分解成d個分量,d=rank(Y).Y可以被進一步表示為Y=Y1+Y2+Y3+···+Yd,其中.
步驟3將d個分量中的前m個分量重構為趨勢分量,也即降噪序列,定義I={I1,I2,...,Im},YI=YI1+YI2+···+YIm即為降噪序列,剩余的(d-m)個分量則構成噪聲序列.
步驟4對角平均,通過Hankelization 流程,{YI1,YI2,...,YIm}就可以被轉換成時間序列

此時原始的P2P 網貸市場收益率綜指序列的高頻重構分量就可以被重新表示為

極限學習機是由Huang 等[26]提出的一種特殊類型的單隱含層前饋神經網絡.隨機初始化其輸入權值和偏置并得到對應的輸入權重,在ELM 模型的整個訓練過程中并不需要對模型的各個參數進行調整,只需要對模型隱含層神經元的個數進行設置,最終就可以獲得唯一的最優解[45].具有簡潔高效,無需調參,訓練學習速度較快等優點,其基本網絡結構如圖1 所示.

圖1 極限學習機基本結構Fig.1 The basic structure of extreme learning machine
極限學習機模型的理論架構如下[26]:ELM 模型包括輸入層、隱含層和輸出層,其中輸入層的n個神經元分別與n個輸入變量相對應,隱含層有l個神經元,輸出層的m個神經元分別與m個輸出變量相對應.設隱含層神經元的激活函數為g(x),則ELM 極限學習機的輸出為

其中ωi=[ωi1,ωi2,...,ωin],xj=[x1j,x2j,...,xnj]T,ωi代表輸入層神經元與隱含層神經元之間的連接權值,bi表示第i個神經元的偏差也即隱含層閾值.式(8)也可以表示為Hβ=TT,其中H代表神經網絡隱含層的輸出矩陣,H的具體形式可以表示為

本文采用PSO 算法對ELM 模型輸入層與隱含層連接權值以及隱含層閾值進行參數尋優:第一步,初始化PSO 算法的粒子群,包括學習速率、慣性權重、種族規模及迭代次數;第二步,計算初始化種群的單個個體的均方根誤差,令粒子群適應度為訓練次數,di代表觀測值與平均值的差值.在同一次迭代過程中,首先比較Fi與pbest的大小,接著比較Fi與gbest的大小,其中pbest代表迭代過程中的個體極值,gbest則代表全局極值.然后,用大的一方替代小的一方,否則保持不變;第三步,一直迭代進行上述步驟,直到運行次數大于等于設置的迭代次數、適應度值小于等于規定的閾值3 個條件中之一,此時算法流程停止,并且返回當前最優的個體和適應度;第四步,利用最優的ωi和bi計算輸出權值矩陣H.
文章所提出的EWT-SSA-PSO-ELM 預測模型的機理闡述如下:
遵循已有的“分解”、“重構”、“預測”和“集成”的智能預測模型經典建模架構,P2P 網貸市場收益率預測模型主要由兩大模塊構成:兩階段分解流程和分量預測重構流程.第一部分的兩階段分解過程包括基于EWT 經驗小波分解算法對原始收益率綜指序列進行分解和基于SSA 奇異譜分析算法對高頻重構分量進行降噪處理,目的是為了降低原始收益率綜指序列和高頻重構分量的非線性以及非平穩性特征,從而提升它們的預測效果.第二部分是基于粒子群優化的極限學習機模型對高頻重構分量的噪聲序列和降噪序列、中頻和低頻重構分量進行預測.其中本文選取的Lempel-Ziv 復雜度算法是為了保證分量重構過程的科學性,PSO 參數優化算法是為了提升ELM 模型的預測性能,PACF 偏自相關函數是為了增強預測模型輸入變量選取的合理性.最終,線性疊加集成各個分量預測結果即可得到最終的收益率預測結果.
本文預測模型的具體建模步驟闡述如下:
步驟1數據分解階段,采用魯棒性更高的EWT 經驗小波分解算法對原始的P2P 網貸市場收益率綜指序列進行分解,進而得到若干個具有不同經驗尺度的經驗模式分量.
步驟2分量重構階段,為了降低復雜度以提升建模效率,計算各個經驗模式分量的Lempel-Ziv 復雜度指數2Lempel-Ziv 復雜度指數由Lempel 和Ziv 提出,用于衡量序列復雜性,詳見:https://ieeexplore.ieee.org/document/1055501..參照Zhu 等[46]的研究,以80%為臨界值,按頻率的高低排列,當前N個經驗模式分量的復雜度之和超過所有經驗模式分量復雜度之和的80%時,則前N個經驗模式分量構成高頻分量,復雜度最低的經驗模式分量構成低頻分量,中間部分的經驗模式分量則構成中頻分量.
步驟3高頻分量降噪階段,為了進一步提升高頻重構分量的預測效果,采用SSA 奇異譜分析算法對高頻重構分量進行降噪[41],進而得到高頻重構分量的降噪序列以及噪聲序列.
步驟4分量預測階段,基于ELM 極限學習機預測模型對降噪序列、噪聲序列、中頻分量和低頻分量分別進行預測,并采用PSO 粒子群算法對ELM 模型的參數進行尋優,基于各個預測分量自身的偏自相關函數(partial autocorrelation function,PACF)來選取模型的輸入變量.
步驟5預測結果集成階段,將降噪序列及噪聲序列的預測結果相加即可得到高頻重構分量的預測結果,然后再將高頻重構分量、中頻重構分量和低頻重構分量的預測結果加總集成即可得到最終的P2P 網貸市場收益率綜指預測結果.
本文選取P2P 網貸市場收益率作為研究對象,中國P2P 網貸理財收益率綜指3中國P2P 網貸理財收益率綜指數據詳見:https://www.p2p001.com/licai/shownews/id/1209.html是由第一網貸4第一網貸(www.p2p001.com),隸屬于錢誠,現由深圳市錢誠互聯網金融研究院運維,為互聯網金融門戶網站,為P2P 網貸行業的參與者提供行業資訊和行業大數據.基于所有運營的P2P 網貸平臺的收益率數據綜合編制而成,可以較為客觀地反映P2P 網貸市場整體的收益情況.因此,本文將其作為P2P 網貸市場收益率的代理量,基于Python 軟件編寫爬蟲代碼,爬取2016–05–15~2019–04–04,共1 000 個交易日的收益率綜指數據.參照文獻[46–48]中的設定,本文將總樣本的前80%(2016–05–15~2018–09–16,800 個交易日)作為預測模型的訓練集,將剩余的20%(2018–09–17~2019–04–04,200 個交易日)作為預測模型的測試集,用于檢驗模型的預測效果.本文的實證流程均基于MATLAB(2014a)編程軟件完成,運行平臺為WIN10 系統,英特爾酷睿i7 處理器,CPU 2.8 GHz,運行內存16 GB.
從表1 可以看出,收益率綜指序列整體上較離散,具有一定的序列波動性,J-B 統計量的值也證明了收益率綜指序列并不服從正態分布,這一點也符合金融時間序列的典型特征.

表1 P2P 網貸市場收益率綜指描述性統計Table 1 The descriptive statistics of P2P online lending market yield composite index
圖2 給出了P2P 網貸市場收益率綜指序列圖,可以看出收益率綜指序列總體上呈現出一種典型的不規律特征,震蕩頻率較高.

圖2 P2P 網貸市場收益率綜指序列圖Fig.2 The original P2P online lending market yield composite index series
為了檢驗收益率綜指序列的平穩性和線性特征,此處分別對其進行ADF(augmented Dickey-Fuller)檢驗和BDS(Brock-Decher-Scheikman)檢驗[46,49],檢驗結果如表2 和表3 所示.表2 中收益率綜指序列在顯著性水平1%,5%和10%下的臨界值均小于ADF 值,且p–值為0.190 4,因而收益率綜指序列呈現出非平穩特征.從BDS 檢驗結果也可看出,當嵌入維數從2 增加到10 時,p–值均為0,表明收益率綜指序列具有典型的非線性特征.

表2 P2P 網貸市場收益率綜指平穩性檢驗結果Table 2 P2P online lending market yield composite index stationarity test results

表3 P2P 網貸市場收益率綜指BDS 檢驗結果Table 3 P2P online lending market yield composite index BDS test results

續表3Table 3 Continues
由4.1 節的檢驗結果可知,P2P 網貸市場收益率綜指序列呈現出典型的波動性、非平穩和非線性等特征.為了進一步挖掘其隱含的內在特征,此處采用分解效率和魯棒性更優的EWT 經驗小波分解算法對原始的收益率綜指序列進行分解,進而可以得到8 個經驗模式分量,如圖3 所示,可以看出EWT 分解結果呈現出從低頻向高頻變化的特征.為了進一步提高預測建模效率,因此需要基于各個分量的Lempel-Ziv 復雜度數值對分量進行重構.收益率綜指序列分量重構結果見圖4.

圖3 收益率綜指序列EWT 分解結果Fig.3 EWT decomposition results of yield composite index series

圖4 收益率綜指序列分量重構結果Fig.4 Component reconstruction results of yield composite index series
Lempel-Ziv 復雜度指數反映的是序列內在特征復雜程度,序列的Lempel-Ziv 復雜度數值越大,表明該序列中的周期成分越少,變化越無規律,序列越趨向于一種隨機狀態,所包含的頻率成分越豐富;反之,數值越小,序列越有規律,周期性越強,所含頻率成分越少.從表4 的Lempel-Ziv 復雜度計算結果可以看出各個經驗模式分量的復雜度不盡相同,其中,經驗模式分量3~8 的復雜度之和占總復雜度之和的83.28%,超過臨界值80%.因此,經驗模式分量1構成低頻分量,經驗模式分量2 構成中頻分量,經驗模式分量3~8 構成高頻分量.
可以看出,低頻分量的波動非常平緩,代表了P2P 網貸市場收益率綜指序列的長期運行趨勢,一般不易受到市場及外部環境的沖擊;中頻分量波動特征相對平緩,代表重大事件對收益率綜指序列的沖擊影響,但最終會回歸長期趨勢線;高頻分量呈現出十分復雜的波動特征,代表了市場短期噪聲對P2P 網貸市場收益率的影響,但是方向不定,頻率較高,且持續的時間較短.Lempel-Ziv 復雜度計算結果見表4.

表4 Lempel-Ziv 復雜度計算結果Table 4 Lempel-Ziv complexity calculation results
通過分量重構流程,進而得到了高頻、中頻和低頻三個重構分量,然后基于PSO-ELM 模型對三個重構分量分別進行預測.在機器學習模型的訓練過程中,模型參數的設定和輸入變量的選取對模型的預測性能都起到至關重要的作用.在參考大量相關研究以后,本文的預測模型參數設定如下:PSO 參數尋優算法的初始種群大小為25,最大迭代次數為200,加速因子c1=c2=2.0,利用PSO 算法對機器學習模型進行參數尋優操作;ELM 模型的隱含節點設定為30,輸入層個數即為輸入變量的個數(根據具體的預測分量而定),隱含層節點輸出權值范圍為[-1,1],隱含層節點閾值取值范圍為[0,1].為了保證模型預測效果對比的公平性,本文中所有的PSO 算法均采用該種參數設定.另外,預測模型輸入變量的選取方法參照文獻[38,47,50]中的設定,基于偏自相關函數PACF 來選取各個分量所對應的輸入變量,選取結果如表5 所示.

表5 預測模型輸入變量選取結果Table 5 Input variables selection results
高頻、中頻和低頻分量的PSO-ELM 預測結果如圖5~圖7 所示.

圖5 高頻重構分量PSO-ELM 預測結果Fig.5 PSO-ELM prediction results of high-frequency component

圖6 中頻重構分量PSO-ELM 預測結果Fig.6 PSO-ELM prediction results of medium-frequency component

圖7 低頻重構分量PSO-ELM 預測結果Fig.7 PSO-ELM prediction results of low-frequency component
為了更加科學穩健地體現本文所構建的EWT-SSA-PSO-ELM 模型預測性能的優越性,選取了15個基準對比模型,包括單一預測模型ARIMA,PSO-SVR,PSO-ANFIS 和PSO-ELM 模型; 組合預測模型CEEMDAN-PSO-SVR,CEEMDAN-PSO-ANFIS,CEEMDAN-PSO-ELM 模型; SSA-PSO-SVR,SSA-PSOANFIS,SSA-PSO-ELM 模型; EWT-PSO-SVR,EWT-PSO-ANFIS,EWT-PSO-ELM 模型,EWT -SSA-PSOSVR,EWT-SSA-PSO-ANFIS 模型.采用均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對誤差百分比(MAPE)以及Theil 不等系數(TIC)作為各個模型預測效果的評價指標,并且對各個模型的預測結果進行MCS 模型置信集檢驗以及迪勃爾特–馬里亞諾(DM)檢驗.各個誤差函數計算公式為

其中T代表預測樣本數,Yt代表t時刻的網貸收益率綜指真實值,Pt代表t時刻網貸收益率綜指預測值.RMSE,MAE,MAPE 和TIC 的值越小表明模型的預測精度越高,預測性能越好.
可以明顯地看出,中頻和低頻分量的預測效果顯著優于高頻分量.為了提升高頻分量的預測效果,此處采用SSA 奇異譜分析算法對高頻分量進行降噪處理,從而得到高頻降噪序列及高頻噪聲序列,如圖8 所示.

圖8 高頻重構分量SSA 分解結果Fig.8 SSA decomposition results of high-frequency component
然后,再利用PSO-ELM 模型對其進行預測,最后加總集成高頻降噪序列、高頻噪聲序列、中頻以及低頻分量的預測結果即可得到最終的EWT-SSA-PSO-ELM 預測結果,如圖9 所示.

圖9 EWT-PSO-ELM 與EWT-SSA-PSO-ELM 預測結果Fig.9 EWT-PSO-ELM and EWT-SSA-PSO-ELM prediction results
MCS 檢驗是由Hansen 等[51]提出的衡量模型預測性能的一種方法,相較于SPA(superior predictive ability)更穩健.由于篇幅限制,MCS 檢驗的理論框架及流程詳見文獻[51,52].為了得到MCS 檢驗中的各統計量以及p–值,參照雷立坤等[53]的參數設定方法,將MCS 檢驗的各個參數設置為d=2(block length),模擬次數B=10 000 次作為Bootstrap 過程的控制參數,MCS 檢驗的顯著性水平α取值為0.1,也即p–值大于0.1 的模型將幸存下來.
DM 檢驗方法原假設是目標模型A 的預期預測精準性與基準模型B 的預測精準性一致,因此原假設為[48]

因此,DM 統計量為


表6 模型預測誤差對比表Table 6 Model prediction error comparison

表7 DM 檢驗結果Table 7 DM test results

表8 MCS 檢驗結果Table 8 MCS test results

續表8Table 8 Continues
對P2P 網貸市場收益率做出精準預測,不僅可以為P2P 網貸市場上的借貸雙方提供有力的決策參考,同時也可以為銀保監會對P2P 網貸市場進行審慎監督管理提供重要的考量依據.針對已有的收益率預測模型存在的不足,文章首次基于EWT 經驗小波分解算法、SSA 奇異譜分析算法和PSO-ELM 智能預測模型,構建了一種P2P 網貸市場收益率預測模型.研究表明,EWT 分解算法可以有效挖掘出原始序列的內在特征并降低分解誤差,在一定程度上優于CEEMDAN 分解算法;SSA 降噪算法可以有效剝離高頻重構分量的噪聲序列,進而提升高頻重構分量的預測效果;EWT-SSA-PSO-ELM 預測模型的性能優于其余基準對比模型.本文的研究成果一方面豐富了P2P 網貸市場的研究內容,另一方面也為金融市場收益率預測研究提供了一種新的視角和方法.除了收益率預測問題,P2P 網貸市場的風險特征同樣是業界和學術界關注的焦點之一,利用機器學習智能算法預測P2P 網貸市場的風險狀況并且構建出相應的風險規避策略將是下一步的重點研究方向.