999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PCA-BP組合模型的股價預測分析

2021-09-04 08:13:40于春蕾李夢悅尹偉石
關鍵詞:分析模型

于春蕾,李夢悅,尹偉石

(長春理工大學 理學院,長春 130022)

金融業快速發展的同時,股票作為重要的投資渠道引起廣泛關注,股票預測的研究也取得了顯著成果。然而,面對股票市場越來越復雜的非線性特征,投資者無法得到準確的預測結果[1-3],其原因在于,利用傳統算法構建的模型非線性映射能力較弱,且局限性很大,如灰色預測、時間序列等[4-6]。因此若想進一步在投資上規避風險,就必須在已有的理論成果基礎上,進行股票預測的技術研究,這就需要將已知算法的不同優勢結合起來,構建組合模型[7-10]。本文選擇主成分分析法[11]和 BP 神經網絡[12-15]來構建模型,主成分分析法在處理數據上具有優勢,在保證信息數據最少丟失的同時,消除數據的冗余信息;神經網絡則通過對股票歷史數據的學習,在神經元的權值中存儲股價變化的規律。通過運用訓練好的神經網絡來預測未來股價,可以較明顯地增強系統預測結果的可信度和精確度。然而,不是所有股票都有足夠的數據可供PCA-BP組合模型訓練,對此,本文還運用了數據擬合的算法來模擬不同數據量的預測效果。

1 模型原理

主成分分析可以用較少的計算量,達到選擇最佳變量子集的效果,其作為多變量分析方法被廣泛應用;BP神經網絡是一種模擬人腦神經網絡結構從而具有一定的預測功能的數學模型,可以充分逼近任意復雜的非線性關系,擁有較為強大的容錯能力。這兩個算法組成了基本的PCA-BP組合模型。

1.1 主成分分析

主成分分析,是考察多個變量間相關性的一種多元統計方法,旨在通過少數幾個主成分來揭示多個變量間的內部結構。其中,每個主成分都是原始變量的線性組合,且互不相關。由此,這些主成分能夠反映原始變量的絕大部分互不重疊的信息,引進多方面的指標的同時,又將其中復雜的因素歸結為幾個主成分,使得復雜問題得以簡化,并得到更為科學、精準的信息。具體算法步驟如下:

(1)選定估計樣本數,選取指標,構建原始數據矩陣。

(2)為消除量綱、正逆指標的影響,進行原始數據矩陣的標準化處理,得到標準化矩陣。

(3)根據標準化矩陣計算協方差矩陣,以此來反映標準化后數據之間的相關關系及密切程度。

(4)根據相關系數矩陣計算出特征根及對應的特征向量。

(5)得到確定后的多個主成分,同時計算各主成分得分。

1.2 BP神經網絡

BP神經網絡是一種按誤差反向傳播算法訓練的多層前饋神經網絡,其結構分為三層:輸入層、輸出層、隱含層。兩層之間通過網絡權值連接神經元,且中間層和輸出層上的神經元通過加上閥值的形式對前一層神經元傳遞過來的信息進行整合。神經元之間的學習向誤差減小的方向傳遞,進一步修正各自的權值。

反向傳播算法是若干個算法的集合,其過程是:

(1)前向逐層計算直到輸出,計算出模型的預測值。

(2)通過損失函數計算預測值與真實值之間的偏離程度。應用到的均方差損失函數公式可表示如下:

陳靜(2004)對中國大學生的文化認同狀況進行了調查。調查表明,中國涉外大學生對西方文化持開放心態,并對西方文化認同度較高,然而即便如此,他們仍然認為中國文化是“根”,還是認同中國文化[9]。但是他們也存在一些問題,如對西方文化的了解不夠客觀,對民族文化了解不夠深刻等。劉圣明(2007)在高職英語專業學生中發現了“生產性”取向[10]。楊梅(2011)對大一新生的調查表明,生產性變化在極少部分好學生中偶有表現[11]。劉瓊、彭艷(2006)提倡將“生產性”學習作為外語教學的目的[12]。

(3)使用梯度下降算法更新最后一層的參數,然后再一層一層往前更新前面幾層的參數,直到所有的參數都被更新。迭代公式如下:

其中,通過前向傳遞時候計算得出,再利用殘差逐層更新參數。

1.3 數據擬合

數據擬合,即曲線擬合,是一種把現有數據透過數學方法來代入一條數式的表示方式,其擬合的曲線能大致模擬數據的基本趨勢,一般采用最小二乘法來確定數據的系數,公式如下:

最小二乘法通過最小化誤差的平方和,為數據匹配最佳函數,在未知數據的求解,以及優化問題的求解方面有著顯著效果。

2 模型建立

為驗證模型對不同行業股票預測的適用范圍,模型選取了不同行業的五只個股:東方財富、中信證券、建設銀行、京東方A以及龍津藥業進行股價預測。

經網易財經網站下載得到各股2019年1月2日至2019年12月31日期間244個交易日的開盤價、最高價、最低價、收盤價、前收盤、漲跌額、漲跌幅、成交量、成交金額、換手率、總市值這些股票變量。在這些變量中,收盤價作為預測數據,其他10項作為影響收盤價變化的因子(與收盤價非線性相關),這些均作為歷史數據供模型使用。

2.1 PCA-BP組合模型

圖1 PCA-BP組合模型流程圖

依據圖1流程圖建立PCA-BP組合模型,首先進行指標選取:由于影響收盤價變化的因子不可避免會出現信息的重疊,對此,需要對這些因子進行相關性分析,了解各因子的信息重疊程度。以東方財富為例,選取SPSS統計分析軟件,對2019年的這10種影響因子(個案數為244)進行皮爾遜相關性分析,得到相關性分析結果,如表1所示。

表1 相關系數矩陣

表中,漲跌額與漲跌幅相關系數高達0.986;換手率與成交量、換手率與成交金額、成交量與成交金額這三組相關系數分別達到了0.977,0.987,0.973。在保留原有價格信息的基礎上,需剔除漲跌額、成交量及成交額這三個關聯程度大的因子。余下7個因子之間仍有部分相關系數大于0.8,有必要對這些因子做主成分分析。

將這7個因子作為指標,以月為分析周期,根據主成分分析算法,應用東方財富2019年12月的22個交易日的數據樣本,計算指標累積方差貢獻率,結果如表2所示。

表2 累積貢獻率

通過上表可發現兩個成分的累積貢獻率已達到了96.174%,可選擇兩個主成分作提取,提取的主成分如表3所示。

表3 成分矩陣

由表3中的數據可得到這兩個主成分的得分,將其作為BP神經網絡模型的輸入向量,將收盤價預測值作輸出向量,構建三層BP神經網絡模型。首先設定初始參數,并對輸入數據進行訓練,之后調整相關參數,多次反復訓練,不斷更正模型結構。通過對長期數據的回測,選擇預測值最接近于實際值的參數,最終形成優化的PCA-BP組合模型。

2.2 數據擬合

引入數據擬合的過程可以概括為兩步。第一步,目標是通過數據擬合來完成各項指標的預測。其中,擬合步驟為:首先選擇Matlab軟件中的polyfit函數對指標數據進行曲線擬合,得到擬合數據的系數列表。然后選取ployval函數用來帶入自變量的值,并根據數據系數列表,計算數據的值。最后繪制出數據點1至8次擬合的效果圖,同時加以比較,選擇擬合效果最好的次數,其值即是各項指標的預測值。

第二步,則是將預測到的各項指標輸入到訓練好的PCA-BP組合模型中,最終得到要預測的某日的收盤價

3 預測結果及分析

依據模型建立過程,研究結果分兩個階段:第一階段是基于PCA-BP組合模型的回測,進行模型精確度的研究;第二階段是根據不同時段預測未來某天的收盤價,作實證分析。

3.1 仿真回測

根據下載得到的五只股的2019年數據,以月為分析周期,分別得到每個月的兩個主成分得分,并將其輸入到訓練好的BP神經網絡模型,輸出得到了各股2019年各月的走勢結果。以東方財富為例,將2019年12月2日至6日的模型局部放大回測結果繪制,如圖2所示。

圖2 東方財富局部回測結果

通過圖2可以看到,預測值和實際值之間僅有微小的差距,為進一步驗證模型的預測效果,現計算預測值與真實值間的平均相對誤差,并與未經過PCA處理的BP神經網絡模型比較,結果如表4所示。

表4 模型對比結果

依據表4數據,可證實主成分分析法與BP神經網絡組合模型回測時具有非常高的精確度,且在穩定程度上也高于BP神經網絡。然而在實際運用中,PCA-BP組合模型在面對較少的數據量時并沒有達到很好的效果,因此下一步需對引入數據擬合算法的模型作實證分析。

3.2 實證分析

分別利用前一周和前一月的數據預測2020年1月2日的的收盤價。首先將這兩組數據通過數據擬合的方式分別預測得到當日的最高價、最低價、開盤價、前收盤、漲跌幅、換手率、總市值,并計算各自主成分得分,通過訓練好的BP神經網絡模型,預測得到1月2日收盤價的不同預測結果,如表5所示。

表5 周預測月預測對比結果

由表5數據可以得到,京東方A和建設銀行的月預測偏差略大,其他股票預測效果良好。根據此次實驗數據,計算得到這五個股的平均相對誤差結果,對比周預測與月預測的預測結果,周預測有著更為精準的預測值。分析誤差可得,股價在長時間波動較大的情況下,短時間預測得到的結果與近期的股價相關聯,不會被之前的大幅度波動干擾,相對結果更為準確。其他三只股長期收盤價穩定,長時間的預測,較多數據使模型的訓練結果更加精確,從而更小的縮減偏差。借鑒股票的歷史數據變化,能更充分的發揮模型的作用。

4 結論

運用PCA-BP組合模型在大量數據的預測上,得到了與實際值非常接近的預測值,同時,由于數據擬合算法的選取,模型在短時間段的預測上有很大優勢。整個股票預測階段中,研究出與每個階段都適合的新型方法與技術來建立模型是主要目標,尋找新型的算法,勢必經歷經驗的積累以及思維上的創新,與之相伴的是模型建立和優化時面對不足不斷改善的堅持。當今金融行業飛速發展,投資業興起,股票市場將會愈加復雜多變,為符合當代發展的需要,模型精確度仍需加強,模型復雜度仍需降低,在不同環境下的泛化能力仍需提高,所以,在未來還需要注入更大精力去挖掘神經網絡技術在股價預測上的潛力。

猜你喜歡
分析模型
一半模型
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 欧美无遮挡国产欧美另类| 久久国产毛片| 国产精品久久久免费视频| 亚洲综合狠狠| 国产精品30p| 欧洲欧美人成免费全部视频| 欧美专区日韩专区| 99999久久久久久亚洲| 亚洲婷婷在线视频| 99在线观看视频免费| 亚洲首页国产精品丝袜| 91香蕉视频下载网站| 亚洲精品日产AⅤ| 亚洲第一视频网| 91精品国产无线乱码在线| 午夜精品国产自在| 成人在线不卡| 欧美日本在线| 亚洲成人黄色在线| 中文字幕永久在线观看| 免费午夜无码18禁无码影院| 国产精品xxx| 国产精品尤物在线| 久久久久亚洲AV成人网站软件| 国产最爽的乱婬视频国语对白| 青青草国产一区二区三区| 欧美成人影院亚洲综合图| 婷婷开心中文字幕| 久久久久久国产精品mv| 少妇极品熟妇人妻专区视频| 强奷白丝美女在线观看| 在线播放91| 国产精品不卡永久免费| 无码专区在线观看| 精品一区二区无码av| 一区二区三区毛片无码| 好吊色妇女免费视频免费| 亚洲aⅴ天堂| h视频在线播放| 亚洲欧美极品| 久久不卡精品| 青青草国产精品久久久久| 中文字幕亚洲精品2页| 成年片色大黄全免费网站久久| 国产精品浪潮Av| 日韩福利在线视频| 特级做a爰片毛片免费69| 国产精品一线天| 精品久久777| 国产精品思思热在线| 久久精品中文字幕免费| 999精品视频在线| 欧美日韩亚洲国产主播第一区| 久久久久国产精品熟女影院| 欧美日韩第二页| 青草娱乐极品免费视频| 亚洲 成人国产| 久久精品无码国产一区二区三区| 无码久看视频| 国产不卡在线看| 精品免费在线视频| 国产精品30p| 久久久久无码精品| 欧美国产三级| 国产91麻豆免费观看| 操操操综合网| 99久久国产综合精品女同| 精品人妻AV区| 欧美日韩一区二区在线播放| 精品国产网| 欧美第一页在线| 成人精品视频一区二区在线| 国产经典三级在线| 国产在线一区二区视频| 亚洲精品爱草草视频在线| 激情在线网| 免费人成黄页在线观看国产| аv天堂最新中文在线| 日韩精品高清自在线| 青草国产在线视频| 国产午夜人做人免费视频中文| 日本黄网在线观看|