999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LSTM神經網絡模型的股票價格變化預測研究
——以百度股價為例

2022-08-18 02:34:08席小雅秦荷斌魯志娟
全國流通經濟 2022年16期
關鍵詞:特征模型

席小雅 秦荷斌 魯志娟

(西安歐亞學院,陜西 西安 710065)

由于市場經濟的日益蓬勃發展,金融服務機制系統也越來越完善,使得人民群眾普遍地投入到了金融市場投資當中,人民對金融信息的需求水平也日益增高。伴隨著現代經濟社會信息化和互聯網的現代化發展,計算機等技術系統也日益完備,為解決人民群眾的金融信息需求問題提供了非常強大的技術物質基礎和使用工具。

Shinkaiouchi等(2016)采用貝葉斯估計和神經網絡開展股市預測,實驗比較了二種方式的預測效果,結果表明,神經網絡方法獲得了更好的預測效果。Pano-Azucena等(2018)在分析股票的大盤數據中引入了神經網路模型,并將趨勢、模式、波動性等參數導入模型中,實測結果顯示神經網路模型的預計有效性明顯高于其他預測模式。黃超斌等(2021)利用多模型對股票價格進行預測,將BP神經網絡模型、LSTM、CNN、RNN、GRU網絡模型的預測結果進行對比,損失函數MAE、MSE、MAPE的值均小于其他模型,認為LSTM模型的預測效果較好。黃麗明等(2019)實現了一種多路循環的神經網絡與深度學習的股票預測方法。比較LSTM神經網絡、CNN神經網絡以及SMF神經循環網絡的優劣后,分別預測只有價格特征,價格特征和當天新聞標題特征組合,價格特征和當天文檔數量特征組合,價格特征、當天新聞標題特征及天文檔數量特征組合,共4種情況的準確率。認為價格特征、當天新聞標題特征及天文檔數量特征組合的平均表現最優。張曉春等(2020)用邏輯回歸及LSTM神經網絡模型兩種方法對股價數據進行了預測,邏輯回歸部分作者嘗試不同的回看天數,根據前10天、15天、30天、50天、100天、150天、200天及230天作為回看數據進行實驗,發現均在3天處求得最小MSE,因此選用3天作為回看數據代入邏輯回歸,求得MSE為0.97。LSTM部分作者將數據前40%、20%數據作為訓練集和驗證集,通過不斷的模型調整與優化,確定模型參數值后求得LSTM的MSE值為0.00087,認為LSTM神經網絡模型是一種比較好的選擇。

鑒于股價數據關聯性強,數據復雜度高,信息難以挖掘的特點,并結合文獻研究認為LSTM神經網絡模型能夠較好地適用于股價預測的問題上,因此本文選擇LSTM模型分別從單特征和多特征兩個角度實現股價的預測。

一、模型介紹

1.人工神經網絡

人工神經網絡(Artificial Neural Networks,ANNS),也被叫做神經網絡(NNS),它是根據了人腦的生理學研究,使用了仿真生物神經網絡,以此來獲得對信息處理的功能的數學模型。人工神經網絡已經被證明適用于處理復雜的數據結構,其核心成分是人工神經元,每個神經元接收來自其他幾個神經元的輸入,將它們乘以分配的權重,將它們相加,然后將總和傳遞給一個或多個神經元。1943年由科學家McCulloch和Pitts提出了最為經典的MP神經元模型,將神經元的整個工作過程抽象后如圖1所示。

圖1 神經元結構圖

圖中xi(i=1,2,3,…,n)為輸入的數據,wi(i=1,2,3,…,n)為權重,Σ為求和,b為偏置項,g為激活函數,常見的激活函數有sigmoid函數、雙曲正切函數(tanh)、線性整流函數(RELU)、softmax函數,因此神經元的輸出可以用如下式子表示:

2.RNN循環神經網絡

在傳統的神經網絡模型中,是從輸入層到隱含層再到輸出層,層與層之間是全連接的,每層之間的節點是無連接的,因此傳統的神經網絡訓練及測試的速度較慢,還容易產生過擬合、局部極小值等缺陷,且這種普通的神經網絡對于很多問題無能無力。RNN循環神經網絡(Recurrent Neural Networks)是一個專為序列數據分析而構建的深層網絡模式,其在語音識別、語言翻譯和圖片描述等方面獲得較為廣泛的應用。也正因于此,RNN在自然語言處理(NLP)中獲得了巨大的成功。在RNN網絡系統中,不同的時步長擁有同樣的一個權重,可以循環地完成跨時間的聯系。由于權重的共用,在RNN網絡系統中的時間參數大大減少。在實踐中,為了降低復雜性往往假設當前的狀態只與前面的幾個狀態相關。RNN循環一般結構及循環模塊展示如圖2所示。

圖2 RNN循環一般結構及循環模塊展示圖

3.長短期記憶神經網絡(LSTM)

長短期記憶神經網絡(LSTM)是一類獨特的RNN模型,由Hochreiter與Schmidhuber提出,LSTM與典型的RNN基本框架一致,只是使用了不同的方式來計算隱藏狀態。LSTM的出現就是為了克服傳統RNN神經網絡模型信息淹沒(短期記憶)以及訓練中梯度消失與梯度爆炸的問題。相比于傳統RNN單元架構,LSTM創新性地推出了控制部門架構,使網絡模塊可以高效地解決時間序列中長期依賴關系,歷史時序信號也得以高效傳輸。因此,對于時間序列的預測問題,LSTM在時間單位構造上有著獨特優勢。LSTM神經網絡結構及循環模塊展示如圖3所示。

圖3 LSTM循環一般結構及循環模塊展示圖

LSTM的巧妙之處在于通過增加多處的門控,圖3循環模塊中3個方形形狀叫做“門”,起到對信息選擇的作用,三個門從左向右分別為遺忘門、輸入門、輸出門。這些門使得自循環的權重是變化的,控制了上一單元有多少信息可以通過,當前單元有哪些信息可以傳遞給下一個單元。LSTM循環模塊中計算公式如下。

遺忘門計算公式為:

輸入門計算公式為:

輸出門計算公式為:

輸入處理單元:

二、 數據處理

1.數據來源

本次實驗利用Python中的Pandas_datareader包連接stooq金融數據網站獲取百度股票價格,數據選取時段為2005年8月5日至2022年4月5日,共4195條數據。數據指標主要包括:交易數據開盤價格(open)、最高價格(high)、最低指數(low)、收盤價格(close)以及成分證券成交量(volume),交易數據前五行如圖4所示。

表1 百度交易數據展示(部分)

2.數據標準化

由于指標之間量綱差異性較大,因此計算結果會受到大量綱指標的影響,為了消除此影響,需要對數據進行數據標準化。本文實證中使用零均值歸一化的方法對數據進行標準化的處理。

對原始數據進行標準化后的數據如圖5所示。

表2 標準化后數據展示(部分)

3.劃分數據集

本文選取2005年8月5日至2019年12月31日,共3625條數據為訓練集集,選取2020年1月1日至2022年4月5日,共570條數據為測試集,測試集占比約為14%。將百度股價以折線圖展示如圖6所示,其中藍色部分(2005年~2020年)為訓練集數據,黃色部分(2020年~2022年)為測試集數據。

圖6 百度股價折線圖

4.損失函數選擇

損失函數是用來評價模型的預測值和真實值差別的程度,損失函數越好,通常模型的性能也就越好,不同的模型所用的損失函數一般也是不一樣的。常見的損失函數有均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差百分比(MAPE)、平均絕對誤差(MAE)等,本研究選用均方誤差(MSE)當作損失函數,MSE計算公式如下:

三、 實證研究

1.單特征LSTM神經網絡

(1)模型的構建

選擇收盤價(Close)單列進行股價(收盤價)的預測,模型的選擇時間窗口長度為60,構建三層LSTM網絡模型,LSTM模型第一層、第二層、第三層展開節點均為為128,增加全連接層,輸出1一個數據。經過實驗,循環訓練次數為20、30、40次時,損失函數的值差別不大,考慮機器性能選擇循環訓練次數(epoch)為20次;將每32個樣本數據打包成一個batch進行訓練,即batchsize為32;為了讓目標函數在合適的時間范圍內收斂到最小的目標值,設置學習率為0.001;在模型優化器(optimizer)的選擇上,采用同等數據量下,熵損失及優化時間都較好的Adam算法;對訓川練集數據采用隨機打散,并以MSE指標作為模型的損失函數進行訓練。

(2)數據預測

對上述模型進行訓練,利用測試集進行驗證,得出該模型的損失函數MES為0.2183,得到的真實數據與預測數據如下所示,將利用測試集代入模型得到的預測數據和原始真實數據進行可視化展示,如圖7所示。

圖7 單特征LSTM股價預測圖

2.多特征LSTM神經網絡

(1)模型的構建

選擇交易數據開盤價格(open)、最高價格(high)、最低指數(Iow)、收盤價格(close)以及成分證券成交量(volume)5個指標對股價(收盤價)進行預測,模型構建同單特征LSTM模型。模型選擇時間窗口長度為60,構建三層LSTM網絡模型,LSTM模型第一層、第二層、第三層展開節點均為為128,增加全連接層,輸出1一個數據。經過實驗,循環訓練次數為20、30、40次時,損失函數取值差別不大,考慮機器性能選擇循環訓練次數(epoch)為20次,將每32個樣本數據打包成一個batch進行訓練,即batchsize為32,采用Adam算法作為模型的優化器(optimizer),對訓川練集數據采用隨機打散,并以MSE指標作為模型的損失函數進行訓練。

(2)數據預測

對上述模型進行訓練,利用測試集進行驗證,得到該模型的損失函數MES為0.0078,遠遠小于單特征LSTM模型。將利用測試集代入模型得到的預測的數據和原始真實數據進行可視化展示,如圖8所示。

圖8 多特征LSTM股價預測圖

3.綜合評價

通過比較單特征LSTM以及多特征LSTM的損失函數(MSE)值,認為多特征LSTM擬合效果更優,認為LSTM可以對多維數據進行建模,并能從更多維度的數據中提取有用的信息。

表3 股價預測模型MSE指標匯總表

四、總結與展望

預測股票價格的走勢一直是股票市場研究的熱點。本文運用LSTM模型分別從單特征及多特征兩個角度對百度的股價進行預測。首先通過對股票以及神經網絡的相關知識,從問題及方法兩個方面探究了其可行性。鑒于股票價格高相關性及復雜性,本文選擇使用LSTM神經網絡模型對股票數據進行分析,通過模型不斷的調整,實現對股價的預測。

選擇百度股票的5項指標,為了消除單位對數據結果的影響,對數據進行標準化處理,將標準化后數據分為訓練集和測試集兩部分,為LSTM神經網絡模型做好數據準備。本文從兩個角度實現股價的預測,經多次對模型進行調參及優化,最終得出單特征模型損失函數值為0.2183,而多特征損失函數值為0.0078,認為多特征LSTM模型有更好的預測效果。

受到各種各樣因素的影響,研究股票價格預測問題的道路還很長,需要解決的問題還有很多。在今后的研究中,可以嘗試加入更多的指標,進一步優化模型的結構及參數,或多方法的對比,以探索更加精準的預測效果。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲综合亚洲国产尤物| 色国产视频| av在线手机播放| 最新日本中文字幕| 成人噜噜噜视频在线观看| 亚洲天堂视频在线观看免费| 激情无码字幕综合| 香蕉综合在线视频91| 另类综合视频| 国产波多野结衣中文在线播放| 午夜国产精品视频| 综合亚洲色图| 国产香蕉在线| 国产微拍一区二区三区四区| 九九热在线视频| 日韩欧美高清视频| 精品成人一区二区三区电影 | 亚洲视频a| 欧美午夜视频| 日本高清免费一本在线观看| hezyo加勒比一区二区三区| 国产精品无码在线看| 国产精品无码AⅤ在线观看播放| 日韩福利在线观看| 国产手机在线小视频免费观看| 欧美在线精品怡红院| 青草91视频免费观看| 亚洲国产成人自拍| 一本色道久久88综合日韩精品| 无码日韩精品91超碰| 亚洲 欧美 日韩综合一区| 久996视频精品免费观看| 99手机在线视频| 国产91视频免费| 一区二区在线视频免费观看| 99久久精品国产自免费| 91无码人妻精品一区二区蜜桃| 中文字幕亚洲综久久2021| 亚洲人人视频| jizz在线观看| 毛片基地视频| 亚洲IV视频免费在线光看| 国产午夜在线观看视频| 在线一级毛片| 久久婷婷色综合老司机| 国产日韩欧美中文| www成人国产在线观看网站| 亚洲永久精品ww47国产| 国产在线拍偷自揄观看视频网站| 久操线在视频在线观看| 国产精品亚洲专区一区| 久久精品人人做人人综合试看| 国产91透明丝袜美腿在线| 亚洲v日韩v欧美在线观看| 国产91丝袜| 亚洲视频a| 高清免费毛片| 伊人查蕉在线观看国产精品| 国产成人夜色91| 精品亚洲麻豆1区2区3区| 精品综合久久久久久97超人| 国产呦精品一区二区三区下载| 亚洲免费福利视频| 欧美亚洲另类在线观看| 嫩草国产在线| 午夜欧美在线| 凹凸国产分类在线观看| 中文字幕调教一区二区视频| 久久综合激情网| 五月婷婷导航| 26uuu国产精品视频| 国产区在线观看视频| 色综合五月婷婷| 日韩精品专区免费无码aⅴ| 日韩视频免费| 亚洲男女天堂| 日本一本在线视频| 欧美精品一区二区三区中文字幕| 欧美不卡在线视频| 欧美精品在线视频观看| 亚洲狼网站狼狼鲁亚洲下载| 久久九九热视频|