999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

結合公司財務報表數據的股票指數預測方法

2022-01-05 02:32:12王基厚林培光周佳倩李慶濤蹇木偉
計算機應用 2021年12期
關鍵詞:財務報表實驗信息

王基厚,林培光,周佳倩,李慶濤,張 燕,蹇木偉

(山東財經大學計算機科學與技術學院,濟南 250014)

(?通信作者電子郵箱llpwgh@163.com)

0 引言

股票市場是國家經濟的重要組成部分,股票指數作為反映股市變化的重要標志,也反映了國家經濟發展變化的情況,同時股票指數的變化還影響著投資者的經濟利益。然而受到政治、軍事、宏觀經濟等多種因素的影響,使得股票指數充滿復雜性,也使準確預測股票指數成為一個困難的問題。許多學者[1-4]通過增加數據特征來應對這種復雜性,提高預測準確率。

有效市場假說的半強勢形式表明,資產價格完全反映了可公開獲得的信息[5]?;谶@個前提,只要有新的信息進入市場,價格就會發生變化。在市場中,上市公司以定期報告和臨時報告等形式,向投資者和社會公眾公開披露公司及與公司相關的信息。研究表明,財務披露是預測股票指數變化的一種吸引人的且具有潛在財務回報的手段[6]。因此,本文結合公司披露信息中的財務報表進行股票指數預測研究。

本文主要工作是提出了一種結合公司披露的財務報表數據進行股票指數預測的方法。該方法在使用股票指數歷史數據進行預測的同時還結合了公司財務報表數據,并通過降維方法處理公司財務報表數據形成的高維矩陣,在減少數據噪聲影響的同時,保留對原始數據表達最優的數據特征。該方法通過增加數據特征來應對股票指數波動的復雜性,提高預測的準確性,在滬深300和上證50數據集上的實驗結果表明,與其他預測方法相比,本文提出的結合公司財務報表進行股票指數預測的方法具有較好的預測結果和較高的準確度。

1 相關工作

股票市場具有較高的復雜性,影響股票市場的波動存在著多方面的因素,僅僅利用歷史數據有局限性,不能完全模擬出復雜的市場變化。國內外學者利用金融文本挖掘、金融情緒分析等方法增加數據特征來應對這種復雜性。如文獻[1]中提出了一種名為StockAssistant 的股票評論分析方法,該方法綜合考慮股價走勢、評論內容、分析師表現等多個因素,對股票評論的可靠性進行建模,并通過真實股票數據的交易模擬清楚地驗證了該方法對股票評論可靠性建模的有效性;文獻[2]中通過提取和探索股票的內在屬性來增強股票的趨勢預測,并證明了從集體投資行為中提取股票屬性在股票預測任務中的有效性;文獻[3]中提出了一種基于情感分析的金融市場趨勢預測方法,該模型通過對股民評價進行情感分析來提取情感向量和計算情感權重,隨后利用股民情感數據和股市歷史數據進行預測研究,并通過實驗證明,相比一些傳統模型,該方法在較小的樣本集上依舊有很好的預測效果;文獻[4]中開發了一種新穎的模糊雙支持向量機,以合并從新聞文章中提取隱藏的主題模型和情感信息,從而預測股價趨勢。

數據特征的增多,會帶來大量噪聲,使預測精準度下降,因此需要降維方法來進行特征提取,以減少噪聲。如文獻[7]中使用小波變換來處理高度不規則的金融時間序列以進行數據去噪,該方法可以同時分析金融時間序列的頻率和時間分量;文獻[8-9]中進行金融時間序列預測研究時,均使用主成分分析(Principal Component Analysis,PCA)消除冗余信息,在保留大部分原始數據信息的同時,提高了數據質量和預測響應速度。

近年來,隨著深度學習技術在圖像識別[10-11]、自然語言理解[12-13]、語音識別[14-15]等領域的成功應用,越來越多的研究者在金融時間序列預測領域使用深度學習技術。如文獻[16]中采用多層感知器回歸(MultiLayer Perceptron Regression,MLPR)構建預測模型,并通過實驗驗證了所提出的模型在預測準確性上優于比較模型;文獻[17]中提出了一種基于支持向量回歸(Support Vector Regression,SVR)的混合算法,該方法在聚類大量財務時間序列數據方面具有巨大潛力,能有效提高預測股價和財務指標的準確性。

在金融時間序列預測領域中,長短期記憶(Long Short-Term Memory,LSTM)網絡是應用最多的機器學習模型之一。如文獻[18]中結合注意力(Attention)機制將LSTM 用于研究互聯網金融市場動態預測問題,并通過實驗驗證了所提模型在該問題上的有效性與穩健性;文獻[19-20]中均使用基于變分模態分解(Variational Mode Decomposition,VMD)和LSTM的金融數據預測方法來進行研究,并通過實驗驗證了該模型的優越性;文獻[21]中建立了基于LSTM 深度神經網絡的高精度金融市場時間序列短期預測模型,并驗證了LSTM 深度神經網絡具有較高的預測精度,可以有效地預測股市時間序列。

本文提出的結合公司財務報表的股票指數預測方法,在考慮股票指數歷史數據的前提下,融入公司財務報表信息的各項財務指標進行股票指數預測。新加入的財務指標增加了數據特征,但是含有大量噪聲,因此需要進行數據降維,在消除噪聲的同時,提取出有利于預測的信息。另外,由于股票指數歷史數據和公司財務報表數據的時間間隔不同,本文使用了雙通道的LSTM 模型,將兩種數據從不同的通道輸入模型。使用該方法在滬深300 和上證50 數據集上的預測實驗表明,結合公司財務報表進行股票指數預測的結果較好,精度提高。

2 融入財報信息的指數預測方法

本文提出的結合公司財務報表的股票指數預測方法如圖1 所示。該方法首先對股票指數歷史數據和公司財務報表數據進行預處理,主要是對處理公司財務報表數據時生成的高維矩陣進行降維,然后用雙通道的LSTM 對歸一化后的數據進行預測研究。本章主要介紹公司財務報表信息中的財務指標選取、多種降維方法和所使用的機器學習方法。

圖1 結合公司財務報表的股票指數預測方法Fig.1 Stock index forecasting method based on corporate financial statement data

2.1 財務報表信息

比率分析法是分析公司財務報表最基本的工具,它通過財務報表的有關指標的比率計算來分析公司的經營活動以及公司目前和歷史的狀況。該方法主要運用四類比率進行分析,這四類財務比率分別反映了公司的償債能力、運營能力、盈利能力和成長能力。

本文方法運用這四類財務比率中的10 種財務比率進行股票指數預測研究,分別是反映償債能力的產權比率、資產負債率,反映運營能力的總資產周轉率,反映盈利能力的凈資產收益率、總資產凈利率、銷售凈利率,以及反映成長能力的營業收入增長率、凈利潤增長率、凈資產增長率、總資產增長率。在使用這10 種財務比率時,需要將該數據處理成如式(1)所示的形式:

其中,ai.j.k表示截止第i天,公司j的第k種比率。本文使用第T天之前3個季度的公司財務報表數據來預測第T天的指數,這三個季度的數據分別保存在三個矩陣A中。

2.2 數據降維方法和歸一化

將股票指數歷史信息與財務報表信息相結合進行股票指數預測研究,在處理財務報表數據時會形成如式(1)所示的高維矩陣,雖然能為股票指數預測提供更豐富的預測信息,但是過高的維數會帶來大量噪聲,并且會占用大量的存儲空間,使模型運行效率低下,所以需要對高維矩陣進行降維處理,提取出對原始數據表達最優的數據集。

本文分別使用了8 種降維方式來進行實驗對比,分別是等距映射(Isomap)、快速獨立成分分析(Fast Independent Component Analysis,FastICA)、局部線性嵌入(Locally Linear Embedding,LLE)、截斷奇異值分解(Truncated Singular Value Decomposition,TSVD)、t-Distributed 隨機鄰域嵌入(tdistributed Stochastic Neighbor Embedding,t-SNE)、核主成分分析(Kernel Principal Component Analysis,KPCA)、多維縮放(Multiple Dimensional Scaling,MDS)和主成分分析(PCA)。

其中PCA 是最常用的無監督降維算法,該方法通過尋找最大方差的方向來進行降維,即通過對特征的協方差矩陣進行分解來尋找方差最大維度,將多個特征變量轉化為少數幾個主成分,這些主成分之間彼此正交,能反映特征變量的大部分信息,從而達到降維目的。KPCA 是對PCA 的一種推廣。該方法通過非線性變換將原始特征變量映射到高維特征空間,然后在高維特征空間利用PCA 進行特征提取。而TSVD則對特征變量的原始數據直接進行奇異值分解,找到其中指定的最大的K個奇異值,從而生成一個指定維度的分解矩陣,以達到降維目的。FastICA 是一種線性盲源分離算法,它通過尋找最大獨立的方向來進行降維,降維后各個成分是獨立的,有利于發現一些隱藏因素。與PCA 保留數據的最大可分性不同,MDS 降維方法更加關注高維數據內部的特征。使用MDS 降維后的數據,樣本之間的歐氏距離在低維空間得以保持。與MDS 類似的降維方法是Isomap,這是一種流形學習方法,它與MDS 的不同之處在于計算樣本距離時使用了測地距離。同為流形學習降維方法的是LLE,使用該方法進行降維,可以保持鄰域內樣本之間的線性關系,即樣本之間的映射坐標能夠在低維空間中得以保持。另一種流形學習降維方法t-SNE則盡量保證降維前后樣本相互之間的分布概率不變。

降維后的數據表示為如式(2)所示的形式:

其中,bi,j表示降維后第i天第j維特征的值。本文使用第T天之前3個季度的公司財務報表數據來預測第T天的指數,這三個季度的數據降維后分別保存在三個矩陣B中。從這三個矩陣B中分別取出第T行數據表示為c1、c2和c3,依式(3)所示組成矩陣cT,其中下標1、2、3 分別表示第幾個季度。要使用cT對第T天的指數進行預測,需要對cT進行歸一化以消除變量間的量綱關系。歸一化計算方式如式(4)所示:

其中:yi表示歸一化后的數據,xi表示歸一化前的數據,xmin表示數據集中的最小值,xmax表示數據集中最大值。

2.3 雙通道的長短期記憶網絡

本文方法使用雙通道的LSTM(如圖2 所示)進行股票指數預測。雙通道的LSTM 模型擁有兩個輸入層,可以將時間跨度不同的兩組數據輸入到模型中,每個輸入層分別與一層LSTM網絡層相連接,在LSTM層之后加入Dropout層來防止過擬合,然后連接共享網絡層將兩種信息融合。共享網絡層之后再連接一層LSTM網絡層,并在LSTM層之后也加入Dropout層來防止過擬合。最后連接一個Dense輸出層以輸出結果。

圖2 雙通道的LSTMFig.2 Dual-channel LSTM

LSTM[22]是一種時間循環神經網絡,是目前在金融時間序列預測領域中應用最多的機器學習模型之一。LSTM 的優越之處在于,它特有的“三門”結構,使它不必像常規循環神經網絡(Rerrent Neural Network,RNN)那樣在實際使用過程中面臨梯度消失的問題,也使它能更好地處理長期依賴問題。LSTM 的“三門”結構包括遺忘門(ft決定丟棄信息)、輸入門(it決定更新信息)和輸出門(ot決定輸出信息),具體情況如圖3所示。如圖3 所示,t時刻的輸入xt與上一時刻的輸出ht-1先經過遺忘門的sigmoid單元來決定LSTM 單元狀態需要丟棄哪些信息,然后經過輸入門的sigmoid 單元來決定LSTM 單元狀態需要更新哪些信息,并通過一個tanh 層得到新的候選單元信息。舊的單元狀態Ct-1根據上述信息來更新為新的單元狀態Ct。最后xt與ht-1經過輸出門的sigmoid 單元來決定LSTM 單元輸出狀態Ct的值ht。這一過程的計算公式如式(5)~(10)所示:

圖3 LSTM的內部結構Fig.3 Internal structure of LSTM

其中:σ表示sigmoid 激活函數;Wf、Wi、WC、Wo是權重矩陣;bf、bi、bC、bo是相應的偏差矩陣。

3 實驗與結果

3.1 度量標準

本文使用均方根誤差(Root Mean Squared Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)對本文所提方法的性能進行定量評價。式(11)~(13)是這三種標準的計算方式。

3.2 數據集

本文使用的數據集為上證50指數和滬深300指數的股票指數歷史數據以及兩者成分股中的上市公司的財務報表數據。其中,上證50 指數的股票指數歷史數據選用的日期為2015 年1 月5 日至2019 年12 月31 日(共1 219 個交易日);滬深300 指數的股票指數歷史數據選用的日期為2017 年1 月3日至2019 年12 月31 日(共731 個交易日)。本文使用的股票指數歷史數據包括開盤價、最高價、最低價、收盤價、成交量、成交金額和漲跌幅。在將數據整理成監督學習形式后,使用前80%個樣本的數據作為訓練集,其余20%個樣本的數據作為測試集。數據來源為銳思金融數據庫(www.resset.com)。

3.3 降維方法對比實驗

本節旨在研究在處理公司財務報表數據過程中,不同降維方法對預測結果的影響,找出使預測結果最優的降維方法。實驗中使用的降維方法分別是FastICA、Isomap、KPCA、LLE、MDS、PCA、t-SNE 和TSVD。實驗結果如表1 所示:在上證50數據集(SSE 50)上,使用PCA 降維方法的RMSE 值最小,使用TSVD 降維方法的MAE 值和MAPE 值最小;在滬深300數據集(CSI 300)上,使用TSVD 降維方法的誤差最小,預測最精準。綜合來看,TSVD 降維方法的效果最好,在后續的對比實驗當中,將使用以TSVD方法降維的LSTM-TSVD模型進行對比。

表1 不同降維方法的預測效果對比Tab.1 Comparison of prediction effects of different dimension reduction methods

3.4 對比實驗和結果

本文實驗中使用第T天之前5 天的股票指數歷史數據和第T天之前3 個季度的公司財務報表數據來預測第T天的指數收盤價。實驗中batch_size 為128,epoch 為300。為驗證本文方法的可行性與高效性,使用LSTM、CNN-LSTM、LSTMAttention和VMD-LSTM方法進行對比實驗。其中,CNN-LSTM是由CNN 與LSTM 組成的混合網絡,LSTM-Attention 是在LSTM 網絡中加入注意力機制的預測模型,VMD-LSTM 是一種以VMD方法處理數據并結合LSTM進行預測的方法。為了更直觀地對比各個模型在不同數據集上的實驗結果,本文選擇了部分實驗預測結果展示在圖4 和圖5 中,從中可以看出,LSTM-TSVD模型的擬合效果優于其他方法。

圖4 上證50指數測試集上的部分預測結果Fig.4 Partial prediction results on SSE 50 Index test set

圖5 滬深300指數測試集上的部分預測結果Fig.5 Partial prediction results on CSI 300 Index test set

各模型在不同數據集上的評價指標如表2 所示。由表2可以看出,LSTM-TSVD 方法的所有評價指標均小于其他方法,說明與表2中其他預測方法相比,LSTM-TSVD方法的預測效果最好。

表2 各模型預測效果對比Tab.2 Comparison of prediction effects of different models

4 結語

本文提出的結合公司財務報表的股票指數預測方法,在考慮股票指數歷史數據的同時,融入了公司財務報表信息的財務指標進行股票指數預測。新加入的數據增加了數據的特征數量,提供了更多的信息以應對復雜的股票指數變化。在處理公司財務報表數據時,諸多降維方法中,使用TSVD 降維方法的預測效果最好。另外,本文使用了雙通道的LSTM 模型,將時間間隔不同的股票指數歷史數據和公司財務報表數據從不同的通道輸入模型。在滬深300和上證50數據集上的實驗結果表明,結合公司財務報表進行股票指數預測的結果較好,精度較高。今后的工作將將嘗試將更多的股票信息數據融合到一起,在現有工作的基礎上加入如股民情感信息、新聞信息等。

猜你喜歡
財務報表實驗信息
記一次有趣的實驗
新會計準則下企業合并財務報表的研究
做個怪怪長實驗
我國財務報表審計與內部控制審計的整合研究
遼寧經濟(2017年5期)2017-07-12 09:39:47
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
內部控制審計對財務報表信息質量的影響
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
指標分解法在企業財務報表分析中的應用
主站蜘蛛池模板: 伊伊人成亚洲综合人网7777| 欧美成一级| 欧美色伊人| 成人福利在线免费观看| 91蜜芽尤物福利在线观看| 国产极品粉嫩小泬免费看| 四虎国产精品永久一区| 欧美乱妇高清无乱码免费| 国产成人免费手机在线观看视频| 久久毛片基地| 91精品视频在线播放| 久久毛片基地| 97se亚洲综合不卡| 91精品国产一区自在线拍| 亚欧乱色视频网站大全| 欧美国产日韩在线观看| 毛片三级在线观看| 久久天天躁狠狠躁夜夜躁| 亚洲色图欧美| 她的性爱视频| 国产玖玖视频| 国产视频 第一页| 2020亚洲精品无码| 国产福利在线免费观看| 精品欧美视频| 一本大道香蕉中文日本不卡高清二区| 91黄视频在线观看| 欧美成人一区午夜福利在线| AV网站中文| 伊人精品成人久久综合| 国产精品自在拍首页视频8| 国产高清又黄又嫩的免费视频网站| 免费va国产在线观看| 无码福利视频| 4虎影视国产在线观看精品| 欧美人在线一区二区三区| 国产男女免费完整版视频| 少妇精品网站| 成色7777精品在线| 国产激爽爽爽大片在线观看| 欧美精品亚洲二区| 视频二区中文无码| 国产在线观看精品| 国产精女同一区二区三区久| 喷潮白浆直流在线播放| 欧美一级在线| 国产jizz| 少妇露出福利视频| 国产精品偷伦视频免费观看国产| 911亚洲精品| 美女被躁出白浆视频播放| 99爱视频精品免视看| 国产97公开成人免费视频| 日韩欧美中文| 无码又爽又刺激的高潮视频| 久久性妇女精品免费| 亚洲综合九九| 香蕉伊思人视频| 青青久视频| 免费日韩在线视频| 国产精品13页| 免费啪啪网址| 国产成人精品2021欧美日韩| 香蕉国产精品视频| 国产国拍精品视频免费看| 五月丁香在线视频| 国产成人综合网在线观看| 国产一二三区在线| 久久国产精品影院| 在线观看国产小视频| 亚洲天堂.com| 国产成人艳妇AA视频在线| 不卡无码h在线观看| 成人年鲁鲁在线观看视频| 国产精品漂亮美女在线观看| 国产69精品久久| 自慰网址在线观看| 色香蕉网站| 成人免费一级片| 色天天综合久久久久综合片| 91久久偷偷做嫩草影院电| 全部无卡免费的毛片在线看|