李曉寒,王俊,賈華丁,蕭劉
基于多重注意力機制的圖神經網絡股市波動預測方法
李曉寒1*,王俊1,賈華丁1,蕭劉2
(1.西南財經大學 經濟信息工程學院,成都 611130; 2.四川久遠銀海軟件股份有限公司 住房金融行業部,成都 610063)( ? 通信作者電子郵箱lixiaohan134@163.com)
股票市場是金融市場關鍵組成部分,因此對股票市場波動的研究對合理化控制金融市場風險、提高投資收益提供了重要支持,一直以來都是學術界和相關業界的關注焦點,然而,股票市場會受到各種因素的影響。面對股票市場中多源化、異構化的信息,如何高效挖掘、融合股票市場的多源異構數據具有挑戰性。為了充分解釋不同信息及信息間相互作用對于股票市場價格波動的影響,提出一種基于多重注意力機制的圖神經網絡來預測股票市場的價格波動。首先,引入關系維度構建股票市場交易數據和新聞文本的異構子圖,并利用多重注意力機制實現圖數據的融合;其次,通過圖神經網絡門控循環單元(GRU)進行圖分類,在此基礎上完成對股票市場中上證綜合指數、滬深300指數、深證成份指數這三個重要指數波動的預測。實驗結果表明,從異構信息特性角度,相較于股票市場交易數據,股市新聞信息對于股票價格影響存在滯后性;從異構信息融合角度,所提方法與支持向量機(SVM)、隨機森林、多核-means (MKKM)聚類等算法相比,預測準確率分別提升了17.88個百分點、30.00個百分點和38.00個百分點,并進行了模型交易策略的量化投資模擬。
股市預測;多重注意力機制;圖神經網絡;股市新聞;圖數據
為實現金融風險防范、投資獲利等,股票市場作為金融市場重要組成部分,得到了學者和投資者們廣泛關注。在過去三十多年里,中國股票市場作為發展最為迅速的新興資本市場,成為學者們重點研究和關注的對象。在對股票市場研究中,有效市場假說和行為金融理論得到普遍認可。基于有效市場假說[1]認為完全理性的投資者能夠根據獲得足夠完全信息,作出迅速、合理的投資行為。該理論認為在市場有效假設條件下,投資者很難實現超額投資收益。然而隨著金融行為學研究的深入,學者們發現投資者會受到文化、心理等因素影響,市場中人們的金融行為存在非理性[2-3]特征。隨著對以上兩種理論研究的深入,學者們逐漸形成共識,認為影響股市波動的因素眾多,而且不同信息可以反映不同因素對于股市波動影響。股票市場各因素的相互關系及作用成為研究的方向和熱點[4-5]。信息技術發展為研究分析股市價格波動提供了數據基礎。交易數據[6]如開盤價、收盤價、成交量等逐漸衍生出動量[7]、重量[8]等衍生指標用于預測分析股票市場價格波動。隨著互聯網及移動互聯技術發展,股市新聞對于股票市場投資者的影響越發顯著。股市新聞包羅萬象,從反映股票市場行情、公司經營事件的客觀、中立性新聞,到帶有傾向性的新聞報道,都會對股票市場短期走勢產生影響[9-10]。目前,研究者們提出了大量基于股市新聞情感分析的方法用于股市預測[11-12]。Simon[13]針對新聞數量進行研究,驗證了大量信息將會導致注意力貧乏。Chan[14]以新聞標題為切入點,研究了投資者對于新聞的敏感程度。王曉丹等[15]則從新聞媒體關注度和情感指標兩個方面研究了新聞報道對股票市場價格波動的影響。Liu等[16]提出了利用企業知識圖嵌入系統擴展企業相關新聞信息。在此基礎上,采用門控循環單元(Gated Recurrent Unit, GRU)模型結合股票新聞情緒和焦點股票的數量特征來預測股票價格波動。隨著研究深入,為能夠更加準確預測股市波動,用于預測的股市信息逐漸由交易數據、股市新聞數據等單一指標逐漸發展為多維度指標數據。多維度指標數據呈現多源化、異構化特性。對于多源異構數據的融合、處理、分析成為預測股市價格波動亟待探索和解決的問題。Thakkar等[17]將股票市場融合技術分為信息融合、特征融合和模型融合。信息融合[18]主要是通過對新聞信息進行提取,與股市交易數據等實現數據融合,以獲得用于股市預測的綜合性數據。特征融合[19]則多采用算法模型將同源數據表達為不同形式,從而實現多維特征提取。模型融合[20]則主要是對統計模型、人工智能算法模型、深度學習模型等進行組合,形成復合模型分析預測股票市場波動。在最新研究中,融合方法和技術得到進一步發展,Zhang等[21]采用長短期記憶網絡中引入注意力機制識別長期時間依賴以突出關鍵特征,構建了基于多種數據來源的分析框架。Patel等[22]提出了一種基于支持向量回歸兩階段融合的方法,對智能算法融合以預測印度股市價格波動。
但是目前研究存在一定局限性,總結概括如下:首先,對于股票市場新聞文本信息處理,當前研究主要停留在對指定來源新聞文本進行量化研究,然而面對多種來源的股市信息如何高效甄別客觀、真實信息,并未有更為深入的探索研究;其次,傳統融合方式一定程度上忽略了部分融合指標的金融特性、指標間關系及時間序列特征;再次,現有融合分析方法在挖掘股票市場數據金融特征、相互作用、時間序列等隱含語義信息時有待進一步擴展;最后,為彌補作者之前研究[23]股市預測信息維度過于單一的問題,本文對圖神經網絡在股票市場價格預測進行了更加深入的探索。同時,將研究對象由美國股市調整為中國股票市場,中國股票市場作為全球最大新興資本市場,其研究意義得到顯著提升。本文的主要工作如下:1)構建新聞文本子圖數據,利用文本相似性完成頂點聚合,進行新聞文本信息挖掘融合; 2)引入關系維度充分表示時間序列相關關系,構建具有股市指標特征信息的異構圖數據,實現多源異構數據融合; 3)為挖掘多源異構數據隱含語義信息,結合異構圖數據構建多重注意力圖神經網絡進行股市波動預測。股市波動預測及策略回測實驗結果表明,本文方法在股市預測方面取得了較好效果。
有效市場假說闡述在投資者理性及市場信息被完全獲得且理解的假設下,股票價格將實現對信息的充分反映。另外與之對應的理論體系是行為金融理論[24],該理論認為影響股市波動的因素存在非理性特征,解釋了股票市場中日歷效應、動量效應等異常現象。以上兩種理論在股票市場中得到了驗證、發展,為股票市場預測奠定了理論基礎。在過去三十多年里,對股票價格波動的研究和預測從未停止過。學者們利用各種交易數據及衍生出的技術指標預測股市走勢[25]。采用統計學、經濟學等方法構建時間序列[26]、因子定價模型[27]用于研究股市波動。如Jegadeesh等[28]提出股票價格有延續原來運動方向的趨勢,成交量、換手率均衍生出動量因子用于股票價格走勢預測。Fama等[29]利用總市值、賬面市值比等衍生指標因子構建了因子定價模型用于解釋預期股票報酬率橫截面變化。然而隨著金融行為學理論的發展,學者們發現投資者受到文化、心理等因素影響,存在非理性特征。新聞事件[30]、社交媒體[11]、股吧[31]等數據經過自然語言處理后成為此類研究的主要指標,學者們不斷拓展文本嵌入方法,引入卷積神經網絡(Convolutional Neural Network, CNN)、循環神經網絡(Recurrent Neural Network, RNN)等機器學習算法用于股市研究[32-33]。
股票市場融合技術主要包括信息融合、特征融合和模型融合。Zhang等[18]分別從網絡新聞、社交媒體中提取事件和用戶情緒,并通過一個耦合矩陣和張量分解框架提取信息,研究其對于股價波動的綜合影響。Kim等[19]提出了特征融合長短期記憶卷積神經網絡模型,結合同一數據不同表示,將股票時間序列和股票圖表圖像進行特征融合。Hassan等[20]對隱馬爾可夫模型、人工神經網絡和遺傳算法進行融合得到復合模型預測金融市場行為。近年來,股市新聞與歷史交易指標數據融合應用于股市走勢預測,成為熱門研究方向,如Tan等[34]提出了用張量代替串聯向量實現數據信息融合來建模獲取市場信息,并利用事件驅動機制平衡不同數據類型的異構性完成數據預測。Chai等[35]對多源數據預加工提取相應特征,采用擴展隱馬爾可夫模型對量化預處理特征進行建模,捕獲數據中潛在的時間依賴性用于金融時序預測。主流方法針對股市異構數據的融合、處理進行了大量研究[36-38]。然而,當今股市新聞數量龐大,新聞來源渠道多樣,新聞真偽難辨。如何高效處理海量數據,對有用、真實新聞信息進行甄別,并與結構化的股市歷史交易數據進行有效融合成了亟待解決的問題。
為能夠解決圖數據深度學習問題,圖神經網絡應運而生。短短幾年時間中圖神經網絡技術突飛猛進,得到了廣泛應用[39-41]。Bruna等[42]2013年首次提出圖卷積神經網絡,采用譜空間方法定義圖卷積。利用切比雪夫多項式的近似擬合卷積核(ChebNet)[43]和圖卷積網絡(Graph Convolutional Network, GCN)[44],為降低時空復雜度,從空間角度定義節點權重矩陣,對核函數進行參數優化。Kim等[40]提出了一種利用關系數據進行股票市場預測的分層注意力網絡。選擇性地聚合關于不同關系類型的信息,并將這些信息添加到每個公司的表示中,此方法用于預測個股價格和市場指數走勢。Liu等[16,45]提出了一種利用上市公司之間關系知識圖譜,采用封閉式回歸單元模型結合相關股票新聞情緒、焦點新聞情緒和焦點股票數量特征預測股票價格波動。Matsunaga等[46]驗證了市場預測和圖形神經網絡交叉工作的有效性,將公司知識圖譜引入預測模型模仿投資者投資決策,使用滾動窗口回溯測試不同市場和較長時間跨度的有效性。學者們將圖神經網絡應用于股市預測進行了大量探索,圖數據根據關系維度拓展特征指標,用于股票市場走勢預測。為分析預測股票市場波動,目前所開展的股票市場信息圖結構數據構建及分析研究均處于起步階段。
為解決股市新聞信息的挖掘和交易指標數據多時間尺度問題,本文基于開放世界假設,構建股市新聞子圖和交易指標數據子圖,通過異構圖融合表示股票市場多源異構數據隱含語義信息,提出多重注意力圖神經網絡模型用于分析預測股票市場價格波動。
本文提出一種基于多重注意力機制的圖神經網絡模型用于股市波動預測分析。圖1展示了所提方法的模型整體框架。

圖1 本文模型整體框架

圖2為圖1①部分中子圖數據嵌入方法示意圖,如圖2(a)所示,選取5個交易日作為節點構建交易指標子圖。結合相鄰交易日的延續性,交易日節點之間設置邊。開盤指數、最高指數、最低指數、收盤指數、成交量、成交金額6個指標作為節點特征。圖2(b)股市新聞子圖將每個交易日股市新聞作為一個指標子圖,以每條新聞作為子圖節點,新聞文本詞向量作為節點特征,新聞文本相似度作為邊的權重構建新聞文本之間的聯系。圖2(c)將兩類子圖中的節點按照異構節點設立邊,構建股市復雜網絡圖數據。

圖2 圖數據嵌入方法






注意力機制如式(6)所示:

為了避免梯度爆炸及消失問題,引入殘差連接將權重矩陣及特征直接相加作為隱藏層輸入,如式(7)(8)所示:


采用GRU進一步提取特征形成特征向量矩陣,通過遞歸神經網絡忘記門舍棄部分特征信息,而輸入門則添加部分新的信息到節點特征中,并進行式(8)的狀態層歸一化處理:



通過聚合更新過程,不斷更新權重矩陣。模型采用交叉熵損失函數完成訓練過程。本文引入多重注意力機制完成股票市場異構圖數據分類,從而完成股票市場波動的預測分析。
程序首先定義所取交易日的區間,構建子圖,按照交易日設立子圖節點,取交易日交易數據指標作為節點特征。
對于股市新聞子圖的構建,則采用兩個核心函數。第1個函數EWEIGHT()主要用來計算新聞之間相似度,在子圖數據構建過程中,作為邊權重值。采用函數jieba()進行分詞,并采用函數SparseMatrixSimilarity()進行文本之間相似度的計算。第2個函數CREATNEWSUB()作為子圖構建函數,每一條新聞文本作為一個節點,函數add_edge()增加節點之間的邊,并利用函數EWEIGHT()對邊權重進行賦值。新聞文本向量作為節點特征。
本文所提出的多重注意力圖神經網絡在2.2節中進行了詳細闡述。代碼利用for循環利用多重注意力完成頂點特征嵌入提取過程,更新權重參數。其中權重參數包括邊權重和節點特征權重,利用權重矩陣完成異構圖數據有效信息提取,完成圖分類進行股市波動預測。
本文采用CSMAR數據庫(China Stock Market & Accounting Research Database)進行實驗,使用該數據庫2013-01-11至2018-12-31數據信息分別構建上證綜合指數、滬深300指數、深證成份指數的股市圖數據。其中2013-01-11至2017-12-31數據設置為訓練數據,采用dgl(https://docs.dgl.ai/)構建圖數據并進行相應卷積操作,每日新聞文本數據隨機取500條,新聞指標子圖以每條新聞作為圖節點,新聞文本詞向量作為節點特征,新聞文本相似度作為邊的權重構建新聞文本之間的聯系,每個交易日為一個子圖。采用gensim(https://radimrehurek.com/gensim/)庫將新聞文本轉換成200維詞向量作為節點特征。Word2Vec設置參數為(=20,=7,_=0,=1,=0.15,=10,_=10 000),其他均采用默認參數。Similarities模塊計算新聞文本之間的相似度作為新聞子圖邊的權重。交易數據指標子圖則選擇預測之前的5個工作日,將每個交易日開盤指數、最高指數、最低指數、收盤指數、成交量、成交金額六個指標作為聚合后的節點特征,通過連接操作與聚合頂點特征拼接。圖3(a)中邊的深淺與新聞文本相似度成正比,節點大小則與節點度成正比。圖3(b)中灰度標識新聞之間的相似度。兩類子圖節點如圖2所示構建的異構圖數據,作為輸入訓練及測試數據,該數據具有任意兩節點間的平均路徑相對較短。股市新聞子圖中,關鍵新聞節點度值較大,與其他新聞節點具有緊密的關聯性,具有律度分布特性。兩類指標所屬模塊度值較低,平均模塊度為-0.36。本文輸入數據具有小世界特性、律度分布特性、社區結構特性,屬于復雜網絡圖數據。復雜網絡圖數據以交易日之前的5個工作日交易指標節點和當日股市新聞節點構成,標簽為+1指數較前一交易日漲與跌進行二分類標記0:<0、1:0。模型訓練及測試輸出預測數據為復雜圖數據分類結果,即指數漲跌分類。

圖3 股市新聞圖數據
為能達到模型理想訓練效果,本文主要從兩個方面優化提升訓練效果。首先,損失值收斂情況,當模型逐漸收斂到一個較小的損失值,并且測試預測準確率達到預期要求且穩定,在這期間調整dropout值等參數,防止過擬合;其次,設置合理的訓練循環次數,為合理利用計算資源,提高訓練效率,訓練循環次數由初始值100次逐漸遞增,遞增幅度為100。直到在訓練循環次數內,損失值收斂,訓練預測準確率達到預期。經多次調整參數進行實驗后,本文設計網絡模型基本達到預期要求,訓練過程如圖4所示。

圖4 圖神經網絡訓練過程
本文混淆矩陣如表1所示。將股市收盤價的上漲和下跌作為分類預測結果:預測結果與真實結果都為上升,則為真陽性(True Postive,);預測結果為上升而真實結果為下降,則為假陽性(False Positive,);預測結果為下降而真實結果為上升,則為假陰性(False Negative,);預測結果為下降而真實結果也為下降,則為真陰性(True Negative,)。

表1 混淆矩陣
準確率(accuracy)和召回率(recall)是評價機器學習預測模型的重要指標。模型的準確率與預測性能密切相關。本文的準確率及召回率如式(12)和式(13)所示:


為能夠探究新聞文本影響的滯后性及各算法的最優參數設置,本文采用2018-10-01至2018-12-31交易日數據用于測試,實驗結果表明模型對上證綜合指數、滬深300指數、深證成份指數的預測結果。本文所提出方法基于圖關系權重注意力網絡進行表示。首先,與GATConv(Graph Attention Network Convolution)[18]、RelGraphConv(Relational Data with Graph Convolutional Networks)[37]、文獻[38]中提出的一種新的神經網絡模塊EdgeConv、SAGEConv(Graph SAmple and aggreGatE Convolution)[39]等嵌入操作進行對比。
為能夠進一步驗證所構建模型對新聞文本信息挖掘及融合技術的優越性,本文引入多源指標方法支持向量機(Support Vector Machine, SVM)、隨機森林(Random Forest, RF)、多核-means(Multiple Kernel-Means, MKKM)聚類[40]、基于張量的股票信息分析器(Tensor-based Stock Information Analyzer, TeSIA)[41]用于模型對比,對比方法并未考慮新聞數據之間的關系維度,對特征進行向量數據拼接,所引入用于對比的模型參數設置如表2所示。本文提出的模型則按照表3中相關參數進行設置。
SVM 是一種應用廣泛的機器學習分類算法。將這兩種類型的特征拼接成向量,并將向量輸入支持向量機進行預測。
RF 在多源特征分類任務中表現出優異的性能,本文將拼接成的向量使用隨機森林方法進行預測。
MKKM MKKM聚類的目標是從一組指定的核中找到最優組合,從而能夠準確地將特征向量劃分為若干類。在本研究中,將來自兩個股市評價指標的特征串聯起來,在核空間中探索出最佳聚類結果用于股票市場走勢判斷。
TeSIA 將2.2節中提取的兩種指標特征結合起來構造一個二階張量。然后通過張量分解去除冗余,根據價格運動方向建立張量流模型進行預測。TeSIA融合多源信息建立基線用于預測,在部分多源數據預測項目中取得了較好的效果。
預測標簽則為股市當天收盤價與前一交易日收盤價的對比。表4和圖5分別從預測的準確率和穩定性兩個方向展示了本文所提出方法與其他預測方法的比較結果。表4中,考慮到股市新聞對于股市影響的滯后性,實驗中分別通過模型挖掘的股市新聞對T+1、T+2、T+3時刻的股市走勢進行了預測。

表2 實驗網絡參數設置

表3 實驗模型參數設置

表4 不同指數預測結果對比
通過圖5和表4中呈現的結果,可以得出本文所提出的方法對于T+2時刻的股票走勢具有較好的預測能力。進一步分析數據,發現新聞圖數據中節點度較大的節點,如2018年11月13日“天然氣價格上漲”的新聞,當日大于關系權重閾值的相關節點新聞達到13條。在模型中也準確預測出了相關股票之后的走勢。2018年11月28日“關稅會威脅 蘋果這個假期季過得有點艱難”的新聞,當日大于關系權重閾值的相關節點新聞達到23條,也準確地標記了之后的股票走勢。為進一步了解模型預測性能,本文將模型對T+2時刻股市走勢預測的ROC(Receiver Operating Characteristic)、AUC(Area Under Curve)進行了對比。通過實驗驗證,SVM、RF、MKKM聚類等算法在表4中T+2交易日平均準確率分別為:55.12%、55.00%、53.00%,本文方法準確率與SVM、RF、MKKM聚類等算法平均準確率相比,對3種指數波動預測準確率分別提升了17.88個百分點、30.00個百分點和38.01個百分點。本文所提出的方法與GATConv、RelGraphConv、EdgeConv、SAGEConv、SVM、RF、MKKM、TeSIA方法相比在預測準確率和穩定性方面具有明顯優勢。

圖5 不同分類器預測的ROC AUC圖
如表4和圖5所示,本文方法在T+2股市走勢預測中,明顯優于其他方法。為進一步論證本文方法形成的策略在量化交易中收益情況。選取2019-11-25至2020-04-22期間100個交易日上證綜合指數、滬深300指數、深證成份指數數據進行本文策略的回測。模型預測上漲,則生成買入信號,下降則生成賣出信號,連續相同信號不觸發交易操作。策略初始資金為10 000,以交易日收盤價作為收益結算標準。本文具體展示了上證綜合指數、滬深300指數、深證成份指數收益情況實驗結果并進行分析。圖6分別采用表4中所提及的方法進行交易策略回測。為能夠清晰呈現策略收益情況,對圖5、表4中預測效率較好的SVM、RF、MKKM、TeSIA預測模型形成的交易策略進行回測比較。

圖6 不同指數策略收益
圖6分別對根據策略投資上證綜合指數、滬深300指數、深證成份指數收益情況進行了展示。如圖6所示,因受2020年3月份新型冠狀病毒疫情影響,同期上證綜合指數下跌1.43%,滬深300指數下跌0.28%,深證成份指數上漲10.29%。本文所提出的方法投資收益率為19.53%、17.32%和25.6%,收益率為最高,收益優于三種指數的整體走勢和其他策略收益。因本文策略中并未考慮股市預測中的做空收益,所以本文策略回測收益與預測指數的走勢密切相關。股市在經歷突如其來的黑天鵝事件(新型冠狀病毒疫情爆發)引起的兩次大幅下跌情況下,通過本文策略起到了止損的重要作用,取得了較好的收益。面對大量的新聞數據,本文所提方法對于股市預測更加準確、迅速,不但有效挖掘突如其來的利空新聞,更是能夠通過日常股市新聞準確提取預測股票走勢的有效信息,與歷史交易數據融合形成有效的股市波動評價體系。
本文提出一種經過優化的圖神經網絡用于股市新聞信息挖掘和異構數據融合。基于開放世界假設,構建股票市場異構圖數據,設立新聞數據的節點、節點特征、邊及邊的權重。根據邊的權重優化卷積模塊注意力機制,利用注意力機制實現股票市場異構數據融合,預測股市價格波動。在實驗驗證中,采用本文方法取得了較好的效果,擴展了圖數據及圖神經網絡在股票市場新聞挖掘和異構數據融合中的應用。本文提出方法提高了股市新聞文本的挖掘效率,但是影響股票走勢因素非常多。在接下來的研究中將考慮增加交易衍生、圖形化指標等數據,嘗試構建、優化圖神經網絡模型,提高模型訓練效率及預測性能,使模型可以應用到股市風險防控及量化投資中,并泛化應用到其他金融產品的走勢預測中。
[1] FAMA E F. Efficient capital markets: a review of theory and empirical work[J]. The Journal of Finance, 1970, 25(2): 383-417.
[2] KAHNEMAN D. Maps of bounded rationality: psychology for behavioral economics[J]. The American Economic Review, 2003, 93(5): 1449-1475.
[3] SHILLER R J. Irrational Exuberance[M]. Revised and Expanded 3rd Ed. Princeton: Princeton University Press, 2016:237-267.
[4] HONG H, KUBIK J D, STEIN J C. Social interaction and stock-market participation[J]. The Journal of Finance, 2004, 59(1): 137-163.
[5] STROHSAL T, WEBER E. Time-varying international stock market interaction and the identification of volatility signals[J]. Journal of Banking and Finance, 2015, 56: 28-36.
[6] OLIVEIRA N, CORTEZ P, AREAL N. The impact of microblogging data for stock market prediction: using Twitter to predict returns, volatility, trading volume and survey sentiment indices[J]. Expert Systems with Applications, 2017, 73: 125-144.
[7] CAKICI N, FABOZZI F J, TAN S. Size, value, and momentum in emerging market stock returns[J]. Emerging Markets Review, 2013, 16: 46-65.
[8] BURTON R F. Why is the body mass index calculated as mass/height2, not as mass/height3?[J]. Annals of Human Biology, 2007, 34(6): 656-663.
[9] TETLOCK P C. Giving content to investor sentiment: the role of media in the stock market[J]. The Journal of Finance, 2007, 62(3): 1139-1168.
[10] BARBER B M, ODEAN T. All that glitters: the effect of attention and news on the buying behavior of individual and institutional investors[J]. The Review of Financial Studies, 2008, 21(2): 785-818.
[11] ATKINS A, NIRANJAN M, GERDING E. Financial news predicts stock market volatility better than close price[J]. The Journal of Finance and Data Science, 2018, 4(2): 120-137.
[12] WEI Y C, LU Y C, CHEN J N, et al. Informativeness of the market news sentiment in the Taiwan stock market[J]. The North American Journal of Economics and Finance, 2017, 39: 158-181.
[13] SIMON H A. Designing organizations for an information-rich world[J]. International Library of Critical Writings in Economics, 1996, 70: 187-202.
[14] CHAN W S. Stock price reaction to news and no-news: drift and reversal after headlines[J]. Journal of Financial Economics, 2003, 70(2): 223-260.
[15] 王曉丹,尚維,汪壽陽. 互聯網新聞媒體報道對我國股市的影響分析[J]. 系統工程理論與實踐, 2019, 39(12):3038-3047.(WANG X D, SHANG W, WANG S Y. The effects of online news on the Chinese stock market[J]. System Engineering — Theory and Practice, 2019, 39(12):3038-3047.)
[16] LIU J, LU Z C, DU W. Combining enterprise knowledge graph and news sentiment analysis for stock price prediction[C/OL]// Proceedings of the 52nd Hawaii International Conference on System Sciences. [2021-07-02].https://scholarspace.manoa.hawaii.edu/bitstream/10125/59565/0125.pdf.
[17] THAKKAR A, CHAUDHARI K. Fusion in stock market prediction: a decade survey on the necessity, recent developments, and potential future directions[J]. Information Fusion, 2021, 65: 95-107.
[18] ZHANG X, ZHANG Y J, WANG S Z, et al. Improving stock market prediction via heterogeneous information fusion[J]. Knowledge-Based Systems, 2018, 143: 236-247.
[19] KIM T, KIM H Y. Forecasting stock prices with a feature fusion LSTM-CNN model using different representations of the same data[J]. PLoS ONE, 2019, 14(2): No.e0212320.
[20] HASSAN M R, NATH B, KIRLEY M. A fusion model of HMM, ANN and GA for stock market forecasting[J]. Expert Systems with Applications, 2007, 33(1): 171-180.
[21] ZHANG Q, YANG L J, ZHOU F. Attention enhanced long short-term memory network with multi-source heterogeneous information fusion: an application to BGI Genomics[J]. Information Sciences, 2021, 553: 305-330.
[22] PATEL J, SHAH S, THAKKAR P, et al. Predicting stock market index using fusion of machine learning techniques[J]. Expert Systems with Applications, 2015, 42(4): 2162-2172.
[23] 李曉寒,賈華丁,程雪,等. 基于改進遺傳算法和圖神經網絡的股市波動預測方法[J/OL]. 計算機應用. (2021-08-17) [2021-08-20].http://kns.cnki.net/kcms/detail/51.1307.TP.20210816.1658.012.html.(LI X H, JIA H D, CHENG X, et al. Stock market fluctuation prediction method based on improved genetic algorithm and graph neural network[J/OL]. Journal of Computer Applications. (2021-08-17) [2021-08-20].http://kns.cnki.net/kcms/detail/51.1307.TP.20210816.1658.012.html.)
[24] KAHNEMAN D, TVERSKY A. On the interpretation of intuitive probability: a reply to Jonathan Cohen[J]. Cognition, 1979, 7(4): 409-411.
[25] LO A W, MacKINLAY A C. Stock market prices do not follow random walks: evidence from a simple specification test[J]. The Review of Financial Studies, 1988, 1(1): 41-66.
[26] TANG H, CHIU K C, XU L. Finite mixture of ARMA-GARCH model for stock price prediction[C/OL]// Proceedings of the 3rd International Workshop on Computational Intelligence in Economics and Finance. [2018-10-10].http://www.cse.cuhk.edu.hk/~lxu/papers/conf-chapters/TangCIEF2003.pdf.
[27] ROJAS I, VALENZUELA O, ROJAS F, et al. Soft-computing techniques and ARMA model for time series prediction[J]. Neurocomputing, 2008, 71(4/5/6): 519-537.
[28] JEGADEESH N, TITMAN S. Returns to buying winners and selling losers: implications for stock market efficiency[J]. The Journal of Finance, 1993, 48(1): 65-91.
[29] FAMA E F, FRENCH K R. The cross-section of expected stock returns[J]. The Journal of Finance, 1992, 47(2):427-465.
[30] FAMA E F, FRENCH F K R. Multifactor explanations of asset pricing anomalies[J]. The Journal of Finance, 1996, 51(1):55-84.
[31] SI J F, MUKHERJEE A, LIU B, et al. Exploiting topic based twitter sentiment for stock prediction[C]// Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers). Stroudsburg, PA: Association for Computational Linguistics, 2013: 24-29.
[32] DING X, ZHANG Y, LIU T, et al. Deep learning for event-driven stock prediction[C]// Proceedings of the 24th International Joint Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2015: 2327-2333.
[33] DING X, ZHANG Y, LIU T, et al. Using structured events to predict stock price movement: an empirical investigation[C]// Proceedings of the Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2014: 1415-1425.
[34] TAN J H, WANG J, RINPRASERTMEECHAI D, et al. A tensor-based eLSTM model to predict stock price using financial news[C/OL]// Proceedings of the 52nd Hawaii International Conference on System Sciences. [2021-07-02].https://scholarspace.manoa.hawaii.edu/bitstream/10125/59606/0166.pdf.
[35] CHAI L, XU H F, LUO Z M, et al. A multi-source heterogeneous data analytic method for future price fluctuation prediction[J]. Neurocomputing, 2020, 418: 11-20.
[36] ZHANG X, LI Y X, WANG S Z, et al. Enhancing stock market prediction with extended coupled hidden Markov model over multi-sourced data[J]. Knowledge and Information Systems, 2019, 61(2): 1071-1090.
[37] KIM R, SO C H, JEONG M, et al. HATS: a hierarchical graph attention network for stock movement prediction[EB/OL]. (2019-11-12) [2021-06-20].https://arxiv.org/pdf/1908.07999.pdf.
[38] LI Q, WANG J, WANG F, et al. The role of social sentiment in stock markets: a view from joint effects of multiple information sources[J]. Multimedia Tools and Applications, 2017, 76(10): 12315-12345.
[39] 呼延康,樊鑫,余樂天,等. 圖神經網絡回歸的人臉超分辨率重建[J]. 軟件學報, 2018, 29(4):914-925.(HUYAN K, FAN X, YU L T, et al. Graph based neural network regression strategy for facial image super-resolution[J]. Journal of Software, 2018, 29(4):914-925.)
[40] KIM K-J, HAN I. Genetic algorithms approach to feature discretization in artificial neural networks for the prediction of stock price index[J]. Expert Systems with Applications, 2000, 19(2): 125-132.
[41] LI Q, JIANG L L, LI P, et al. Tensor-based learning for predicting stock movements[C]// Proceedings of 29th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2015:1784-1790.
[42] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[EB/OL]. (2014-05-21) [2021-06-20].https://arxiv.org/pdf/1312.6203.pdf.
[43] DEFFERRARD M, BRESSON X, VANDERGHEYNST P. Convolutional neural networks on graphs with fast localized spectral filtering[C]// Proceedings of the 30th International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2016: 3844-3852.
[44] KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL]. (2017-02-22) [2021-06-20].https://arxiv.org/pdf/1609.02907.pdf.
[45] LIU Y, ZENG Q G, YANG H R, et al. Stock price movement prediction from financial news with deep learning and knowledge graph embedding[C]// Proceedings of the 2018 Pacific Rim Knowledge Acquisition Workshop, LNCS 11016. Cham: Springer, 2018: 102-113.
[46] MATSUNAGA D, SUZUMURA T, TAKAHASHI T. Exploring graph neural networks for stock market predictions with rolling window analysis[EB/OL]. (2019-11-27) [2021-06-20].https://arxiv.org/pdf/1909.10660.pdf.
[47] HUANG T L. The puzzling media effect in the Chinese stock market[J]. Pacific-Basin Finance Journal, 2018, 49: 129-146.
[48] ARASU A, WIDOM J. Resource sharing in continuous sliding-window aggregates[C]// Proceedings of the 30th International Conference on Very Large Data Bases. [S.l.]: VLDB Endowment, 2004: 336-347.
LI Xiaohan, born in 1985, Ph. D. candidate. His research interests include financial information management, intelligent decision-making, big data, business intelligence.
WANG Jun, born in 1987, Ph. D., associate professor. His research interests include financial technology, financial intelligence.
JIA Huading, born in 1956, Ph. D., professor. His research interests include machine learning, algorithmic trading, spread spectrum sequence design.
XIAO Liu, born in 1986, senior engineer. His research interests include machine learning, big data,social security, economics and finance.
Stock market volatility prediction method based on graph neural network with multi-attention mechanism
LI Xiaohan1*, WANG Jun1, JIA Huading1, XIAO Liu2
(1,,611130,;2,,610063,)
Stock market is an essential element of financial market, therefore, the study on volatility of stock market plays a significant role in taking effective control of financial market risks and improving returns on investment. For this reason, it has attracted widespread attention from both academic circle and related industries. However, there are multiple influencing factors for stock market. Facing the multi-source and heterogeneous information in stock market, it is challenging to find how to mine and fuse multi-source and heterogeneous data of stock market efficiently. To fully explain the influence of different information and information interaction on the price changes in stock market, a graph neural network based on multi-attention mechanism was proposed to predict price fluctuation in stock market. First of all, the relationship dimension was introduced to construct heterogeneous subgraphs for the transaction data and news text of stock market, and multi-attention mechanism was adopted for fusion of the graph data. Then, the graph neural network Gated Recurrent Unit (GRU) was applied to perform graph classification. On this basis, prediction was made for the volatility of three important indexes: Shanghai Composite Index, Shanghai and Shenzhen 300 Index, Shenzhen Component Index. Experimental results show that from the perspective of heterogeneous information characteristics, compared with the transaction data of stock market, the news information of stock market has the lagged influence on stock volatility; from the perspective of heterogeneous information fusion, compared with algorithms such as Support Vector Machine (SVM), Random Forest (RF) and Multiple Kernel-Means (MKKM) clustering, the proposed method has the prediction accuracy improved by 17.88 percentage points, 30.00 percentage points and 38.00 percentage points respectively; at the same time, the quantitative investment simulation was performed according to the model trading strategy.
stock market prediction; multi-attention mechanism; graph neural network; stock market news; graph data
This work is partially supported by Science and Technology Program of Sichuan Province (2020JDJQ0061, 2021YFG0099).
TP391.7; TP18
A
1001-9081(2022)07-2265-09
10.11772/j.issn.1001-9081.2021081487
2021?08?19;
2021?11?30;
2021?12?03。
四川省科技計劃項目(2020JDJQ0061, 2021YFG0099)。
李曉寒(1985—),男,山東濟南人,博士研究生,CCF會員,主要研究方向:金融信息管理、智能決策、大數據、商務智能; 王俊(1987—),男,山東青島人,副教授,博士,CCF會員,主要研究方向:金融科技、金融智能; 賈華丁(1956—),男,四川成都人,教授,博士,CCF高級會員,主要研究方向:機器學習、算法交易、擴頻序列設計; 蕭劉(1986—),男,四川成都人,高級工程師,主要研究方向:機器學習、大數據、社會保障經濟與金融。