吳英麗



[摘 要] 國際實踐表明,系統性金融風險不僅危及金融穩定,更會給宏觀經濟和社會財富造成重大損失。我國正處于轉軌階段,考慮到在國際金融危機帶來的外部風險輸入和我國轉軌階段自身的結構性和周期性問題雙重刺激的背景下,我國實體經濟與金融體系面臨的風險正在逐步增大并逐步顯現。如果我們能對股票市場的風險進行識別,然后采取相應的措施,就可能降低危機發生的可能性和它帶來的損失。構建能夠監控股市相關風險、及時準確評估系統性金融風險的預警模型已成為一項重要而緊迫的任務。文章根據國內外最新研究和實踐,從五個層面考察了導致股市風險的風險因素,并利用Python構建機器學習模型,對中國股市的風險識別和預警進行了實證研究。
[關鍵詞] 股票市場;風險因素;機器學習模型;風險預警
中圖分類號: D262? ? ? ? ? 文獻標識碼:A? ? ? ? ? ?文章編號:1674-1722(2021)21-0025-03
全球經濟金融一體化使全球金融市場的大環境變得更靈活、更多樣,同樣也使各國金融市場相互間越來越緊密地聯系在了一起,從而使金融風險的傳染性更強、波及面更廣、影響更深。通過對金融危機的研究和分析,可以發現股票市場是金融風險傳遞的一個重要媒介[1]。
從理論上講,股市的變化應該同步于宏觀經濟變化,但實際上并非如此,股票交易往往能顯示出人們對未來經濟發展的預期,所以股價的變化往往發生在實體經濟發展變化之前。由此可見,如果我們可以事先預測并掌握未來經濟的大致走勢,并采取有效的措施,就可以降低金融危機發生的可能性和它帶來的損失。中國股票市場已經發展了30多年,也經歷了艱難曲折的過程,現在的整個行業環境已經發生了翻天覆地的變化,識別股市系統性風險也顯得尤為重要。
股市系統性風險是危及金融體系和實體經濟的一種重要風險[2]。股市系統性金融風險的概念早已有之,系統性風險的概念最初與銀行擠兌和貨幣危機聯系在一起。2008年,全球金融危機使系統性風險再次成為學界關注的熱點。2008年全球金融危機是由美國房地產泡沫和金融衍生工具杠桿所引發的次貸危機,波及全球,規模空前。與傳統次貸危機不同,此次危機將銀行、房地產行業、保險公司、對沖基金和消費者等社會經濟主體連成了一個經濟利益共同體,共同承擔風險因素,使次貸危機迅速演化成全球金融危機,這也是全球經濟金融一體化帶來的不利的一面。此次危機不僅在產業之間相互危害,還在國與國之間傳染。2008年的次貸危機所引起的國際范圍的金融危機迅速地從美國蔓延到世界各地,我國的股票市場也深受其影響,以至于長期處于低迷狀態。美國次貸危機事件的發生,警告了全世界金融體的監管問題,必須結合實際情況加強對金融監管體制,才能避免這一類實踐的發生[3]。
近年來,國際經濟金融形勢的不確定性顯著增加,在危機持續影響和經濟面臨嚴峻挑戰的背景下,防控金融風險、保障金融安全應當受到長期重視。2017年,我國中央經濟工作會議明確指出,要高度重視金融風險的防控,提高和完善監管能力,避免系統性金融風險的發生。黨的十九大報告也強調,要改革金融體制,完善金融監管體系,守住不發生系統性金融風險的底線。因此,識別金融風險信號,對防范化解金融風險有重要意義。
在以往的研究中,預警模型普遍用到的是logit-probit模型。由于它是一種線性模型,對于現實生活中的很多非線性問題,它是不能解釋的[5]。所以文章選取機器學習模型作為預警模型,選擇LSTM模型進行預警研究。
一、相關模型與方法
文章構建基于LSTM模型的股市危機預警模型檢驗投資者情緒和宏觀經濟對為期半年內股票市場,并采用CMAX法進行危機事件識別。
(一)危機識別
股市危機,是指股票市場的指數突然發生大幅度下降。首先計算下降指數,當下降指數小于時,則判定當期為危機時刻。再選出此階段初始值為1的時刻,然后將其前118天對應的時期的因變量I設置為1,其余為0。
(二)LSTM網絡
LSTM網絡屬于遞歸神經網絡(RNNs)家族,旨在學習長期和短期依賴關系,主要是為了解決長序列訓練過程中的梯度消失和梯度爆炸問題。簡單來說,就是相比普通的RNN,LSTM能夠在更長的序列中有更好的表現。LSTM網絡作為一種深度學習模型,目前廣泛應用于金融領域。
LSTM網絡通過隱藏的狀態向量保持了對任意長度序列數據的低處理能力,同時通過引入所謂的存儲單元增強了長距離依賴的學習能力。
LSTM網絡內部主要有三個階段,如圖1所示。
1.忘記階段。這個階段主要是對上一個節點傳進來的輸入進行選擇性忘記。具體來說是將計算得到的Zf作為忘記門控,來控制上一個狀態的Ct-1哪些需要留、哪些需要忘。
2.選擇記憶階段。這個階段將這個階段的輸入有選擇性地進行“記憶”,主要是對輸入的Xt進行選擇記憶。當前的輸入內容由前面計算得到的Z表示。而選擇的門控信號則是由Zi來進行控制。
將上面兩步得到的結果相加,即可得到傳輸給下一個狀態的Ct。3.輸出階段。這個階段將決定哪些將會被當成當前狀態的輸出,主要是通過Z0來進行控制的。并且還要對上一階段得到的C0進行放縮(通過一個tanh激活函數進行變化)。對于LSTM網絡的每一個結構,新的候補狀態Z與LSTM的三個階段,也稱三個門:遺忘門Zf、更新門Zi和輸出門Zo的關系如下。
二、數據的選取
文章通過對股票市場內部指標、宏觀經濟指標、投資者行為指標、大宗商品指標和國外市場股票市場指標的分析,共選取了15個預警指標進行建模。最終,市盈率作為代理股票市場內部的指標;M2同比增長率作為宏觀經濟的代理指標;消費者滿意指數作為投資者行為指標體系指標;代理指標作為大宗商品選擇原油價格指標;標普500作為國外股票市場指數指標。以上指標的相關數據都從wind數據庫獲取,如表1所示。
三、實證分析
首先,我們進行危機識別。分析判斷2011年到2020年間發生了兩次股市危機。一次是2015年6月,另一次是2018年2月,如圖2所示。

接下來,我們進行模型預測分析。將2011年1月4日到2020年1月23日的數據按照8∶2的比例切分為訓練集和測試集。先用訓練集訓練初始的LSTM模型,從而得到最優參數,然后再用測試集驗證模型的準確性。我們所使用的評估模型準確性的指標包括:召回率、準確率、F-1分數和ROC曲線。ROC曲線如圖3所示。召回率、準確率、F1分數如表2所示。

根據模型的預測結果可以看出來,我們選取的預警指標讓機器學習模型的準確率達到了97%,是一個較高的準確率,這將為我們投資人提供一個較為準確的結構。
四、結語
文章從多方面選取股市危機預警指標,通過指標篩選最終確定了每個市場有效的代理指標。在選擇預警模型時,我們通過調研發現機器學習比統計學模型更具有預警意義。因為機器學習模型更能反映非線性的問題。通過實證我們也可以看出,首先用CMAX方法進行危機識別是非常準確的,它準確識別出了2015年的中國股市動蕩危機和2018年由中美貿易戰所引發的股市危機,具有很強的識別性能。接下來又從五個市場中選取最具有代表性的代理預警指標放入到機器學習中進行預測,最后發現LSTM的預警效果非常好,準確率已經達到97%。可為今后的投資者提供了一個較為準確的預警體系。
參考文獻:
[1] 楊翰方,王祎帆,王有鑫.中國輸入性金融風險:測算、影響因素與來源[J].數量經濟技術經濟研究,2020,37(07):113-133.
[2] 宮曉莉,熊熊,張維.我國金融機構系統性風險度量與外溢效應研究[J].管理世界,2020,36(08):65-83.
[3] 郭峰 . 兩次“危機”對經濟金融的影響 [J]. 中國金融,2020(21):87-89.
[4]唐旭,張偉. 論建立中國金融危機預警系統[J].經濟學動態,2002(06):7-12.
[5]陶玲,朱迎.系統性金融風險的監測和度量——基于中國金融體系的研究[J].金融研究,2016(06):18-36.