陳冰



隨著“滬港通”政策的開通,上海證券交易所和香港證券交易所之間的關系更加緊密。本文主要研究了“滬港通”政策對中國股市風險預警的影響。首先,對股市風險進行劃分;其次,選擇了上證180指數的收盤價、移動平均線、指數平滑異同移動平均線、心理線指標、乖離率、相對強弱指標和人氣指標作為特征變量;最后,運用機器學習方法對中國股市風險進行預測并分析“滬港通”政策對股市風險預警的影響。樣本預測結果表明:“滬港通”政策的開通使得中國股市風險預測更加準確。
一、引言
資本市場開放是一個國家金融發展的重要標志。自20世紀90年代以來,中國資本市場通過股權分置改革等幾項重大改革迅速發展。然而,目前我國資本市場的發展仍落后于發達國家,尤其是資本市場的司法管理體制和市場的對外開放程度。資本市場開放對國內經濟的增長和金融體系的健康發展具有重要意義(Bekaert,2005;Marco,1993)。為了促進資本市場的健康發展,促進國內市場與國際市場的融合,我國在維持原有的合格境外機構投資者制度(QFII)、合格境內機構投資者制度(QDII)和人民幣合格境外機構投資者制度(RQFII)政策的基礎上,證監會在2014年11月17日宣布“滬港通”政策正式實施。“滬港通”政策的開啟使得境外投資者能夠以較低的交易成本直接進入內地股票市場,提升了內地股票市場與國際接軌的程度。因此,“滬港通”在中國股票市場發展的進程中具有里程碑式的意義。
“滬港通”在推進股市發展和經濟進步的同時,也加劇了資本市場的波動風險,并可能誘發金融風險。金融是一個國家重要的核心競爭力,一旦發生金融危機,它不僅阻礙了國民經濟的發展,給國家帶來嚴峻的考驗,而且也會通過風險傳導機制影響其他國家的經濟發展,從而對全球經濟產生影響。例如,Kaminsky等人(1998年)發現1997年的亞洲危機起源于泰國,然后蔓延到其他亞洲國家和地區最終進入美國和歐洲的金融市場。隨著全球經濟一體化,各國經濟相互影響,一個股票市場發生危機事件,不僅給該股票市場帶來沉重的打擊,而且還會導致其他股票市場發生危機事件,從而在全球引發較大的金融危機。因此,很有必要對股票市場進行風險預警研究。通過對股票市場風險進行預警,可以讓相關的部門及時進行調整,較好地應對股票市場的危機事件。因此越來越多的學者和實踐者開始開發風險預警系統,且股票市場在金融市場中具有重要地位,對股市風險預警的研究更加重要。
在風險預警中只要有兩個問題需要解決,即風險度量方法和風險預警模型。國內外有許多學者對風險度量方法進行了研究,如,王鵬和黃旭(2018)使用多分形分析方法把金融市場的風險分為了正常狀態和關注狀態;Sotirios P. Chatzis(2018)把危機事件定義為在每個工作日,如果低于收益率的經驗分布函數的百分之一,則稱之為危機事件;方若男和駱品亮(2020)將違規風險分為嚴重違規和無嚴重違規,被注銷牌照地稱之為嚴重違規,其余稱為無嚴重違規;周成和居里鍇(2020)使用一種綜合風險值量化模型將機械安全風險分為重大風險、較大風險、一般風險和低風險四類;Peiwan Wang(2020)使用SWARCH、雙峰法選擇閾值的方法對股票市場的動蕩進行識別。對于金融市場風險預警模型的問題,王鵬和黃旭(2018)為解決數據不平衡問題,使用Twin-SVM模型對金融市場風險進行預警;Sotirios P. Chatzis(2018)使用了邏輯回歸、決策樹、隨機森林、支持向量機、神經網絡、XGBoost、深度學習前饋網絡和結合方法分別對一天和二十天的金融市場風險進行預警;方若男和駱品亮(2020)使用隨機森林模型對第三方支付違規風險進行預警;Peiwan Wang(2020)使用LSTM方法對股票市場的動蕩進行預警。
根據上述研究,研究“滬港通”對中國股市風險預警的影響具有重要意義。本文的其余部分組織如下:第二節描述了股票市場風險識別的方法以及風險預警模型;第三節為本文的實證部分;第四節描述了本文的結論。
二、模型
(一)SMOTE
為了避免不平衡數據集對預警結果的影響,本文采用合成過采樣技術 (SMOTE)來平衡數據集。 SMOTE算法的基本思想是通過分析少數類別人工合成新樣本,然后將人工合成的新樣本添加到數據集中,使原始數據中的類平衡。
(二)股市風險預警模型
1.DT。決策樹是在已知情況下發生概率的基礎上,通過構成決策樹來求取凈現值的期望值大于等于零的概率,評價項目風險,判斷其可行性的決策分析方法。決策樹是一種監督學習的方法,所謂監督學習就是給定一堆樣本,每個樣本都有一組屬性和一個類別,這些類別是事先確定的,那么通過學習得到一個分類器,這個分類器能夠對新出現的對象給出正確的分類。
2. XGBoost。XGBoost是一種基于樹的提升技術。與決策樹算法相比,XGBoost算法創新地利用了二階導數信息損失函數,使 XGBoost 算法收斂更快,確保更高的求解效率,并且增加了可擴展性。 XGBoost 算法的另一個優點是它使用列采樣參考隨機森林算法的方法,進一步減少計算量配件。目前,XGBoost算法被廣泛使用的原因不僅是訓練好的模型性能好,速度快,可以進行一些大規模的數據計算,其還能夠解決分類問題,有效處理分類難題。
三、實證
(一)數據的選擇
在本文中,作者選擇上證180指數作為原始數據,樣本跨度為2013年11月16日至2016年11月17日。通過Wind數據庫得到上證180指數從2012年11月16日到2016年11月17日的開盤價,該段時間上證180指數的開盤價的走勢圖如圖1所示。為了降低上證180指數日收益率序列的異方差性,本文用其對數收益率來描述實際收益率。計算公式對數收益率的計算結果如下所示:
其中是t日股指的收盤價。上證180指數的對數收益率的走勢圖如圖2所示。
為了研究“滬港通”政策對中國股市風險預警的影響,需要對時間進行劃分,考慮到“滬港通”政策正式開通的關鍵時間點,本文將時間劃分為兩個時間段:一是“滬港通”政策執行前期,2012年11月16日至2014年11月16日;二是“滬港通”政策執行期,2014年11月17日至2016年11月17日。
(二)股市風險度量
為了更好地對股市風險進行預警,最重要的是對股市的風險進行度量。股市風險度量的方法有很多,比如收益率方法、CMAX方法等。本文使用收益率方法對股市風險進行度量,即當收益率低于所有收益率的前百分之十時,將其定義為危機事件,標記為1;當收益率高于收益率的前百分之十時,將其定義為無危機事件,標記為0。
(三)特征指標的選擇
特征指標的選擇對股市風險預警具有重要的作用,本文選擇的特征指標主要包括上證180指數的收盤價、移動平均線、指數平滑異同移動平均線、心理線指標、乖離率、相對強弱指標和人氣指標。本文選擇的特征指標變量的解釋如表1所示。
(四)股市風險預警結果及分析
本文首先將上證180指數的收盤價、移動平均線、指數平滑異同移動平均線、心理線指標、乖離率、相對強弱指標、人氣指標以及狀態指標變量整合到一起,進而每個交易日都會有一組相應特征指標變量和狀態指標變量。本文通過收益率的方法對股市風險進行度量,將危機事件標記為1,將無危機事件標記為0,眾所周知,危機事件發生的頻率很小,所以我們的狀態指標變量中大部分為0,即無危機事件,只有少部分為1,即危機事件。因此,本文數據集是一個不平衡的數據集。其次,本文將數據集的70%作為訓練集,30%作為測試集。一個不平衡的數據集會對模型的預測結果產生一定的偏差,并且本研究中,危機事件是我們最關注的,即樣本量較少的類別,因此,使用小類樣本合成過采樣技術(SMOTE)對數據集的訓練集進行平衡。最后,本文再使用決策樹模型和XGBoost模型對股市風險進行預警,進而分析“滬港通”對股市風險預警的影響。
為了更好地分析股市風險預警的結果,本文選擇了一些評價指標對股市風險預警結果進行分析,即準確率、召回率、F1值、ROC曲線和AUC值。混淆矩陣如表2所示。評價指標的計算公式如下:
本文選擇了決策樹模型和XGBoost模型對股市風險進行預警,通過決策樹模型和XGBoost模型的評價指標來分析“滬港通”政策的開通對股市風險預警的影響。“滬港通”政策開通前后的決策樹模型的評價指標如表3所示。通過表3發現,在“滬港通”政策開通前和“滬港通”政策開通后,訓練集的準確率、訓練集的召回率和訓練集的F1值都是1。然而,在測試集中,“滬港通”政策開通前測試集的準確率為0.543,“滬港通”政策開通后測試集的準確率為0.580,即“滬港通”政策開通后決策樹模型的準確率上升了0.037;“滬港通”政策開通前測試集的召回率為0.550,“滬港通”政策開通后測試集的召回率為0.574,即“滬港通”政策開通后決策樹模型的召回率上升了0.024;“滬港通”政策開通前測試集的F1值為0.546,“滬港通”政策開通后測試集的F1值為0.577,即“滬港通”政策開通后決策樹模型的F1值上升了0.031。“滬港通”政策開通前的決策樹模型的ROC曲線如圖3所示,“滬港通”政策開通后的決策樹模型的ROC曲線如圖4所示。通過對比圖3和圖4發現,“滬港通”政策開通前的ROC曲線明顯低于“滬港通”政策開通后的ROC曲線,并且“滬港通”政策開通前的ROC曲線的AUC值為0.55,“滬港通”政策開通后的ROC曲線的AUC值為0.57,即“滬港通”政策開通后的決策樹模型的ROC曲線的AUC值上升了0.02。綜上所述,從決策樹模型對股市風險預警的評價指標結果可以得出“滬港通”政策的開通對股市風險預警具有一定的積極作用,即相對于“滬港通”政策開通前,“滬港通”政策開通后,股市風險可以較為準確的被預測出來,從而使得相應的部門采取及時的防范措施,減少股市發生危機所造成的損失。
“滬港通”政策開通前后的XGBoost模型的評價指標如表4所示。通過表4可以發現,“滬港通”政策開通前訓練集的準確率為0.962,“滬港通”政策開通后訓練集的準確率為0.927,即“滬港通”政策開通后訓練集的準確率下降了0.035;“滬港通”政策開通前訓練集的召回率為0.959,“滬港通”政策開通后訓練集的召回率為0.927,即“滬港通”政策開通后訓練集的召回率下降了0.032;“滬港通”政策開通前訓練集的F1值為0.959,“滬港通”政策開通后訓練集的F1值為0.927,即“滬港通”政策開通后訓練集的F1值下降了0.032,“滬港通”政策開通后XGBoost模型訓練集的準確率、召回率和F1值都有所下降。然而,對于XGBoost模型的測試集,“滬港通”政策開通前測試集的準確率為0.551,“滬港通”政策開通后測試集的準確率為0.605,即“滬港通”政策開通后XGBoost模型的測試集的準確率上升了0.054;“滬港通”政策開通前測試集的召回率為0.643,“滬港通”政策開通后測試集的召回率為0.630,即“滬港通”政策開通后XGBoost模型的召回率下降了0.013;“滬港通”政策開通前測試集的F1值為0.545,“滬港通”政策開通后測試集的F1值為0.613,即“滬港通”政策開通后XGBoost模型的F1值上升了0.068。“滬港通”政策開通前XGBoost模型的測試集的ROC曲線如圖5所示,“滬港通”政策開通后XGBoost模型的測試集的ROC曲線如圖6所示。通過對比圖5和圖6發現,“滬港通”政策開通前的ROC曲線明顯低于“滬港通”政策開通后的ROC曲線,并且“滬港通”政策開通前的ROC曲線的AUC值為0.69,“滬港通”政策開通后的ROC曲線的AUC值為0.74,即“滬港通”政策開通后的決策樹模型ROC曲線的AUC值上升了0.05。綜上所述,從XGBoost模型對股市風險預警的評價指標結果可以得出“滬港通”政策的開通對股市風險預警具有一定的積極作用。
通過對比表3和表4發現,雖然XGBoost模型訓練集的評價指標比決策樹模型訓練集的評價指標低,但是在測試集中XGBoost模型比決策樹模型的評價指標略高一點。另外,通過對比圖3、圖4、圖5和圖6發現XGBoost模型ROC曲線的AUC值比決策樹模型的ROC曲線的AUC值高,因此,XGBoost模型相對于決策樹模型具有較好的預測性能。
四、結論
本文以上證180指數作為研究對象,使用決策樹模型和XGBoost模型分別對“滬港通”政策開通前和“滬港通”政策開通后的股市風險進行預警。通過對評價指標的分析可得出以下結論:“滬港通”政策的開通對股市風險預警具有一定的積極作用,可以更好地預測出危機事件,從而使得相關部門采取應對措施降低危機事件帶來的損失;XGBoost模型相對于決策樹模型具有較好的預警性能。
參考文獻:
[1] BekaertG ,Harvey CR ,LundbladC.Does financial
liberalization spur growth. 2005:3-55.
[2] Marco, Pagano. Financial markets and growth: An overview[J]. European Economic Review,1993:613-622.
[3]Kaminsky, Graciela, Lizondo,等. Leading indicators of currency crises.[J]. IMF Staff Papers, 1998.
[4]王鵬,黃迅.基于Twin-SVM的多分形金融市場風險的智能預警研究[J].統計研究,2018,35(02):3-13.DOI:10.19343/j.cnki.11-1302/c.2018.02.001.
[5] Chatzis S P ,Siakoulis V ,Petropoulos A , et al. Forecasting stock market crisis events using deep and statistical machine learning techniques[J]. Expert Systems with Applications, 2018,112(DEC.):353-371.
[6]方若男,駱品亮.基于隨機森林的第三方支付違規風險預警研究[J].技術經濟,2020,39(09):11-21.
[7]周成,居里鍇.面向機械安全風險預警的評估方法[J].中國安全科學學報,2020,30(08):86-92.DOI:10.16265/j.cnki.issn1003-3033.2020.08.013.
[8] Wang P , Zong L ,Ma Y . An Integrated Early Warning System for Stock Market Turbulence[J]. Expert Systems with Applications, 2020, 153:113463.
[9]林宇,黃迅,淳偉德,黃登仕.基于ODR-ADASYN-SVM的極端金融風險預警研究[J].管理科學學報,2016,19(05):87-101.
[10]胡毅,王玨,楊曉光.基于面板Logit模型的銀行客戶貸款違約風險預警研究[J].系統工程理論與實踐,2015,35(07):1752-1759.
[11]張奇,胡藍藝,王玨.基于Logit與SVM的銀行業信用風險預警模型研究[J].系統工程理論與實踐,2015,35(07):1784-1790.
課題項目:首都經濟貿易大學2022年研究生科技創新項目。
作者單位:首都經濟貿易大學管理工程學院,碩士。