榮夢杰
(武漢華夏理工學院 信息工程學院)
2019年2月22日下午,習近平總書記在中共中央政治局第十三次集體學習時指出“防范化解金融風險特別是防止發生系統性金融風險,是金融工作的根本性任務”,因此及時、準確地掌握有效的金融風險信息是金融監管工作的重中之重。隨著大數據時代的到來,金融市場也萌發了新跡象——互聯網金融,互聯網金融在極大地促進金融市場發展的同時,也帶來了新的挑戰,使得金融市場風險形式與傳導機制更加復雜,金融風險呈現復雜的非線性特征。根據以往研究,金融風險測度方法主要可以分為三大類:信號法、綜合評價法和模型法。信號法主要依賴于歷史經驗所得,并不適用于我國。雖然針對金融風險測度的模型已有很多,例如,基于期望損失理論的邊際期望損失(MES)法、系統性期望損失(SES)法、系統性風險度量(SRISK)法等,基于條件在險價值理論的CoVaR和Co-Risk模型,基于Black-Sholes期權定價理論的未定權益分析(CCA)法[1],但這些經典模型都是針對傳統金融市場而言,無法準確刻畫現如今的金融市場。綜合評價法被廣泛用在金融風險測度方面,因為該方法靈活、多變、適應性強,其中權重的確定方法有很多,常用的有等方差權重法[2,3]、主成分分析法[4]、信用加權法[5]等,針對當今金融市場風險特征,這些加權方法已不足以充分刻畫金融風險,因此本文采用能夠進行非線性建模的隨機森林模型來確定權重[6],最終進行綜合評價,力求更加及時、準確地刻畫出金融風險狀況。
隨機森林通過決策樹對樣本進行分類,最早由Leo Breiman和Adele Cutler提出,該分類器通過Bagging算法,隨機抽取樣本,重復構建決策樹,最終給出分類結果,其算法如圖1。

圖1 隨機森林算法流程圖
本文選取三大經濟區域所包含的18個省區市作為研究對象①,觀察時段為2000年到2020年,相應的指標數據來源于各省、市統計年鑒,其中,證券交易額數據來自各省、市的《國民經濟和社會發展統計公報》。為消除量綱的影響,將數據進行標準化處理,并對地區生產總值增長率指標進行倒數正向化處理。
隨著區域金融一體化進程的持續推進,不同區域之間的金融業務往來愈加頻繁,也就意味著區域間的風險連帶效應增強,區域內部金融市場機制與區域外部環境的相互作用、相互制約對本區域的金融市場穩定都起著同等重要的作用。因此,想要準確評價區域金融風險水平就要從多個維度、不同空間進行綜合考慮,不能只考慮金融市場內部環境,外部環境同樣是影響區域金融風險的重要因素[7]。結合我國環渤海、長三角和泛珠三角區域的區域特征,從金融市場內部和外部兩個維度出發,構建的區域金融風險指標體系如表1所示。

表1 區域金融風險指標體系
確定了衡量三大經濟區域金融風險的主要因素以后,需要進一步確定各個因素對區域金融風險的影響程度,進而確定出各個因素的權重。在確定權重之前,需要先量化各個因素對區域金融風險的影響程度。運用Rstudio對原始數據進行整體聚類,發現聚類結果欠佳,觀察發現以2008年為分界點,此節點前后數據波動變化呈現明顯不同,因此以2008年為分割點,將原始數據劃分為兩個部分,進行分段聚類。為獲得每一部分的類別標簽,先運用層次聚類法確定每個部分的最佳聚類數,再進行k-means聚類,最終給出樣本的類別標簽。為確定k-means聚類的結果是否準確,因此需要驗證聚類結果的現實意義,表2列出了2000年-2008年時間段內的頻數統計結果,表中只顯示了各類別中出現頻率較高的地區。

表2 k-means聚類結果統計②
一般而言,地區的金融風險水平與其經濟實力是成正比的,可根據地區的經濟發展狀況初步推斷地區的金融風險水平。從下表2可以看出,分在第二類的北京、廣東、上海等地區為經濟較為發達、金融市場發展較為成熟的地區,分在第三類的河北、安徽、江西等地區為經濟、金融發展相對落后的地區,分在第一類的大部分地區的經濟發展處于中等水平,二分在第二類的地區多為經濟發達區域??梢钥闯?,k-means最終的聚類結果與實際的經濟實力水平相符,確實對各個地區的風險水平進行了有效區分。
將上文中確定的類別標簽作為目標監督值進行隨機森林構建,通過對已知類別的學習過程來確定各個指標的重要性程度。把含有類別標簽的全樣本分為訓練集和測試集,比例為3:1,確定決策樹的合適個數n,進行隨機森林搭建,得到如下圖2、圖3所示的誤差收斂圖.2000-2008年數據段,n在數值200附近誤差開始趨于平緩,因此n取200,2009-2020年數據段,n在數值300附近誤差開始趨于平緩,因此n取300。

圖2 2000-2008年隨機森林過程的誤差收斂圖

圖3 2009-2020年隨機森林過程的誤差收斂圖
為確定各個指標的權重值,構建上述隨機森林模型,輸 出IncNodePurity指 標,IncNodePurity指標越大,指標對目標值越重要,各指標的IncNodePurity值如下表3所示,本文用各個變量在全部變量中的IncNodePurity值占比來表示各指標對于測度金融風險的權重,加權求和計算出區域金融風險。

表3 隨機森林構架過程的IncNodePurity指標
對表3中指標數據進行加權求和,求出三大經濟區域2000年到2020年間的金融風險平均水平,并繪制出各個區域的金融風險演變趨勢折線圖,如圖4所示。

圖4 三大經濟區域金融風險水平演變趨勢
由三大經濟區域金融風險水平演變趨勢圖可以看出,整體來看,2000年到2020年間三大經濟區域金融風險呈現此起彼伏的循環變化趨勢,期間的金融風險波動幅度相近,三大經濟區域風險明顯增大、風險明顯相對穩定的時間區間大致重合,主要由于三大經濟區域的經濟、金融都相對完善、成熟,業務往來較為密切,導致區域之間的風險聯動性更為明顯,促使三大區域的金融市場波動變化同步、風險相依性較強。
2000年到2020年間,2008年的金融危機對我國金融市場產生的影響巨大,本文基于隨機森林模型測度出的三大經濟區域金融風險水平,相較于2000到2020年間的其他年份,確實都在2008年附近產生了較大波動,說明本文的風險測度方法選取較為合適,能刻畫出相對真實的金融市場風險現狀。三大經濟區域的金融風險水平除了受金融危機影響在2008年前后出現幅度較大的異常波動外,其他觀察期內整體的金融風險波動幅度和水平都較為穩定。金融危機過后,自2010年以來,金融風險水平整體在平緩發展中略有下降,整體波動也趨于平緩。
本文以三大經濟區域為研究對象,對2000年到2020年間18個地區的面板數據進行分析,建立隨機森林模型測度出三大經濟區域的金融風險水平,得出以下結論并給出相應建議:
(1)2000-2020年間三大經濟區域金融風險的聯動效應明顯。
金融監管部門可通過區域間的聯動效應整體把握三大經濟區域的金融風險狀況,可通過其中一個區域的風險演變趨勢有效預判其他區域的風險走勢與變化。
(2)自2010年以來,我國金融市場平均風險水平明顯下降,風險波動也趨于平緩。
金融監管部門除持續穩定金融市場的當前狀態外,應有針對性地加強三大經濟區域外部環境穩定性的維護,減少外部環境因素對內部金融市場穩定性的牽制強度與力度,以實現三大經濟區域金融市場內部與外部系統的“良性有效循環”,推動三大經濟區域金融市場穩定、高效運行。
【注釋】
①環渤海區域:北京、天津、河北、遼寧、山東;長三角區域:上海、江蘇、浙江、安徽;泛珠三角區域:廣東、福建、江西、湖南、廣西、海南、四川、貴州、云南。
②括號內為同一地區在同一類中出現的頻數。