999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學習解構區域金融風險防控研究進展

2022-09-15 10:27:26張立華張順順
計算機與生活 2022年9期
關鍵詞:金融方法模型

張立華,張順順

1.溫州商學院 金融貿易學院,浙江 溫州 325000

2.倫敦大學國王學院 國王商學院,倫敦WC2B 4BG

在大數據、云計算、元宇宙、人工智能等新技術革命的推動下,機器學習(machine learning,ML)誕生了自然語言處理(natural language processing,NLP)、計算機視覺(computer vision)和機器人(robotics)技術發展的一座座里程碑。伴隨著海量數據的挖掘過程,區域金融風險防控面臨著數據稀疏性和復雜性的挑戰。區域金融風險的量化和防控非常重要。當金融機構愈來愈強大和業務更加綜合,準確量化和減輕風險的綜合統計模型變得比過往任何時候更加復雜多變。當需要準確評估大金融機構的投資組合風險敞口,運用傳統的統計或模擬方法將變得越來越無所適從。為克服傳統方法的缺陷不足,研究者開始關注ML 方法在應對區域金融風險防控中的應用。

理論學術界相關的研究工作已經逐漸展開,不斷研發的ML 防控區域金融風險研究方法主要表現為兩方面:一是,從傳統金融風險管控ML 視角看,2016 年Cavalcante 等人介紹了2009—2015 年的主要研究文獻,綜述了計算智能方法的金融市場動態預測,全文著重于金融數據的預處理和聚類、未來市場走勢的預測、金融文本信息挖掘技術等。隨后,De Spiegeleer 等人描述了傳統高斯回歸的加速多個數量級的機器學習技術,擬合了復雜的希臘值風險并總結了隱含波動率,減少了模型的普通期權價值測算、美式期權定價和超越Black-Scholes 模型奇異期權定價的計算次數。2020 年Mashrur 等人介紹了一個傳統金融風險管理ML 分類法,詳述了其過去十年中的重要出版文獻,梳理了研究人員面臨的主要困惑,指出了傳統金融風險管理機器學習的未來研究方向。二是,從金融系統風險管控ML 視角看,Helbing強調了當今全球網絡具有廣泛且相互依存的系統,當網絡世界的復雜性和交互作用增加時,這些系統可能對社會造成嚴重的破壞。之后,2019 年Kuo對現有的利用大數據分析、網絡分析和情感分析等ML技術評估衡量金融系統風險的研究方法進行了綜述,梳理了當前金融系統風險ML 的研究方法和未來工作方向。2020年Giudici等人描述了多元網絡結構的關聯網絡模型(correlation network models,CNM),注重系統風險、間接風險敞口,將其關聯于直接風險敞口,捕捉和度量金融網絡中的系統風險。RFRP(regional financial risks prevention)防控模擬的優化路徑如圖1 所示,ML 模型求解過程是對傳統統計計量方法的一種優化策略。

圖1 RFRP 防控模擬的優化路徑Fig.1 Optimal path to simulate RFRP prevention

綜合來看,以往研究文獻分別關注傳統金融風險管理或者金融系統風險管控,然而,缺乏對區域金融風險管控的科學化分類法和區域金融風險管控框架中優化ML 方法。本文的研究擴展有以下幾個方面:首先提出了區域金融風險防控的科學分類,在ML 的簡要概述上描述了ML 的關聯性,這有助于研究者在復雜多變的區域金融風險領域中確定正確的研究方向;其次綜述了傳統金融風險防控ML 的主要方法和技術,并基于不同的方法和技術,梳理了傳統金融風險防控ML 的國內外研究進展,揭示了傳統金融風險防控ML 應用的實踐路徑;再次梳理了區域金融系統風險防控ML 的主要模型和技術,著重于金融系統風險防控ML 的最新進展,以便駕馭ML 目前在區域金融系統風險防控領域中的研究方向和重點領域;最后對區域金融風險防控機器學習新興方向和前景技術進行了展望,希望有助于國內外研究者和從業者,進一步研發出更適合的ML 方法與技術,有效應對區域金融風險。

1 區域金融風險防控和機器學習簡要概述

區域金融風險無論在管理區域TFR 還是堅守不發生區域FSR 中都要進行識別、評測和預防,但以往文獻對區域金融風險存在著模糊不全面的理解和應用,其中涉及“地區”和“區域”這對詞語。查證調研了該對詞語歷史發展過程,發現“地區”與“區域”的內涵是基本一致的。本文認為區域金融風險一般呈現出五種表現形式:(1)跨國層面的金融風險;(2)國內層面的金融風險;(3)跨省層面的金融風險;(4)省內層面的金融風險;(5)跨市層面的金融風險。本文將區域金融風險分為區域傳統金融風險和區域金融系統風險兩大類型。這種金融風險分類視角不同于傳統的風險劃分方法,既有助于機器學習模擬區域傳統金融風險,也有利于機器學習量化區域金融系統風險。

1.1 金融風險簡單概述與分類

金融行業的繁榮發展伴隨著承擔、預防和化解金融風險。金融事件可能造成不利的金融市場波動、貸款違約、金融機構倒閉、欺詐活動、客戶損失。根據金融風險因素的來源,本文拓展了2017年Silva等人研究脈絡,在傳統的金融信用風險、市場風險、操作風險、保險風險基礎上,引入“系統風險(systemic risk)”。

(1)信用風險是指債權人履行貸款違約或破產合同義務能力的不確定性。信用風險主要呈現為零售貸方風險和企業貸方風險。

(2)市場風險是指高度流動性的金融市場風險敞口導致公司標的資產、債務或收入價值的不確定性。市場風險主要表現為利率風險、匯率風險、大宗商品價格風險等。

(3)操作風險是指金融業務操作的不可預測性致使虧損風險或錯誤欺詐行為造成績效損失。操作風險一般可分為業務風險和事件風險。業務風險表現為經營業績的不確定性,事件風險呈現出業務操作產生不利影響事件的不確定性。

(4)保險是一種保險人事先約定,承諾在一定時期內發生意外事故并造成損失的情況下,對被保險人進行賠償或提供保險服務的金融系統,也是一種應對風險的方法。保險風險主要特征表現在保險損失或死亡事件中的不確定性。

(5)系統風險是指由金融機構崩潰等影響的廣泛事件引發的金融系統嚴重衰退的概率,事件對金融市場以及整個經濟帶來負面沖擊。

圖2 匯總了不同來源的金融風險種類及范圍,有助于及時運用各種區域金融風險防控策略測度和化解金融復雜體系的風險。這種新的分類視角有助于對區域金融風險開展重點研究和應對未來金融系統所面臨的風險挑戰。

圖2 金融風險分類Fig.2 Taxonomy of financial risks

1.2 機器學習簡單概述

機器學習是一種利用以往數據或經驗提高績效或準確預測的計算機算法,其學習具有優化損失或回報函數的性能。基于學習方式的機器學習主要分類為:

(1)監督學習(supervised learning,SL)

SL 又稱為有導師學習,是利用標簽(labelled)的樣本數據進行訓練,其算法中訓練模型可用于對未標簽(unlabelled)的數據做出預測。監督學習主要包括回歸和分類。圖3 給出了SL 的流程框架。

圖3 監督學習的流程框架Fig.3 Progress framework of supervised learning

(2)無監督學習(unsupervised learning,UL)

UL也稱為無導師學習,是指利用沒有被標簽的數據探測模式識別的機器學習任務。該算法中沒有可用的標簽數據。無監督學習算法旨在解決未標簽數據的聚類(clustering)、異常檢測(anomaly detection)、降維(dimensionality reduction)等特定問題。從圖4 可以理解UL 的決策系統。

圖4 無監督學習的流程框架Fig.4 Progress framework of unsupervised learning

(3)半監督學習(semi-supervised learning,SSL)

SSL在實際應用中很常見,其利用大量的未標簽數據以及標簽數據進行模式識別研究。SSL 的具體流程框架如圖5 所示。從學習算法看,SSL 可以分類為生成模型(generative models)、自訓練算法(selftraining)、協同訓練算法(co-training)、半監督支持向量機(semi-supervised supported vector machines,S3VM)、圖論算法(graph-based algorithms)。

圖5 半監督學習的流程框架Fig.5 Progress framework of semi-supervised learning

(4)強化學習(reinforcement learning,RL)

RL 是指不確定性下實現在環境交互過程中最大化回報或完成特定目標的序列決策。強化學習方法主要包括時序差分學習(temporal-difference learning,TD)、狀態-動作-回報-狀態-動作(state action reward state action,SARSA)算法、異步優勢行動者評價者算法(asynchronous advantage actor-critic,A3C)、深度Q網絡(deep Q-network,DQN)、深度確定性策略梯度(deep deterministic policy gradient,DDPG)等。圖6表明智能體與環境的交互過程是一個試錯策略,以最大化獎勵累計值。

圖6 強化學習的流程框架Fig.6 Progress framework of reinforcement learning

(5)深度學習(deep learning,DL)

深度學習是一種提取特征的多層表示的、擬合特征到標簽的層級轉換的非線性復合函數的機器學習形式。這種學習方法非常適合復雜非線性數據相互作用的識別模式。隨后,深度學習方法發展了卷積神經網絡(convolutional neural network,CNN)、循環神經網絡(recurrent neural networks,RNN)、長短期記憶網絡(long short-term memory,LSTM)。近年,出現了一種融合深度學習和強化學習用于金融市場動態環境中做出決策的深度強化學習。

例如代表性RNN 模型是將輸入序列映射到輸出序列的非線性動態系統。如圖7 顯示右側是左側遞歸表示的展開表示,其中遞歸關系表達式如下:

隨時間反向傳播算法(backpropagation through time)可以直接應用于圖7 右側展開網絡的計算圖,以計算所有狀態s和所有參數的總偏差導數。

圖7 循環神經網絡框架Fig.7 Progress framework of RNN

目前流行的LSTM解決了RNN 無法處理長距離依賴的問題,改進了網絡間的梯度流。

2 傳統金融風險防控機器學習方法分析

20 世紀80 年代以來,隨著區域經濟一體化和金融國際化的發展,區域金融風險對區域金融穩定帶來挑戰。從1988 年起,巴塞爾銀行業監管委員會(Basel Committee on Banking Supervision,BCBS)先后發布了巴塞爾協議I(Basel I)和巴塞爾協議Ⅱ(Basel II),Basel I、Basel Ⅱ都著重于銀行不同資產的風險差異。借鑒Basel I、Basel Ⅱ對銀行風險的劃分,區域傳統金融風險防控機器學習方法的系統性分類具體模型如圖8 所示。本章分類框架綜合分列了利用機器學習模擬區域傳統金融風險中的信用風險、市場風險、操作風險、保險風險等方法與技術。

圖8 區域金融風險防控機器學習方法分類框架Fig.8 Taxonomy framework of machine learning for regional financial risks prevention

鑒于以上綜述的TFR 防控不同ML 方法,表1 分析了各類ML 方法的優點、局限和傳統場景等。

表1 TFR 防控的不同ML 方法比較Table 1 Comparison of ML methods for TFR prevention

2.1 信用風險模擬方法

信用風險(credit risk)定義為借款人履行義務的不確定性。這包括個人貸款違約或公司破產。信用風險防控著重于信用評分和破產預測。信用評分(credit scoring)系指個人貸款的風險敞口,而破產預測是指企業借款的風險度量。從統計建模來看,破產預測和信用評分用于建模的解釋變量不盡相同。前者的解釋變量關注于公司資產負債表或損益表等的主要財務比率;而零售信用評分模型(retail credit scoring)的預測變量使用貸款申請人的財務和人口統計信息。

近20 年以來,機器學習預測個人或企業違約的文獻不斷增長。其中用于信用風險評估分為兩類:

(1)監督學習預測信用風險

兩個最常用的預測破產或信用評分的分類器(classifiers)是支持向量機(support vector machines,SVM)和神經網絡(neural network,NN)。Kim 等人描述了一種多類SVM。新的選擇特征方法改進了這些模型的有效性。與此同時,集成學習(ensemble learning)和混合模型(hybrid models)也被廣泛應用。

Ghodselahi和Hu等人對自助聚合(Bagging)、提升法(Boosting)、堆疊法(stacking)等集成學習方法進行了綜述。Wang 等人描述的支持向量機提高了集成模型的預測性能。隨后,Ampountolas 等人和Harding 等人指出隨機森林算法(random forest)優于其他單一或混合分類器模型。

(2)無監督學習模擬信用風險

聚類方法(clustering methods)適用于識別破產或信用違約風險,這些方法有助于識別申請組合貸款的個人或企業。Lim 等人分析了聚類動態評分模型(cluster-based dynamic scoring model),并指出可以通過聚類的不同分類器獲取更高的評分精度。Kou等人綜述比較了研究文獻的不同聚類方法。

Kim等人提出了一種解決信用評級的多類SVM新方法。之后文獻[22]通過決策樹和AdaBoosed 決策樹解決財務預警問題。文獻[23-28]通過引入自助聚合、提升法、堆疊法、支持向量機、隨機森林或通過神經網絡、分類與回歸、梯度提升法,或引入自助聚合支持向量機、自助聚合隨機森林等集成算法,進行特征選擇,改進了信用風險建模,提升了風險預測準確率問題。與此同時,文獻[29-30]通過數據分割或聚類選擇,提出了無監督學習的行為評分或驗證了多準則決策的有效性。針對信用風險ML 算法選擇特征、性能績效、數據規模等問題,表2 分析了信用風險預測模型方法的局限性。

表2 信用風險預測方法的局限性Table 2 Limitation of credit risk model

2.2 市場風險模擬方法

正如Shiller所言,市場風險的主要測度是運用資產收益標準差衡量資產波動率。為了使市場風險最小化同時收益最大化,機器學習可采用動態資產配置系統。最優投資組合的機器學習模型主要有兩大類型:機器學習預測波動率和機器學習優化投資組合。

波動率(volatility)被定義為未來金融市場資產價格的不確定性。較高波動率呈現出較高市場風險。市場風險防控的波動率機器學習的典型方法有:

(1)傳統統計方法改進

20 多年以來,Luong 等人證明了混合機器學習(hybrid machine learning)技術可以改進傳統GARCH模型和隨機方法的性能。人工神經網絡(artificial neural networks,ANN)可與GARCH 模型和隨機波動率模型融合,做出更準確的波動率預測。利用GARCH模型輸出作為多層感知機(multi-layer perceptron)模型的輸入,不僅可使模型預測更加準確,而且對于不同的窗口大小(window sizes)、堆疊模型(stacked model)呈現出更好的穩健性和一致性。與此同時,Park 等人研究發現了機器學習模型,特別是支持向量回歸(support vector regression)、高斯過程回歸(Gaussian process regression)和神經網絡模型可完全取代傳統的參數模型。Luo 等人分析了循環神經網絡與隨機波動率模型(stochastic volatility models)相融合可以顯著提升模型的預測能力。

(2)神經網絡序列方法

Hochreiter 等人指出了長短期記憶網絡模型是序列分析的循環神經網絡流行變體,長短期記憶網絡模型被應用于預測波動率。最近,Ramos-Pérez 等人基于隨機森林、支持向量、人工神經網絡建立了混合人工神經網絡,其呈現的預測績效可靠性更高。

(3)市場文本數據方法

傳統方法沒有將金融、經濟、流行病新聞等非結構化(unstructured)文本數據(textual data)用于預測波動率。Groth 等人總結了股票交易量和價格等結構化數據不僅用于機器學習預測投資組合波動率,而且文本數據也可作為市場波動率的重要解釋變量(predictors)。從歷史上看,金融市場文本數據有著不同的來源:一方面,來自資產波動輿論的公開討論區(public discussion boards)。Antweiler 等人早先討論了樸素貝葉斯(naive Bayes)算法根據公開討論區留言準確預測交易量和波動率。之后,Nizer等人研究了公司新聞可作為標的資產波動率短期預測的關鍵解釋變量指標。隨后,Manela 等人分析了支持向量回歸可將新聞隱含波動率以及市場崩盤等引發的不確定性作為有效解釋變量預測收益的波動率。另一方面,Oliveira 等人指出了有部分文本挖掘(text-mining)預測需要使用Twitter 微博等社交媒體上的數據。此后,Xu 等人分析了“谷歌趨勢”(Google trends)可作為股票市場預測波動率的有效指標。近來,自然語言處理(NLP)技術不斷用于提高金融預測性能。Xu 等人指出新聞文章、微博等非結構化文本數據可包含金融決策的重要信息。

投資組合優化(portfolio optimization)是指一組特定金融合約權重的預期收益最大化或金融風險最小化資產配置過程。許多機器學習方法技術有助于構建波動率最小的投資組合。

(1)監督學習優化投資組合

Papadimitriou等人描述了支持向量預測S&P500股指極端變動的非線性關系。Ban 等人使用了新正則化(regularization)或交叉驗證(cross-validation)技術,進一步提升了監督學習模型的性能。Pinelis 等人發現了隨機森林模型優于傳統的投資組合選擇模型。

(2)在線學習優化投資組合

Li 等人分析了金融市場均值回復(mean reversion)假設下找到最優投資組合權重的在線投資組合選擇策略(online portfolio selection strategy)。隨后,Li 等人對使用投資組合選擇的不同在線學習方法進行了文獻綜述。

(3)強化學習優化投資組合

Jiang 等人總結了強化學習方法可運用卷積神經網絡(CNN)、循環神經網絡(RNN)和長短期記憶網絡(LSTM)達到策略優化。同時,Almahdi 等人分析了循環強化學習方法(recurrent reinforcement learning,RRL),在產生市場買賣信號的同時,并基于下行風險調整目標函數(downside risk-adjusted objective function)獲得最優資產配置權重。

Luong等人提出了一種基于隨機森林與GARCH模型隨機融合的解決波動率預測的新方法。針對GARCH 方法中參數建模的路徑依賴問題,文獻[33-34]基于支持向量機、深度循環神經網絡,分別提升了傳統計量模型的預測性能,實現了基于實際場景優化預測。文獻[35-36]針對金融時間序列問題,闡述了基于長短期記憶網絡或混合人工神經網絡的波動率預測方法。文獻[39-40]從新聞文本數據測度了市場的隱含波動率,提高了市場風險的預測效應。表3給出了針對波動率預測的文獻模型的局限性。

表3 預測波動率方法的局限性Table 3 Limitation of volatility prediction models

Papadimitriou 等人提出了一種基于支持向量機預測指數組合收益與風險的非線性新方法。文獻[45-46]通過績效正則化與交叉驗證技術、隨機森林與彈性網絡等監督學習技術,預測了資產組合的收益和波動風險問題;文獻[47-48]基于被動均值回歸,設計了最小損失函數的新權重,優化在線學習投資組合;文獻[49-50]提出的深度強化學習、循環強化學習框架,優化了傳統機器學習方法,獲得資產組合的優化配置。針對投資組合優化的文獻算法,表4 解釋了相關投資組合預測文獻模型的局限性。

表4 優化投資組合的局限性Table 4 Limitation of portfolio optimization

2.3 操作風險模擬方法

金融欺詐活動是金融機構操作風險的主要來源之一。Ngai等人描述了金融欺詐檢測系統的機器學習算法,區分了欺詐性金融數據與大數據。金融欺詐活動包括欺詐性信用卡交易和洗錢、欺詐性保險索賠、證券和大宗商品欺詐。這類操作風險防控機器學習算法可以分為監督學習方法和無監督學習方法:

(1)監督學習方法

Sahin等人總結了邏輯回歸(logistic regression)、神經網絡、K-最近鄰(K-nearest neighbor)、決策樹(decision trees)和支持向量機等二元分類器被用于欺詐檢測的研究文獻。Bahnsen 等人描述了特征工程方法(feature engineering methods)可以有效提高欺詐檢測模型的預測性能。Abbasi 等人指出元學習(meta-learning)算法可檢測欺詐。Kusaya 等人分析了人工神經網絡等ML 方法也用于檢測欺詐行為。當前,基于文本挖掘(text-mining)算法也被用于檢測欺詐研究。

(2)無監督學習方法

Nian 等人綜述了基于異常檢測處理欺詐檢測。Papernot 等人提出了異常檢測的理論框架。2019 年Chalapathy 等人發現了深度學習模型也可用于異常檢測。近年來,生成式對抗網絡(generative adversarial networks,GAN)已被用于模擬和檢測欺詐活動。

監督機器學習和無監督機器學習方法可以用于自然語言處理模型訓練和調優。自然語言處理技術被廣泛用于挖掘與欺詐檢測的相關文本。近年,Purda等人基于決策樹方法,在排序單詞上應用支持向量機等分類器,有效提高了識別欺詐報告的準確度。Hajek 等人綜述了自然語言處理模型從財務報表中檢測欺詐行為。

Bahnsen 等人基于ML 和數據挖掘技術構建了一種信用卡欺詐檢測的新方法。通過實際金融成本,提取交易數據的真實特征。文獻[54-55,57,59-60]通過引入ML 的元學習,自適應學習、堆棧泛化,卷積神經網絡、循環神經網絡、長短期記憶,生成對抗網絡實現了異常檢測處理信用卡等金融欺詐問題。針對操作風險ML 算法提取特征、性能績效、數據規模等問題,表5 列出了操作風險預測模型方法的局限性。

表5 操作風險預測方法的局限性Table 5 Limitation of operational risk prediction models

2.4 保險風險模擬方法

保險公司為社會提供保險服務的同時,也承擔或引發金融保險的不確定性。保險風險可能呈現多種來源,每種風險都需要準確地預測。保險公司預測失誤將導致保險產品定價過低,引發公司未來金融風險;人壽保險公司需要準確估計人口預期壽命。保險風險主要包括索賠風險、死亡風險等。

索賠風險(claims risk)是指與投保人(policyholders)保險索賠有關的所有未來的不確定性。索賠頻率(claim frequency)和索賠額度(claim severity)是確定未來不確定性的重要指標。索賠建模的傳統統計模型主要是廣義線性模型(generalised linear models,GLM)。但GLM 模型的缺點是假設索賠頻率和索賠額度獨立,并不符合實際。集成模型(ensemble models)預測索賠頻率和索賠額度的績效優于GLM 模型。同時,神經網絡可以高質量預測憑保單索賠(policylevel claim)的準確率。索賠風險建模的車載信息系統(Telematics)為保險業務提供了重要的動態數據庫。當獲得汽車傳感器數據(Telematics data),可以捕捉到汽車司機的行為特征。這種車載信息數據庫改進了索賠預測的準確性。

遠程醫療系統(telemedicine)逐漸應用于保險領域。保險智能服務需要數據作為支撐。有效地獲取高質量的數據資源成為不可或缺的重要工作。Tsai等人首次提出了一種圖像超分辨率重建(image superresolution reconstruction,ISRR)算法,基于傅里葉變換(Fourier transform)的多幅圖像恢復增強高頻信息的超分辨率重建算法。該模型假設圖像中不存在動態模糊(motion blur)和觀測噪聲(observation noise),忽略了光學系統的點擴散分布,僅適用于理想的圖像退化模型。

針對保險理賠風險面臨的數據缺失、數據稀疏、數據重建和數據安全等問題,需要增加ML 中訓練樣本的數量,減少模型過擬合。當前圖像超分辨率重建(ISRR)算法的相關研究已經逐漸展開,如Ghaffar等人提出了一種提高衛星圖像超分辨率的數據增強技術(data augmentation technique,DAT)。超分辨率卷積神經網絡(super-resolution convolutional neural network,SRCNN)作為最先進的深度學習模型測試DAT。模型中超分辨率輸出的重建質量使用峰值信噪比(peak signal to noise ratio,PSNR)進行定量評估,同時運用超分辨率前后測試樣本的可視化進行定性評估。構建深度學習算法的衛星圖像訓練數據集可能會影響分類或回歸的性能和速度。通常構建深度學習匹配規模的數據集很困難。實證發現數據增強緩解了數據稀缺問題,也減少了模型等的過度擬合。實驗結果表明SRCNN 模型有效融合了增強方法與實際標準方法。

Ledig 等人提出了生成對抗網絡的單幅圖像超分辨率算法(super-resolution using a generative adversarial network,SRGAN),SRGAN 是第一個對放大四倍自然圖像超分辨率的框架。模型提出了由對抗損失(adversarial loss,AL)和內容損失(content loss,CL)組成的感知損失函數(perceptual loss function)。模型通過訓練比下采樣(down-sampling)層更多上采樣(up-sampling)層的編碼器-解碼器網絡(encoderdecoder network),基于下采樣中恢復圖像詳細特征,AL 使得判別器(discriminator)生成的圖像更加接近自然圖像。CL 促使圖像的感知相似,不是像素空間相似。深度殘差網絡從深度下采樣恢復圖像逼真性。平均意見得分(mean opinion score,MOS)測試結果表明SRGAN 獲得的圖像MOS 值比其他方法獲得圖像MOS 值更加接近原始的高分辨率圖像。目前SRGAN 已被應用于從低分辨率圖像生成高分辨率圖像的醫學、保險領域。

2021 年Li 等人運用神經網絡改進了ISRR 處理低分辨率圖像的問題,提出了基于自注意力機制圖像超分辨率重建(self-attention-based image reconstruction)方法,利用殘差網絡(residual network)結構和子像素卷積(sub-pixel convolution),提取圖像中的詳細信息;運用生成對抗(generative confrontation)和圖像特征感知機(image feature perception),提高了圖像重建質量,保障數據的安全傳輸。目前,圖像超分辨率重建算法應用于金融保險的研究文獻并不多見。

死亡風險(mortality risk)是金融機構提供與受益人長壽相關的人壽保險產品的未來不確定性。死亡率(mortality rate)是人壽保險的量化指標,對人壽保險產品進行估值。通常表示為特定人群組中每1 000人的預期死亡人數。以往死亡風險建模研究主要分為兩方面:一是廣泛應用的年度死亡率演化的離散時間模型(Lee-Carter模型等);二是刻畫了瞬時死亡的連續時間隨機模型。近年來,多種ML 技術已經用于死亡率建模。神經網絡已被廣泛用于增強預測多人口死亡率(multi-population mortality)預測的方法。比如神經網絡擴展了Lee-Carter模型預測多人口死亡率同時,也可以用于多人口死亡率預測的降維分析。

目前X 光圖像檢測技術(X-ray image detection,XRID)是保險、醫學、質量檢測、安全檢查等行業中最重要的診斷方法之一。主要提供形態信息,也可獲取一些功能信息。X 光可以穿透普通可見光無法穿透的物質,X 光波長越短、密度越低或厚度越薄,其穿透率越高。X 光可以實現其他檢測方法無法比擬的獨特檢測效果。就X 光的實時成像來說,通過探測器將檢測數據傳輸至電腦顯示端,經過軟件同步處理,呈現出實時成像檢測結果,具有操作簡單、實時保存、追溯性強的特點。

冠狀病毒病(COVID-19)是一種被世界衛生組織(WHO)命名為大流行病的急性呼吸道疾病,醫療衛生系統面臨著感染人數突然激增和高死亡率的巨大壓力。Karthikeyan 等人運用X 光圖像、CT 掃描和超聲波等死亡率檢測技術,提出了基于檢測數據的ML 方法,預測COVID-19 死亡風險,以96%準確率預測了死亡率。在整個疾病期間,對神經網絡、邏輯回歸、XGBoost、隨機森林、SVM 和決策樹等ML 模型進行了訓練和性能比較。發現使用XGBoost 的重要特征提取和神經網絡方法,提前16 天以90%的準確率做出了預測,有助于提高醫療保險系統的決策過程。

X 光圖像檢測技術等臨床數據的ML已被用于預測COVID-19 患者的病情惡化導致死亡風險。Sriram等人指出COVID-19 患者數據的稀缺性,目前受到預訓練數據(pretraining data)和目標COVID-19 患者數據之間差異的限制,需要補充對非COVID-19 圖像的監督預訓練,在預訓練中使用動量對比(momentum contrast,MoCo)的自監督學習,學習更通用的圖像表征(image representations)用于下步任務。提出了一種新的多圖像序列預測的轉換器架構(transformer-based architecture)模型,結果表明模型實現了0.848AUC 預測96 h 的死亡率。

Gourdeau 等人闡述了胸部X 光圖像檢測(chest X-ray detection,CXRD)結果,表明亟需從當前CXRD開展未來COVID-19 患者的病情評估(severity evaluation)。基于CheXnet 開放數據集(65 240 名患者的224 316 幅胸部X 光圖像)訓練了一種重新調整的深度學習算法,提取映射到放射標簽的數據特征。從開源數據集(COVID-19 圖像數據集)和多機構ICU數據集中收集了COVID-19 陽性患者的CXR,從圖像和報告中將數據分組為成對的CXR“更差”“穩定”或“改進”三類。訓練了深度學習提取的特征,實時病情評估和未來放射軌跡的預測,進行了觀測者操作特性曲線(receiver operating characteristic curve,ROC)分析和曼-惠特尼檢驗(Mann-Whitney tests)。COVID-19 在本地圖像數據收集上訓練的病情評估具有良好的分布外泛化性。CXRD 深度學習表明了病情評估和軌跡進行分類的應用前景。當納入臨床數據和更大樣本量的研究得到驗證,可以為分診決策(triage decisions)、保險風險預測提供有效信息。

2018 年綜合汽車圖像、司機行為特征的動態數據庫車載信息數據庫開始用于改進保險索賠風險預測的精確性。之前,Tsai 等人提出了一種完善保險索賠風險數據的圖像超分辨率重建(ISRR)問題的雛形,其模型通過傅里葉變換的多幅圖像恢復增強高頻數據信息。文獻[65-67]提出了改進ISRR 的數據增強新技術,引入卷積神經網絡、生成對抗網絡、自注意力機制,利用殘差網絡結構和子像素卷積提取圖像的特征信息,將圖像從低分辨率轉為高分辨率,補充了圖像數據庫及數據稀缺問題,提高了數據的傳輸效率,減少了傳輸數據加密和密鑰交換的成本,成為保障數據安全的重要環節。超分辨率醫學圖像(super-resolution medical images)可以幫助更準確地判斷疾病,提高索賠的準確度,化解和減少索賠風險。為保險理賠風險預測做好了數據增強的準備基礎。針對保險索賠風險ML 算法提取圖像特征中的圖像處理的問題、數據傳輸的安全等問題,表6 解析了基于索賠風險預測模型方法的局限性。

表6 索賠風險預測方法的局限性Table 6 Limitation of claims risk prediction models

Lee 等人早前提出了一種預測死亡風險的離散時間模型。之后,文獻[69-71]相繼提出了死亡風險預測的連續時間隨機模型、多人口死亡風險模型、降維死亡風險模型等。隨著ML 算法的發展,使用X 光圖像檢測技術成為一種預測保險死亡風險的新方法。2021—2022 年間,文獻[72-74]運用X 光圖像檢測了COVID-19 的患者病情,通過神經網絡、邏輯回歸、XGBoost、SVM 和決策樹等ML 方法進行訓練,補充非COVID-19 圖像的監督預訓練,提取自監督和圖像表征。針對數據集沒有包括臨床數據和樣本數量的限制,其泛化能力不足。表7 給出了基于死亡風險預測模型方法的局限性。

表7 死亡風險預測方法的局限性Table 7 Limitation of mortality risk prediction models

3 區域金融系統風險防控機器學習分析

2008 年國際金融危機后,從始于2010 年巴塞爾協議Ⅲ,到2017 年最終方案的確認,既強調資產風險,又匹配資產負債期限,著重防范和化解銀行系統風險,統一規劃微觀審慎管理與宏觀審慎監管。當今,金融系統風險(systemic financial risk)主要研究策略是識別風險并監管風險。過往文獻對金融系統風險著重于風險損失演化、“大而不倒”金融機構的識別,以及對金融、經濟的影響沖擊研究。本章將從金融機構網絡、大數據、金融穩定性和監管量化視角展開對區域金融系統風險防控的機器學習研究。

3.1 金融機構網絡的風險分析

基于網絡的金融系統風險(network-based financial systemic risk)被定義為從宏觀視角研究網絡系統對金融系統的風險傳導。2008 年美國金融危機和2010年爆發的歐債危機以來,金融機構網絡系統風險已經成為研究者持續關注的熱門課題。金融機構相互連接形成的復雜網絡存在著風險傳導的或然性。一方面,銀行系統流動性要求銀行間的直接關聯;另一方面,產品同質化和風險規避致使銀行間有著廣泛的間接聯系。正如Battiston 等人所言,經濟和金融政策需要應用網絡分析(network analysis)、行為建模(behavioural modelling)和復雜系統(complex systems)理論的融合。Haldane 等人分析了金融體系的衍生工具交易是金融網絡風險的主要來源。同時,Prasanna 等人和Hu 等人發現了金融網絡系統和風險傳染致使金融網絡的風險擴大。之后,Diebold 等人利用加權有向圖(weighted directed graph)的連通性(connectedness),研究了美國2007—2008 年金融危機期間主要金融機構的日度股票收益的波動率。Acemoglu 等人總結了復雜金融網絡的轉折點和穩定性將決定金融政策的發展方向。

(1)金融網絡的風險敞口與傳導

金融網絡被定義為一個模擬銀行違約過程的風險敞口矩陣。Amini 等人通過異質性有向圖(inhomogeneous directed graphs)研究了金融網絡的級聯過程(cascade process)和漸近傳染(asymptotic contagions),提出了監管政策應對風險傳染敞口設定為最小資本比率。Bluhm 等人基于互聯銀行資產負債表,研發了一個系統風險的網絡模型,并提出了宏觀審慎系統在險價值(value at-risk)方法。Choi發現了較大金融機構對金融網絡有更大的積極作用,因此,做強做大金融機構將有助于保障銀行體系的穩定性。Giudici 等人通過多元圖模型(multivariate graphical models)和貝葉斯圖模型(Bayesian graphical models)實證了不同國家作為金融網絡中心節點具有不同的行為特征。Yu等人提出了一種新的復雜網絡方法,模擬銀行間網絡的系統風險傳染,發現金融機構具有充足資本儲備金可用于預防風險傳染。同時,Betz等人闡述了一個不同時期系統風險的評測框架。該框架揭示了銀行業分化(fragmentation)與主權銀行間的聯動過程。Shen提出了一種模擬電子物流投資金融風險的貝葉斯網絡方法(Bayesian networks approach)。

(2)金融機構網絡的結構

多層銀行網絡(multilayer bank networks)是相同資產相同風險的金融系統的重要特征。Battiston 等人發現多層網絡致使抵御金融風險的能力不斷下降,并使金融危機成本不斷增加。Poledna 等人描述了信用、衍生工具、外匯和證券關聯的金融多層網絡,且單層網絡預期損失被低估了90%。同時,分析了金融多層網絡系統風險總和低于總風險的非線性特征。Grassia 等人提出了一種檢測復雜網絡系統崩潰預警信號的量化系統風險方法,機器學習更好地量化復雜系統的脆弱性及其沖擊反應。

當前,隨機圖論、博弈論、收益成本分析等一系列數學模型和復雜網絡方法被引入銀行系統風險的研究。流行病模型和隨機最優模型等也被應用于金融網絡研究。區域金融網絡的系統風險研究還并不多見。顯然,未來網絡會變得更廣泛并產生大量數據,網絡金融系統風險應從大數據視角展開分析。

Amini 等人提出了一種基于度序列和任意權重分布下異質性、加權、有向隨機圖風險傳染的新框架。文獻[84-85]引入多元高斯圖、動態貝葉斯、級聯違約、復雜網絡傳染等多元網絡方法,識別和預警金融復雜網絡的系統風險敞口;文獻[88-90]通過復雜性、違約概率、違約可回收率分析了多層網絡成本持續增加,圖卷積神經網絡和多層次感知機的引入,更好地拆解了網絡復雜系統,量化了復雜網絡系統績效。表8分析了針對金融機構網絡風險ML 的局限性。

表8 網絡風險預測方法的局限性Table 8 Limitation of network risk prediction models

3.2 系統風險防控的大數據分析

如今,大數據不僅借助數據挖掘技術和商業智能進行了理論研究,而且在金融系統風險分析、供應鏈金融風險等管理中開展了廣泛的實證應用。金融系統風險防控的大數據分析主要從算法和數據兩方面展開。

(1)系統風險大數據分析

從金融系統風險來說,大數據分析是基于金融大數據研究風險源與分散風險的相互關系。金融大數據包括銀行同業資金流動、全球資本流動等金融信息,被用于風險預警和風險識別以應對金融風險。近十年來,涌現了大數據算法、網絡合約與金融市場相關性、金融信用風險評估、股市波動分析以及股價與輿情關聯性等模型。Cerchiello 等人建立了第一個基于兩個異質性數據源的大數據系統風險模型,實證了聯合運用貝葉斯方法的不同數據結構,并評測了金融風險與公眾輿情的相關性。Sarlin引入了模擬系統風險的機器學習、網絡分析、仿真和模糊系統(simulation and fuzzy systems)等智能算法。Sarlin提出了一種具有繪圖、地圖和網絡三個模塊的金融監管可視化工具。Cerchiello 等人研究了基于金融推文和金融市場的風險傳染模型,當發生沖擊時可預測金融風險的相關性。

(2)系統風險的數據問題

金融系統是大數據的主要來源。金融系統風險分析依托于高質量的數據。目前,區域和全球金融市場數據的不可利用性或質量問題使得系統風險的研究文獻并不多見。如何保證大數據的有效性問題研究是一個亟待解決的話題。Cerchiello 等人提出的多源異構數據集成(multi-source heterogeneous data integration)應視為大數據。Flood 等人分析了金融風險總是與時間和時變數據相關,難以確保數據資源的有效金融風險分析。加之,金融機構的復雜性,數據集成和質量也是一個不容易解決的問題。Jagadish 等人總結了大數據分析應包括數據收集、建模分析、數據解讀和應用等步驟。然而,大數據的異質性(heterogeneity)、時效性(timeliness)、不一致性(inconsistency)和不完整性(incompleteness)等也成為金融市場應用中的障礙。同時,Yang等人提出了一個改進存儲數據的框架和分類標準。Brammertz等人提出了從金融合約信息粒度(information granularity)中提取金融大數據的監管信息,并研發了針對機構、系統和個人等多層次金融目標的混合模型。為了給大數據分析奠定堅實的基礎,需要進一步完善數據質量的評價指標體系(evaluation index system)。

(3)金融市場的情緒分析

推文、新聞、法律等互聯網數據一直視為研究金融風險的文本數據。當前,研究學者從輿情視角分析了金融系統風險。首先,Nyman 等人發現金融系統風險可通過基于文本集(text set)的市場情緒來衡量。Chiang 等人從金融新聞網站收集并構建了一個金融文本數據庫,提取常用詞集并測算了情緒指數(sentiment index),發現了情緒指數可用于預測電子行業的股票指數。Tsai 等人利用金融銀行報告的文本信息預測金融風險,實證了軟信息(soft information)與金融風險具有強相關性,發現了金融風險與市場情緒間存在強相關性。Meyer 等人運用粒度情感分析(granularity sentiment analysis)研究金融新聞,揭示了定價和風險預測模型,通過自然語言處理提取相應句法句型和預測情緒。情感分析(sentiment analysis)和輿情挖掘(opinion mining)旨在利用文本挖掘發現客戶和市場的態度、輿情和趨勢。目前,機器學習情緒分析方法主要有回歸與排序方法(regression and ranking methods)、詞典與機器學習情感分析(lexicon and machine learning sentiment analysis)、規則排放模型算法(rule-based emission model algorithm)、正面詞匯與負面詞匯比例(fractions of positive and negative words)等。

文獻[92-94]主要引入機器學習、圖模型、貝葉斯方法,以及金融穩定分布圖、銀行關聯圖可視化,識別和預測金融推文、金融市場的關聯風險、風險溝通等系統風險的重要特征。從系統風險數據視角看,文獻[91,95-96]分析了多源異構數據、大數據規范、數據提取和清洗、數據整合和加總,強化了數據信息豐富的金融風險管理系統基礎。從金融市場情緒視角看,文獻[99-100,102]通過文本集、新聞機構和網站,運用KNN 算法、支持向量機、樸素貝葉斯,結合半監督學習和監督學習,抑或使用自然語言處理提取句法句型特征,更準確預測金融新聞情緒,識別和預防金融系統風險。表9 分析了針對大數據風險預測ML的局限性。

表9 大數據風險預測方法的局限性Table 9 Limitation of big data risk prediction models

3.3 系統風險防控的金融穩定性分析

現代金融創新要求構建一個穩定的金融體系,以便更好地既規避金融風險又保證流動性。全球金融危機后,第二代預警模型(early warning models)隨著技術的發展開始應用于金融穩定測度。如今,決策樹(decision trees)、稀疏模型(sparse models)和無監督學習(unsupervised learning)成為用于金融穩定的主要機器學習技術。

首先,決策樹模型是研究金融穩定的重要預警模型。Duttagupta 等人基于二元分類樹(binary classification tree)方法,分析了50 個新興市場和發達經濟體的銀行危機,決策者只需監控特定變量是否超過目標國家的預警門檻值。Manasse 等人測度了可能導致新興市場銀行危機的脆弱性,通過交叉驗證聚合(cross-validation aggregating,CRAGGING)方法測試了540 個備選預測變量,識別出兩個銀行危機的“危險區域”。2019 年Gabriele基于15 個歐盟國家的樣本,使用CRAGGING 算法識別了銀行系統危機的脆弱性,發現了信貸總量高和市場風險低的認知是關鍵因素。Tanaka 等人根據銀行財務報表的預測變量,通過隨機森林模型評測了銀行業的脆弱性。Ward基于17 個國家的長期樣本,運用自助聚合(Bagging)和隨機森林算法衡量了銀行危機的風險,決策樹集成學習(tree ensembles)算法的預測性能好于傳統Logit模型。2019 年Casabianca 等人基于100 個發達和新興經濟體的數據,使用自適應提升算法(AdaBoost)識別了銀行系統危機的累積,發現了機器學習算法比Logit 模型具有更好的預測性能。2021 年Bluwstein 等人實證了機器學習在樣本外優于邏輯回歸的預測,根據每個觀測的危機概率分解為預測變量的貢獻總和,對機器學習模型進行了預測。其次,決策樹集成學習方法也被用于主權危機的早期預警模型。2019 年Arakelian 等人根據宏觀經濟基本面、門檻值等預測變量,運用遞歸分區(recursive partitioning)方法衡量了區域歐洲主權風險。最后,決策樹模型還可被用于預測貨幣危機。Joy等人使用CART 模型和隨機森林算法,基于36 個工業化經濟體的樣本,識別了每種危機的主要變量,預測了貨幣危機和銀行危機,并分析了危機的不同原因。

早前,Barry使用了貝葉斯方法解決估計誤差項累積造成的不利影響。之后,Brodie 等人和Fan等人運用LASSO 回歸方法對優化問題進行了正則化,構建了穩定的稀疏投資組合。從貝葉斯模型的金融穩定性來說,Eidenberger 等人研發了一個金融壓力指數的預警系統模型,運用了30 個備選解釋變量,并基于最大概率解釋變量遴選了重要的預測變量。Chen 等人使用層次貝葉斯模型(Bayesian hierarchical model)研究了2008 年全球金融危機的決定因素,對組合變量選擇進行了聯合處理。2019 年Guidolin 等人基于時變貝葉斯模型估測了美國次貸危機的影響,估計了美國金融市場的跨資產風險傳染。Lang 等人使用了Logistic LASSO 算法并融合懲罰參數的交叉驗證,基于銀行和宏觀金融數據,實時遞歸了(real-time recursive)樣本外測試其模型。2019 年Alessi等人將LASSO 算法應用于測度主權危機,識別了遞歸環境中主權信用違約互換(credit default swaps,CDS)的宏觀橫截面指標,并估測了特定經濟基本面的市場時變敏感性。Holopainen 等人總結了Logit LASSO 模型、分類樹(classification trees)和隨機森林等機器學習方法作為預警模型,指出了決策樹算法(tree-based algorithms)的性能高于樸素貝葉斯(naive Bayes approach)方法和LASSO 算法,LASSO 算法優于標準Logit 模型。顯然,LASSO 回歸模型是金融穩定的重要稀疏模型。

近年來,網絡方法在金融穩定研究中得以廣泛認同。正如Battiston 等人所說,金融系統終歸是一個復雜系統,可通過傳統網絡方法研究其彈性、穩健性和穩定性等重要特征。Glasserman 等人已將網絡模型用于風險傳染建模。之后,Battiston 等人運用網絡方法測度了金融系統風險。美國金融危機后,網絡應用的文獻數量呈指數式增長。Marcus 等人提出了有效的人機合作關系能夠降低系統風險方法。人類和人工智能差異推動了新技術在金融市場、監管和政策制定中的使用,并分析了它們對金融穩定的潛在影響。2020 年Schuldenzucker 等人研究了無法確定銀行違約時的系統風險。

Duttagupta 等人首次引入二元分類樹,提出了應對銀行危機的預警模型。文獻[108-109]通過分類決策樹、遞歸分區、分類樹集成、自適應提升算法,提出了應對銀行系統危機的預警系統,識別銀行危機的宏觀驅動力。文獻[115,119]通過引入LARS-LASSO、Logistic LASSO 建模技術,運用協方差矩陣、損失函數、正則化邏輯回歸、交叉驗證,回歸預測了總風險敞口稀疏投資組合、風險早期預警。文獻[118]基于脈沖響應函數、貝葉斯估計,預測了美國金融危機跨資產傳染機制。文獻[75,123-124]從網絡分析、人工智能、依賴關系框架,分析了金融市場、信用違約互換合約中的系統風險,成為用于金融穩定的ML 技術。表10分析了針對穩定性風險預測ML的局限性。

表10 穩定性風險預測方法的局限性Table 10 Limitation of stability risk prediction models

3.4 系統風險監管的量化分析

為了應對金融危機,無論是金融研究者,還是中央銀行和國際金融組織一致認為金融監管缺失致使金融系統風險傳遞和蔓延。21 世紀以來,Galat 等人和Kara先后描述了金融系統風險監管研究過往涌現出的大量文獻。全球金融危機的文獻總結了金融網絡、大數據分析和金融穩定性分析等多種衡量系統風險的方法,與此同時,文獻研究中也描述了金融監管的設計分析。Posner 等人發現在評估金融監管成本時應該考慮效益成本分析(benefit-cost analysis)。系統風險監管的網絡分析是金融監管研究的一個重要課題。從Bosma分析政策相互依賴性和Clark 等人總結的最優干預政策(optimal intervention policy)規則看,定量分析監管決策將成為未來金融監管的主流方向之一。之前,Cao 等人比較了不同的監管機制,并推導出應對系統流動性風險的方法。隨后,Nucera 等人對系統風險進行了分類研究,發現價格與資本評級結果呈現出顯著性偏差。

Posner 等人引入了一種應對金融風險監管系統危機的效益成分分析的新方法。通過解決信息外部性、規避系統危機等測算金融監管成本。文獻[126,128-129]通過協調不同國家的資本充足要求、政策工具之間相互依賴性、最優干預政策措施,提出了定量識別和化解系統風險的金融監管的新方向。表11分析了基于金融風險監管量化預測方法ML 的局限性。

表11 監管量化預測方法的局限性Table 11 Limitation of quantitative supervision prediction models

針對以上分析的FSR 防控的不同ML 方法,表12闡述了各類ML 方法的優勢、缺陷和適應場景等。

表12 FSR 防控的不同ML 方法比較Table 12 Comparison of ML methods for FSR prevention

4 區域金融風險防控機器學習研究展望

本文提出了區域金融風險防控機器學習方法的科學分類和簡要概述,描述了金融風險分類、區域金融風險和機器學習方法。同時,本文基于巴塞爾協議Ⅲ的前后,梳理了傳統區域金融風險防控的機器學習方法分析,并系統地綜述了區域金融系統風險防控機器學習的具體應用。從以往區域金融風險防控機器學習文獻來看,國外的分析研究方興未艾,而國內的分析僅有零星研究。如今,隨著經濟學計算機化的發展,ML 在關注預防TFR 的同時,更加著重防范和化解FSR。圖9 展望了未來RFRP 管控機器學習的數據、建模、預測、監管科技等方法技術將在以下六方面迎來新的發展。

圖9 區域金融風險防控機器學習方法未來方向Fig.9 Future direction of machine learning for regional financial risks prevention

4.1 提升預測傳統風險能力

近年來,TFR 防控中信用風險、市場風險、操作風險的測度問題,表現為模型復雜非收斂性、數據來源有限、運算速度過慢等問題。可借鑒ML、深度學習和大數據的邏輯算法思想,通過文本數據、音頻數據和視頻數據,豐富TFR 防控中的數據缺失,求解策略問題的非線性解,可準確預測在線借款方的違約風險;也可預測為投資者賺取更多的收益。同時,可以結合以往TFR防控中統計計量模型與ML算法互相補充有效數據信息也是未來研究的一個重要發展方向。

4.2 數據安全驅動風險防控

如今的研究中,許多模型算法的數據面臨著時變數據不穩定性、數據隱私性、數據高噪音、模擬成本昂貴的問題。實踐中為了解決RFRP 防控中ML 可能面對數據隱私致使數據不可用、記錄缺乏、模擬昂貴的問題,需要基于小數據學習模型基于少量樣本進行有效學習。針對RFRP 防控機器學習數據統計上的非平穩性或大量噪聲時,用于分類情景或時間序列情景的穩健學習方法可以解決有問題數據。許多學者運用聯邦學習分布式訓練技術避免了數據泄漏,通過利用多方模型訓練,而無需交換潛在的私人或敏感客戶的金融數據,不需要從數據持有方訪問數據,保護了數據隱私性和安全性。未來差分隱私建立了個人隱私更高的標準,在聯邦學習技術防止多方泄漏私人數據和信息的同時,差分隱私技術是解決RFRP 的ML 模型整體安全性的一個重要發展方向。

4.3 大數據挖掘系統風險數據

當前利用數據挖掘的FSR 數據面臨著因為數據的不可用性,大數據還沒有完全被用于金融系統風險的問題。大多數研究FSR 的文獻主要是從宏觀層面、順周期視角識別應對金融風險。大數據技術需要突破目前異常行為檢測、微觀主體分類管理、跨國公司監管建模等微觀管理研究缺陷。識別“大而不倒(too big to fail)”機構是一項金融宏觀審慎監管的重要任務。然而,隨著金融系統高度網絡化、復雜性,以及風險傳染不確定性的研究,“大而不倒”逐漸轉變為“復雜不倒(too complex to fail)”的問題。識別金融復雜網絡關鍵節點是推動金融監管措施和政策的有效路徑。顯然,大數據分析技術、偏微分方程的金融生態穩定性是金融復雜網絡的主流研究,大數據在FSR 中的應用將成為未來研究的主要方向。與此同時,系統重要性金融機構管理和數據挖掘需要進一步深入研究,以往金融網絡中的風險傳染和系統風險被認為源自系統重要性金融機構,因此,大多數國家重點監管這些金融機構。然而,研究表明非金融機構和金融機構關聯的網絡穩定性可能影響整個系統的穩定性。金融網絡的多維體系結構呈現出網絡金融機構受到非金融機構的影響,增加了金融系統的不穩定性。當前,RFRP 防控中區域網絡關系著重關注于金融機構、非金融機構之間的債務、借貸資本和現金流量。因此,區域非金融機構和金融機構的數據來源是未來大數據研究的主要方向。

4.4 風險測度模型的構建優化

以往大多數研究主要用于預測,神經網絡等高維參數模型準確識別了特征和標簽之間的相關性,很少關注特征和模型預測之間的因果關系。但是,對于信用批準決策模型、因果關系解釋模型等RFRP 防控研究對研發者和監管機構都是非常重要的環節。歧視發現和公平感知機器學習的技術改進,有助于信用批準決策等金融風險管理。神經網絡的不確定性測量是一個非常活躍的研究領域,預測區間可以看作神經網絡點預測不確定性的準確指標。未來的ML模型需要改善和優化以往學習中的高度隨機性、不可解釋性、不公平性等特征。同時,從金融系統風險的宏觀性、全局性特征來看,基于金融復雜化網絡的特征,未來應開發融合機器學習模型與傳統計量方法的聯合模型,發揮兩者的優勢互補是新的重要研究方向,為識別、測度和治理RFRP 防控注入堅實的理論基礎。

4.5 圖像數據增效的新方向

目前圖像數據增效已經成為識別、測度金融保險風險管控的新發展方向。金融保險實踐中密度不足的模糊成像將致使數據嚴重匱乏。為了擴充圖像數據和模型泛化能力,需要引入圖像數據增強算法。圖像超分辨率重建算法增加了ML 中訓練樣本的數量,減少模型過擬合。超分辨率卷積神經網絡提高了衛星圖像超分辨率的數據增強技術,模型中高分辨率輸出的重建質量使用峰值信噪比進行定量評估,同時運用超分辨率前后測試樣本的可視化進行定性評估,數據增強緩解了數據稀缺問題。當前生成對抗網絡的單幅圖像超分辨率算法從低分辨率圖像生成高分辨率圖像,獲得的圖像MOS 值比其他方法更加接近原始的高分辨率圖像。自注意力機制圖像超分辨率重建方法運用神經網絡,提高了圖像重建質量,保障數據的傳輸安全。近年來,為了應對冠狀病毒大流行的保險體系開始引入X 光圖像檢測技術。X 光技術可以實現操作簡單、實時成像、追溯性強的獨特檢測效果。目前COVID-19患者數據的稀缺性,需要補充對非COVID-19 圖像的監督預訓練,基于X 光圖像檢測數據的ML 方法預測COVID-19 死亡風險有助于提高醫療保險系統決策效率。COVID-19在本地圖像數據收集上訓練的病情評估具有良好的分布外泛化性。圖像數據增效為金融保險系統風險防控將迎來廣泛的應用前景。

4.6 風險監管量化的集成對策

為了應對金融系統風險,RFRP 管控應建立一個理論研究和管理實踐相結合的有機生態框架。這是管理科學的本質,也是信息技術的根本要求。近年來,應對RFRP 的金融科技監管(Reg-Tech)已經成為金融科技持續發展的重要話題。金融系統風險監管是一項復雜的系統工程,需要一套在數據科學定量研究中綜合集成的政策工具箱。毋庸置疑,RFRP 的科學研究應是ML、行為監管、微觀審慎、宏觀審慎的相互融合。然而,最優政策選擇需要對成本和收益進行綜合評估。因此,對政策執行效果評價是RFRP的重要范疇。多目標方法以及成本效益分析是解決未來RFRP 量化監管深入研究的重要發展方向。

猜你喜歡
金融方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
何方平:我與金融相伴25年
金橋(2018年12期)2019-01-29 02:47:36
君唯康的金融夢
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
P2P金融解讀
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 亚洲天堂免费观看| 国产色婷婷视频在线观看| 最新无码专区超级碰碰碰| 亚洲成av人无码综合在线观看| 69免费在线视频| 欧美日韩国产系列在线观看| 亚洲乱码在线播放| 草草线在成年免费视频2| 人妻少妇久久久久久97人妻| 在线综合亚洲欧美网站| 97青青青国产在线播放| 亚洲精品无码专区在线观看| 免费A级毛片无码免费视频| 毛片免费在线视频| 亚洲欧美日韩中文字幕一区二区三区| 精品久久久无码专区中文字幕| 欧美国产菊爆免费观看 | 亚洲色图另类| 国产成人精品亚洲日本对白优播| 国产色爱av资源综合区| AV不卡无码免费一区二区三区| 91在线日韩在线播放| 欧美精品另类| 亚洲无码高清一区二区| 一级爆乳无码av| 欧美精品伊人久久| 蜜臀AVWWW国产天堂| 国产成人欧美| 亚洲精品在线影院| 女同国产精品一区二区| 国产欧美在线视频免费| 欧美成人二区| 超级碰免费视频91| 日韩天堂视频| 亚洲AⅤ综合在线欧美一区| 91视频99| 亚洲欧洲一区二区三区| 男女猛烈无遮挡午夜视频| 国产精品自在在线午夜| 日本不卡在线视频| 久久久91人妻无码精品蜜桃HD| 国产网友愉拍精品| 国产成人高清精品免费5388| 视频一区视频二区日韩专区| 亚洲中文字幕久久无码精品A| 中文字幕人妻无码系列第三区| 在线看片中文字幕| 色综合综合网| 色AV色 综合网站| 亚洲资源站av无码网址| 久操线在视频在线观看| 国产免费好大好硬视频| 国产综合日韩另类一区二区| 国产丝袜无码一区二区视频| 亚洲精品自拍区在线观看| 美美女高清毛片视频免费观看| 欧美一区二区啪啪| 午夜不卡福利| 99人妻碰碰碰久久久久禁片| 精品国产福利在线| 制服丝袜国产精品| 亚洲欧洲日韩久久狠狠爱| 人人艹人人爽| 免费一极毛片| 国产精品久久久久无码网站| 欧美一区二区丝袜高跟鞋| 色成人亚洲| 日韩资源站| 国产免费黄| 亚洲性视频网站| 国产精品一区二区在线播放| 欧美在线网| www.youjizz.com久久| 亚洲一区色| 国产精品专区第一页在线观看| 最新亚洲av女人的天堂| 永久免费无码日韩视频| 久久午夜影院| 亚洲毛片网站| 免费a在线观看播放| 欧美成人影院亚洲综合图| 久久久精品国产SM调教网站|