黃洲丹
【摘要】本文主要分析大量數據的機器學習方法以及金融服務領域內的機器學習方法的應用,介紹機器學習的背景和機器學習方法的概述,對機器學習的使用領域進行探索,討論金融機構內的若干應用案例:信用風險模型,信用卡欺詐和洗錢檢測以及監控金融機構違反行為標準的行為。
【關鍵詞】機器學習 深度學習 信用風險與收益模型 信用卡欺詐 反洗錢
一、前言
機器學習是一個人工智能領域,它使用算法,允許計算機無需編程即可學習。機器學習有兩種形式:監督和無監督。在有監督的機器學習中,建立統計模型以便基于特定輸入預測結果(例如,基于各種宏觀經濟變量的輸入預測GDP增長);在無監督的機器學習中,執行數據分析以識別模式而不估計因變量。
機器學習很重要,因為它可以分析數據樣本,以便識別數據中的模式和關系,并可以進行樣本外預測,然后對模型進行數千或數百萬次分析,以便模型可以提高其預測能力。在這方面,機器學習與“大數據”革命密切相關。有監督的機器學習還可以分析非參數和非線性關系,這些關系可以適合任何給定的模型并對依賴變量和自變量進行推斷。
機器學習主要應用于三大類統計問題:回歸,分類和聚類?;貧w和分類都可以通過有監督的機器學習來解決,而聚類則遵循無監督的方法。回歸問題可以預測定量的連續變量,包括通貨膨脹和GDP增長;分類問題對離散的因變量進行預測,例如過濾垃圾郵件和血液類型;聚類涉及觀察輸入變量而不包括因變量,例子包括反洗錢分析。
二、深度學習
深度學習方法遠離我們迄今為止討論的“經典”模型方法,經典模型專注于定義明確的結構化數據集,而深度學習則通過在學習過程中應用多層算法并轉換原始數據來識別復雜模式,從根本上模仿人類大腦。每種算法都關注數據的特定特征(稱為表示),并且這些表示的分層允許模型包含各種輸入,包括低質量或非結構化數據。重要的是,這些層不是由工程師設計的,而是由模型從各種數據中學習的。
例如,深度學習已被用于面部識別和自然語言學習模型,模型已足夠復雜,不僅能夠對討論主題進行分類,還能夠對所涉人員的情緒進行分類。然而,深度學習模型非常復雜,通常需要數百萬或數億個數據集。
三、機器學習的應用
金融機構處理他們需要分析的大量數據,這需要復雜的分析工具。為響應新的法規和合規措施,在2007 - 2009金融危機之后,金融機構需要報告更全面的資產負債表指標和業務模式細節,進行壓力測試以及流動性測量,對資本和抵押品進行報告。
金融機構還面臨著來自消費者應用程序,社交媒體供稿和各種系統元數據輸出的大量低質量,非結構化數據(稱為大數據)。機構能夠有效地分析這些大量數據變得越來越重要,包括使用傳統的機器學習技術以及更復雜的深度學習技術。金融機構應使用傳統的機器學習技術來挖掘高質量的結構化監管數據,深度學習和神經網絡應該用于低質量,高頻率,“大數據”類型的源。
(一)信用風險與收益模型
金融機構最近采用機器學習方法和傳統模式來提高他們預測金融風險的能力,他們逐漸擺脫了不那么復雜的傳統線性信用風險模型回歸。但是,機器學習模型往往不適合成功地納入金融機構的持續風險監控,機器學習模型可能過于復雜并且對過度擬合數據敏感。它們的(通常是極端的)復雜性使得難以應用管轄一致的數據定義,并且模型對于監管目的而言過于復雜,包括基于巴塞爾內部評級(IRB)方法的內部模型也是如此,審計員很難了解他們。盡管存在缺點,但機器學習模型可以成功地用于優化具有監管功能的現有模型。例如,線性和較不復雜的非線性機器學習模型都可以應用于現有的監管和收益預測模型。
(二)欺詐
銀行已成功將機器學習用于檢測信用卡欺詐,信用卡欺詐可以比其他風險領域更有用地結合機器學習,因為模型的培訓,回測和驗證需要大量的信用卡交易。模型還可以通過無監督的學習方法(如聚類)成功地用于反洗錢或打擊資助恐怖主義活動,但難以僅使用歷史數據來訓練洗錢檢測算法以檢測欺詐活動。
(三)交易中行為和市場濫用的監督
對交易者違規行為的監控是另一個不斷增長的領域,其中機器學習越來越多地用于檢測流氓交易,內幕交易和基準操縱活動。金融機構發現這些違規行為的早期發現很重要,因為它們可能對機構造成重大的財務和聲譽損害。
金融機構成功應用機器學習所面臨的挑戰之一包括與開發人員共享過去違規信息的法律復雜性。此外,系統需要是可審計的,但由于機器學習模型旨在不斷從數據中學習,因此很難向合規官員解釋為什么某個行為會引發警報。作為對這些問題的補救,可以設計系統以將機器學習與人類決策相結合。通過將人類決策與機器學習相結合,系統數據可用于了解有關交易者的全面信息,并創建一個不太復雜且更適合審計和監管目的的系統。
四、小結
如今,機器學習和人工智能是金融服務領域的重要課題。金融機構正在尋求更強大的分析方法,以便管理和挖掘越來越多的監管報告數據和非結構化數據,用于合規和風險管理或為了與其他金融機構和金融科技公司有效競爭。
機器學習方法具備分析大量數據的能力,同時提供深度的預測分析,可以提高金融機構中風險管理和合規領域的分析能力。例如,檢測付費系統中復雜的非法交易模式以及更準確的信用風險建模。機器學習方法在金融服務領域的應用高度依賴于環境,金融機構并不總是提供用于培訓或分析的高質量數據。更重要的是,幾種方法的分析的預測能力可能以增加模型復雜性和缺乏解釋性洞察力為代價,這是需要改進的地方。
參考文獻:
[1] Van Liebergen, Bart,“Machine Learning:A Revolution in RiskManagement and Compliance" Institute of International Finance,April 2017.
[2]彼得·哈靈頓著.李銳,李鵬,曲亞東,王斌,譯.機器學習實戰[M].北京:人民郵電出版社,2013.
[3]賀建清.金融科技:發展,影響與監管[J].金融發展研究,2017(06).