許多人工智能專家常說AI最適合應用于金融行業。因為金融是歷史記錄數據最豐富且準確的領域之一,甚至斷言金融行業將被AI取代。但有個極大的問題是,人工智能無法解釋自己的行為,這使得強監管的金融行業很難大規模采用AI。
當銀行考慮采用人工智能時,這個所謂的“黑盒子”問題就會反復出現,無論是信用評分,貸款還是其它類型業務。一位長期從事金融風控領域的業內高管直言,傳統銀行普遍都希望利用社交網站來進行營銷,但如果銀行不能明確掌握所有客戶屬性數據,就很容易被合規部門擋下。
這類限制使得銀行在AI導入的實際業務上,存在著理想與現實的巨大落差。根據“麻省理工斯隆管理評論”(MTT Sloan ManagementReview)與“波士頓顧問集團”(The BostonConsulting Group)于2017年所做研究”RESHAPING BUSINESS WITH ARTIFICIALINTELLIGENCE”,調查人工智能在各行業的被采納程度。結果金融服務業評估目前AI對其產品服務、工作流程的影響程度僅約10%,
甚至許多情況下,銀行即便導入AI,效果也不如想象神奇。例如金融機構導入傳統規則引擎系統來進行檢核其實已行之有年,但缺點是真實金融場景的維度太多,人工定義的規則引擎無法做到很精準判別。為了寧枉勿縱,系統就存在大量誤報。因此即使采用規則引擎,對人工審核的要求仍然非常巨大。
“國際上各大金融機構對反洗錢都是投入大量的人力,人工審核部門都非常巨大。”一位業內人士表示,這除了使成本居高不下之外,更大的風險是繁復檢核容易使客戶不滿、甚至失去客戶。業者解釋,洗錢行為必須經過司法部門調查才能確立罪責,所以要求要很強的解釋性。如果A1只能指出某個帳號可疑,卻無法自我解釋原因時,調查人員就無法據以展開進一步調查。
而機器學習中的一個晚近分支——無監督式學習(UML),正是一種能夠自我解釋的AI。
無監督式學習是機器學習的一種方式,訓練時不需要人力給予標簽,僅須對機器提供數據輸入。因為沒有預設標簽,無監督式學習機器不會知道其分類結果是否正確,但優點在于它會自動從數據中找出潛在的規則,因此其結果具有較強的可解釋性。臉書人工智能負責人、也是AI領域最有影響力的專家之一的Yann LeCun,就多次提倡無監督式學習是AI技術的未來。
有監督機器學習模型通常單獨查看每個賬戶,類似于每次看這幅畫中的一個點。無監督機器學習可分析賬戶間的關聯性,即便個體賬戶無任何可疑表象,也能從數據中檢測到可疑模型。這種方式類似于我們能看到并理解畫中的整體圖案而不是每一點,即便每個點的顏色和形狀都不盡相同
DataVisor聯合創始人兼CEO謝映蓮(左)、DataVisor CTO俞舫(右)
無監督式學習雖已在學研界是一大主流方向,但在產業界大規模成功應用的例子還并不多,用于金融領域的更是少之又少。但一家由兩名華人女性共同在美國硅谷創辦的人工智能新創公司DataVisor,卻是最領先將無監督式學習應用在金融領域的公司之一。
DataVisor以“無監督機器學習”(UML)引擎為核心,結合傳統自動規則引擎和全球數據庫,致力于解決金融領域的在線欺詐和金融犯罪檢測難題,可對每小時新發生的10億數量級的事件進行分析,自動判斷并發現潛在的惡意攻擊,至今在全球范圍內已處理超6000億用戶事件和1.4億壞用戶,保護全球40億互聯網用戶,最近并入選《華爾街日報》最新發布的“2018最值得關注科技公司Top25”榜單。
DT君獨家專訪DataVisor,剖析無監督機器學習在金融領域的應用優勢。聯合創始人兼CEO謝映蓮說明,金融行業數據豐富,但數字化并不完善,這是對所有機器學習模式的一個普遍存在的挑戰。而無監督式學習的好處在于對數據缺失的容忍力較高,并不依賴數據的完整性。
“無監督機器學習的優勢是可以將海量數據在沒有標簽的情況下進行檢測,且產出的結果具有很強的可解釋性。”謝映蓮進一步說明,無監督式學習是機器學習的一個分支,相較于監督式學習和強化學習等其它分支,無監督學習并不需要人力來輸入標簽,而是主動實時找尋新的模式,進行新的學習。
為何無監督式學習有助于解決人工智能在金融行業應用的痛點呢?
“這跟金融行業自身的發展改變有關”,DataVisor聯合創始人兼CTO俞舫解釋,“過去金融工具比較單純,欺詐形式與危害程度都比較有限。但現在網路交易愈來愈頻繁,犯罪形式也日新月異,等到有標簽后再做機器學習很多時候已經晚了,在反應新型攻擊上是非常滯后的。”
而無監督學習可以使海量數據在沒有標簽的情況下進行檢測,把群組性的異常找出來,且產出的結果具有很強的可解釋性,甚至能在攻擊未發生前就防患于未然。以國內猖獗的網絡黑產主導的數字金融欺詐為例,DataVisor中國區總經理吳中說明,金融欺詐如要惡意轉帳,通常會有個過程。首先攻擊者需要創建大量惡意帳號,接著需要“養號”,也就是為帳號制造一些貌似正常的紀錄,接下來才能用這些帳號進行欺詐。而傳統規則引擎、或有標簽的監督式學習,比較難檢測出養號早期、貌似正常的惡意帳號。無監督式學習則是會主動把群組性的異常找出來,提供人員進行預判。
吳中觀察,正因國內黑產盛行,可以看到金融機構將對人工智能產生更多的需求,會更有意識地去探索。在數據飛速增長的情況下,國內金融機構勢必將進入升級換代的過程。盡管目前仍有其限制,但整個行業已在加速奔向由人工智能驅動的未來。沒人能夠真正準確預測人工智能下一個突破將何時出現,但更有意識地探索,將是保持領先的關鍵。(摘自美《深科技》)(編輯/華生)