仲崇高 遲愛寧
泰州學院,江蘇 泰州 225300
技術進步可以提升企業生產效率,推動社會經濟發展。金融業作為現代經濟的核心,一直是各項科技前沿技術研發的積極參與者和受益者。在過去幾十年里,技術一直在為金融帶來變革。依托這些技術提供、精煉的信息價值、數據價值,金融業經歷了20世紀末的全面電子時代到21世紀興起的互聯網浪潮,實現了跨越式發展,形成了互聯網金融、金融科技(FinTech)等新的發展模式。另外,也促成了金融各領域與科技各領域之間的合作,并深刻地促進了金融生態圈的生長和發展。目前,人工智能技術(artificial intelligence,AI)成為推動金融業革新的新動力。
2015年,《國務院關于積極推進“互聯網+”行動的指導意見》將“互聯網+人工智能”列為11項重點行動之一。2016年,“人工智能”一詞寫入國家“十三五”規劃綱要;2016年,《“互聯網+”人工智能三年行動實施方案》發布,從鼓勵智能制造,逐步擴展到鼓勵 AI 進行全面的生態賦能。金融作為人工智能落地的最佳場景之一,成為政府關注鼓勵的重點方向。2017年7月20日,國務院發布《新一代人工智能發展規劃》指出,人工智能核心產業規模預期到2030年超過1萬億元。萬億人工智能市場將助力金融行業的整體技術更新,促進金融業從傳統金融向智能金融發展。
智能金融是人工智能與金融全面融合而產生的新金融服務模式,它以人工智能、大數據、云計算等創新科技為核心要素,在提升金融機構服務效率的同時,實現金融服務的智能化、個性化和定制化。知識圖譜是人工智能的主要技術之一,智能金融的發展,需要知識圖譜技術的支持。知識圖譜的知識提取、融合、分析、推斷、決策等功能在大數據、云計算的基礎上不斷推動金融的智能化發展。
研究人員試圖將深度學習技術融入知識圖譜技術框架,以知識圖譜為代表的符號主義和以深度學習為代表的聯結主義,正在走上協同并進的新道路。融入深度學習的知識圖譜技術,將為金融業智能化提供更多助力。
目前,國內學者的研究主要集中于金融科技、人工智能在金融中的應用,如金融科技與科技創新的應用[1-2],人工智能與金融科技競爭[3],人工智能與金融革命[4-6],以及知識圖譜在金融業的具體場景應用[7-9],少量文獻研究了智能金融[10]。本文研究了知識圖譜與智能金融的關系,以及融入深度學習技術后的知識圖譜對金融業的促進作用。
智能金融的概念是在現代大數據和人工智能技術發展背景下產生的,具備自動化信息處理、輔助決策和部分自決策相結合、自動化執行等特征的金融服務綜合應用。智能金融,本質上是人工智能技術驅動的金融創新。從科技角度講,智能金融的發展,是基于人工智能技術的智能客服、智能風控、智能營銷、智能投研、智能投顧等場景的解決方案,人工智能技術能夠服務于金融全部業務流程,這也是人工智能能夠快速在金融業發展的原因之一。在人工智能技術的運用和大數據的沉淀與挖掘過程中,金融行業的邏輯從標準化、高風險、邊界有限向個性定制、安全可靠、場景連接轉變,這意味著金融服務的對象更加廣泛、金融服務的過程更加安全、金融服務品質更加精細。
智能投顧為客戶提供精準定制產品。由于客戶的性別、年齡、投資能力等的差異,金融機構的“標準化”產品往往無法滿足客戶的需求,無法實現客戶收益的最大化。智能金融分兩步可實現精準定制的邏輯。以智能投顧為例,第一步,精確實現充分了解客戶(know your customer,KYC),基于豐富的數據量,人工智能算法可以實現更細的數據顆粒度,將投資者的流動性、負債水平、資金量、儲蓄率等數據更細致地融入客戶風險偏好、資產偏好中去。第二步,個性定制金融產品。借助人工智能算法,為客戶定制適合的金融產品,其收益回報往往更為穩健。
智能投資量化產品風險。智能投資運用機器學習、量化分析等技術與算法將投資市場上的標的風險進行識別與量化,進而將投資者的資產分散到債券、權益和另類等相關性較低的資產中,使得投資者的資產組合收益來源和波動率來源更為分散,從而有效抵御單一種類資產帶來的風險。
智能金融加速了普惠金融的進程,向行業上下游擴展。智能金融已經延伸到傳統金融業難以普及到的廣大農村地區。以往普惠金融中需要大量人力完成的業務,現已被人工智能及相關技術替代,傳統以人力為核心資本以實現普惠金融的邏輯被人工智能改寫。
智能金融與不同業態進行組合,這在一定程度上實現了所在行業的上下游擴展。以智能保險為例,人工智能在保險業的運用最早屬于金融科技領域,現在應用范圍擴大,幾乎包含了全部領域,通過將營銷、定價、風控、承保、保全以及理賠等內容組合,擴展了保險行業的上下游。
作為人工智能的重要分支,知識圖譜不僅可以發現數據之間的關系,而且能利用關系進行推理,從而賦予數據更多價值。目前,知識圖譜被應用到了搜索、地圖、個性化推薦等領域。金融作為一個對數據具有強依賴性的領域,對知識圖譜的應用有更切實的需求,已經發展出包括反欺詐、失聯客戶管理、精準營銷、智能搜索和可視化、問答交互在內的多種應用方式。
知識圖譜是描述客觀世界中實體及其之間關系的一種語義網絡,由節點和邊組成。知識圖譜的發展歷程可以追溯到20世紀70年代誕生的專家系統。
知識圖譜提供了從“關系”的角度去分析問題的能力,是關系表示最有效的方式之一。如圖1所示,在知識圖譜中,每個節點表示現實世界中存在的“實體”,每條邊為實體與實體之間的“關系”。語義類型中最頂層抽象類是實體。其中,實體可分為概念實體和物理實體。概念實體指沒有具體實體的對象;物理實體指的客觀世界存在的對象。三元組是知識圖譜通用的表現形式。所謂三元組,就是由一個表示主語的節點,一條表示謂語的邊和一個表示賓語的節點組成一條記錄。當圍繞著一個主語有很多用三元組表示的關系呈現時,就構建了知識圖譜。

圖1 知識圖譜示意
知識圖譜與其他信息源不同之處是它可以由計算機直接訪問,而無須任何的人工介入。由于計算機只理解正規的語言,所以知識圖譜中包含的信息通常被稱為結構化數據,而非結構化數據(如純文本)只能夠被人類理解。從技術層面設計上來說,知識圖譜必須考慮兩個基本的權衡:一是知識圖譜應該具有足夠的描述性,以便復雜的知識能夠被機器編碼;二是這種描述性應該足夠的簡單,以便計算機能夠快速地處理。從領域上來說,知識圖譜可分為通用知識圖譜和特定領域知識圖譜。通用知識圖譜包含了大量的現實世界中的常識性知識,強調的是廣度;特定領域知識圖譜面向特定的垂直領域,強調的是深度。在實際中,知識圖譜的應用趨勢逐漸從通用領域走向特定領域。不同行業都在關注適合自身的知識圖譜技術的應用方式,但目前仍未形成大規模應用。
當前,知識圖譜在金融領域的應用仍處于起步階段,主要應用包括反欺詐、失聯客戶管理、精準營銷、智能搜索和可視化、問答交互。
2.2.1 反欺詐
反欺詐是對包含交易欺詐、網絡欺詐、電話欺詐等詐騙行為進行識別的一項服務,而知識圖譜的反欺詐計算是對反欺詐分析實時性的體現。知識圖譜在金融領域反欺詐方面的應用包括貸前審批和貸中預警。目前知識圖譜在金融領域的應用,主要集中在貸前審批管理。在貸前的審批階段,將借款人的基本信息、消費記錄、行為記錄、關系信息等整合到反欺詐知識圖譜里,比對客戶一度、二度關系是否觸黑,以及客戶消費關聯商家是否異常等。同時,利用不一致性檢驗,對借款人的風險進行分析和評估。例如,當兩個借款人填寫了相同的電話號碼時,這種不一致性就有可能是欺詐行為。
同時,知識圖譜還可以有效甄別團體欺詐。甄別團體欺詐的方式有兩種:一是根據之前標記的黑名單客戶,利用知識圖譜確定與其有緊密聯系的欺詐用戶。二是根據團體欺詐會共享部分信息的特點,利用知識圖譜發現不同用戶之間的信息關聯性,從而識別欺詐團體。
在貸中的交易階段,通過構建已知的主要欺詐要素(如設備、賬號、地域等)的關系圖譜,全方位監控借款人的風險數據,對潛在欺詐行為做出及時反應。即使欺詐分子修改了登陸時間和地址之類的行為線索,知識圖譜仍然可以挖掘出共用設備、共用IP等可疑特征,從而識別欺詐事件。
2.2.2 失聯客戶管理
在貸后管理中,知識圖譜也發揮著重要作用。當借款人不按時還款并且“失聯”時,催收人員的工作難度加大。目前貸后管理對知識圖譜的應用,主要是結合借款人授權的通信記錄,挖掘與借款人有關系且在相同平臺借過款的新聯系人,從而重新取得與借款人的聯系,提高催收成功率,此技術已廣泛應用。同時,各金融機構也在進一步擴充數據維度,如工作單位等。
2.2.3 精準營銷
知識圖譜在精準營銷中的應用有兩種形式。一是理解用戶。通過知識圖譜聚合用戶的基本屬性,如年齡、學歷、消費習慣、搜索習慣等,將這些基本屬性加以分類,形成不同的用戶標簽,展現不同類別用戶的身份特質及具體偏好。然后分析客戶潛在需求,進行精準推送。二是挖掘潛在客戶。基于現有用戶的社交網絡知識圖譜,根據交往方式和頻次等社交行為建立關系模型,從而實現潛在用戶的拓展。此外,還可以結合所有用戶的標簽特征,使用社區算法將全局用戶細分,識別隱藏在數據深處的價值用戶。目前此種形式較為常見,主要是通過借款人之間的推薦關系,挖掘為平臺帶來大量資金和新客戶的推薦人,分析這些推薦人的特征,從而發展新的具有類似特征的客戶。
2.2.4 智能搜索和可視化
通過知識圖譜,搜索功能可以在語義上擴展更多的搜索關鍵詞,從而獲取更全面的信息,通過圖譜可視化技術,可以以圖形網絡的形式展示全方位信息,包括復雜信息和隱藏信息等。
2.2.5 問答交互
知識圖譜在問答交互中最常用到的場景是文本客服。首先通過知識圖譜創建知識庫,在對用戶問題進行語義理解和解析后,利用知識庫查詢、推理得出答案并反饋給用戶。通過知識圖譜,所有知識點以及連接知識點的邊都與問句關聯起來,極大地提高了應答的關聯性和準確性。
目前雖然知識圖譜在金融領域的應用方式多種多樣,但是由于應用場景非標準化以及建模較難的原因,導致知識圖譜在金融領域的應用還處于初級階段,尚未形成大規模應用。但知識圖譜技術已成為金融科技公司未來技術競爭的關鍵領域。
國外對于知識圖譜與深度學習結合的應用也進行了深入的研究與探索,并取得了很好的效果。例如,2004年在硅谷開始運作的 Palantir,結合客戶提供的信息源與公共網絡上的事件,提供對海量數據的研究分析,其金融數據分析平臺 Palantir Metropolis 可以對金融數據進行復雜搜索、可視化編輯、關聯發現等操作。
國內互聯網巨頭同樣在知識圖譜與深度學習結合方面進行了研究探索。例如,神馬知識圖譜已發展為擁有近5000萬實體、近30億關系的大規模知識圖譜。百度發布了深度學習平臺—PaddlePaddle平臺,騰訊公司也發布了DI-X深度學習平臺,為用戶提供一站式的深度學習服務。
在未來的應用中,知識圖譜和深度學習將在更多層面形成互補,提升深度神經網絡的可解釋性,知識圖譜技術和方法還將進一步與自然語言處理技術深度融合。知識圖譜將幫助金融行業構建有學識的人工智能,走向知識智能時代。
融入深度學習技術的知識圖譜,打造知識智能金融,為金融業的高質量服務提供技術支持。①提供更加智能的數據服務。可以為金融問答系統、智能客服系統以及金融智能搜索等業務提供相應的支持,提升金融信息的檢索效率,幫助構建知識型的智能金融客服,滿足金融業務的實際需求。②幫助解決金融自然語言處理NLP所遇到的技術問題,如實體語義消歧、文本語義理解、文本結構化等。③促進知識驅動的金融決策分析領域深入發展。金融因果關聯圖譜的精細化構建及深入應用趨勢,包括圍繞事件構建事理知識圖譜、利用事件抽取技術提升新聞事件識別的敏感度、建立事件因果推理知識庫、利用事理圖譜分析技術對事件影響力傳導進行深度分析等。④提升金融預測能力。金融知識圖譜在金融預測分析中具有重要的作用,是進行事件推理的基礎,可應用于智能投研和智能投顧等領域。例如,當重大事件發生時,可根據產業鏈圖譜推導出未來可能會受影響的公司。⑤讓金融搜索更具價值。在智能投研、智能投顧和智能客服等場景,基于深度學習技術的金融問答和語義搜索的技術,不僅使信息獲取更加便捷,還可把各方面的相關信息組織成立體化信息,并且能提供一定的分析預測結論。⑥賦能風險評估與反欺詐。風險評估是互聯網時代的傳統應用場景,是通過大數據、機器學習技術對用戶行為數據分析后,進行用戶畫像,并進行信用和風險評估。引入深度學習技術后,可以進一步提升關系穿透、挖掘的能力,從而偵測欺詐行為,有助于關聯交易關聯賬號識別、信息披露等,在風控領域有較大的應用空間。
目前,大多金融機構對于數據的應用處于“從信息到知識”的階段,而知識圖譜突破了現有的關系型數據庫的限制,從信息中發掘和構建深度的關聯,使得信息知識化,提供更加智慧的決策支持。行業或企業知識圖譜的建設需要考慮以下3個方面:首先,需要分析行業特點,創建統一的數據模型和視圖;其次,要對收集的各類行業數據進行整合,并通過關聯計算找出數據間的關系,再使用圖數據庫保存及展示;最后,建立業務模型對數據進行機器學習,挖掘有價值的信息支撐業務場景。
具體到金融行業,建立知識圖譜有3個主要步驟:①從金融機構內部結構化數據、非結構化數據以及互聯網采集數據、第三方合作數據中辨別金融實體;②定義并挖掘金融實體間的各種關系,如企業與企業之間的集團關系、投資關系、上下游關系、擔保關系,企業與個人之間的任職、實際控制、一致行動關系,從而生成知識圖譜;③定義并表達業務邏輯,在知識圖譜構建的知識體系中,可以實現各種具體任務,如對企業股權關系、一致行動人、實際控制人等挖掘,擔保圈、擔保鏈、擔保群挖掘,疑似欺詐交易發現及欺詐團伙追蹤發現等,及時發現商機和識別風險傳導機制。
此外,金融知識圖譜還包含了很多其他的形式,如A股的公司、港股和美股的公司,各種基本面的數據、行情的數據等都在逐漸知識圖譜化,還有公告數據、研報數據及工商數據等都是金融知識圖譜的分支。
當前,知識圖譜在金融業還沒有形成大規模的應用,很多仍處于調研階段,主要原因在于金融機構知識圖譜理解不深以及知識圖譜本身構建的困難,具體體現在數據的可訪問性、數據的可發現性、領域知識的集成以及策略的生成4個主要方面。
以策略的生成為例。現有階段,機器在業務場景中還無法完全替代人類的作用,而是輔助人類做出價值判斷、風險判斷,通過過往的案例或者既定的邏輯,為人類推薦可行的策略。具體場景有:在用戶交互層面,有意圖理解、語言生成、用戶畫像匹配等;在業務層面,有邏輯生成、投資模型、風險模型等;涉及的數據處理有規則提取、知識庫建設,語義檢索、邏輯推理等。
在智能金融時代,金融知識圖譜構建主要有兩個方面挑戰。一方面,需要著手進行面向人工智能的大數據治理,在數據層面上通過知識圖譜將原有的金融數據再次加工、整理;另一方面,進一步把知識圖譜等人工智能技術的服務能力開放給傳統的業務系統,進行面向人工智能的服務治理。