

當前數字經濟快速發展,數據生產要素的價值日益凸顯。金融行業是數據密集型和科技驅動型行業,商業銀行數字化轉型過程中對數據要素價值需求持續增長。聚焦商業銀行業務實際,存在數據壁壘難以打破、數據價值流通不暢、金融服務智能化受限、數據利用安全風險發生等問題。區塊鏈技術支持多方數據協作和數據存證,而隱私計算技術支持多方數據協同計算,兩者提供了解決數據安全與隱私問題的新手段,可以在不泄露原始數據的前提下,開展多方數據安全共享,釋放多方數據價值,實現數據“可用不可見,可控可計量”。針對數據共享難等痛點,融合運用區塊鏈和隱私計算技術,探索多方數據安全跨域合作,提升數據價值利用效率,對更好地推動商業銀行數字化轉型工作具有積極的現實意義。
區塊鏈技術應用發展
2019年10月24日,習近平總書記在十九屆中央政治局第十八次集體學習時指出,區塊鏈技術的集成應用在新的技術革新和產業變革中起著重要作用。區塊鏈技術應用已延伸至數字金融、物聯網、智能制造、供應鏈管理、數字藏品等多個領域,我國要積極推進區塊鏈和經濟社會融合發展。2020年以來,國家和地方政府高度重視區塊鏈技術與產業發展,積極出臺相關鼓勵政策。國家發展改革委明確將區塊鏈納入新基建范疇。工信
部、中央網信辦聯合發布的《關于加快推動區塊鏈技術應用和產業發展的指導意見》指出,到2025年,區塊鏈產業綜合實力達到世界先進水平,產業初具規模。地方政府層面,截至2023年12月,全國已有29個省市將發展區塊鏈技術產業納入地方“十四五”規劃。區塊鏈是一種由多方共同維護、分布式儲存的記賬技術,具有數據難以篡改、信息抗抵賴、多中心、分布式記賬等特點,可重構信用形成機制,深刻影響金融交易過程,推動金融基礎設施變革和商業價值低成本轉移。區塊鏈在銀行應用場景可分為三類:一是對數據存證防偽、數據確權及數據全生命周期管理有較大需求的場景。例如,電子保函、數字保理、數字藏品等業務相關電子資料存證溯源,以及產業數字資產可信采集、有效識別、確權認證、使用流通的全流程全生命周期管理。二是多主體間對提升協作效率、降低信任成本有較大需求的場景。區塊鏈作為多方協作系統,通過數據防偽保真建立數字信任,并通過可信流程協作提升各方協作效率。例如,貿易金融、供應鏈金融等場景需要多個參與方實現互信和業務高效協作。三是對數據安全共享和數據聯合計算有較大需求的場景。區塊鏈作為分布式數據庫,能夠實現在一定程度上保障隱私數據安全前提下的數據共享。例如,反欺詐黑名單共享、聯合征信等。關于區塊鏈技術本質及應用發展,有三個要點值得關注。首先,密碼學是區塊鏈技術的基石——密碼學在區塊鏈技術中的主要用途在于保護鏈上數據信息的機密性、完整性、認證性和不可抵賴性,并由此構建基于數據的信任機制。第二,跨鏈技術是區塊鏈能在更大范圍內開展數據要素和數據價值融通、共享和交換的橋梁——跨鏈主要解決鏈上與鏈下、鏈與鏈之間的數據等要素的互操作問題,通過跨鏈技術,實現區塊鏈網絡中的資產、數據和業務的互操作,有助于構建互聯互通的產業生態,推動數據要素和數據價值在全球范圍內流通。第三,區塊鏈作為數據底座技術之一,能有力支撐數據中臺發展——區塊鏈匯聚了業務流程中的信息流、商流、物流、資金流等數據,且有效保障了數據的可控共享、不可篡改,為授信、風控等業務場景提供了相對安全可信的基礎分析數據,能解決信息割裂和不可信等痛點,支持大數據金融創新業務發展。
隱私計算技術應用發展
隱私計算技術是一套包含人工智能、密碼學、數據科學等眾多領域交叉融合的跨學科技術體系,其核心作用是讓兩個或多個參與方在不泄露各自數據的前提下,實現加密狀態或非透明狀態下的數據協同計算,為隱私信息提供全生命周期保護,實現數據價值挖掘和共享。從底層技術路徑視角出發,隱私計算分為三個主流發展方向:多方安全計算(Multi-Party Computing,MPC)、聯邦學習(Federated Learning,FL)和可信執行環境(Trusted Execution Environment,TEE)。多方安全計算主要研究在無可信第三方的情況下,安全地進行多方協同計算問題。該技術應用了密碼學的一些重要隱私技術成果,包括同態加密、秘密共享、不經意傳輸、混淆電路、零知識證明等。聯邦學習是一個多方協同的機器學習框架,可滿足多個參與方在保護數據安全和隱私信息的前提下進行數據計算和模型訓練。對于不同應用場景的數據集特點,聯邦學習又分為縱向聯邦學習、橫向聯邦學習和聯邦遷移學習三類。可信執行環境是數據計算平臺上由軟硬件方法構建的一個安全區域,通過將模型及模型需要的數據匯集到可信安全區域中,實現互不信任的多個參與方進行數據協同計算,輸出計算結果,同時保證在安全區域內代碼和數據的機密性和完整性。
在銀行產業數字金融領域,產業價值鏈縱橫交織,產業數據多源異構、海量高頻,存在數據要素安全共享融合難、數據價值挖掘難等問題。隱私計算技術在保護隱私數據安全的前提下,實現產業多方數據協同計算,可在風險控制、聯合營銷等場景中發揮重要作用。基于隱私求交、隱私查詢、聯合建模等隱私計算技術手段,在數據不出域的前提下,可實現產業生態不同主體多維度數據融合,橫向聯通電信運營商數據、交通出行數據、消費數據、征信數據等,并將多維度的數據納入反欺詐模型、聯合風控模型、精準營銷模型中,以此開展多方協同計算,釋放多方數據價值。
隱私計算技術本質及應用發展有三個要點值得關注。首先,密碼學是隱私計算技術的核心——隱私計算大量應用了當今密碼學在數據隱私保護領域的經典研究成果,在密文計算、聯合計算、數據隱私保護等方面具有獨特優勢。第二,隱私計算支持多方協同計算,有利于數據信息價值共享——隱私計算技術提供了打破數據孤島,解決數據安全與隱私問題的新技術手段,可在不泄露原始數據的前提下,開展多方數據安全共享,釋放多方數據價值,實現數據“可用不可見”。第三,隱私計算可與區塊鏈、大數據等技術融合應用,更好地支持隱私數據保護——隨著歐盟《通用數據保護法案》(GDPR)的出臺和《中華人民共和國個人信息保護法》的施行,隱私立法時代正在開啟,隱私計算、密碼學、區塊鏈、大數據等技術快速迭代,日益成熟,融合運用隱私計算與區塊鏈、大數據等技術來實現隱私數據保護和安全共享恰逢其時。
區塊鏈與隱私計算相互賦能、融合創新
區塊鏈與隱私計算可實現優勢互補
區塊鏈技術大量應用了密碼學技術,實現數據可溯源、不可篡改和可審計,在推動數據要素共享和數據價值流動方面具有先天優勢,但仍存在鏈上鏈下數據隱私保護手段不足、鏈上鏈下計算處理能力不足等問題。隱私計算技術博采密碼學之長,大量應用了當今密碼學在數據隱私保護領域的經典研究成果,形成多方安全計算、聯邦學習等技術體系,在密文計算、聯合計算、數據隱私保護等方面具有獨特優勢,可有效彌補區塊鏈在數據隱私保護能力上的不足。但與此同時,隱私計算亦存在在計算流程、模型參數更新和身份可信等方面缺乏有效監督驗證,以及協作平臺環境缺乏、激勵機制不完善等問題。區塊鏈與隱私計算融合應用,可在如下方面實現互補:一是在身份認證方面,利用區塊鏈和分布式數字身份實現數字身份管理,確保參與方真實可信;二是在數據全生命周期保護方面,區塊鏈對隱私計算過程中的數據申請、授權、計算結果全過程上鏈記錄和存儲,可保障隱私計算過程數據全生命周期的安全性,滿足全程可追溯、防作弊,以及監管審計要求;三是在高效協作方面,可引入數據質量評價體系和激勵機制,提升參與計算的數據質量,推動數據安全共享計算;四是在協同計算能力方面,隱私計算融合了密碼學重要隱私技術成果,包括同態加密、秘密共享、不經意傳輸、混淆電路、零知識證明等多方安全計算技術和聯邦學習技術,極大地拓展了區塊鏈在鏈上鏈下的隱私保護能力。
區塊鏈與隱私計算技術融合創新的三種模式
區塊鏈與隱私計算的技術融合創新包括存證溯源層、智能合約層和技術架構層三種模式。
一是存證溯源層融合。隱私計算涉及的中間計算過程和最終結果等數據信息均通過區塊鏈進行存證溯源,實現隱私計算過程中關鍵數據信息的全生命周期保護。在這種模式下,參與多方協同計算的各種任務記錄、源數據Hash摘要、中間計算過程、結果數據均上鏈存證,由此保障隱私計算的數據和算法全生命周期可信。
二是智能合約層融合。在區塊鏈系統中實現和部署具有隱私計算功能的智能合約。基于區塊鏈智能合約和隱私計算相關算法,開發具有隱私計算功能的智能合約,實現密鑰分發、同態加密、秘密共享、隱私查詢、聯合統計等功能,完成區塊鏈與隱私計算技術融合應用。
三是技術架構層融合。構建統一和深度融合的“區塊鏈+隱私計算”開放架構。通過對區塊鏈底層部分功能模塊重構和開發,在區塊鏈上層協議實現分布式模型聚合任務,構建支持隱私計算功能的新型區塊鏈底層平臺架構,實現區塊鏈和隱私計算在協議層面的深度融合。
區塊鏈與隱私計算技術融合的銀行應用解決方案
在銀行業務發展過程中,為解決數據可用、數據可信等問題,需要將區塊鏈與隱私計算技術融合,形成聯合黑名單共享查詢、聯合統計分析、反欺詐標簽補全、聯合風控建模等創新數字化技術解決方案。
聯合黑名單共享查詢
銀行、小貸公司等金融機構均維護逾期、失信、欺詐等行為的客戶黑名單信息,但各機構的信息并不互通,黑名單信息難以共享。金融機構若能夠在不泄露用戶隱私的前提下,共享黑名單信息,則可以大大降低各機構盡調成本,完善用戶信息特征庫,提升金融應用效率和效果。
在傳統數據查詢服務模式中,查詢方向數據源方發送明文或加密的身份要素發起查詢,數據源方直接返回數據標簽,這種查詢方式,存在數據源方將查詢方客戶身份要素等隱私信息泄露的風險隱患。隱私信息檢索技術則可以在不泄露用戶信息的前提下完成黑名單共享查詢。例如,機構A向機構B查詢用戶張三是否有逾期或者違約行為,該過程中不泄露用戶信息,機構B不知道機構A的具體查詢信息,機構A也不知道除該張三用戶以外的其他用戶信息。
基于區塊鏈與隱私信息檢索技術,在各參與方之間組成聯盟鏈,查詢方采用隱私信息檢索查詢方式向聯盟發起查詢申請,對各參與方數據上傳、查詢等操作都記錄在鏈上存證,并設計數據質量評價體系,推動各方積極參與數據共享。在銀行業務場景下,具體業務流程為:用戶在機構A申請貸款,機構A驗證用戶身份并受理;聯盟鏈驗證機構A身份,驗證通過后機構A發起黑名單隱私查詢;通過智能合約和消息中間件,進行任務和密鑰分發,并通過不經意傳輸協議實現加密數據交互等;機構A獲得其他機構返回加密數據,并使用私鑰解密,獲得黑名單查詢結果;最后,系統積分結算,激勵任務參與者。
聯合統計分析
產業生態中,多頭借貸行為利用各金融機構之間“數據不互通、信息不對稱”實施欺詐。在多頭借貸等場景中,單個機構掌握的數據不足以有效規避欺詐風險,亟待打通機構間的數據孤島,探索開展聯合征信工作。對于各金融機構而言,用戶在該機構辦理借貸等服務的信貸數據屬于商業秘密,需要一種安全可信且保護隱私的方法實現數據信息共享。
基于區塊鏈、同態加密、秘密共享等技術,構建多方協同計算平臺,可在各方不披露具體貸款信息等業務數據的前提下,計算出具體借款人的跨金融機構授信、用信總金額等信息,實現聯合征信查詢。在銀行業務場景下,具體業務流程為:客戶向機構A發起借貸申請,機構A經過身份認證后通過協同計算平臺發起該客戶的聯合征信查詢任務;各機構計算節點接收申請,并確認有效后,參與聯合征信計算任務;隱私計算智能合約對各機構提交的加密或混淆數據進行聯合計算,得到統計結果;金融機構A通過智能合約查詢加密結果并解密,得到客戶的各機構授信、用信總額等信息,完成聯合征信查詢流程。整個過程中,任務發起、身份驗證、同態加密計算等操作均上鏈存證,實現操作記錄數據可追溯和可審計。此外,核心業務流程實現密文傳輸、密文計算、密文存儲,保證數據安全。
反欺詐標簽補全
銀行業務領域反欺詐識別工作往往需要電信運營商、電商等外部機構的標簽數據,以獲得更高的反欺詐識別率。客戶標簽作為重要隱私數據不能直接跨域共
享。基于隱私求交技術,數據持有方之間可在保護數據隱私的前提下對客戶數據集求交集,完成重疊客戶標簽補全。由此,金融機構從其他機構獲得自有客戶更多涉及欺詐行為的標簽數據,以完善客戶畫像。
在反欺詐標簽補全場景中,基于區塊鏈和隱私求交技術,可實現持有各自數據集合的兩方執行雙方集合的交集運算,并在不泄露用戶隱私前提下得到交集結果。在銀行業務場景下,具體業務流程為:機構A發起聯合標簽補全查詢任務;機構B配置標簽補全聯合查詢任務,并同意開啟反欺詐標簽補全任務;雙方共同啟動隱私計算任務,任務完成后,反饋隱私查詢計算結果。在整個過程中,任務查詢、計算數據、授權行為記錄等數據操作均存證于區塊鏈,便于追溯和監管審計。
聯合風控建模
風控模型是金融機構風險管理的核心,風控模型的構建需要利用客戶多維數據實現。一般而言,數據樣本越多,特征維度越豐富,風控模型效果就越好。銀行本地擁有的客戶特征維度往往有限,難以滿足精準建模需求。特別是銀行對公業務領域,針對樣本量少、樣本不平衡等問題,可與外部機構開展數據合作,基于區塊鏈和同態加密、秘密共享、差分隱私、聯邦學習等隱私計算技術,在不泄露數據信息的前提下完成聯合建模,構建更精準高效的風控模型。
聯邦學習是在各參與方無需共享數據資源,即數據不出本地的情況下,進行數據建模聯合訓練,建立共享的機器學習模型。根據參與方數據的特征和樣本空間的不同,聯邦學習可分為橫向聯邦學習、縱向聯邦學習和聯邦遷移學習。橫向聯邦學習適用于用戶特征重疊多、用戶樣本重疊少的情況;縱向聯邦學習適用于用戶樣本重疊多、用戶特征重疊少的情況;聯邦遷移學習適用于用戶特征和用戶樣本都重疊少的情況。聯邦學習一般包括加密樣本對齊、加密模型訓練和效果激勵三個部分,目前業界主流的聯邦學習框架有TensorFlow Federated、Pysyft、FATE、FedML等。
基于區塊鏈與聯邦學習技術開展聯合風控建模,利用區塊鏈授權機制、身份管理等,建立安全可信合作,可提高聯合風控建模可信度。在銀行業務場景下,具體業務流程為:聯盟鏈驗證各參與方身份,啟動聯合風控建模任務;模型參數初始化,各參與節點使用各自持有的數據在本地訓練模型,模型參數更新;模型訓練結果上鏈,并通過協同計算中間件匯聚各參與節點的訓練結果,用于更新模型參數,并開始下一輪迭代訓練,直到模型訓練結束。在上述過程中,對各參與方進行貢獻評估,通過積分發放等方式實行利益分配及激勵機制,以鼓勵各方積極參與。在整個聯合建模流程中,任務發起、重要梯度等中間參數交互(可進一步采用同態加密進行參數保護)、運行結果等數據均進行上鏈存證,便于后期追溯審計。
結語
銀行業務領域,通過區塊鏈與隱私計算技術在身份認證、數據全生命周期保護、高效協作和協同計算等方面優勢互補和融合應用,有助于在隱私與數據保護的前提下,開展跨域數據合作,支撐產業多方數據安全融合、協同計算和數據價值挖掘,推動銀行業務發展。未來,隨著區塊鏈和隱私計算技術持續更新迭代,在架構和協議層面實現區塊鏈與隱私計算的深度融合應用,將有效提高模型存儲和更新過程中的安全性、隱私性與效率,推動可信AI發展,最終以各方數據資產的價值最大化實現數字經濟時代多方共贏的局面。
(華夏銀行信息科技部賈蒴,龍盈智達〔北京〕科技有限公司楊璇、張月、鄭宏、李廣龍、陽少杰對本文亦有貢獻)
(作者單位:華夏銀行,龍盈智達〔北京〕科技有限公司)
責任編輯:孫爽
976639255@qq.com