胡浩
隱私計算的產業圖譜
目前,隱私計算市場尚處于發展的初期。從服務對象來看,在國內,隱私計算市場目前主要是一個面向企業的市場;但在美國,已經出現了通過為企業提供隱私計算服務從而間接為個人提供隱私保護服務的模式,未來很有可能出現直接為個人提供隱私保護服務的應用。
隱私計算產業生態
隱私計算的產業生態中主要包含數據需求方、數據供應方、數據流通基礎設施建設方、數據交易服務方、政策規則制定方和市場監管方六方。
數據需求方是指那些需要使用數據來完成其業務目標、解決問題或支持決策的組織、個人或部門。例如,市場研究公司需要收集和分析大量的市場數據,以便提供有關市場趨勢、消費者行為和競爭環境的洞察;金融機構需要收集和分析客戶數據,以評估風險、做出投資決策和開展反欺詐活動;政府機構需要收集和分析人口、經濟、環境等各種數據,以制定政策和規劃資源分配等。
數據供應方是指那些能夠提供數據資源的組織、企業或個人。數據供應方可以是數據提供商、數據中介、數據管理公司、數據科技公司等。這些組織可以收集、整理、加工和存儲各種數據,如市場數據、消費者數據、環境數據、金融數據、社交媒體數據等。數據供應方可以通過不同的渠道向數據需求方提供數據,如通過API、數據集成、數據交換等方式。在數據供應鏈中,數據供應方的重要任務是確保數據的質量和準確性,并遵守相關的法律法規和道德標準,以保護數據的安全和隱私。數據供應方還需要不斷優化數據處理流程,以提高數據的處理效率和降低成本,從而更好地滿足數據需求方的需求。
數據流通基礎設施建設方是指開展隱私計算平臺建設的機構,如隱私計算廠商、云服務商、大數據服務商等。
數據交易服務方是指那些致力于構建和提供基于隱私計算的數據流通基礎設施的組織、企業或個人。數據流通基礎設施建設方可以通過構建安全的數據通道、開發隱私計算算法、提供數據安全管理和風險控制服務等方式,為數據的流通提供技術支持和保障。隱私計算數據流通基礎設施建設方包括技術服務提供商、數據中介、數據安全公司、云計算服務提供商等。
政策規則制定方負責制定數據要素和隱私計算的指導意見、辦法、法律法規、規章制度、指引、條例等,主要包括國務院及相關部委、行業協會、各級地方政府等。
市場監管方負責對數據要素安全合規使用的監管,主要包括網信辦、各省市大數據管理局等。
隱私計算廠商圖譜
目前提供隱私計算技術服務的廠商大致可以分為兩大類:一類是互聯網巨頭,主要包括阿里、螞蟻、微眾、騰訊、百度、華為、京東、字節跳動等,這類公司運用其在互聯網領域的領先地位布局隱私計算,或應用于企業內部服務,或向其他機構出售其服務;另一類是隱私計算初創公司,主要包括華控清交、富數科技、星云Clustar、數牘科技、藍象智聯、洞見科技、锘崴科技、翼方健數、沖量在線、光之樹、融數聯智等,這類公司專注于隱私計算賽道,已經取得了一些賽道中的技術領先優勢,并服務于其他機構。
隱私計算的發展態勢
技術路線百花齊放
隱私計算技術大體可分為三種主要技術路線,分別是多方安全計算、聯邦學習和可信執行環境。其中,26%的企業布局了多方安全計算;52%的企業布局了聯邦學習;21%的企業布局了可信執行環境。由于各類技術方案各有優勢,面對用戶的不同應用需求,21%的企業提供多種技術方案供用戶選擇。采用多方安全計算、聯邦學習和可信執行環境等主流方案的企業合計約占使用隱私計算技術企業的的99%。此外,有極少量的企業采用其他隱私計算技術,如零知識證明等。
產業發展配套環境逐步完善
從產業發展的配套環境來看,相關企業和機構在學術研究、開源生態、標準體系等方面積極探索,推動著隱私計算向上蓬勃發展。
學術研究領域關注度持續提升。作為一門融合了多學科的新興技術,發展與應用隱私計算對于技術理論的研究有較強的依賴性。2011年以來的10年間,隱私計算領域共發表論文5280篇,論文數量始終保持著不低于10%的增速逐年上升。其中,2019年的上升幅度較大,隱私計算領域每年的發文量穩步超越1000篇。可見理論研究層面對隱私計算的關注在持續增強。
技術企業積極擁抱開源生態。開源社區的知識共享和多方協同有利于加速技術升級和商業化項目落地。近兩年,國內外很多大廠和創業團隊都在積極開源。
配套技術標準體系日漸完善。技術的最終使命是業務應用,作為技術的載體,產品如何構建、如何落地將對用戶的業務形態產生重要影響,這就需要統一規范的技術標準,為產品的可用、易用劃出基線。目前,從IEEE、ISO、ITUT等國際組織到中國通信標準化協會(CCSA)、全國金融標準化技術委員會(金標委)等,均在組織力量制定或發布隱私計算相關的技術標準。
成熟商業模式還需繼續孵化。隱私計算行業目前整體處于規模商用的前期。其一,隱私計算技術的效率總體來說相較于本地計算更低,難以滿足大規模商用的要求;其二,若采取系統平臺的形式,那么平臺部署在哪里,是部署在客戶本地還是第三方機構,目前也難以明確;若采用硬件或軟件銷售的模式,客戶是否能在相應的硬件一體機或軟件上進行二次開發,以更好的匹配其隱私計算需求,也未有定論。這些問題主要源自計算效率的低下和分潤機制的不完善。只有不斷提升隱私計算技術的計算效率,更好的滿足客戶應用場景的需求;并通過市場化探索,通過成本定價結合收益定價的模式,不斷完善分潤機制,使數據提供方、技術供應商和客戶均能從隱私計算交易中獲得公平的收益,才能逐漸形成成熟的商業模式。
隱私計算的金融行業應用
基于隱私計算的銀行交易反欺詐
以云計算、區塊鏈、大數據等為代表的新一代信息通信技術,正在加速金融業與信息科技的創新融合。金融科技在使支付、借貸、投資、保險等金融服務變得高效便捷的同時,也為銀行業帶來了申請欺詐、交易欺詐和營銷欺詐等欺詐風險。申請欺詐是指在信貸申請階段存在的惡意逾期、中介代辦、內外勾結、團伙欺詐等行為;交易欺詐指第三方在客戶不知情的情況下,非法利用他人賬戶進行的賬戶盜用、偽卡盜刷等行為,以及內部員工在支付和交易過程中的違規操作、騙取客戶或行內資金等行為;營銷欺詐是指黑產利用金融機構發放新用戶紅利時的推廣活動漏洞,進行非正常參與、非法獲取營銷紅利,致使金融機構遭受損失的行為。
攻擊對象不確定、犯罪主體難追蹤、外部欺詐風險涵蓋范圍廣、防控難度大等原因使金融欺詐成為導致銀行業受損最嚴重的風險之一。據國外研究機構統計,欺詐風險每年導致的銀行業受損金額高達近千億美元,國內銀行每年因欺詐風險損失的金額也高達百億元。
對于絕大多數銀行機構,反欺詐的最大難題是反欺詐模型建立過程中數據來源單一,單純依靠自身業務數據構建出的反欺詐模型識別準確度極低。隨著黑色產業鏈的智能化與集團化發展,各類欺詐手段的特征越發隱蔽、難以察覺,且跨行業欺詐逐漸成為常態,單次欺詐行為貫穿社交媒體、銀行App等多個工具,各機構的單方數據無法應對。如何在有效保護數據安全的前提下,合法合規地利用內外部數據,豐富樣本數據特征維度,構建更加精準的反欺詐風控模型,提升反欺詐能力,是各類銀行的當務之急。
針對銀行反欺詐管理中遇到的特征維度不足、安全與利用矛盾、解決方案碎片化等困境,基于聯邦學習等隱私保護計算技術的“數據+平臺+模型”一體化解決方案,通過實現銀行與外部機構在反欺詐場景下的跨行業數據鏈接,聯合了金融交易特征、社交行為特征和相關人員特征等多維度特征信息構建反欺詐模型,能實現更精準有效的交易欺詐甄別,提升銀行機構交易反欺詐能力。
基于隱私計算的金融風控
隨著信貸市場規模的擴張,市場對信貸風控的要求也日益增加,但銀行等金融機構掌握的客戶信用信息不全,人行征信系統又無法完全覆蓋,大量數據的控制權分散在不同部門、機構及互聯網公司,“數據孤島”問題嚴重,有效數據的缺失嚴重制約了金融機構對客戶信用風險的評估。
傳統的聯合建模方式需要匯集雙方數據到一個集中的場所,但對于銀行等屬于強監管行業的金融機構來說,數據絕不允許出庫,這種情況就需要數據機構帶著數據到銀行等客戶環境內建模,數據機構的數據出庫不可避免,即便采用安全屋等方式,數據的傳輸和使用過程也存在極大的泄露風險。行業亟需一種能在金融機構和數據機構雙方數據都不出庫的前提下完成定制化模型構建工作的技術能力。
基于多方安全計算、聯邦學習等隱私計算技術構建的金融風控模型,需要金融機構和數據機構兩方/多方協作。其中,金融機構擁有用于建模的部分特征,數據結構也擁有用于建模的部分特征以及標簽信息,通過多方安全計算平臺,兩方/多方樣本首先進行樣本對齊(PSI),選取對齊的樣本用于模型訓練,接著對兩方/多方擁有的特征進行特征選擇和特征工程,然后通過安全聯邦機器學習算法訓練出風控模型,用于后續的預測打分,并與金融業務系統對接。整個過程各方數據均不出庫,也不依賴于任何第三方,進一步增強了安全性和實用性。
基于隱私計算的精準營銷
線下廣告主無法有效利用大型互聯網投放平臺,如每日頭條、抖音等,大量數據源以孤島形式存在,沒有流通和充分挖掘。金融機構可以通過多方計算方式與外部數據源進行用戶分層模型的聯合建模,實現用戶的分層與分群,并基于這些分群的結果及用戶的偏好,設計相關的存客促活營銷策略。
以白名單流量獲客為例。首先,銀行在投放前進行撞庫,剔除存量用戶、被拒用戶。傳統方式是銀行開放全量客戶給廣告商撞庫,造成用戶信息泄露,安全方式是通過安全求交,實現對交集之外的用戶隱私保護。其次,銀行在投放時可做前置風控,通過多方安全計算平臺結合運營商數據及媒體數據進行三方聯合建模,降低無效投放,提高營銷效能。最后,銀行的樣本無須出庫,即可和媒體進行多方聯合計算,迭代投放模型。
銀行業隱私計算創新應用的政策建議
利用隱私計算技術安全合規開展數據價值變現,賦能行業生態,服務社會經濟發展。銀行業在助力經濟轉型的同時,也積累了非常有價值的數據資產,呈現出超全覆蓋、超多維度、連續不間斷、超大數據資產等特征。針對數據要素市場的發展,銀行業可以利用自身數據的規模優勢和價值優勢,構建產業生態,在公共管理、交通旅游、安全監控、欺詐防控、商圈分析、金融征信等領域提供數據共享服務,釋放銀行業數據要素生產力,增強為社會經濟發展的數據賦能能力。
加大研發投入,積極開展隱私計算關鍵技術研究,提前布局。隱私計算產品與其他的數據處理產品不同,其本身承載著保護隱私數據安全的重要功能,技術服務廠商與產品使用者都應謹慎對待隱私計算產品的安全性挑戰,而算法協議安全、開發應用安全和安全共識正成為當前隱私計算應用亟需解決的問題。面對數據要素市場未來可能出現的重大機會,銀行業應當在新賽道加大研發投入,對相關技術開展研究,提前布局,在行業競爭中占領制高點。
充分利用銀行業資本優勢,加快算力建設,加強異構網絡的互聯互通,為隱私計算的大規模應用打下良好基礎。對于數據提供機構和數據應用機構而言,普遍存在與不同機構合作時需要部署不同的隱私計算平臺的問題,導致系統建設重復和運營成本增加。由于不同的隱私計算平臺是基于各自特定的算法原理和系統設計實現的,且目前閉源的平臺很多,平臺之間很難完成信息的交互,因此計算平臺之間互聯互通的壁壘成為了隱私計算面臨的新挑戰,或使“數據孤島”變成了“數據群島”。銀行業擁有大量的數據資產,可以在隱私計算基礎設施建設方面發揮重要的牽頭和協調作用,促進統一的數據要素市場的形成。
利用隱私計算技術,全面提升銀行業合規監管水平。通過隱私計算技術,可以整合內外部收集到的各種數據,盡可能消除申請及交易等環節的信息不對稱問題。并且可在充分保障用戶隱私的前提下對客戶行為進行關聯建模,從而更全面地了解客戶、評估客戶行為的合規性。基于多方數據源進行聯合建模可豐富反欺詐、反洗錢等合規監管模型和知識庫,對客戶進行持續識別,增強反欺詐、反洗錢等風險洞察及溯源核查能力。
(作者單位:上海數據交易所)
責任編輯:孫 爽