史晨昱
銀行業金融機構有著良好的大數據基礎。隨著信息化、智能化的快速發展,數據資源逐步成為銀行業的戰略資產,數據產生的價值越來越受到重視。前不久銀監會發布《銀行業金融機構數據治理指引(征求意見稿)》(以下簡稱《指引》),要求銀行業金融機構將數據治理納入公司治理范疇,并將數據治理情況與公司治理評價和監管評級掛鉤。
什么是“數據治理”?《指引》將數據治理定義為:“通過建立組織架構,明確董事會、高級管理層、部門等職責要求,制定和實施系統化的制度、流程和方法,確保數據統一管理、高效運行,并在經營管理中充分發揮價值的動態過程。”總體來看,數據治理包含這樣幾個基本要素,即數據治理架構、數據管理高效運行、數據質量控制以及數據價值充分實現。
與互聯網上產生的大數據低價值密度不同,銀行大數據具有高價值密度的特點。數據已經成為銀行經營的核心生產要素,客戶定位、產品定位、風險控制、金融市場的交易,無一不依賴于數據。與以往不同的是,數據不僅僅是經營和決策的支持工具,而是一種產品或服務形態,是用數字化改造流程和管理方式。如何在全企業甚至全集團內部,有目的、有組織地采集、存儲、利用數據,讓數據產生新價值,就不再是技術和管理層面的事情,必須上升至戰略層面,納入董事會、高管層的戰略視野和戰略思考之中,并通過戰略規劃、組織、流程、資源使數據戰略能夠打破部門之間藩籬、集團內部法人之間的藩籬,有目標、有計劃、持之以恒地貫徹和推進。
然而,實際情況卻是,中國銀行業金融機構的數據質量存在較多問題,主要表現為:
一是數據的準確性和完整性欠缺。信息化系統建設往往缺少統一規劃和科學論證,系統之間缺乏統一的標準,形成了眾多“信息孤島”。
二是數據的時效性和適應性不夠。就數據本身而言,大數據分析以海量數據為基礎,而當前數據可得性不強,銀行主要依賴于其內部數據進行大數據處理工作,因此,數據分析結構存在很大局限性;大數據種類混雜,數據失真、失效等問題正瓦解大數據質量,以低質量數據為基礎的大數據分析,處理結果的可靠性得不到滿足。
三是客戶的個人信息保護不足。2016年公安部掛牌督辦并告破的“5·26侵犯公民個人信息案”,涉及高達257萬條公民個人銀行信息,涉案金額高達230余萬元,而該案的“內鬼”竟然就是某行一位支行行長。該案所造成的社會負面影響及給銀行帶來的聲譽風險之大,足令業界警鐘長鳴。
這三個方面的問題對大數據應用的拓展造成阻礙。為了最大程度地挖掘數據價值、建立有效的數據治理機制成為銀行機構最重要的功課之一。
數據治理機制涉及的問題包括,有多少個環節?誰來參與?由誰授權數據的這些操作?誰可以被允許對數據進行這些操作?誰對操作的結果負責?誰來監督?等等。這些問題貫穿整個銀行大數據的全生命周期。銀行亟需一種足夠安全、可靠的技術來保障數據資源、資產的共享、開放、流通和保護。與此同時,正趨成熟的區塊鏈技術為彌補大數據治理中的難題提供了新的思路。
區塊鏈技術系包括分布式技術、密碼學、共識機制與時間戳等幾大基礎技術的有機結合,該種結合模式賦予了區塊鏈技術“去中心化”與“去信任化”特征,成為解決當前數據孤島問題的主要突破口,同時避免了數據所有權的錯配問題,而區塊鏈技術特有的加密及時間戳技術也使數據的真實性得到有效保障。
首先,區塊鏈具有可追溯性和不可篡改性,數據塊一旦生成就表示得到過所有參與者的認同,無法篡改,且帶有時間戳。這個好處應用到銀行大數據治理當中可以幫助數據確權(包括原始來源、管理權、訪問權、使用權等),促進數據流通,準確記錄數據的產生、交換、轉移、更新、開發利用整個過程。把數據作為核心命脈,擔心數據因為共享或開放出去之后核心業務就丟失的部門可以因此而消除顧慮。
其次,在區塊鏈上,數據包的哈希值是唯一的,能驗證數據包的真實性。哈希加密算法對數據可能涉密或隱私部分進行加密,能在流通環節將數據進行一定程度的脫敏。同時,在涉及數據各方之間采用非對稱加密技術,可以更好地劃分角色,更加精細化對數據的操作權限,保障數據隱私安全,從而降低銀行對數據的安全隱私擔憂。
再次,應用區塊鏈技術,每個區塊的生成都得到了所有參與者的共識,在區塊鏈上,數據交換記錄是所有參與者認可的、透明的、可追溯的,數據的來源和流通路徑是可以被記錄和追溯,對數據的每一次更新和修改都“有跡可循”,同時,采用哈希算法可以對數據的完整性進行驗證,從而保障和提升了數據在流通中的質量。
此外,應用基于區塊鏈的智能合約技術,可以自動管理和執行銀行之間約定好的數據共享開放利用規則,在實際操作過程中減少人為的干預,營造可信任的數據共享開放環境。
總體而言,區塊鏈技術能在最大程度上彌補大數據應用的漏洞,因此銀行業應正視區塊鏈技術的潛在價值,將區塊鏈技術納入數據治理發展規劃,探尋該項技術在銀行數據治理活動中的具體應用模式,突破大數據技術的局限性。
當然,由于銀行業務部門較多,導致數據類型多樣、標準各異,因此,需要創建的區塊鏈也必然數量繁多、多種多樣,從而針對區塊鏈本身的治理也將會是問題。同時,由于區塊鏈上的數據所有參與方都要存一份拷貝,而某些類型的銀行數據量太大,沒有辦法完全生成區塊上鏈,例如視頻監控數據。這種情況下,從傳輸效率和節省存儲空間消耗的角度出發,區塊鏈技術可能還只應用到治理機制層面,對銀行大數據的治理起到一定的輔助作用。