北京易華錄信息技術股份有限公司 劉傳
針對目前數據產權模糊、管理“散、亂、差”和收集困難等問題,“數據銀行”基于銀行托管資金的理念及構架,以保護數據所有權、隱私權、收益權為核心,搭建管理與運營平臺,以提供數據的匯集、一級開發、確權、管理和交易等服務功能,實現數據的增值、評估、信貸等價值。
數據銀行的構建包括基礎環境、數據存儲、業務內容三個層面,基礎環境的建設主要是針對政府數據、企業數據、個人數據通過搭建城市數據湖以達到數據匯集,形成城市數據資源池;數據存儲層面需包括數據工廠、托管區和儲蓄區,主要開展數據清洗與加工等一級開發業務;業務內容層面,在數據一級開發的基礎上,對數據資產進行盤點、評估和登記,以便于開展定價、抵押、API中介等交易類服務,同時為保證數據資產安全,還應建立信息安全體系、數據身份識別體系、用戶信用體系等。
數據銀行的構建由數據源、數據傳輸、數據資產化、存儲資源池、業務服務、數據標準以及數據安全七個部分組成,其中存儲資源池根據數據使用頻度的不同可以分為冷數據和熱數據。根據大數據“二八定律”,對于冷數據可以使用藍光光盤、磁帶等低耗能存儲介質以降低長期保存成本。
數據來源主要分為政府、企業、個人、第三方機構四類,數據銀行作為一個開展數據金融的商業機構,在進行商業化運轉的同時也將不斷衍生新的數據,結合建設全介質混合存儲平臺通過將數據冷熱分離的低耗能存儲,可有效提升數據源匯集與使用效率,補充業務所需的數據資源條目,不斷擴展可服務用戶的范圍。
數據傳輸通過互聯網、移動互聯網、物理遷移、專線和物聯網等技術手段,對不同類型的各類數據進行傳輸交互的通路,以便數據匯集到數據銀行進行數據資產化的處理[1]。
數據資產化是數據可進行交易的必備環節。通過數據傳輸環節匯集到的數據源是無序、雜亂、冗余的,如果要進行資產化使用就需要對數據進行一級開發,包括了數據清洗、編目、脫敏等內容,并且還應對一級開發處理后的數據進行價值評估,也就需要建設一套可行的數據價值評估體系,只有完成這一系列操作流程后融合到的數據才能真正用于數據交易,也才是具備了資產屬性的數據資源,數據資產價值評估模型的建立有利于提高數據資產價值評估工作效率、有利于提升數據增值運營水平、減少決策失誤和避免經濟損失。
數據存儲資源池的建立可以建設“現金庫”和“黃金庫”。“現金庫”的數據產品雖然缺乏長期使用價值,但具備流動性與場景性強的特點,其不適用于長期存儲,但短期變現價值較好,能夠較快的服務于日常的各類數據業務;“黃金庫”的數據產品雖然個體價值較高并具備普適性應用價值,但其自身直接提供服務的可能性較低,需要深度開發成其他數據產品才能發揮更大的價值,可不斷賦能不同時期的基礎應用場景。
數據銀行是數據金融價值屬性的體現,它基于數據“海量、安全、綠色、生態”的存儲、計算和挖掘服務能力,采用類銀行的經營模式、商業理念和管理方法。數據銀行的主要業務包括:數據收儲、數據價值評估、數據資產交易、數據資產信貸等[2]。
數據收儲是指對數據源進行匯集存儲和一級開發,針對數據類型與來源可將數據劃分為:涉密數據、敏感數據、隱私數據、開放數據等類型,并針對不同類型依照數據特點與應用場景、存儲方式,進行不同程度的一級開發。例如:針對涉密和敏感數據就僅能完善數據結構,將非結構化數據整理成結構化數據并完善標注,此類數據應主要以藍光存儲為主,等數據解密或不具有敏感性時再進行資產化開發;而隱私數據和開放數據在獲得數據所有權人的允許后可以主要用于數據資產化開發,在經過清洗、脫敏等處理后以提升數據價值,此類數據主要存儲于熱磁或固態硬盤,以滿足應用端響應速度的需要。
數據價值評估主要是為機構或個人開展數據盤點、資產登記、價值評估等確權賦值業務,核心是為數據的資產化價值體現提供業務支撐。數據價值評估模型的建立將解決數據資產確權與評估問題,為企業提供數據資產金融化服務,以提升數據流動性,釋放其資產價值。
數據資產交易與資產信貸是數據價值體現的主要形式,數據經過評估后就具備了抵押、擔保的價值,可以為企業融資、數據資產證券化等業務的開展提供支撐。數據資產的定價是在傳統資產價值評估與定價基礎之上,增加數據類型、時效性、完整性等分類評估[3]。
數據銀行區別于一般的數據交易中心的核心區別在于要搭建具備長期、安全、綠色低碳數據存儲能力的數據中心底座,因此其應用場景存在一定的獨特性和優勢。數據銀行核心獨有數據的特性包括:時間空間維度長,非結構化數據,價值顆粒度低但易與其他數據融合聚變,應用場景不明晰,買賣雙方差異化,時效性要求低,價值需要數據治理才能呈現。基于數據銀行應用場景的獨特性:互聯網企業數據應用場景,主要是以熱數據的應用為主,追求的重點是數據的即時性或短時期內效應,數據銀行全場景應用除了熱數據之外,其獨特性在于開發基于有長期時間維度、數據量龐大的冷數據,用戶對象特征需要長時期的信息積累才能暴露或表現出來的場景。基于數據銀行數據融通的必要性:數據銀行與傳統人工智能的應用最大區別在于數據量的易得性、龐大性、多樣性和時間尺度的長期性的限制,用戶不能或者無法全部獲得數據的全貌;數據擁有者和數據需求方較難直接對接,或達成買賣協議保障不足,因此需要通過數據銀行的數據融通和交易服務,增加數據的內容完整度、時間維度完整性、結構一致性和價值凸顯性等。
數據銀行的商業模式主要包括存儲空間租售、數據加工服務、數據產品出售、數據交易撮合、數據價值評估等。數據銀行宜采用“自營”帶動“集市”策略,數據交易初期以“自營”模式,通過高質量的數據“商品”組建數據銀行的基本商品庫,吸引數據需求方,后期逐步帶動其他數據供應方進入數據銀行,提高整體數據集市的交易活躍度。數據銀行以全場景應用反向促進數據的匯聚融通,數據交易能否長期持續高頻詞進行,其核心在于交易之后的應用場景是否真實存在并且可變現,供需雙方的真是需求能否得到滿足。
數據的基礎化服務還包括數據的一級開發,數據銀行通過對數據的一級處理,使其變成標準化的可交易資源,用戶可以根據需要來決定對數據是委托交易還是留存自用[4]。
數據銀行的五大應用場景主要包括:
(1)醫療衛生,數據類型主要為基因數據、醫療影響數據、醫療病歷數據等,其具備數據量大、應用場景多、對個人價值高等特點,數據來源主要為醫療、個人、研究所等,數據未來的需求方主要為醫藥公司、保險公司、科研院所、疾控中心等;
(2)司法存證數據,數據類型主要為庭審音視頻和卷宗檔案等,數據具有量大需長期保存的特點,數據來源主要為公檢法機構所持有的數據,數據的需求方主要為法律從業機構及智能司法開發機構;
(3)教育行業,數據類型主要為錄像、學習檔案、課件等資源,數據具有量大、長期存儲、價值大等特點,數據來源主要為學校、網課平臺等教育類機構,數據的需求方主要為智慧教育開發商、網校、素材網站等;
(4)前沿科學方面,主要數據類型為天文數據、衛星遙感數據、語音和面部數據,數據具有長期海量存儲、獲取成本高、產學研轉化可能性高等特點,數據提供方主要為天文臺、航天局、數據源提供商等機構,數據需求方主要為天文愛好者、軟件開發商、地圖公司、旅游公司、保險公司、安防與定位識別、自動駕駛等公司;
(5)城市人車物數據,數據類型主要為車輛通行數據、城市建筑數據、城市人流數據等,數據具有數量大、存儲時間長、實時更新等特點,數據主要來源于交通部門、施工單位、檔案局等,數據的主要需求方為貨運公司、金融機構、文旅企業、城市管理部門等。
數據銀行的業務主要包括數據資產定價、數據產品交易、數據API中介、數據資產咨詢等業務。數據資產定價是指基于數據一級開發處理后生成的數據資產,對其類型、時效、應用性、完整性等全方面進行綜合評估定價,常用的定價模式包括平臺預定價、協商定價、固定價、拍賣定價、反饋性定價等多種模式;數據產品交易主要是指搭建不同類型和行業交易平臺發布金融數據、行為數據、企業數據、社會數據、交通數據、通信數據、電商數據、工業數據、投資數據、醫療數據、衛星數據等行業數據產品,以及模型算法、可視化組件、應用平臺等大數據工具,數據分析結果、行業分析報告等咨詢材料,數據用戶根據自身業務需求,購買所需數據產品[5]。
數據API中介主要是基于開放的數據網上商城,對數據銀行未存儲和分析數據,提供在線交易渠道,通過API接口形式為各類用戶提供出售、購買數據服務,實現交易流程中介管理,并按包月或調用次數進行收費。
數據資產咨詢主要是基于數據授權下對托管數據資源進行分析處理,開展管理咨詢的大數據建模、大數據分析、商業模式轉型、市場營銷策劃等;以及基于技術服務的產業數據搜集眾包服務、數據清洗、數據分析、智慧城市等定制化業務;并根據數據擁有機構或個人數據價值進行補貼。
數據銀行是在對海量數據的全量存儲、全面匯聚、規范確權和高效治理的基礎上,對數據進行資產化、價值化,最終實現數據的交易融通和應用增值,是數據經濟時代的數據要素市場化配置下的新業態、新模式。數據銀行將對數字經濟的發展起到導向作用,喚醒全社會對于數據資產價值的意識,引領全社會更加重視數據要素和數據資產管理;實現數據的高效匯聚、確權、治理、融通、交易和應用,最大程度開發和釋放數據要素價值,提高數據要素市場化配置的能力和效率,成為賦能和推動經濟良性循環的新引擎[6]。
數據銀行的建立是數據存儲設施與數據金融屬性的重要結合。在業務開展中,一方面進行數據價值評估、數據交易、數據監管、數據安全、數據資產證券化等常規業務體系,打造數據交易基礎創新平臺;另一方面,可以突破貴陽大數據交易中心等傳統數據交易中心的技術瓶頸,依托光電磁融合混合存儲技術,針對數據進行“冷熱”分類存儲,在降低成本的同時,滿足開展高價值數據存貸、應用業務需要,在滿足數據所有者對數據安全存儲、備份、歸檔的同時,拓寬數據應用業務渠道,完善數據價值的業務鏈條。
數據銀行的建立有利于打破信息孤島、加速要素流通。任何機構和個人可以將自身擁有的信息作為一種資產“存入”銀行,由“銀行”或第三方負責數據開發利用,再將加工處理過的數據以不同的產品、服務形態進行交易。數據銀行加工標準、交易規則、交易機制等的制定均基于對于市場需求和風向的密切掌握,促使各單位、各行業、多門類的數據跳脫出原有的藩籬,相互融合,打破行業信息壁壘,削減“信息孤島”現象。由于數據具有時效性,所以發布和購買數據的及時性是十分重要的,數據銀行可以讓有需求的用戶及時得到所需的數據,也可以讓數據供應方及時將所擁有的數據發布出去,為“借貸”雙方提供了良好的途徑,加速數據之間的流通,提高數據共享的效率。
數據銀行的建立還將有利于優化數據供需配置、整合碎片資源、激活數據價值。數據資源供給碎片化和需求多元化是數據資源開發利用的主要難題。“數據銀行”創造了一種類似共享經濟的機制,消除了供需之間的信息不對稱,讓零散的信息資源在一個平臺上呈現、匹配和交易。數據銀行模式通過健全的數據交易流程和完善的數據交易體制,將分散的數據匯集起來,大大降低數據交易成本,減少數據流通過程中的信息不對稱問題,幫助政府、企業更加精準、明智地進行決策。