徐曉宇 中國科學技術大學管理學院
自 2001 年“大數據”一詞在 Gartner的研究報告中出現后,圍繞大規模數據集所形成的采集、存儲、分析、應用等一系列產業得到快速發展,同時社會各界對“大數據”一詞的理解逐漸深入和完善,起初研究者傾向于從技術角度、特征等方面對大數據進行闡述。而隨著大數據的影響逐漸擴大至整個社會層面,從研究、應用到產業發展的過程中,大數據開始從單一的“數據集”的概念豐富成涵蓋數據、技術和產業的綜合概念[1]。
國務院《促進大數據發展行動綱要》中提出,“大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合”,通過對數據進行采集、存儲和分析,能夠挖掘出數據背后潛藏的價值。正是基于這些特點,大數據正快速發展為新一代信息技術和服務業態。綱要中所明確的“大數據”概念,以綜合的視角對整個體系進行了概括,可視為對大數據的標準定義。
數千年以來,實驗驗證、理論推導和科學計算一直是人類探索自然、研究社會的基本認知范式。而在大數據時代,數據思維方式成為“第四范式”。在未來,大數據將成為金融發展的重要推手,金融發展也將越來越依賴于數據以及數據所帶來的新的認知方式,出現了龐大的數據需求。
金融業是數據導向程度最高的行業之一,大數據的巨大潛力鼓勵了銀行、保險、證券等細分領域內的金融機構通過數據利用來拓展金融服務范圍,并促進金融業與各行業進行交流,搭建新的網絡。在此過程中,金融業龐大的數據需求已遠超自身所擁有的數據量。與此同時,在政府、企業和個人數據迅速積聚的背景下,全社會的數據規模已經從PB級增長到ZB量級[2],海量的數據總量為數據交易創造了可能。
大數據正助力金融行業的發展,為金融業發展賦能。在實際應用中,金融業的數據需求已遠超其體系內部所掌握的數據范圍,在更大程度上需要與外部數據進行聯動,而海量的數據總量加之供給的大數據自身所特有的模糊性、時效性和冗余性等特點都對大數據價值挖掘能力提出了更高且更迫切的要求。在此過程中,數據交易平臺應運而生。在市場運營中,多數交易平臺的問題層出不窮,很大程度上制約了數據交易,數據變現困難。
交易權屬不明。在數字社會所形成的網狀結構中,去中心化的特點尤為突出,其開放、平等、協作、共享的精神內核表現在數據權利上體現為共享權,在數字化產品中體現可復制性、非消耗性等特點突出,已得到產權確認的數據依然可以以極低的成本進行復制和擴散,給在數據交易所進行數據交易的數據供求雙方帶來不小的交易隱患。
定價機制合理性有待提高[3]。與此前的工業時代不同,大數據時代的數據產品定價和數據資產評估受到數據品種、數據完整性時效性、數據樣本覆蓋、時間跨度等多種因素的影響,因而需要明確合理的定價機制。但目前中國的數據交易市場尚處在初級階段,數據商品定價缺乏統一的行業標準,在交易中賣方居于主導地位,合理性、持續性亟待提升[4]。
此外,還存在交易平臺法律地位不明確、產權界定不清晰、交易規則和標準缺乏、安全保護隱患重重、專業人才缺乏等痛點。
盡管大數據在金融領域的應用潛力很大,但目前來看,金融體系內部的數據應用中仍存在諸多困難[2]。
技術應用和業務探索有待突破。金融機構現有的數據系統架構涉及多家系統平臺和供應商,對其進行技術改造的難度較大。除此之外,在實際應用中,金融業的大數據分析和預測模型存在一定的誤判率,為提高預測的準確性,金融機構還需要投入成本進行相應的優化升級。
行業標準和安全規范有待完善。目前,金融大數據還未形成統一的存儲標準和共享平臺,金融機構間仍存在不同形式的數據壁壘,缺乏有效的協同,數據孤島問題突出。此外,行業內部需完善個人隱私的保護機制,金融用戶的信息安全保護需要提升。
頂層設計和扶持政策需進一步細化。金融大數據的應用缺乏統籌規劃,有分散、臨時、應激等顯著特點,信息開發潛力大。
面對種種挑戰,數據交易平臺可以通過區塊鏈技術實現數據確權,以網絡擔任信用中介,通過某些特定算法評判出信用的真偽,以加密技術為支撐,根據不同的應用場景編寫出不同的智能合約,從而為全球的互聯網金融構筑起新的信用范式。交易平臺還可采取捆綁式定價、一類一策以及以數易數等多種交易方式,進行綜合定價,豐富數據交易方式[5]。
金融行業的大數據應用仍存在很多問題需要克服[6],需要國家出臺專項產業規劃和扶持政策以促進金融大數據發展,也需要發揮行業的優勢,在行業內推動數據開放、共享并建設統一平臺,強化行業標準和安全規范。
在大數據時代,金融的邊界不斷延伸,金融牌照公司和部分有互聯網大數據功能的公司將圍繞生態圈、戰略和產品進行競爭,未來的金融大數據市場競爭格局充滿變數。