文 梅 宏
信息化就是信息技術廣泛應用及深入社會生活各個方面的歷程,真正的信息化浪潮是從個人計算機進入市場、進入家庭開始的。以單機應用為主要特征,其主要目標是實現辦公數字化。而隨著互聯網的大規模商用,以聯網應用為主要特征的網絡化應用逐漸出現,這一過程就是社會數字化。如今,互聯網正在進入以數據深度挖掘和融合應用為主要特征的時期。伴隨互聯網出現的新經濟模式也開啟了數字經濟時代。從農業經濟到工業經濟再到數字經濟,如今的數據已經成為重要的生產要素。
2017年4月IDC發布的《數據時代2025》預計,2020年全球數據量將超過50ZB左右,2025年全球數據量將達到175ZB,其中實時數據將占比30%。而在2021年3月,IDC預計全球大數據市場支出規模將在2024年達到約2983億美元,預測5年期內(2020—2024)實現約10.4%的復合增長率(CAGR)。大數據服務支出將在全球層面保持其主導地位,占市場總量一半以上。
聚焦我國,中國大數據支出整體呈穩步增長態勢,市場總量有望在2024年超過200億美元,與2019年相比增幅達145%。同時,中國大數據市場5年復合增長率(CAGR)約為19.7%,增速領跑全球。
2012年:7月,美國風險投資人Matt Turck開始繪制大數據產業圖譜V1.0,2012年10月更新并發布大數據產業圖譜V2.0,大數據基礎設施作為研發重點,基礎設施相關業務和企業發展較快,生態系統逐漸形成并快速演化。
2014年:大數據產業聚焦數據研發,大數據分析成為熱點,大批公司成立并快速發展,風險投資大量涌入,生態系統仍處初級階段。
2016年:大數據應用成為發展重點,面向行業和領域的應用型企業發展迅猛,生態系統向更成熟發展。
2017年:數據治理首次納入基礎設施,數據治理與數據安全成為重點實施領域,生態系統發展全速推進。
2018年:數據治理是大數據生態系統中快速增長的部分之一;2018年是“數字化轉型”階段,數據驅動的業務真正落地;大數據與AI難以區分,呈“體”和“用”的關系。
2019年:數據和AI生態系統仍然是最令人興奮的技術領域之一,基礎設施、云計算、人工智能、開源以及人類經濟和生活的整體數字化也在快速發展,并相互交織,這一切都推動“萬物數據化”成為一種快速演進的“大勢”。
2020年:云計算和數據技術(數據基礎架構、機器學習/人工智能、數據驅動的應用程序等)成為數字化轉型的核心技術,數據生態系統的韌性與活力進一步顯現。
針對這8年間大數據領域的變化,可以將其分為5個階段:基礎技術和基礎設施、分析方法與系統、行業和領域應用、大數據治理、數據生態體系。
數據作為生產要素的特征、價值和意義可以從兩個角度分析:一是本體論。數據本身蘊含很多信息、知識、規律甚至智慧,數據是有價值的。二是方法論。從方法論角度來看,怎么用數據理解行業成為了重點。
通過對傳統生產要素數字化并數據化來實現賦值、賦能,數據從某種意義上已經成為傳統生產要素在數據空間中的數字孿生。數據要素的主要特征包括:1.非排他性(或非獨占性),即可復制、可共享、可交換、可多方同時使用,共享增值;2.非競爭性,即開發成本高,在動態使用中發揮價值,邊際成本遞減;3.非稀缺性,即萬物數據化,快速海量積累,總量趨近無限,具有自我繁衍性;4.非耗竭性,即可重復使用、可組合、可再生,在合理運維情況下可永遠使用。生產要素的類別隨著技術發展、社會進步在不斷擴展,數據要素作為一種新型生產要素,能夠數據化所有其他要素,并促進其他要素提升生產效率。“萬物數字化、萬物互聯”的時代,由數字化萬物所構建的數據空間,為人類認識世界和改造世界提供了顛覆性手段。將勞動、土地、資本、技術、管理、知識等各類要素數字化并數據化,發揮數據對提高生產效率的乘數倍增作用。
當前,數據要素化面臨4個挑戰:一是數據的資產地位尚未確立,二是數據確權難題尚待破解,三是數據共享流通障礙重重,四是數據安全和隱私保護體系尚不健全。
實施國家大數據戰略,建設數字中國,發展數字經濟是新時代的必然選擇,其途徑是加快推進各行各業的數字化轉型,其關鍵是加快培育數據要素市場。無疑,這是一項系統工程,需要統籌、系統化推進。我以為,數據治理體系的構建需要先行!
構建數據治理體系要堅守4個基本原則:一是堅持戰略思維,構建數據治理體系;二是堅持辯證思維,深刻認識數字經濟時代的一般規律;三是堅持創新思維,探索引入新型數據治理理念;四是堅持底線思維,切實保障國家安全和人民權益。
要統籌協調好國家、行業及組織3個層次之間關系。國家層面,要加緊制訂數據治理的“上位法”,指導和監管行業及組織的數據治理;行業層面,通過行業自治的模式,在自愿原則上形成行業協會或聯盟等,作為政府和企業間的橋梁,在國家法規和政策的指導下,制訂并執行行規行約和各類標準,監督企業的行為,并向政府傳達企業的共同需求;組織層面,在國家和行業框架下,針對自身特點,確定治理目標,優化對大數據資源的管理,最大化從大數據獲得的收益,并為行業和國家大數據發展貢獻成功應用實踐。
要構建數據治理體系,須切實做好4方面工作。
第一,強化頂層設計,理順權責邊界。推動數據相關立法,明確數據確權、隱私保護、交易流通、數據跨境等管理要求;構建政府主導、多方參與的數據治理體系,厘清政府、行業、組織等在數據要素市場中的權責邊界。
第二,建立流通機制,促進市場配置。建立完善數據登記、分類分級、質量保障等管理制度和標準規范,確保數據資源有效供給;參照自然資源特許經營模式,建立數據開發利用、加工運營、交易服務等流通機制,推進數據產品和服務的有序流動。
第三,開展試點示范,推動應用落地。在有條件的地區試點先行,以數據要素市場化配置改革為突破口,探索形成數據評級、數據交易與監管機制;梳理總結并推廣試點工作經驗,形成數據運營加工的新業態,以市場化方式推進應用落地。
第四,加強理論研究,提升技術能力。鼓勵更多的學科介入,積極開展數據治理、數據流通、數據運營、數據加工等基礎理論研究,充實理論儲備;支持數據確權、數據互操作、共享流通、數據安全、隱私保護等相關技術研發,提供有效技術保障和方案。
數據治理體系需要持續完善制度法規、標準規范、應用實踐和支撐技術4個方面的治理工具和手段。特別是需要鼓勵應用實踐,允許認定的地方、機構在一定的范圍內先行先試,獲取經驗和教訓,以應用實踐為牽引,推進制度法規、標準規范和支撐技術的發展完善。