杜小勇
專家視角
對數據要素的幾點認識
杜小勇
中國人民大學信息學院,北京 100872,E-mail: duyong@ruc.edu.cn
2023年3月10日,十四屆全國人大一次會議表決批準了《國務院機構改革方案》(以下簡稱《改革方案》),其中組建國家數據局令人矚目,也是這次機構職責優化調整的重點領域之一。新組建的國家數據局將負責協調推進數據基礎制度建設,統籌數據資源整合共享和開發利用,統籌推進數字中國、數字經濟、數字社會規劃和建設等。根據這個方案,中央網絡安全與信息化委員會辦公室承擔的研究擬訂數字中國方案、協調推動公共服務和社會治理信息化、協調促進智慧城市建設、協調國家重要信息資源開發利用與共享、推動信息資源跨行業跨部門互聯互通等職責,國家發展和改革委員會承擔的統籌推進數字經濟發展、組織實施國家大數據戰略、推進數據要素基礎制度建設、推進數字基礎設施布局建設等職責劃入國家數據局。
組建國家數據局是為了更好地發揮數據要素的基礎資源作用和創新引擎作用而整合優化中央層面相關職能的必然路徑,有其背后的理論邏輯和現實考量。以下從三個方面進行分析。
2010年前后,大數據作為一類技術出現在Gartner曲線上。2012年被認為是我國大數據的元年,中國計算機學會等學術組織都在這一年成立了大數據專家委員會。在過去的十多年中,對大數據價值的認識,經歷了三個階段。
第一個階段,大數據是作為科學研究的新范式被公眾所接受的。2009年,微軟研究院為了紀念偉大的計算機科學家、圖靈獎獲得者、也曾是微軟研究院的首席科學家吉姆·格雷博士出版了《第四科學范式:數據密集型科學發現》,將大數據作為繼科學觀察、邏輯推理、計算機模擬之后的第四種科學研究范式。書中介紹了用大數據重新定義科學學科,包括天文學、環境科學、生命科學等等。按照這種科學范式,研究起始于數據的收集,通過開發數據工具實現對數據的分析,獲得科學的洞察。這種研究范式盡管不能替代傳統的科學研究范式,但是突破了個體研究者的能力局限,在許多科學領域取得了矚目的成果。大數據的價值被廣泛認知。
第二個階段,大數據是作為賦能工具對傳統的工業和商業、以及政府管理和社會生活等各個方面產生影響,帶來巨大的變革。大數據猶如血液流淌在信息系統中,促進了社會經濟系統效率的提高。2015年9月5日,國務院發布《國務院關于印發促進大數據發展行動綱要的通知》,2017年12月習近平總書記在十九屆中央政治局第二次集體學習時,就實施國家大數據戰略進行了布局。大數據正式成為國家戰略,在國家層面開始大力推動政府部門數據共享,穩步推動公共數據資源開放,統籌規劃大數據基礎設施建設。在政府領域,以解決民生堵點問題為抓手的各種惠民項目(如“最多跑一次”)的推出與實施,有效地推動了公共數據的共享。“數字化轉型”成為這個階段的最顯著的特征。
第三階段,大數據是作為生產要素參與經濟活動和價值分配。這是一次重大的理論創新,體現了黨和政府對數據價值認識的進一步深化。2020年3月30日,中共中央、國務院發布《關于構建更加完善的要素市場化配置體制機制的意見》,首次把數據作為生產要素寫入中央文件,數據作為一種新型生產要素,正在加速融入我國經濟價值創造體系,重塑經濟運行的生產、流通、分配、消費等各環節。《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》中提出要打造數字經濟新優勢,迎接數字時代,激活數據要素潛能。以數字化轉型整體驅動生產方式、生活方式和治理方式變革。2023年先后發布的數字中國頂層設計和數據要素基礎制度(簡稱“數據二十條”)更是將數據要素推到了一個新高度。
由此可見,大數據從科學研究的新范式,到數字化轉型賦能各行各業,再到數據作為生產要素,體現了我們對數據價值認識的不斷深化。當然,并不是說大數據作為科學研究范式已經過時了,更不是說數字化轉型已經完成了,而是說人們對數據的認識越來越深入了。在這樣的背景下,成立國家數據局是很自然的選擇。
釋放數據價值關鍵在培育數據要素市場,而數據要素市場的繁榮需要一個可持續的、健康發展的數商生態來支撐。筆者曾從數據價值鏈的視角,厘清了數據價值釋放需要具備的基本活動和輔助活動,構建了數商生態的主體模型和職能。數據價值創造的基本活動主要包括數據資源化生產、數據服務化開發、以及數據價值化利用,這三者之間并不一定是線性或單向的關系,例如,在數據服務化開發的過程中,可能會發現缺少一些必要的數據資源,從而觸發新的數據資源化生產的活動,在數據價值化利用過程中可能發現新的數據服務需求,從而催生新的數據服務化開發活動,等等。數據價值創造的輔助活動是圍繞上述基本活動而展開的,雖然這些輔助活動不是直接以創造數據價值為目的,但是能夠降低價值創造過程的成本與風險。輔助活動至少可以包括技術賦能、風險管控和價值分配三個方面。例如,在數據服務開發過程中,風險幾乎是必要存在的。特別是級聯風險更具有破壞性。因此,級聯風險的隔離就顯得非常重要。我們需要有一些中介機構,對數據服務開發進行風險評估,幫助識別潛在的風險,并為風險兜底,這樣可以降低數據服務開發商的風險成本,提高整個價值鏈應對風險的彈性。
釋放數據價值還需要處理好與數據安全的關系。一般認為釋放數據價值必然帶來數據安全問題,我們的研究表明這兩者是數據要素對立統一的兩個方面。一方面,數據的使用會帶來數據安全的隱患,無視數據安全底線會帶來系統性風險,但過度的數據保護會傷害數據價值的釋放。這體現為日益嚴峻的數據危機。另一方面,良好的數據保護會促進數據價值的釋放,而數據的充分使用,也有利于數據的安全保護。這體現為數據價值的可持續發揮和整體社會效益的最大化。
數據作為一種新型生產要素,對于我們都是一個新生事物,對其本質和規律的認識還遠遠不夠,我們需要在實踐中探索其本質規律。政府要創新體制、明確安全底線,積極引導數據要素市場以有效應對數據危機,同時又要定好位,為實踐和探索留足空間。企業要充分發揮企業家的創新精神,勇于探索。要把握機會、創造數據價值,更要正視數據危機日益嚴峻的現實,牢記社會責任感,樹立牢靠的企業責任意識和自律意識,從生態共創的視角,壓實數據治理的責任,積極參與治理規范的塑造,遵紀守法不違規。此外,還要引導各種社會力量來參與數據要素的治理,共同營造發揮數據要素價值的健康生態。
無疑,成立國家數據局,可以促進數據價值的釋放,統籌發展與安全的關系,減少內部消耗,有利于數字經濟健康有序發展。
2022年12月19日,中共中央、國務院發布《關于構建數據基礎制度更好發揮數據要素作用的意見》(俗稱“數據二十條”),提出了構建包括數據產權、流通交易、收益分配和要素治理等四大方面數據基礎制度。這為大數據的價值釋放開辟了新的空間。但是,我們必須對構建數據基礎制度的困難性有充分的認識,這方面的工作才剛剛開始,存在諸多難題和挑戰。
首先是數據資源分類體系。類比于自然資源(例如土地),需要構建資源目錄,對資源做到心中有數。但是,對于數據資源如何構建資源目錄?目前文獻和實踐中一般分為個人數據、企業數據和公共數據,這樣的分類還不能滿足實踐的需要。例如,有些平臺企業,事實上承擔了一定的公共事務,這部分公共事務所涉及的數據顯然具有公共數據的屬性。再比如,企業數據中也有大量的個人數據。數據資源分類是數據要素化過程中必須解決的一個難題。
其次是技術支撐體系。數據有關制度需要有合適的技術支撐才能落地,比如如何標識數據,如何為數據定價,如何確保數據擁有方的利益等等,如果沒有合適技術的支撐,有些關于數據的制度就是一紙空文。所以,我們在推動數據基礎制度制定的過程中,所提出的概念、要求等應充分考慮技術的可行性。
第三是數據治理體系。數據要素不能像一些自然資源一樣,完全由政府管理,而是要引進多方治理的概念,開展數據治理。梅宏院士主編的《數據治理之論》提出了數據治理的一個三維框架,即從治理主體看,包括國家、行業和組織三個層次;從治理的內容看,包括資產地位的確立、管理體制機制、開放與共享、以及安全與隱私保護四個維度;從治理工具看,包括支撐技術、制度法規、標準規范和應用實踐等四個方面。圍繞這個框架存在大量的科學問題還沒有答案,還有大量的研究工作需要展開。
第四是數據要素化體系。從數據資源化到數據資產化到數據資本化,是釋放數據價值的三個階段。每一個階段都有很多的基礎性課題需要研究和突破。在數據資源化階段,要解決數據的標識問題、連接問題、以及互操作問題,還要解決數據的質量問題等。只有具有一定的條件下數據才能成為資源,才具有價值,并不是所有的原始數據都是具有價值的。在數據資產化階段,包括了產品化和商品化,要對數據產品進行標準化的描述,要研究其定價的機制和利益分配的機制等。在數據資本化階段,包括了數據證券化以及相關的一系列問題。目前在全國各地出現了一批數據交易所,這些數據交易所就是數據資本化的一個重要設施。
這些問題都需要我們從理論和實踐兩個維度上去探索和解決。我國的新型舉國體制,要求有這樣一個國家局來做頂層設計,一體化推動。
Preliminary Exploration of Data Factors
10.19788/j.issn.2096-6369.230104

杜小勇
中國人民大學校長助理/教授
教育部數據工程與知識工程重點實驗室主任