編者按:
中國電子信息產業集團有限公司(CEC)作為網絡安全和數據治理領域的國家級戰略科技支撐力量,創新性地開展數據安全與數據要素化工程研究,率先在數據要素的理論、制度、市場、技術等方面的跨學科研究上取得實質性突破。作為國內首個數據治理領域的學術期刊,《網絡安全與數據治理》正在成為相關領域理論研究和工程實踐的重要學術平臺,希望通過本次采訪能夠讓業界更廣泛地了解國內數據治理領域已經取得的理論突破和實踐成果。
記者:6月22日,中央全面深化改革委員會第二十六次會議通過了《關于構建數據基礎制度更好發揮數據要素作用的意見》,構建和夯實數據基礎制度對培育數據要素市場具有什么樣的作用和意義?
陸志鵬:中國電子自2020年以來與清華大學開始聯合研究,我們在組織專家交流研討的過程中深刻認識到,數據要素市場之所以發展不起來,基礎制度缺失是重要瓶頸。具體來看,要實現數據要素化,數據產權問題無法繞開,所以數據要素的基礎制度里第一個必須破解的就是產權制度。第二個是流通交易制度,原來點對點的流通模式成本高、監管難,原始數據的場內交易活力不足,導致各方普遍感到束手無策。第三個是收益分配制度,數據作為一種生產要素,如何參與勞動、生產、銷售各個環節的分配,目前仍然缺乏有效的制度安排和實現路徑。最后就是安全治理制度,我們知道數據安全形勢越來越嚴峻,安全問題必須引起重視。
此次,《意見》要求“統籌推進數據產權、流通交易、收益分配、安全治理,加快構建數據基礎制度體系”,這為解決當前數據要素市場化存在的突出問題給出了關鍵指引,標志著我國數據要素化走向了一個新的重要階段,數據要素市場化配置工作正式全面啟動。此外,《意見》的出臺將為構建全國統一的數據要素市場奠定制度基石,同時也為下一步探索更加具體的制度安排構建起頂層框架,具有非常重大的意義。
記者:數據加快實現要素化,既是黨中央的重要部署要求,也是社會各界的熱切盼望。您認為,當前阻礙數據要素化的主要瓶頸是什么?
陸志鵬:在全面落實四項數據基礎制度要求,推動數據要素市場化配置改革的制度建設、產業實踐過程中,我們發現,當前數據開發利用具有鮮明的“從開集到開集”特征,即:一側是數據資源,從品類來看是個開集,同時又是變動的、分散的、海量的;另一側的應用場景也是開集,也是變動的、多樣的、海量的。傳統的數據流通模式之下,數據是從開集的數據資源到開集的數據應用,導致二者之間的連接路徑十分復雜。
下一個階段,數據需要從資源型的開發利用模式轉向要素型的規模化流通模式,如果仍然遵循傳統路徑,必然會面臨數據的確權、計量、定價、收益分配等現實難題。這些難題歸納起來,主要是兩方面問題:一是安全問題,二是流通問題。流通與安全兩方面的問題并非孤立存在,而是混雜交織在一起,即流通和安全是一種“零和困境”:強調安全,原始數據的流通無法實現;強調流通,原始數據的安全無法保障。
具體來看,在落實數據產權制度方面,當前數據的主體多元交織,造成確權難;數據的權屬關系復雜交錯,造成析權難;數據相關的法律條款分散模糊,造成實施難。在落實數據流通交易制度方面,由于缺少標準化的交易標的物,缺少穩定安全的交易機制,以及缺少高效可信的交易平臺,導致規模化、普惠化的流通交易體系難以建立。在落實收益分配制度方面,受制于產權制度不清晰、交易標的不明確等,導致產業實踐過程中面臨數據價值評估難、數據定價難、收益分配機制形成難等現實問題。在落實安全治理制度方面,諸多司法判例表明,我國面臨數據泄露失竊嚴重、數據算法監管困難、以及安全管理制度仍不健全等難題。
記者:如何加快推動數據四項基礎制度落地是當前的重要任務。中國電子在落實四項數據基礎制度方面的取得了哪些理論成果和方案創新?
陸志鵬:科學的價值是為了有所發現,技術的價值在于創新,而工程的價值在于應用。當前數據安全和數據要素方面的技術創新、理論研究有很多,但是如何在工程實踐上落實這四項制度,真正使數據能夠融合起來、共享起來、流通起來,這是需要我們解決的一個工程實踐問題。
因此,自2020年初以來,中國電子聯合清華大學,組織了清華大學的七個學院和中國電子所屬中國系統、中電數據、奇安信三家公司,組成了百人專家團隊聯合攻關研究。研究過程中,我們的定位是既要有理論研究和創新,也要注重多重實踐,因此我們選擇了以工程路徑來實現數據的安全流通,更好發揮數據要素作用。迄今為止,已形成近20萬字研究成果,提出了切實可行的工程方案,率先在數據要素的理論、制度、市場、技術等領域的跨學科研究和方案創新方面取得實質性突破,為加快落實四項數據基礎制度奠定了堅實的基礎。
我們首創提出了以“數據元件”為核心的工程方案。在總結歸納傳統四個生產要素的市場化配置規律后,通過研究發現,在原始數據與數據應用之間,存在一種類似于分子的狀態,這個狀態我們定義為“數據元件”。數據元件是通過對數據脫敏以后,根據市場需要、應用場景需要,由若干個相關字段形成的數據集,或由數據的關聯字段通過建模形成的數據特征,是需求明確、交易高頻和數據標準化程度高的一個數據的初級產品。定義數據元件以后,就可以有效實現原始數據和數據應用間的解耦。我們發現,數據的確權、流通交易、收益分配和安全治理問題都迎刃而解。
在數據確權方面,我們提出“兩分離、三階段”的確權方法。“兩分離”就是先把信息和數據進行分離,信息具有人格權,數據具有財產權;財產權又分為所有權和用益權,數據主體對數據具有所有權,數據持有主體對數據具有用益權。“三階段”就是在數據的資源化階段、元件階段和產品階段,通過將數據權利拆分并在不同主體之間有序流轉,將多個數據主體及數據持有主體收斂到兩類主體,即數據元件模型的開發商和數據元件的運營單位,再進一步收斂到單一主體,即數據產品開發商。這一工程化的路徑讓數據市場的產權主體非常明晰,對數據確權問題有了一個初步的解決辦法。
在流通交易方面,我們構建了基于數據元件的要素流通體系。在數據資源階段做到了“數據可用不可見,數據不動模型動”;到了數據元件階段,通過數據加工中心生產數據元件,進一步構筑數據要素互聯網,在互聯網上實現數據交易,然后產生數據產品,這樣實現了數據的規模化流通。這個過程也與傳統四要素的流通以及信息技術的發展都有個"中間態"的基本規律是一致的。
在收益分配方面,我們形成了“三階段”區別定價市場分配機制。首先,在數據資源階段形成以數據規模為基礎,成本法為主定價機制;然后,到了數據元件階段,由于數據元件可以看做模型與數據兩部分,因此形成以數據元件價值為基礎,收益法為主的定價機制;第三個階段,是以產品需求為基礎,市場法為主的定價機制。綜上,按照成本法、收益法和市場法,實現了數據要素在不同的階段參與分配的差異化機制。
在安全治理方面,我們構建了以“數據元件”為核心要件的“一庫兩網”的安全治理架構。首先我們定義和研發了一個產品叫“數據金庫”,它不同于傳統的數據中心和云計算,而是由政府主導建設,數據和外網物理隔離的一個高保險的基礎設施。將核心數據、重要數據和個人隱私數據存放在數據金庫,通過數據金庫的內網實現數據金庫之間的數據共享和數據交換。將數據金庫里的核心數據、重要數據和個人隱私數據加工成數據元件,通過數據單向網閘、數據擺渡的方式傳輸到外網空間,也就是數據要素互聯網。數據以數據元件的形態在數據要素互聯網上進行流通,切實保障了數據安全。
這一以數據元件為核心的數據要素化工程方案,全面落實了四項數據基礎制度,得到了社會普遍積極反響。多個地方黨委政府對工程方案給予了高度認可。該方案作為“城市級數據要素市場化配置綜合改革試點方案”通過專家組評審,被認為是“城市級數據要素市場化配置綜合改革試點的優先選擇”。
記者:中國電子在推動數據要素化方面開展了哪些實踐?有何經驗和啟示?
陸志鵬:中國電子自去年開始在武漢、德陽、大理、江門等城市開展了試點。其中,德陽的改革方案被中國經濟體制改革研究會評選納入中國改革年會2021全國十大改革典型案例。目前,我們正在徐州等城市進行全方位的復驗,我們期待能夠通過這些試點實現數據要素化工作的推進和相應制度的落地。
從德陽試點情況來看,我們總結得出:制度體系是基礎,有了制度保障,數據企業能夠放心地交出數據參與流通;技術創新是核心,定義了數據元件以后,數據流通問題得到了化解;市場分配是關鍵,我們把要素市場、產品市場和資源市場進行了合理的分類、合理的界定;工程路徑是亮點,我們強調的不僅僅是創新,更多的是落實,更多的是實踐。我們相信通過和各地政府、各個行業攜手合作,將進一步加快實踐數據要素市場化配置綜合改革進程。只要我們通過試點實踐把路走通,就能夠成為一個可在各地復制的好的路徑。