問題一:數據元件的核心理念在產品體系中是怎么體現的?
鄭曦:首先,作為連接數據供需兩端的“中間態”,數據元件實現原始數據與數據應用“解耦”,破解了“安全與流通對立”的難題。數據元件在技術上更貼近源端,有效消除了數據應用的針對性,更利于促進數據流通。因此,數據元件為打通數據資源側、數據供給側和數據應用側提供了技術路徑。
其次,數據元件在數據要素流通過程中實現了安全屬性、價值屬性和品質屬性的統一。原始數據通過數據“解耦”實現風險隔離的同時,被加工提純為數據元件,使數據價值密度和數據品質得到大幅提升,利于數據低成本、高效率的流通,為數據資產化和數據市場化流通交易提供了有利條件。
最后,對數據要素的全生命周期管理勢在必行。在產品體系中,數據要素加工交易中心負責實現數據元件開發生產和交易,并圍繞數據元件構建全流程智能化監管平臺,實現“數據元件可控可計量,數據元件可信可溯源”,推動數據要素高效、集約、安全生產和規模化流通。數據金柜是數據金庫中的存算單元,承擔關鍵數據的安全存儲和數據元件的存儲計算任務。安全可信數據空間通過數據元件實現高效率、多主體在線供需對接、多對多數據安全融合共享。智能政務一體化平臺的數據引擎對接數據元件,實現數據組織的高效利用與安全保障。
中國電子數據產業有限公司將繼續堅持理論研究與產品研發雙軌并行,將數字平臺與數據平臺在數據元件理論基礎上深度結合,不斷推動數據產業做強做優做大。
問題二:請介紹一下系列產品目前的落地實踐情況。
鄭曦:中國電子數據安全與數據要素化工程理論研究與實踐始于2020年,已經分別在德陽、大理、徐州、溫州、鄭州等省市落地試點。其中,德陽市試點項目是中國電子數據安全與數據要素化工程實踐最早的試點示范工程。作為“全國城市數據治理工程”首批試點城市,德陽的數據安全與數據要素化工程實踐形成“1+4+N”制度體系,涵蓋主體、設施、數據、市場四方面制度設計,交付數據要素加工交易中心,初步構建起數據要素三級市場,目前上架涉及電力、能源、金融等領域的數據元件超過1 600類,開始全面釋放數據要素價值。
國家數據局提出實施“數據要素×”行動,其中重要的一項就是要加快推進數據基礎設施的建設工作。中國電子先行先試,聚焦“關鍵數據過于分散、安全保障不足”等問題,自主研發的“數據金庫”可廣泛應用于核心數據、重要數據、敏感數據和數據元件的存儲計算和互聯互通,目前已經成為數據資源存儲和數據要素流通的重要自主安全數據基礎設施。徐州市數據金庫(試點)作為中國電子在全國落地建設的首個數據金庫,目前已順利通過驗收委員會專家驗收,一致認為該項目統籌解決數據安全和數據要素化協同發展難題,在全國具有較強的示范引領作用。目前鄭州、溫州等地的數據金庫建設工作正在緊鑼密鼓的展開。
中國電子數據安全與數據要素化工程進入構建“全程全網”數據要素流通和市場配置體系的高階階段,鄭州、溫州、徐州、德陽、大理州五地“數據要素互聯網”組網運行今天正式啟動。作為數據基礎設施的建設的重要組成部分,全國首個基于“數據元件”的數據要素網的建成標志著數據元件規模化流通和產品化交易的圖景開始變為現實,數據要素乘數效應即將釋放。同時,安全可信數據空間、數據分類分級管理系統、智能政務一體化平臺正在相關部委、重點行業和地區交付和試運行中。
問題三:數據要素流通面臨哪些挑戰?面向政府的數據要素服務,數據要素加工交易中心的技術優勢是什么,如何落地?
鄭曦:目前數據要素流通存在主要四個方面的難題:一是數據產權方面,數據的主體多元交織,造成確權難;數據的權屬關系復雜交錯,造成析權難。二是流通交易方面,缺少標準化的交易標的物,缺少穩定安全的交易機制,缺少高效可信的交易平臺,難以規模化高效流通。三是收益分配方面,受制于產權制度不清晰、交易標的不明確,導致實踐過程中數據價值評估難、數據定價難。四是安全治理方面,數據流通交易的過程安全問題日益嚴峻,數據安全和數據要素是一體兩面,安全不解決,數據無法流通。
當前,面向政府的數據要素服務仍存在供需不順暢、標準不統一、數據孤島多、共享應用難等問題。數據元件可有效破解政務數據難題,實現數據要素的高效配置,讓數據“供需兩端”真正貫通,有效應對這種開放、復雜、多變的供需結構。基于數據元件打造的數據要素加工交易中心是由“一套操作系統、五大支撐體系、五大業務平臺和五類數據工具”等構成,是大規模、全流程、自動化的數據元件加工生產流水線,可對數據要素化流程以及平臺軟硬件資源、數據資源進行調度管理,實現全生命周期的數據要素開發與管控。
數據要素操作系統是整個工程系統的核心,向上可支撐“場景域”等政務數據創新應用,向下可配置數據金庫和算力中心等基礎設施資源,適配數據歸集、數據處理、元件開發、元件維護、元件交易等各類數據治理的相關工具,并根據清洗處理、資源管理、元件開發、元件交易、監管等管理平臺的指令進行統一任務調度和流程管控,實現政務數據要素服務的自主安全。
總之,數據要素加工交易中心可有效提升政府履職能力,增強數字政府治理效能,為推進國家治理體系和治理能力現代化提供有力支撐。同時,數據資源要成為數據資產,需要形成標準化產品,并能夠在市場中形成流通和交易。通過搭建數據要素加工交易中心,利于數據的確權、定價和大規模流通,可打通數據要素的上下游產業鏈,逐步構建數據要素產業生態,對于實現政府資產的保值增值具有現實意義。
問題四:安全可信數據空間產品可以應用在哪些領域或場景,可以解決哪些問題?怎么樣保障數據在數據空間中使用是安全合規的?
鄭曦:長期以來,行業數據被分割在各個市場主體內部,行業數據壁壘阻礙了數據價值的最大化開發,政府機構及大型企業內部同樣面臨著“數據孤島”問題,而數據跨主體共享流通又面臨著安全、合規、信任等重重難題,數據存量優勢難以轉化為高質量發展優勢。
為推動行業及機構企業數據“活起來、動起來、用起來”,我們創新打造基于數據元件的安全可信數據空間。安全可信數據空間以數據金庫和數據元件為基礎,結合數據智能識別能力、數據安全防護能力和數據安全監測能力,保障多主體數據安全融合共享,助力金融、能源、航空、雙碳等領域解決空間內數據規模化加工和融合問題,解決行業數據的安全、可信和高效流通的問題,促進數據空間的數據價值化長效運營。以法律法規及行業規范為依據,內置行業場景規則及空間運行規范,通過規章制度策略化、使用規范合約化、合約履行智能化,支持字段級定向場景細粒度的合規管控與安全控制。安全可信數據空間還提供全鏈條的流通溯源控制、全生命周期的過程安全管控和全棧式國產化基礎設施技術支撐,系統化解決空間內安全與合規問題。
問題五:數據分類分級對于保障數據安全流通具有重要意義,請問你們的分類分級產品目前支持哪些行業?具有哪些優勢?
鄭曦:金融、政務、能源、醫療、教育等行業對于數據的安全性、隱私保護和合規性有著極高的要求,數據分類分級管理系統針對行業特點和需求,提供了定制化的解決方案。通過深入了解各行業的業務場景和數據特性,構建并內置了多個行業知識庫,確保分類分級的準確性和適用性,很好地滿足了行業需求。
在分類分級的精準度方面,系統適配數十種常見數據庫和主動元數據管理,支持AI算法進行智能分類分級和自動化更新運維,通過持續的學習和優化,系統的分類分級準確性不斷提高。在數據安全方面,系統采取了多重防護措施。除了數據脫敏加密、身份驗證、功能權限控制、安全審計等常規手段外,還提供了文檔隱寫水印功能和數據權限控制,以確保數據在傳輸和存儲過程中的安全。在操作易用性方面,支持用戶以思維導圖或知識圖譜形式查看分類法分級統計成果,做到心中有數,用戶無需具備深厚的技術背景,也能快速上手。
只有更好地了解數據的價值和重要性,才能制定出更有針對性的策略。系統為用戶提供了全面的數據資產管理功能,可以對數據進行標簽化、評級、評估、封裝、整合等操作,集靈活性、智能化、安全性于一身,以滿足行業客戶在數據安全流通領域的各類亟需。
問題六:大模型等人工智能技術方興未艾,您認為將對數據要素治理的產生哪些啟示和影響?
鄭曦:數據治理與大模型技術的發展密不可分,目前不斷生成、優化、迭代符合中國國情的大模型技術的任務非常緊迫。大模型技術和自身的優化迭代要依托高質量的數據集和語料庫,目前數據主要集中在政府、行業企業或者頭部互聯網平臺企業手里,如何讓政府、企業或平臺能將、敢將數據共享出來,供我國的大模型技術使用是一個基礎性問題。而數據要素與數據安全治理工程恰恰可以提供解決方案,通過數據元件的中間態,保障數據安全、提高數據價值、提升數據品質,為人工智能的訓練和優化迭代提供支撐,為大模型演化提供高質量的數據集和語料庫。通過數據元件可將不同行業的數據融合提供給大模型進行訓練,通過優秀行業的人工智能應用促進整個數字經濟和智慧社會的發展。數據元件的中間態不僅解決了數據質量問題,同時也解決了多場景數據融合的問題,是數據治理未來發展的一個重要方向。