999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據空間的產業數據流通利用:邏輯框架與技術實現

2024-01-01 00:00:00劉博夏義堃
圖書與情報 2024年2期

摘 " 要:在大力推動數據要素市場建設與智改數轉的戰略背景下,產業數據的流通利用仍面臨動態供給不足、安全可信度不高、互操作性不強等多方面問題,而數據空間模式在制度設計、技術工具等方面的創新突破具備解決此類問題的適配優勢。文章以破解產業數據流通利用困境為導向,通過建構數據鏈、創新鏈、產業鏈協同聯動的基本思路,基于數據空間的結構化框架設計與技術解決方案實現了三鏈互動的邏輯框架;通過聚焦數據、主體、環境等重點目標,從流程化視角出發對整體技術架構進行解構設計,規劃其中的主要功能模塊,并從支撐技術體系運行的核心組件切入,建構以數據流通利用功能為核心的功能性技術工具,呈現了該架構中關鍵技術的基本原理和前沿趨勢。

關鍵詞:數據空間;產業數據;數據流通;數據利用;數據要素

中圖分類號:G203 " 文獻標識碼:A " DOI:10.11968/tsyqb.1003-6938.2024016

Industrial Data Circulation and Utilization Based on Data Spaces: Logical Framework and Technical Implementation

Abstract Under the strategic background of vigorously promoting the construction of data factor market and intelligent transformation and digital transformation, the circulation and utilization of industrial data still faces many problems such as insufficient dynamic supply, low security and reliability, and weak interoperability. The innovative breakthroughs of data spaces model in institutional design, technical tools and other aspects have the adaptability advantage to solve such problems. Guided by solving the dilemma of industrial data circulation and utilization, this article realizes the logical framework of the interaction of the three chains by constructing the basic idea of synergistic linkage of data chain, innovation chain and industrial chain based on the structured framework design and technical solutions of data spaces; by focusing on key targets such as data, subject and environment, the overall technical architecture is deconstructed and designed from a process perspective, the main functional modules are planned, and the core components supporting the operation of the technical system are cut in to construct functional technical tools with data circulation and utilization as the core, presenting the basic principles and cutting-edge trends of key technologies in this architecture.

Key words data spaces; industrial data; data circulation; data utilization; data factor

隨著科技革命與產業變革的加速推進,“數字產業化”與“產業數字化”的深度交融勢不可擋。國家數據局等17部門印發的《“數據要素×”三年行動計劃(2024-2026年)》中,17次提及“產業”一詞,高度重視數據流通利用對于產業發展的放大、疊加、倍增作用。在全球數據博弈加劇、數字產業競爭激烈的時代背景下,存量龐大、增量顯著、需求密集的產業數據往往被視為高附加值數據,暢通上下游數據環節、協同多方數據關系、開發共識性技術工具、增強主體數據自主權等已經成為許多國家產業數據價值釋放的政策著力點。然而,產業數據由于分布松散、多源異構、競合博弈等復雜屬性的交織,其流通在安全性、合法性、合規性和流通動力、效率、監管方面均有待提升[1],借助于數據智能分析手段的深入利用也面臨復雜性增強和可靠性降低的雙重挑戰[2]。為提升數據的可用、可信、可流通、可互操作、可追溯水平,數據空間作為一種新的數據管理模式逐漸受到業界和學界的普遍關注。歐盟發布的《歐洲數據戰略》提出在制造、環保、移動、衛生、金融、能源、農業、公共管理、技能九大領域開展共同數據空間建設,并已經在歐洲健康數據空間(EHDS)、歐洲云計劃(Gaia-X)和移動數據空間(Catena-X)等領域展開實踐探索。我國信息通信研究院牽頭成立可信工業數據空間生態鏈,重點開展數據空間技術、標準和產業研究,推動技術落地與行業示范,輻射帶動農業、電子、化工等行業性應用探索。

目前,國內外圍繞數據空間的相關研究主要集中在架構模式、技術方案、領域應用與風險應對等方面。如Hoeyer等從宏觀上探討了數據空間的數據管理模式創新與價值導向[3],Curry則從微觀上對數據管理、數據索引、數據關聯、數據保護等具體技術進行了創新探索[4]。在不斷增強的“工業互聯”趨勢下,以工業數據空間為代表的數據空間產業應用引發德法日等國關注,并在制造業領域[5]形成了較多研究成果。然而,現有研究缺乏從“數據流通”到“數據利用”的貫通視角,難以從產業數據價值實現的技術層面為數據空間建設提供針對性框架指導。本文著眼于實現跨組織的產業數據流通利用,深入解析數據空間的模式創新與技術優勢,厘清產業數據“流通-利用”有機銜接的內在邏輯,探索并提出一體化的技術架構,同時,分析其關鍵技術構成,旨在為可持續的產業數據生態構建及其數智轉型升級提供理論和實踐指導。

1 " 產業數據流通利用困境與數據空間技術適配性分析

1.1 " "產業數據流通利用的現實困境

產業數據涵蓋了行業產業從規劃、生產到運營、銷售等完整的業務流程,是產業實踐的數字化映射,具有不可估量的經濟社會價值。產業數據的流通與利用關聯緊密,流通反映了數據從提供者到需求者的交換交易過程,利用表示了需求者對數據的處理、分析和挖掘,二者既是產業數據供需關系的表達,也是數據價值流轉和連續性價值創造過程的體現。同時,產業數據持有者、需求者之間常常會出現角色互換,既需要提供數據,也需要以交換或交易等方式獲取數據。因而,將二者視為一體化概念或連續性概念展開分析更有助于深化產業數據研究。德勤(Deloitte)研究中心發布的“2024年制造業展望”指出,基于數據構建企業內外部利益相關者的通信將是重要的趨勢和選擇,但同時需要關注由此出現的數據安全、動態響應等多方面挑戰[6]。數智時代的來臨為產業單元間基于數據流通利用的賦能發展開啟了新的機遇,產業領域多源多模態數據融合利用、動態實時數據流轉、規模化高質量數據供需、領域數據智能化開發需求凸顯,并提出了模態融合、數據交易、動態管理等操作性流通利用要求(見圖1)。

對重要需求的認知更大概率是刺激科研研究和研究成果工程化活動的主要因素[7]。為把握數智時代數據需求,本文從技術治理視角出發,通過梳理歐洲議會智庫《歐盟數據挑戰》[8]、日本產業經濟省《制造業的問題及應對方向》[9]、Gartner的《數據共享是加速企業數字化的必由之路》[10]等產業數據流通利用相關研究和報告,認為當前產業數據流通利用中的主要問題集中在以下三個方面。

一是數據動態供給的能力薄弱。隨著泛在智能與泛在計算應用場景的拓展,數據模態、格式日益多元,不同企業或個體生產、持有和使用的數據也隨之變化,數據動態供給能力在一定程度上決定了決策有效性和生產效率[11]。然而,傳統數據管理往往依賴于統一的系統架構或數據模型設計,需要進行前期的軟件、硬件基礎設施建設投入,這種事先設計的“統一系統”存在著靈活性不強、更新成本高等問題,加之談判撮合、信任建立、交易清算等環節需要耗費極高的時間、人力等成本,基于數據動態響應的能力被大大削弱。

二是數據生態的信任低下。諾貝爾經濟學獎獲得者Pissarides提出“電子商務的成功建立在信任的基礎上”[12],數據資源在不同主體間可持續地流通利用依賴于牢固的數據信任基礎。但在數字科技“雙刃劍”的作用下,一方面,數據隱私、保密、倫理風險頻發,數據權屬的不確定性與主體對自身數據的不可控性增強;另一方面,數據持有者對數據需求者和路徑、工具的信任缺失導致數據流通的“不愿、不敢、不想”,日益增長的數據利用需求亟待系統性的思路設計與技術方案建構。

三是跨組織數據的可互操作性不強。實踐證明,基于單一來源數據的分析挖掘難以匹配產業發展的系統性需求,而全樣本、大樣本數據可以提供更加客觀、全面的證據支持[13],“全源數據驅動”對不同主體、系統間的數據互操作提出了要求。由于當下的分散存儲導致產業鏈各單元間存在數據結構差異大和關聯薄弱等共性問題,跨組織的數據流通面臨機制、標準與技術的多重壁壘,加之傳統技術方案高度依賴于格式化指令,也極易在數據轉換過程中造成原始信息的損耗。

1.2 " "問題導向下的數據空間技術適配性分析

美國計算機科學家Michael Franklin等認為“數據空間是一種數據共存而非簡單的數據集成,以增量的、即付即用的方式融合異構異質數據資源”[14]。以該思想為基本遵循,相關研究和實踐從技術、生態和價值等維度對其內涵進行了引申,如數據空間包含主體、數據集和服務三要素[15],并以促進數據價值釋放、打造利益共同體為目標,以數據管理、分布式系統、人工智能和泛在計算等多個計算機科學領域交叉為支撐[4],旨在解決數據權屬管理、數據安全交換等問題[16],是技術與制度二元共治[17]下構建的跨組織無縫數字場域[18]。

1.2.1 " 數據空間的技術推理

不同于數據庫、數據倉庫、數據湖等已有架構[19],數據空間致力于構建跨組織創新協同和價值共創的數據流通利用生態(見表1)。在充實數據管理功能的基礎上,更加關注數據流通利用的屬性與需求特征,將多元組織和機構納入統一、平等的合作框架,基于分布式存儲基本架構和連接器等核心組件,通過身份驗證、元數據代理等中介機制,并借助加密傳輸、隱私計算等技術解決方案來增強主體間的數據信任,進而以更高的可互操作性提高數據流通、利用效率。

1.2.2 " 數據空間的技術適配性分析

數據空間的提出和推廣,契合了多領域數據管理的現實需求,其技術適配優勢為破解當前的數據動態供給不足、自主可信不高、安全保障不穩、互操作性不強等流通利用困境提供了可行的技術推進方法與解決方案。

(1)數據動態供給問題。數據空間廣泛采用分布式存儲技術,并未對數據持有者做出數據格式、更新頻率等強制約束,允許依據持有者個性需求和數據自身屬性對數據進行相應管護。“Pay as you go”模式也只收集和管理與特定主體、特定需求相關的數據,并保持數據檢索范圍與內容的動態更新,使系統設計與數據利用同步[20]。因此,數據空間的技術系統將隨著時間與應用的變化而自我進化[15],具有不斷增強對數據格式、應用需求的兼容性和即時性處理能力。

(2)數據自主權與可信問題。通過強調數據持有者對數據擁有獨立、平等、自主的控制權力和能力,數據空間在技術工具層面的優化是確保預期實現的必然選項。如在數據流通方面,通過元數據代理對內容、格式、質量、來源進行描述,提供數據發現、瀏覽或訪問功能,避免了數據“裸露”樣態下的權屬隱患;信任機制構建方面,由獨立的驗證機構對數據提供者、數據使用者進行雙向身份驗證、數字證書驗證(質量、來源等)和會話管理,與連接器共同構成溯源閉環,以增加用戶間的信任;數據利用方面,數據持有者可以通過嵌入訪問控制、使用控制等策略的連接器確保全流程可控,并通過數據加密傳輸協議避免數據的非法篡改。

(3)數據安全問題。面向多業務場景下的數據安全問題,數據空間采用不同的技術方案予以應對。針對存儲安全問題,分布式架構使主體間形成松耦合甚至零耦合關聯,協同傳統的容災備份策略,極大降低集中式存儲的系統性風險;針對交易安全問題,利用基于區塊鏈的智能合約、清算中心等,增強交易痕跡的不可篡改性和交易流程的透明性;針對計算安全問題,通過嵌入隱私計算、聯邦計算等智能計算技術,為隱私數據和機密數據提供可控的處理、分析環境,能夠實現必要業務場景的數據“可用不可見”。

(4)數據互操作問題。數據空間采用的分布式策略允許數據以原始狀態存儲,通過數據的一階實體化[21]保證內容完整性,避免數據失真,為數據使用者保留了進一步操作的可能。而詞匯表則為數據資源的描述提供標準化參考,規范的術語、概念集合有助于不同主體對數據及其數據關系形成統一描述,增強了建立在一致性理解基礎上的數據互操作性。標準化建設為不同環節的數據流通利用接口調用奠定了基礎,數字對象架構(Digital Object Architecture,DOA)中的解析和管理協議[22]為避免數據重疊、沖突等提供了可靠映射方式。

2 " 基于數據空間的產業數據流通利用理論依據與邏輯框架

2.1 " "理論依據

(1)價值鏈理論:該理論認為企業由一系列相互依存的價值活動集合構成,各活動間彼此連接與支持,形成了以降低成本、提升價值為主要目標的價值鏈[23]。國內學者從數據管理角度進行了概念拓展,提出“價值單元”與其他業務流程弱聯接,能夠獨立運作而不失其價值增值功能的“原子”單元[24]。在具體業務運行中,價值單元的輸出內容可根據具體需求設定,無需集成相關價值單元內部信息系統[25]。上述思想契合了數據空間對相關主體的定位,即以利益相關、地位平等、獨立運行的角色參與數據流通利用,由主體形成的“價值單元”既需要追求共同價值,也需要通過內部優化創造獨特價值。

(2)DIKW模型:信息管理領域專家提出的“數據-信息-知識-智慧”四層級框架,呈現了由原始事實抽象而來的數據逐層向人類可用智慧轉化的一般性過程[26],其基本內涵與引申為信息資源管理研究提供了重要的邏輯遵循。面向數據空間的研究與實踐,其本質是促進數據資源經過流通、加工、分析等技術手段,通過數據型產品、信息型產品等開發為經濟社會發展提供智慧支撐。以DIKW模型為指導,有利于梳理數據空間產業數據流通利用中的數據、信息等不同類型產品背后的數據鏈、產業鏈、創新鏈之間的邏輯轉換。

2.2 " "邏輯框架

(1)按照價值鏈理論所揭示的機理,企業內部、企業之間通過資源配置或分工協調進行生產方式和產出的優化,實現利益最大化[27]。隨著數據要素化向縱深推進,產業鏈上下游企業之間信息互通和資源共享[28]需求擴大,需要貫通數據從“游離”到“交互”的路徑。當前,基于跨組織交換和融合利用的數據價值挖掘得到空前重視,并在產業中具體體現為基于知識的創新轉化[29],能夠將“知識-科學-技術-產業”有機銜接,即聚焦提質增效的創新產出,通過成果轉化以泛在智能、萬物互聯、循證決策等方式賦能產業優化。

(2)從DIKW模型應用來看,數據利用的終極目標是經由人類活動形成能夠指導實踐的知識或智慧。海量產業數據挖掘中的技術感知信息、市場競爭情報等成為企業急需的高價值數據產品,具有賦能產業發展的強大驅動力,能夠引發產業鏈的結構性重塑[30]。同時,新的產業場景又催生了新的創新范式,推動科技創新與產業場景的深度融合。創新鏈是滿足當下需求與感知未來需求并行的過程,面向產業的創新布局不僅能實現核心競爭能力的躍升,也可以為數據原始積累和擴大流通提供更清晰的方向指引。

基于此,本文圍繞數據空間的運行邏輯展開融合分析,搭建基于數據空間的產業數據流通利用框架(見圖2)。其中:數據鏈是數據從持有者流向使用者的閉合路徑,是數據空間中數據交換的完整業務生命周期;產業鏈中各主體單元兼具數據持有者、使用者雙重角色,貫穿產業上下游若干個數據交換業務;創新鏈在微觀上體現為基于DIKW的數據產品形態與價值挖掘、智慧賦能過程,宏觀上則體現為基于數據增值的創新產業化過程,本質是追求數據鏈、創新鏈、產業鏈“三位一體,互促共進”的發展格局。從數據維度上看,重點基于跨組織的數據交換與互操作,通過數據融合利用實現了從數據資源到數據資產、從數據到知識和智慧的兩個轉變過程,促進了數據價值的深度釋放;從主體維度上看,重點通過機制創新和技術實現,確保了參與數據交換的主體擁有平等地位,擴大了“以數據為中心”的資源共享基礎;從環境維度上看,重點是打造安全、可信的數據流通利用生態,實現對數據自主權的持續保護。

3 " 基于數據空間的產業數據流通利用技術架構

3.1 " "整體技術架構設計

為進一步推動數據空間應用于產業領域,并提供技術總攬,本文借鑒工業互聯網產業聯盟、中國信息通信研究院牽頭編寫的《可信工業數據空間系統架構1.0》[31]、德國弗勞恩霍夫協會編寫的Designing Data Spaces[32]中的建設經驗與未來展望,以流程化的功能實現為目標,對基于數據空間的產業數據流通價值實現流程進行了技術架構設計(見圖3)。

按照架構設計,基于數據空間的產業數據流通利用分為資源建設、交易建立、驗證服務、數據傳輸、存證服務、數據利用以及數據控制等功能模塊,涉及數據供應方(即數據空間中的數據持有者)、需求方(即數據空間中的數據利用者)以及提供相關服務的第三方主體,以現有先進技術與可預期的前沿技術為基礎,基于相關技術標準、流程、協議共識,建構了系統性、一體化的技術實現方案。

3.2 " "主要功能模塊

3.2.1 " 泛在環境下的產業數據資源建設

產業數字化場景下,產業鏈全流程所累積的巨量數據資源既構成企業內部的數據資產,也能夠通過自動存儲或智能傳感、物聯網等協同感知方式進入到流通利用環節。在數據空間中,企業等主體間通過交易獲得的數據經過復用、挖掘,將產生新的數據經過本地存儲后構成了數據資源的另一重要來源。由多源匯聚的異構數據需要在語義層面形成映射關聯,使得產業鏈不同類型企業間建立群體性的數據感知與連接機制。數據空間以分布式方案將數據存儲、管護責任下放至產業鏈中松散的主體,一方面需要通過數字對象架構和元數據管理等支持跨組織的數據資源發現和識別,另一方面企業等主體也需要分別采取數據加密、防火墻和容災備份等個性化措施確保數據安全。

3.2.2 " 基于平等交互的數據交易

數據空間為數據交易提供了平等、可信的流通環境,數據持有者、數據中介等數據供應方通過元數據代理發布可對外交換的數據資源信息,以便數據空間內的數據需求方檢索和發現,助推數據由資源屬性向資產屬性轉變。為此,國際數據空間運用信息模型(IDS-Information Model,IDS-IM)以定義輕量化、標準化的數據描述,在此基礎上將分布式數據環境中的元數據聯合為一個基于圖的RDF數據模型,增強了可理解、可操作的數據資源發布、識別機會,使主體無論規模大小、產能強弱都能夠無差別的進行數據流通。同時,數據供應方還可以將數據交易的許可定價、訪問權限與時效等策略進行部署,并展開若干輪次的策略談判,最終達成一致,建立交易協議。

3.2.3 " 基于第三方的可信驗證服務

可信驗證服務主要從數據內容、參與主體以及運行環境三個方面展開。數據內容維度上,基于對數據標準化、數字標識和內容可信等驗證手段,對數據流通的可行性、數據來源以及數據完整性進行確認;參與主體維度上,身份認證的權威性、身份的可辨識性至關重要,需要利用分散式標識符、身份認證技術、數字簽名技術等完成對企業或個人的身份校驗;運行環境上,通過資產管理殼、物聯網等技術對連接器或數據接口等的標準化、有效性和安全性進行驗證,確保數據通過準確、合規、有效的通道進行傳輸。驗證服務一般可以通過應用商店提供的擴展組件,將驗證功能嵌入到連接器中運行。只有全部驗證環節通過后,相關主體的數據資源才能通過連接器進入下游流通,從而促使以往互不相關、互不信任的主體之間形成業務互動。

3.2.4 " 跨組織的數據傳輸

跨組織的數據交換以實現共同利益或數據資源增值為目標,一定程度上消解了企業間信息不對稱的問題。然而,數據作為生產要素具有報酬遞增、非競爭性、低成本復制的特征[33],有必要增強數據持有者對數據的全流程控制以實現自身的數據權益保護,緩解進入市場的權屬擔憂。數據空間在數據傳輸機制的設計上,采用策略管理點(PAP)、策略信息點(PIP)、策略決策點(PDP)、策略運行點(PEP)以及其他策略點(PXP)協同的方式實現數據持有者的數據調節控制。為保障數據流通效率,需要對相關硬件、接口等基礎設施進行標準化處理,如采用一致的數據傳輸協議,對網絡性能進行優化提升等。在具體技術層面,數據傳輸主要涉及數據控制、數據安全、數據溯源等,并通過第三方提供的應用工具促進和保障數據傳輸。

3.2.5 " 基于區塊鏈的存證服務

區塊鏈技術的本質是一種分布式賬本,經過加密哈希相互連接的若干區塊具有安全透明、不可篡改、不可逆的特點[34],為數據空間建立獨立的外部信任約束提供了技術支撐?;趨^塊鏈技術的存證服務無需主動干預交易或經手數據資源,避免了有如數據信托在數據代管、信托標的、多放利益權衡等方面的爭議[35],通過智能合約技術,建立數據交易的供需雙方在滿足一定條件時自動執行條款,實現“Pay as you go”模式;交易結束時,依托第三方的清算中心進行結算、對賬、溯源,與數字貨幣技術等結合完成數據資源、資金的同步交換;通過將全過程日志實時“上鏈”,實現對交易全過程的監督,以時間戳等技術確保各類記錄的不可篡改性,進而支持可信、安全的數據審計。

3.2.6 " 覆蓋全流程的數據控制

作為數字產品的數據有別于實體產品市場交易的“買斷式銷售”,其持有者并不會因為交易完成而放棄對數據的權利。為確保數據權屬,數據空間采取一系列措施,實現對數據質量、訪問以及使用的全生命周期控制。其中,數據質量控制關注了數據資源的完整性、一致性、準確性等問題,主要作用于驗證服務階段;數據訪問控制通過策略部署對數據資源的訪問者做出約束或授權,一般分為自由訪問控制、強制訪問控制、基于角色的訪問控制和基于屬性的訪問控制,主要作用于數據傳輸階段;數據使用控制是數據空間的核心優勢之一,能夠通過連接器功能擴展自定義數據持有者的權利要求,實現全流程的數據可控,包括風險識別、跟蹤保護、使用約束、情境感知等,主要作用于數據利用階段。

3.2.7 " 面向賦能產業的數據利用

數據利用在數據空間架構下的本質是交易所得數據資源的復用,是實現數據價值挖掘與數據增值的末端環節,旨在通過數據向知識、智慧的轉化驅動技術創新和產業變革。一方面,出于對數據隱私、安全等的考慮,交易對象可以不是直接的數據資源本身,而是通過隱私計算等技術實現數據的“可用不可見”,同時滿足數據使用控制所做出的限定;另一方面,數據資源和人工智能技術的融合互促成為產業數據利用的重要驅動力,以多模態數據融合和知識序化關聯為主的內容挖掘技術將深層次貫通或重構DIKW的轉化邏輯。在此基礎上,產業知識圖譜、產業態勢感知、技術機會發現、產業情報系統以及垂直領域大模型訓練等技術使數據、數智賦能產業轉型升級,在新生產數據資源的再存儲、再流通中完成產業數據流通利用的閉環。

4 " 基于數據空間的產業數據流通利用關鍵技術

數據空間并非一種“由0到1”的數據管理方式創新,而是在融合不同技術優勢的基礎上,通過疊加、嵌入若干子領域或子技術的迭代升級,實現整體性模式優化和技術革新。基于數據空間架構推動產業數據流通利用需要明確發揮核心作用的組件,精準定位支撐組件與系統運行的關鍵技術,為實現整體架構設計落地提供技術應用和技術創新方向。

4.1 " "核心組件構成

4.1.1 " 元數據代理中心

為增強數據的互操作性、安全性和可維護性,在數據資源不必要、不允許直接參與流通的環節,元數據流將代替數據流在主體、功能組件中被識別和處理。具體而言,即依據信息模型對數據屬性、結構、關系等做出描述,并通過統一的詞匯表對相關術語進行規范化處理,以便形成具有跨組織一致性理解的數據描述方法。在此基礎上,元數據代理和聯合目錄兩個功能部分構成了元數據代理中心,分別發揮收集管理元數據、檢索發現元數據的功能(其運行機制見圖4)。元數據代理中心在數據空間中履行了“中介”的職能,在分散式網絡環境中為企業主體提供了以數據資源為目標的關系構建路徑,成為促進數據發布和發現的基礎。同時,數據空間中的數據資源具有實體屬性,能夠由企業等主體通過唯一標記作為資產投入流通體系,因此數據標識也是元數據描述的重要組成。如工業互聯網標識解析體系給產品、設備和數字對象賦予了全生命周期身份證,通過分布式、標準化、輕量級解析系統實現了數據查詢和交互[36]。

4.1.2 " 驗證中心與存證中心

參與數據交換的企業主體在產業鏈中是競爭與合作的博弈關系,需要建立信任背書或外部約束來維護健康的交互環境,基于公平、透明原則的驗證服務和存證服務成為數據空間的有效選擇,一般由第三方托管或采用可信任的分布式機制。除對數據資源進行完整性、一致性、準確性等驗證外,驗證中心的核心任務是對參與數據交換的主體身份、參與數據空間的證明以及治理合規性進行驗證:一種方案是采用由發行者、持有者和驗證者三種角色構成的可驗證憑據(Verifiable Credentials,VCs)架構,如W3C可驗證憑據架構中對不可篡改的主體描述和憑證發行機構的信息進行封裝,并通過注冊表進行維護(見圖5);另一種方案則采用去中心化的數字身份(Decentralised Identifiers,DIDs),通過加密公鑰等機制,無需集中式的注冊管理機構即可實現安全的在線交互[37]。存證中心客觀、真實地記錄數據空間中發生的主體行為和數據行為,為保護企業等主體的權利存儲和提供具有法律效力的證據。其中,區塊鏈技術是關鍵支撐,來源于連接器的日志文件經過采集并上載至區塊鏈,實現對數據交易、交換過程的全時空監控。同時,智能合約、數字錢包等功能亦可嵌入存證服務體系,支持存證中心發揮即時交易清算的作用,而避免了議價、毀約等傳統交易爭端。如德國著名IT服務商T-Systems提供了身份驗證、交易合規、公證等于一體的Digital.ID服務,并可嵌入其開發的連接器(Data Intelligence Hub,DIH)進行應用,已經成為國際領先的數據空間身份驗證與交易存證服務商。

4.1.3 " 連接器與應用商店

連接器本質上是數據空間中支持跨組織、跨系統數據交換的集成式軟件工具,是企業等主體參與數據流通生態的標準化接口。其主要任務是在獨立、分散且沒有聯絡基礎的數據供需雙方之間建立聯系,并確保被允許的數據安全高效、權責清晰地進行傳輸。因此,數據空間中的連接器不是單純用以支持數據流動的數據傳輸媒介,而是具有一系列組件功能擴展能力的“綜合體”。首先,連接器具有強大的數據傳輸協議和格式兼容性,以滿足分布式存儲下的多源異構數據流通和處理;其次,連接器允許數據流和元數據流的接入,通過數據標識系統、數據控制機制等保持同一數據資源的實時更新和持續控制。應用商店是數據空間中的應用提供平臺,通過用戶的下載和使用實現數據空間功能擴展,提供公共或個性化的功能,如策略部署、數據加密、數據分析與可視化等。從功能視角上看,連接器與應用商店是相輔相成的兩個部分,連接器為應用組件提供嵌入載體,應用商店則豐富和強化連接器的功能屬性。元數據代理、身份驗證、交易清算等功能組件除了獨立運行的方式以外,也可以通過嵌入連接器實現融合。如Eclipse基金會在Apache 2許可證下開發和發布開源Eclipse Data Space Connector(EDC)已經實現了對資產管理殼、數據審計、信息交換所、數據儀表盤等功能的擴展[38],是ENNA-X和Catena-X數據空間采用的主要技術架構。

4.2 " "關鍵技術

4.2.1 " 語義關聯技術

首屆數據空間語義國際研討會(SDS 2023)于2023年4月在美國舉辦,引發了學界、業界對語義關聯技術在數據空間中應用的廣泛關注和熱烈討論,形成了有關數據空間中語義、語義網的一系列成果[39]。產業數據具有典型的多源異構屬性,其組織、存儲、流通、利用的各環節均有賴于“以數據為中心”的深層次語義關聯。語義的挖掘與關聯既有利于為元數據描述提供具有一致性理解的語義表示方法,也有利于由多元主體提供的數據在單一主體中得到融合挖掘,推進數據資源的流通利用?;谡Z義的數據資源關聯旨在通過多模態數據的語義識別、語義挖掘,從數據層、特征層、決策層進行融合,形成領域主題、概念主題、數據內容以及數據對象實體匯集的立體化知識網絡[40]。在數據關聯融合路徑中,由產業鏈內、外部獲取的多元化數據經過預處理后形成原始數據集,通過特征提取與多尺度解析、語義化描述與序化關聯、多層級融合與評估等實現多模態數據在語義上的關聯構建(見圖6)。在數據驅動與知識驅動深入融合的背景下,以大語言模型為代表的多模態數據交互已經成為現實,伴隨垂直領域特別是產業領域的數據資源建設、數據流通利用將有更具潛力的發展前景。

4.2.2 " 數據標識技術

數據空間中的數據資源具有獨立性、唯一性和持久性的特征,數據標識技術為數據流通利用提供了獨一無二的標識符,從而確保數據資源能夠不受時間、空間的影響而被精準識別和溯源,需要兼顧輕量化、避免沖突、應用方式靈活等要求。當前,業界廣泛強調開發面向第四范式的新型數據基礎設施[41],重點關注了兩種技術方案:(1)強調內容理解的語義網(Semantic Web),以鏈接數據原則(Linked Data principles)為指導,使用通用資源標識符(Uniform Resource Identifier,URI)對數據進行標識[32],通過用戶檢索返回基于RDF框架的描述信息。(2)強調實體獨立的數聯網(Internet of Data),基于數字對象架構提出的數據一階實體化方法,能夠支撐數據空間中高效的數據發現、解析、尋址和訪問要求。此外,哈希算法也是數據標識技術的重要補充,面向數據完整性驗證和防篡改等場景形成廣泛應用。當然,數據標識技術的開發利用還需要與數據生態、標準規范以及基礎設施等協同推進,并進一步探索與數據控制、數據生命周期管理的深度融合。

4.2.3 " 數據控制技術

數據控制是各主體數據自主權在技術層面的實現,并通過一系列“策略”進行了具體表達。傳統數據控制多聚焦于數據訪問控制,但僅通過對數據訪問權限的控制不足以建立可持續的數據信任生態,不利于數據價值的全面釋放??蓴U展訪問控制標記語言(XACML)[42]是一種在國際互聯網上用XML語言來為信息訪問表達訪問控制策略的一種OASIS規范[43],已經成為數據空間中數據控制策略表達的參考標準。XACML3.0更是構建了由策略點構成的數據流模型[44],能夠使數據持有者實現對數據的持續可控,為數據空間設施數據控制提供了參考架構(見圖7)。MY DATA控制技術[45]在國際上形成了成熟、豐富的用例,該技術即使用基于XACML的ODRL策略編輯器進行策略部署,通過干預連接器中與安全相關的數據流來強制執行數據自主權,進而對連接器中的數據流進行細粒度的掩碼和篩選。

4.2.4 " 先進計算技術

簡單的數值計算早已無法適應產業發展對數據價值挖掘的需求,面向安全、高效、智能的先進計算技術成為廣泛的現實需求。先進計算技術基于高性能超級計算機和網絡系統,通過計算位置、計算機理、計算方式和算法變革[46]形成更大的創新支撐力與驅動力。在數據空間運行的多個業務流程中,均呈現了對先進計算技術的需求,一是聚焦安全可信的隱私計算技術,主要包括了基于密碼學的安全多方安全計算(Secure Multiparty Compute,MPC)、基于硬件的可信執行環境(Trusted Execution Environment,TEE)、基于人工智能與隱私保護融合的聯邦學習(Federated Learning,FL),同時呈現了與同態加密、差分隱私等技術融合應用的趨勢[47];二是聚焦數智賦能的智能計算技術[48],重點通過底層“智能驅動的計算”提升數據理解和互操作能力,通過末端“面向智能的計算”擴大數據價值挖掘和賦能產業實踐的空間。

5 " 結語

培育數據要素市場、發展數字經濟是重要的時代主題和必然趨勢,數據空間建設方興未艾,立足于不同產業,以聯盟模式凝聚企業等主體形成利益共同體,是推進數據鏈與創新鏈、產業鏈融合互促的新探索,具有資源互補、利益互聯、國際互通的特征。從國際實踐來看,以歐盟為代表的數據空間建設已取得階段性進展,但在技術架構上仍面臨諸多需要探討的問題,如不斷提高的可擴展性訴求與整體性能如何權衡?技術架構在行業領域的適用性如何評估?不同架構的組件、服務兼容性如何實現……?相關研究還需從運行邏輯、技術構成等認知方面細化明晰,亟待從技術治理與制度治理兩個層面著手深化數據空間建設的探索與應用。

參考文獻:

[1] "高志豪,鄭榮,張默涵,等.基于數據信托的產業數據要素流通:動力邏輯、信托紓困與模式重塑[J].情報理論與實踐,2024,47(4):75-83.

[2] "王卓昊,曾文,李芳,等.新形勢下產業數據資源建設問題思考[J].情報理論與實踐,2023,46(12):9-13,20.

[3] "HOEYER K,GREEN S,MARTANI A,et al.Health in data space:Formative and experiential dimensions of cross-border health data sharing[J].Big Data amp; Society,2024,11(1):20539517231224258.

[4] "CURRY E.Real-time Linked Dataspaces:Enabling Data Ecosystems for Intelligent Systems[M].Cham:Springer Nature,2020.

[5] "GUO J,CHENG Y,WANG D,et al.Industrial Dataspace for smart manufacturing:connotation,key technologies,and framework[J].International Journal of Production Research,2023,61(12):3868-3883.

[6] "Deloitte Insights.2024 manufacturing industry outlook[EB/OL].[2024-03-14].https://www2.deloitte.com/us/en/insights/industry/manufacturing/manufacturing-industry-outlook.html.

[7] "ENGINEERING N R C(U S)D of.Report of the Ad Hoc Committee on Principles of Research-engineering Interaction[M]. National Academy of Sciences-National Research Council,1966.

[8] "European Union data challenge | Think Tank | European Parliament[EB/OL].[2024-03-31].https://www.europarl.europa.eu/thinktank/en/document/IPOL_BRI(2021)662939.

[9] "委託者:経濟產業省.我が國ものづくり產業の課題と対応の方向性に関する調査報告書:令和3年度製造基盤技術実態等調査:公表用[Z/OL].三菱UFJリサ﹢チamp;コンサルティング,2022.https://ndlsearch.ndl.go.jp/books/R100000002-I032244485.

[10] "Gartner.Data Sharing is a Key Digital Transformation Capability[EB/OL].[2024-03-31].https://www.gartner.com/smarterwithgartner/data-sharing-is-a-business-necessity-to-accelerate-digital-business.

[11] "焦豪,楊季楓,王培暖,等.數據驅動的企業動態能力作用機制研究——基于數據全生命周期管理的數字化轉型過程分析[J].中國工業經濟,2021(11):174-192.

[12] "ALSAAD A,TAAMNEH A,SILA I,et al.Understanding the global diffusion of B2B E-commerce(B2B EC):An integrated model[J].Journal of Information Technology,2021,36(3):258-274.

[13] "鄭榮,楊競雄,張薇,等.多源數據驅動的產業競爭情報智慧服務研究[J].情報學報,2020,39(12):1295-1304.

[14] "FRANKLIN M,HALEVY A,MAIER D.From databases to dataspaces:a new abstraction for information management[J].ACM SIGMOD Record,2005,34(4):27-33.

[15] "李玉坤,孟小峰,張相於.數據空間技術研究[J].軟件學報,2008(8):2018-2031.

[16] "邱惠君,王夢辰,劉巍.從德國數據空間的實踐探索看如何構建數據流通共享生態[J].中國信息化,2020(12):105-107.

[17] "包曉麗.可信數據空間:技術與制度二元共治[J].浙江學刊,2024(1):89-100,239-240.

[18] "A European Strategy for data | Shaping Europe’s digital future[EB/OL].[2024-02-14].https://digital-strategy.ec.europa.eu/en/policies/strategy-data.

[19] "范淑煥,侯孟書.數據空間:一種新的數據組織和管理模式[J].計算機科學,2023,50(5):115-127.

[20] "朝樂門.數據空間及其信息資源管理視角研究[J].情報理論與實踐,2013,36(11):26-30.

[21] "羅超然,馬鄆,景翔,等.數據空間基礎設施的技術挑戰及數聯網解決方案[J].大數據,2023,9(2):110-121.

[22] " Al-Bahri M,Ruslan K,Aleksey B.Integrating internet of things with the digital object architecture[J].Internet of Things,Smart Spaces,and Next Generation Networks and Systems:19th International Conference,NEW2AN 2019,and 12th Conference,ruSMART 2019,St[C].Springer International Publishing,2019:540-547.

[23] "PORTER M E.Competitive advantage:creating and sustaining superior performance:with a new introduction[M].Competitive Advantage:Creating and Sustaining Superior Performance,1985.

[24] "李亞函.大型裝備制造企業EVA價值單元體系構建研究[D].天津:河北工業大學,2014.

[25] "李綱,馬亞雪,巴志超.基于價值鏈的數據管理理論思考[J].信息資源管理學報,2018,8(1):9-18.

[26] "莫富傳,婁策群,馮翠翠,等.基于DIKW體系的政府數據利用路徑研究[J].情報科學,2021,39(3):82-87.

[27] "鄭大慶,張贊,于俊府.產業鏈整合理論探討[J].科技進步與對策,2011,28(2):64-68.

[28] "趙林,詹新宇.圍繞發展新質生產力布局產業鏈[N].光明日報,2024-04-09(11).

[29] "曲冠楠,陳凱華,陳勁.面向新發展格局的意義導向“創新鏈”管理[J].科學學研究,2023,41(1):134-142,180.

[30] "李春發,李冬冬,周馳.數字經濟驅動制造業轉型升級的作用機理——基于產業鏈視角的分析[J].商業研究,2020(2):73-82.

[31] "可信工業數據空間系統架構1.0[EB/OL].[2024-03-04].http://www.caict.ac.cn/kxyj/qwfb/ztbg/202201/t20220125_39615

6.htm.

[32] "OTTO B,TEN HOMPEL M,WROBEL S.Designing Data Spaces:The Ecosystem Approach to Competitive Advantage[M].Cham:Springer Nature,2022.

[33] "劉小鈺,許永國,王建平.數據資產的價值實現:跨市場融合與質押擔保應用[J].金融市場研究,2024(3):40-50.

[34] "?魻ZSU M T,VALDURIEZ P.Distributed and parallel database systems[J].ACM Computing Surveys,1996,28(1):125-128.

[35] "李智,張津瑤.數據信托本土化的現實困境與路徑構建[J].學術交流,2023(7):56-72.

[36] "專家觀點-工業互聯網產業聯盟[EB/OL].[2024-03-01].https://aii-alliance.org/index.php/index/c184/n3252.html.

[37] "信任框架-藍圖v1.0-Data Spaces Support Centre——Trust Framework-Blueprint v1.0-Data Spaces Support Centre[EB/OL].[2024-03-02].https://dssc.eu/space/BVE/357075352/Identity+and+Attestation+Management.

[38] "DELGADO M T.Eclipse Dataspace Components[EB/OL].[2024-03-01].https://projects.eclipse.org/projects/technology.edc.

[39] "Companion Proceedings of the ACM Web Conference 2023[M].New York,NY,United States:Association for Computing Machinery,2023.

[40] "張云中.從整合到聚合:國內數字資源再組織模式的變革[J].數字圖書館論壇,2014(6):16-20.

[41] "黃罡,羅超然,馬鄆,等.數據基礎設施關鍵技術發展現狀與挑戰[J].科技縱覽,2023(12):68-71.

[42] "RAMLI C D P K,NIELSON H R,NIELSON F.The logic of XACML[J].Science of Computer Programming,2014,83:80-105.

[43] "[美]Munindar P.Singh,Michael N.Huhns .面向服務的計算:語義,流程和代理[M].張乃岳,戴超凡,徐連君,譯.北京:清華大學出版社,2012.

[44] "eXtensible Access Control Markup Language(XACML)Version 3.0[EB/OL].[2024-03-02].https://docs.oasis-open.org/xacml/3.0/xacml-3.0-core-spec-os-en.html.

[45] "International Data Spaces.MY DATA Control Technologies[EB/OL].[2024-03-02].https://www.dataspaces.fraunhofer.de/en/software/usage-control/mydata.html.

[46] "楊宏,郭雄,李孟良,等.先進計算技術與標準研究[J].中國標準化,2018(20):243-245.

[47] "沈傳年,徐彥婷,陳瀅霞.隱私計算關鍵技術及研究展望[J].信息安全研究,2023,9(8):714-721.

[48] "ZHU S,YU T,XU T,et al.Intelligent Computing:The Latest Advances,Challenges,and Future[J].Intelligent Computing,2023(2):6.

作者簡介:劉博文,男,南京大學數據管理創新研究中心博士研究生,研究方向:科技情報戰略與智能情報分析;夏義堃,女,南京大學數據管理創新研究中心教授,博士生導師,研究方向:政府數據治理、智能情報分析。

主站蜘蛛池模板: 欧美视频在线播放观看免费福利资源| 亚洲欧美精品在线| 国产三级精品三级在线观看| 国产无码精品在线播放| 日本91视频| 天堂av综合网| 久久无码av三级| 国产凹凸视频在线观看| 日韩中文无码av超清| 中文字幕无码av专区久久| 一级香蕉视频在线观看| 欧美成人一区午夜福利在线| 国产精品分类视频分类一区| 午夜丁香婷婷| 精品免费在线视频| 91福利片| 91丝袜美腿高跟国产极品老师| 日本欧美一二三区色视频| 婷婷中文在线| 福利片91| 国产成人永久免费视频| 另类专区亚洲| 欧美性猛交一区二区三区| 国产免费人成视频网| 亚洲码在线中文在线观看| 丰满人妻一区二区三区视频| 国产精选自拍| 东京热一区二区三区无码视频| 乱系列中文字幕在线视频| 中文字幕1区2区| 成人午夜免费观看| 69国产精品视频免费| 男女猛烈无遮挡午夜视频| 亚洲无码电影| 欧美α片免费观看| 99热6这里只有精品| 亚洲欧美自拍中文| 国产乱人激情H在线观看| 无码高潮喷水在线观看| 中文字幕啪啪| 免费日韩在线视频| 91探花国产综合在线精品| 99热这里只有精品5| 久久久久夜色精品波多野结衣| 国内黄色精品| 青青草国产一区二区三区| 在线精品欧美日韩| 久久国产黑丝袜视频| 亚洲综合精品第一页| 在线观看亚洲国产| 亚洲免费毛片| 中文纯内无码H| 亚洲资源站av无码网址| 欧美激情首页| 久久一色本道亚洲| 深夜福利视频一区二区| 国产97视频在线观看| 青青草一区| 国产91丝袜| 久久免费看片| 精品久久久久久中文字幕女| 久久久精品无码一区二区三区| 午夜电影在线观看国产1区| 国产精品自在线拍国产电影| 国产91无码福利在线| 日韩资源站| 性做久久久久久久免费看| 亚洲一区波多野结衣二区三区| 91欧美在线| 色婷婷啪啪| 中文字幕在线免费看| 97精品伊人久久大香线蕉| 国产免费黄| 国内精品一区二区在线观看| 免费看av在线网站网址| 青青热久免费精品视频6| 性欧美在线| 免费三A级毛片视频| 亚洲国产成人麻豆精品| 在线国产三级| 午夜福利网址| 白浆免费视频国产精品视频|