房殿軍 ,鄭卓遠 ,洪 晟 ,韓佳良 ,向佳豪 ,蔣紅琰 ,4
(1.同濟大學 機械與能源工程學院,上海 200092;2.青島中德智能技術研究院,山東 青島 266000;3.北京航空航天大學 網絡空間安全學院,北京 100191;4.江蘇科技大學 機械與動力工程學院,江蘇 鎮江 212000)
數字經濟時代的到來意味著全球行業現有商業模式的快速和重大變革。 對于制造業而言,工業4.0 和智能制造帶來的信息化技術快速發展更使制造業在各方面面臨著挑戰和產業革命。為了迎接這些挑戰, 數據主權交換是不可或缺的先決條件。企業需要分析挖掘大量內部和外部數據,以支持智能制造定制化生產的快速響應要求,同時保證數據主權和數據安全也是許多工業公司的基本需求。
在此背景下,數據主權交換的重要性不斷凸顯,能夠自由高效進行數據交換,同時確保數據安全性和主權控制的數據主權交換平臺的建立將成為構建數字經濟生態的重要支點。 數據主權交換平臺首先要保證在交換過程中對數據主權的控制;其次,要實現跨設備、跨網絡的異構性數據主權交換;最后,要建立多樣化、跨行業領域的數據主權交換渠道。
目前,全球各國均積極推進數據主權交換平臺建設。 美國以大型云服務商亞馬遜網絡服務平臺和微軟旗下的軟件和服務技術平臺Azure 為領頭羊,拓展全球數據市場;英國推出《國家數字孿生體原則》,計劃在英國實現高效、安全的國家級數據共享;歐盟委員會發布《歐洲數據戰略》,計劃建立八大數據空間,打造歐洲數據經濟和數字社會[1]。 我國“十四五”規劃中也提出加快構建智能制造發展生態,持續推進制造業數字化轉型、網絡化協同、智能化變革的戰略[2]。
對于我國的數據主權交換平臺發展,首先要明確數據主權和數據主權交換的概念,同時借鑒國外成功的實踐經驗,理清我國數據主權交換平臺的發展路徑和架構搭建模式,探索符合我國國情的戰略思路。
1.1.1 數據主權
數據主權可以定義為自然人或公司實體對其數據完全自主的控制和管理能力。 數據主權要求數據所有者必須能夠決定、控制和監控其數據發生的操作、數據的接收者以及數據的用途。
對于數據主權的控制不僅發生在數據傳輸的過程中,數據主權保護應是全流程的。 在數據提供者和數據接收者進入數據主權交換平臺時,應存在認證流程;數據在傳輸過程中,應進行可追溯的加密傳輸;數據在使用過程中,應有進行操作監控、權限控制和拷貝修改控制等。
數據主權的目的是在保護數據的需求和共享數據的需求之間找到平衡。 所以針對數據類型和數據類別應采取不同的保護級別。 數據主權被視為發展數字經濟中的關鍵能力,數據主權的建立與保護是數據主權交換平臺構建的基礎。
1.1.2 數據主權交換
數據主權交換是指在保護數據提供者的數據主權的同時,支持用戶進行數據主權交換,實現數據交易、數據分析挖掘、加密傳輸、數據使用控制等一系列功能的實現。
以供應鏈的角度來看,數據交換有兩種情形:第一, 數據交換發生在鏈內企業的垂直合作中,用以支持、形成或優化供應鏈和價值鏈;第二,數據交換發生在跨供應鏈的企業縱向和橫向協作中,通過從數據中挖掘附加價值來實現新的業務模式。 傳統的數據交換平臺多為數據的鏈內交換,對于數據主權的保護并不重視,但隨著跨鏈交換的場景越來越多,數據主權交換需要通過以下幾個手段,實現在保證數據主權的前提下進行數據交換。
第一,認證與準入機制的完善。 在建立數據主權交換平臺時,要對參與者進行完備的信息登記,并通過第三方認證確保其合規性,建立可信的協作網絡環境。
第二,數據交換過程的加密。 在進行數據傳輸時,采取技術手段,如區塊鏈技術、密碼學技術對數據進行加密,防止傳輸過程中的數據泄露并保證交換過程的可追溯性。
第三,全流程的主權控制。 通過訪問控制限制可訪問數據的人員,同時在數據使用者端通過使用控制限制數據的修改、拷貝、傳輸等操作,保證數據全生命周期的主權控制能力。
為適應工業4.0 的發展,解決數據互聯和流通難題,德國聯邦教研部于2014 年底正式提出了“工業數據空間行動”,旨在構建一個安全可信的工業數據主權交換空間,排除企業對數據主權交換不安全性的種種擔憂,弗勞恩霍夫協會成為該項行動的領頭羊[3]。 2018 年 11 月,“國際數據空間協會”(International Data Space Association,IDSA) 正式成立。 目前,已有超過 20 個國家的118 家企業和機構加入,實現了50 個應用案例[4]。
國際數據空間(International Data Space,IDS)的目標是要構建一個完整的數據生態,而非簡單的交易平臺,以解決數據主權管理問題和確保數據安全交換共享。 在將視角從單個用例場景擴展到平臺結構時,國際數據空間將自己定位為一種架構,構建起安全數據主權交換和可信數據共享的策略和機制,也即數據主權原則[5]。 通過 IDS 連接器,國際數據空間的核心組件、工業數據云、個人企業云、本地應用程序和個人設備都可以連接到國際數據空間[6]。圖1 為連接不同云平臺的國際數據空間。

圖1 連接不同云平臺的國際數據空間
國際數據空間將通信和基礎數據服務底層架構與智能數據服務高層架構連接起來,支持建立從數據源到數據使用的安全數據供應鏈,同時確保數據所有者的數據主權[7]。 如圖 2 所 示,2019 年 4 月發布的國際數據空間參考架構3.0 模型包含五層架構、三個視角維度,涉及四大主體和三大運作流程。

圖2 國際數據空間參考架構
其中,業務層定義了IDS 參與者可能承擔的四類主體角色并對其分類,同時還指定了這些角色之間的基本交互模式。 除此之外,還給出認證和使用合同的定義;功能層定義了IDS 的基本功能要求,以及要達到這些功能所必須要實施的更細節的功能;處理層指定了國際數據空間的不同組件之間發生的交互,包括三個主要的運作流程:身份注冊、數據主權交換及數據應用程序的發布和使用;信息層指定了 IDS 信息模型,即 IDS 的通用語言,是 IDS的參與者和組件共享的基本協議,目的是促進兼容性和互操作性;系統層將業務層指定的角色映射到具體的數據和服務架構上,以滿足功能層指定的需求,從而可以被認為是國際數據空間的技術核心,系統層根據功能層確定的需求囊括三個基本的核心組件:IDS 連接器、IDS 代理及應用商店。
對應于五層架構,IDS 給出了從三個視角下的要求和責任。 從安全視角來看,IDS 安全架構提供了識別參與者、保護通信和數據主權交換以及在交換后控制數據使用的方法,在基礎連接器上提出了可信連接器,劃分了安全等級,并對整體平臺的安全性提出要求;從認證視角來看,架構保證參與IDS的任何組織、個人及其用于交換數據的核心組件都有認證,且使用統一的認證流程確保參與者和核心組件認證的一致過程;從治理視角來看,架構從可治理性和合規性的角度定義IDS 的角色、功能和流程,定義了業務生態系統要滿足的要求,以實現安全可靠的企業互操作性。
總體而言,國際數據空間作為一個虛擬數據空間,利用現有的標準和技術以及數據經濟中廣為接受的管理模型,促進安全和標準化的數據主權交換和數據生態系統鏈接,為創建智能服務場景和促進創新的跨公司業務流程提供了基礎,同時保證了數據所有者的數據主權。
為改變歐洲的數字基礎設施目前掌握在少數主要的非歐洲企業手中的現狀,2020 年6 月,德法兩國提出“GAIA-X”計劃,同時在比利時成立 GAIA-X基金會,旨在歐洲構建開放、聯合、安全和可信的數據和云基礎設施,作為數字生態系統的基礎[8]。
GAIA-X 計劃的目標是設計和實施數據共享架構,包括數據共享標準、案例實踐、技術工具和治理機制,以及泛歐盟的云基礎設施和相關數據服務。
為此,GAIA-X 計劃和 IDS 相互補充,以確保聯合生態系統云中端到端的數據價值鏈和數據主權[9],圖 3 顯示了 IDS 架構到 GAIA-X 架構的映射。

圖3 GAIA-X 計劃參考架構
GAIA-X 專注于主權云服務和云基礎設施,而IDS 專注于數據主權交換和數據主權,GAIA-X 與IDS 的交互主要有三項任務:自主數據存儲、可信數據使用和可互操作的數據主權交換,形成了基礎設施生態系統和數據生態系統兩大生態系統,并形成了四項主要原則:身份和信任、數據主權交換、聯合目錄及合規性。
與國際數據空間相比,GAIA-X 將形成一個更龐大和完善的網絡,推動 GAIA-X 在地區、國家和國際上的合作實施[10]。 在這個網絡中,一方面可以解決國家或部門的具體問題,另一方面可以組織跨國界合作,并將促進中小企業融入GAIA-X 生態系統,最終形成數據驅動的全新商業模式、創建跨界和跨網絡的數據生態系統,使利益相關者能夠在其中行使數據主權,從而維護和擴大工業競爭力。
目前,已有眾多企業加入了國際數據空間組織,并利用IDS 架構開發數據主權交換平臺。 這些平臺以實現數據主權交換傳輸、跨設備、跨網絡數據互操作為目的,走在了建設數字經濟的前列。
智能工廠網絡(Smart Factory Web,SFW)是由弗勞恩霍夫IOSB 研究所和韓國電子技術研究所(KETI)共同開發的一個智能工廠平臺[11],支持實現工廠資產和資源的靈活共享和管理,以最大限度地提高效率并提供全球市場的可見性。
SFW 通過 AutomationML,即基于 XML 的自動化描述語言進行本體建模,自動從導入參與者工廠的資產相關信息,以支持對資產和資源的共享[12]。 在工程內部,SFW 通過設置 OPC UA 服務器,通過通信協議提供來自工廠的實時數據。 此外,考慮到生產數據多為關鍵且涉密的,因此SFW 基于IDS 控制策略為數據所有者提供控制機制,保證通信安全和數據主權[13]。
圖4 展示了SFW 的平臺架構和工作原理。 SFW以IDS 連接器為基礎建立SFW 平臺連接器和工廠連接器,各連接器間的通信遵循 IDS 信息格式。 這些連接器利用 Apache Camel 技術在 IDS 基礎連接器的基礎上拓展工業組件,例如使用OPC UA 客戶端從生產中實時讀取數據,并對數據采用加密、證書認證等安全措施。

圖4 SFW 平臺架構及工作原理
SFW 平臺連接器和工廠連接器使用MQTT 代理和MQTT 客戶端來發布或訂閱數據流。 用戶在SFW 門戶搜索工廠,打開配置文件時,SFW 門戶向SFW 連接器發送實時數據的HTTPS 請求,請求被轉發到工廠連接器,工廠連接器向OPC UA 服務器請求實時數據。
之后,OPC UA 服務器將返回數據傳輸到工廠連接器上的 MQTT 代理,SFW 連接器將訂閱該 MQTT數據流,并通過HTTPS 協議返回新的數據值到SFW,通過可視化頁面展示給用戶。
SFW 數據主權交換平臺專注于工廠間的生產數據主權交換和共享,利用生產能力的靈活調整來提高工廠資產的利用率。 工廠所有者可以在智能工廠網絡上提供和獲取生產能力、工廠資產和資源等數據,從而創造附加價值。
通常情況下,物聯網設備難以直接接入數據主權交換平臺,為此德國羅斯托克大學與弗勞恩霍夫研究院開發了針對物聯網設備的數據主權交換平臺,使獨立于工廠或企業的物聯網設備也可以進行數據主權交換共享[14]。 圖 5 展示了物聯網數據主權交換平臺的架構。

圖5 物聯網數據主權交換平臺架構
該平臺借助 IDS 參考體系架構,基于 IDS 連接器開發 IoT 連接器(Internet of Things Connector)構建物聯網設備和數據平臺之間的接口。 并利用開放地理空間聯盟(Open Geospatial Consortium,OGC)提供的物聯網開放互操作性標準SensorThings API,搭建IoT 連接器和物聯網設備之間的互操作層[15],實現來自物聯網設備的數據的共享。
物聯網數據主權交換平臺使用MQTT 代理和REST 來訂閱數據流,圖6 顯示了平臺的工作原理。數據消費者連接到物聯網數據主權交換平臺,并使用自己的IDS 連接器檢索希望獲得的物聯網數據。 在IoT 連接器獲得訂閱通知后,連接器可以通過MQTT訂閱發送實時數據,也可以通過連接器中的OGC 組件將利用RESTful 服務和基于 JSON 的編碼,對數據進行語法、語義互操作性的轉換,并調用HTTP/RESTful接口向數據消費者提供歷史數據。

圖6 物聯網數據主權交換平臺工作原理
物聯網數據主權交換平臺通過IoT 連接器的開發,解決了獨立物聯網設備難以接入數據主權交換平臺的問題,實現了廣泛性的數據主權交換。
面對數字經濟時代的大發展趨勢,各國先后將數據作為頗具戰略意義的國家資源進行維護,探索數據主權保護、數據主權交換技術將是未來搶占國家核心競爭力的要點。 我國應充分借鑒德國、歐盟等發達國家或區域的先進實踐經驗,充分發揮我國在數據基礎設施建設上的優勢,從主權保護、平臺架構、規則標準等多方面,制定符合我國現實狀況的發展戰略,打造國際接軌、國家主導、行業統一的數據主權交換平臺。
3.1.1 發展思路
在第二節的案例中,各數據主權交換平臺均將“數據主權”“實時交換”和“互操作性”作為其核心競爭力,并在構建數據主權交換平臺時注重必不可少的六大要素:數據主權、可信認證、互聯架構、統一標準、安全保障和運行機制。
在搭建數據主權交換平臺時,我國要充分保證六大要素的實現,應從以下幾點著手,逐步擴大發展格局,打造我國主導的數據主權交換體系:
(1)構建數據主權保護核心競爭力
對于數據主權的保護決定了我國所產生數據的實際價值,數據主權的充分保障是建立可信協作數據網絡的基礎。 數據作為一種虛擬商品,如同現實商品一樣,其產生、儲存、轉移、使用、清除的過程也應受到監督和控制。 對于所有參與數據生命周期的參與者而言,必須在受控和受限的條件下進行數據的交換。 構建成熟的數據認證評估與監督體系將消除數據主權交換平臺參與者間的信任危機,而在數字經濟中,這一體系將不再停留于法律文件的書面約束,而是通過加密傳輸、使用控制、電子證書等技術手段實現更強有力的保證。
(2)構建多層次、多角度的立體數據主權交換
我國應充分審視數據主權交換平臺的覆蓋范圍,拓展交換平臺的兼容性。 隨著電子商務、5G 通信等社會信息化技術的發展,數據主權交換將不僅局限在工業互聯網中。 在構建平臺體系時,對于眾多物聯網設備和移動設備應考慮其接入平臺時認證、傳輸協議的標準統一;對于跨網絡、跨行業的數據應尋找技術手段實現異構數據的互操作性;對于跨國數據傳輸,應考慮各國間數據政策和安全的合作,實現多網絡層次、多行業區域角度的數據主權交換。
(3)構建廣泛、多樣的數據生態系統
在實現數據主權交換的基礎功能之上,著眼打造完整的數據生態系統。 首先,關注底層數據基礎設施的建設,構建全國性的主權云服務和云基礎設施;其次,關注中層數據的利用,打造數據分析、數據挖掘與數據主權交換相結合的智能應用程序;最后,關注上層標準規范的統一,建立國際接軌、國家主導、行業統一的數據標準,擴大數據生態系統覆蓋面,打造我國數據價值鏈。
3.1.2 技術重點
在建設我國數據主權交換平臺時,應充分考慮數據主權保護和數據主權交換與新技術的結合。 目前,云技術、人工智能、區塊鏈等技術的迅速發展,為數據主權交換的技術實現提供了先決條件,我國應重點關注以下技術的應用和集成:
(1)云平臺
云平臺的當前發展呈現多樣化的趨勢,以多種架構模式為特征,從以高度集中化的方法,如數據湖,到促進最大程度分散化的方法,如使用去中心化的分布式平臺[16]。 多樣化的云平臺的出現使得數據消費者可以根據其想要交換和共享的數據產品的業務重要性和經濟價值進行選擇。 由于各平臺之間需要發展安全和可信的數據主權交換和共享的能力,多樣化的云平臺也將推動數據主權標準的發展。
(2)物聯網與工業物聯網
物聯網和工業物聯網將包含越來越多的設備,并產生越來越多的數據[17]。 物聯網和工業物聯網架構的標準化,以及其數據主權交換和數據共享的標準化將促進數據市場的建立并推動實現數據經濟。物聯網和工業物聯網中所產生數據的廣泛使用將催生全新的智能化的以數據為中心的服務與新商業模式。
(3)大數據與人工智能
目前大數據應用程序通過附加數據(例如開放數據、來自其他公司的數據或來自數據市場的數據)來補充公司內部數據[18]。 通過數據主權交換擴展數據組合,將顯著改進分析結果或開發全新的使用場景。
人工智能被越來越多地使用,將持續導致對外部數據(例如人工智能模型的訓練)的更大需求,數據主權交換和數據共享的標準化架構的建立,將支持大數據和人工智能在工業生產中的研發與應用。
(4)區塊鏈技術
區塊鏈技術的使用,將推動數據主權和安全數據主權交換和共享的實現[19]。 區塊鏈技術的可追溯性、高加密安全性等特點將支持數據市場中數據資產交易的流程,保證數據在交易過程中的一致性和透明性。
依托國際數據空間的參考架構模型,本文提出一種建設數據主權交換平臺的參考架構。 在本參考架構中,數據主權交換平臺以連接器作為門戶,與數據提供者和數據消費者端的連接器在可信數據主權交換網絡中連接。 數據提供者端的連接器連接并控制數據源,數據消費者端的連接器連接并控制接收數據池。 同時,代理與認證端提供使用者的注冊、身份管理、數據描述和查詢管理等元數據。 此外,應用商店提供數據處理應用程序下載。 圖7 描述了所提出的參考架構。

圖7 數據主權交換平臺參考架構
在認證流程中,數據提供者和數據消費者加入數據主權交換平臺前,均需向代理與認證端提供其身份、設備信息及其擁有數據的描述信息,并經過認證中心頒發電子證書認證后,方可加入平臺。
在數據主權交換過程中,數據消費者可以通過連接器B 在平臺中的數據市場通過數據描述元數據進行檢索,尋找所需要的數據,如連接器 A 所提供的數據。 之后,數據提供者和數據消費者將首先交換身份證書確認動態屬性,交換協議的元數據并充分交換意愿,在達成交換共識后,數據將通過加密傳輸進行交換。 元數據和數據的傳輸過程將受到平臺的嚴格監控和管理,并通過可追溯的方式,如區塊鏈技術進行記錄,保證傳輸安全性和數據主權。
在數據使用過程中,當數據消費者接收到來自數據提供者的數據后,該數據將被存儲在受連接器B 控制的數據池中。 數據消費者應按交換協議中所規定的范圍和權限使用數據,對數據的各類操作,包括存儲、修改、閱覽、拷貝、計算等應受到連接器B的嚴格使用控制。 此外,數據消費者可以在應用商店中下載受信應用程序進行數據分析、處理等操作。
在構建數據主權交換平臺時,如表1 所示,參考架構從三個層面考慮其中的要點原則并關注其中的技術重點。首先在個體層面,要為設備、服務與參與者創建數據身份并進行認證,建立互信環境。在交互層面,主要考慮如何通過技術手段實現互操作性中數據安全交換、數據格式統一及交換流程標準化。 在生態系統或市場層面,則應考慮如何通過自我描述建立市場檢索機制,同時在數據主權交換后如何實現數據操作限制,并通過值得信賴的運行環境拓展生態系統功能,實現數據應用程序的集成。

表1 數據主權交換平臺參考架構
基于以上所述的幾項要點原則,本數據主權交換平臺參考架構具有以下幾點優勢:
(1)可信的協同網絡環境
參考架構為加入平臺的設備、服務和參與者創建可追溯的電子身份證書,并通過認證流程,確保加入平臺的參與者擁有可信的設備和能力。 在可信環境下,參與者將更愿意進行數據的交換與共享。
(2)優良的數據互操作性
參考架構基于合規性認證的連接器實現對用戶數據庫的控制和管理,保證互操作的安全和簡便。 通過資產和數據描述模型,雙方可以在充分交換意愿的前提下進行數據主權交換。 同時,建立統一的數據格式標準,將大幅增強數據的互操作性。
(3)數據傳輸的安全性保證
要求進行加密、記錄可追溯的數據傳輸過程,在數據市場中進行的數據交易將被統一監控和管理。此外,通過連接器進行使用控制,保證數據不會出現濫用,保護了參與者的數據主權。
(4)集成的數據應用程序
參考架構構建了應用程序商店模塊,其中可以集成大數據挖掘、人工智能模型構建等數據分析程序,能夠提升數據主權交換的價值。
本文基于國際數據空間架構,提出一種數據主權交換平臺參考架構體系,首先明確了數據主權與數據主權交換的概念與要點,并介紹國際數據空間和歐洲GAIA-X 計劃構建數據主權交換平臺的理念與架構。然后分別介紹了智能工廠網絡平臺及物聯網數據主權交換平臺的平臺架構及模式,展示了國外基于IDS 架構建設數據主權交換平臺的先進實踐經驗。結合國際數據空間與相關案例在實踐探索中提出的可信認證、數據主權保護和數據連接器等理念和技術解決方案,本文提出的參考架構將有助于我國在發展數據主權交換平臺時解決相關核心問題。