汪 楓
(上海市城鄉建設和交通發展研究院,上海 200032)
數字孿生(Digital Twin)是用數字化方式建立物理實體的虛擬模型,通過實體空間與虛擬空間的交互反饋、融合分析、決策迭代等手段,提高物理實體的精細化管理能力[1]。Grieves 教授[2]于2003 提出了數字孿生實體產品、虛擬產品以及二者間的連接的三維模型。陶飛等[3]對該三維模型進行了擴展,引入孿生數據和服務兩個新維度,提出了數字孿生五維模型,并對數字孿生模型構建與交互進行了研究,提出了“四化四可八用”的構建準則,從“感知—通信—映射—聯動—融合”五方面提出了數字孿生交互理論[4,5]。張晨源、楊帆等[6,7]對數字孿生模型或孿生體可信度評價指標進行了研究。李琳利等[8]對數字孿生系統信息安全框架及技術進行了研究。趙鵬、陳健等[9,10]分別對電力行業、巖土工程行業數字孿生的關鍵技術與進展進行了闡述。張超等[11]對行離散型智能車間提出數字孿生制造單元系統新理論模型與參考框架,并進行了建模與驗證。冷柏寒等[12]提出了面向可重構制造的數字孿生映射建模與監控仿真一體化平臺架構,對虛實映射進行了針對性研究。康孟珍等[13]研究實現了從單向的三維展示的圓明園到虛實互動的平行圓明園,將虛擬空間的圓明園應用于物理空間的圓明園管理模式創新、生態重構及改善體驗等。郭丞皓、尚可、張宇琳、張科等[14-17]分別在飛機起落架健康管理、智慧停車場、異質交通流安全、空氣污染擴散等具體點上進行數字孿生應用研究。
面對數字孿生,多空間(實體空間、虛擬空間)、多領域、多時域和多類型全域數據治理成為數字孿生的重要支撐與關鍵,數據治理是數字孿生物理實體與虛擬實體交互融合的核心[18]。張寧等[19]對數據治理的概念、體系、內容和應用的相關研究進行了述評。安小米等[20]通過對三大國際標準化組織ISO(國際標準化組織)、IEC(國際電工委員會)、ITU-T(國際電信聯盟電信標準局)數據治理相關標準的分析,提出了數據治理宏觀關注政策法規與組織機制,中觀落腳點在數據資產規劃、設計與管理,微觀主要關注數據質量與數據安全的數據治理框架。如何對數字孿生的物理空間、虛擬空間以及連接與互動的數據進行治理的研究與驗證,成為加速推進數字孿生城市建設,促進數字孿生深層應用的急為迫切的問題。
在物理空間中,與物理空間位置相關的信息占90%以上,空間位置信息已成為多源信息組織與融合的核心。城市信息模型CIM 基礎平臺是管理和承載城市空間三維數字模型,集成GIS、BIM 與IoT 數據的綜合性基礎平臺,支撐城市規建管用,是智慧城市的基礎性和關鍵性信息基礎設施[21],CIM 平臺也是數字孿生城市的支撐平臺[22]。
本文分析在數字孿生背景下數據治理的范圍,研究提出基于CIM 平臺面向數字孿生的數據治理框架,并對基于工作流的數據治理與基于分層分級的多源數據可視化等技術進行研究,給出上海市CIM 平臺數據治理建設成果,并對后續研究與實踐工作進行討論。
面向數字孿生,數據治理范圍包括物理空間與虛擬空間兩大空間的數據,物理空間包括物理數據、服務數據、知識數據與衍生數據,虛擬空間包括虛擬數據、服務數據、知識數據與衍生數據。其中物理數據包括體現實體規格、功能及性能等的物理要素屬性數據與反映實體運行狀況的IoT 數據,虛擬數據包括三維模型以及仿真、驗證、評估、分析與預測等的仿真數據,服務數據包括業務應用算法與行為結果,知識數據包括專家知識、行業標準、規則約束與推理推論等,以及數據處理中的衍生數據等[3]。數據治理內容包括兩個空間宏觀、中觀與微觀三個層次。物理空間與虛擬空間的數據治理內容如表1 所示。

表1 物理空間與虛擬空間的數據治理內容
城市信息模型CIM 平臺是數字孿生數據中、微觀數據治理的載體與環境,是數據治理的容器。基于CIM 平臺可融合實現的物理空間與虛擬空間的數據治理功能包括:
(1)數據資產管理,包括數據分類分級、數據資產歸一化、目錄管理、元數據管理;
(2)數據交易管理,包括數據確權、數據估值、數據定價、數據共享、數據交易、數據授權、數據銷售、數據審計以及數據服務保障;
(3)數據融合與分析,包括虛實數據融合、時空數據融合、空間數據與業務數據融合、時空數據分析、業務數據分析以及數據可視化等;
2002年臺灣淡江大學的Liu提出了一種用于模具拋光的柔順工具架,它是利用線性彈簧增強設備的柔順度,即改變接觸柔度,以減小模具的表面粗糙度,如圖4所示[5]。2007年湖南大學的王平研究了一種利用彈簧產生變形以防止拋光工具與模具表面接觸力突變的單自由度自調末端執行器[6]。目前,RAD公司已開發出彈簧式柔順末端操作器產品,可實現軸向的柔順控制,如圖5所示。
(4)數據質量管理,包括考慮數據一致性、可用性、安全性與可及性的數據收集質量、數據組織質量、數據表示質量以及數據應用質量管理;
(5)數據安全管理,包括考慮機密性、完整性以及可及性的數據隱私安全管理;
(6)標準管理,包括數據標準管理與平臺建設標準管理等。
基于CIM 平臺中的數據治理框架如圖1 所示。

圖1 基于CIM 平臺的數據治理框架
整個框架包括基礎設施、數據中臺、業務中臺、數字孿生應用、數據安全及標準規范六部分,可對物理空間與虛擬空間的五大類數據進行融合治理。
基于CIM 平臺的數據治理框架是可擴展的框架。廣義的數據治理包括數據全生命周期各個階段的所有涉及數據處理與應用的全過程,數據治理是一個循序深入的過程。基于CIM 平臺的數據治理框架,可以逐步豐富數據治理內容,通過原子化與模塊化,把數據治理內容作為流程節點,通過動態組合,快速實現不同的數據治理需求,并能在現有基礎上實現動態柔性擴展與深化。
基于CIM 平臺的數據治理框架是開放的框架。五大類數據可逐步進入治理平臺,并能以三維空間模型為基礎,通過全實體對象的唯一編碼,把該對象的全域數據進行關聯整合,形成該實體對象歷史、現在與未來的全生命周期數據集,進一步支撐數據分析與融合,提供應用服務。
基于CIM 平臺的數據治理框架是可視化的框架。數據治理工作涉及大量的計算,數據治理的效果與監控需要可視化展示。通過CIM 平臺的全對象實體可視化能力,可以動態疊加對比分析數據治理效果,比如BIM 模型的輕量化數據治理、數據質量管理可視化監控等,通過可視化比對與監控分析動態調整數據治理參數,進而實時動態掌控數據治理過程與效果。
科學工作流技術已廣泛應用于科學研究、城市管理以及辦公自動化OA 等活動,它是將數據管理、計算、分析及可視化等一系列工作變成原子服務,通過數據流、業務流將原子服務組合在一起,通過流程化定制與任務調度執行,解決大規模數據自動化計算問題[23]。基于工作流理念,馬文臻等[24]設計實現了自動、高效、實時和標準化的空間科學衛星工作流數據處理系統,完成了多衛星任務、多載荷數據源的大規模數據的高度復雜的處理。科學工作流為解決具有流程性的復雜的數據治理提供了有效的手段。
數據質量管理與安全管理,涉及數據接入、質檢、清洗、標簽及安全等環節。把這些數據治理環節功能分解為原子模塊,通過動態組合,定義工作流節點、流程與任務,實現數據資源動態規劃與治理。數據治理核心是建立知識庫,通過建立目錄發布、數據同步、數據質檢、數據清洗、數據標簽、數據安全、數據融合以及數據服務發布知識庫,結合可視化界面動態配置工作流任務,實施數據質量與安全的自動化治理。基于工作流的動態數據治理,同步保持動態擴展能力,隨著知識庫的豐富、數據治理功能或模塊的增加,將實現虛實空間二三維空間地理數據、IoT 數據、業務管理數據的統一快速治理。圖2 是基于工作流的數據質量與安全治理流程框架。

圖2 數據質量安全治理工作流框架
數據可視化是多源數據治理展示與數字孿生應用的窗口,這要求數據可視化要具有流暢性與沉浸感。邊根慶[25]對IFC 格式的BIM 模型重構進行了研究。陳靜等[26]對三維模型紋理烘焙和多尺度可視化GPU繪制方法進行了研究。劉北勝[27]提出了基于云渲染技術的三維BIM 模型可視化方案。饒平平等[28]基于模型輕量化技術,建立BIM 模型輕量化平臺,并應用于BIM 工程信息分析與應用。
本文在數據可視化過程中,為解決不同場景可視化問題,設計按照市、區、街鎮不同的空間范圍,分別對應白模、精模、BIM 三維模型數據,單棟BIM 數據按照先外立面再內部細節,研究建立了空間范圍與精細度相互配合的分層分級可視化方案,并基于樂高標準構件可插拔理念,通過可插拔技術,構建分層分級可視化能力,實現不同場景三維數據動態加載與分析。
上海市CIM 平臺建立了空間地理信息云環境,集成了二三維空間地理數據、BIM 數據、IoT 數據與業務管理數據,實現了空間數據、業務數據、IoT 數據的統一接入管理、目錄管理以及元數據管理,以及數據質檢、數據清洗、數據標簽、數據安全、數據融合,數據分析、數據共享交換、數據服務及應用支撐。基于工作流實現了數據自動化歸集、流程化管理、定制化服務與可視化監控;數據可視化實現了二三維數據一體化、動靜態數據一體化、地上地下數據一體化以及BIM 數據分層分級可視化。
在上海市CIM 平臺中,作為數據中臺,通過前置數據庫、數據接口和流文件三種方式,連通了17 條數據歸集與同步通道;設計了非空、數據范圍、長度、唯一、數據格式、數據字典、文件驗證、截取驗證以及節點驗證等10 類質檢類型;定義了邏輯錯誤(去重)、格式內容清洗、缺失值清洗、邏輯錯誤清洗等6 類清洗類型;設置了信用、行政許可、行政處罰、電子檔案、自然人和法人等8 類標簽;實施MD5 處理、數據裁切、數據模糊化與AES 4 類安全審計;并建立了證件類型、城市體檢指標類型、實施機構、業務狀態等約50 個基礎數據字典;按照數據質量與安全治理需求,設置數據編目、歸集、質檢、清洗、標簽及安全6 個節點,定制了通用數據處理、簡易數據處理、一網通辦數據處理、信用數據處理以及電子檔案處理等五類數據治理模版;基于工作流編制數據治理流程并實施數據治理任務,每天動態處理約100 萬條數據;并對數據治理的六個節點按照紅、綠、灰三種狀態的進行動態可視化監控(紅:異常;綠:正常;灰:沒啟動)。通過工作流自動化數據治理,大大節約了人力成本,提高了數據質量管理與安全管理的效能。數據治理總體界面如圖3 所示。

圖3 數據治理監控系統總界面
基于上海市CIM 平臺實現了二維地圖服務與三維模型服務的動態疊加,即二三維地理空間數據一體化;實現了交通實時路況、船舶實時位置與城市三維模型的動態疊加,即動態靜態數據一體化;實現了地下管線、構筑物以及軌道區間與車站、城市地質等地下三維模型與地上三維模型的疊加,即地上地下三維數據一體化;實現了全市白模、精模以及BIM 模型的分層分級可視化。其中BIM 數據的動態可視化加載與查詢分析如圖4 ~圖7 所示。

圖4 全市白模加載

圖5 拔下白模數據

圖6 插上BIM 數據

圖7 BIM 內部細節數據動態加載
數字孿生背景下的數據治理是一個持續深入的過程。本文提出了一個基于CIM 平臺的數據治理框架,對基于工作流的數據治理與數據可視化二個具體問題進行了初步研究,給出了數據治理成果,這可為相關數據治理研究與實踐提供參考。后續研究重點包括:
(1)傳統的二維空間地理數據的組織管理方法已經很難適應數字孿生背景下的三維數據管理與應用,需要建立面向實體對象的數據組織理論與方法,以有效支撐多源數據融合、抽取與分析;
(2)目前三維空間模型數據與業務管理數據、社會活動數據集成融合正在研究應用中,但是面對數字孿生,仿真數據與業務數據交互融合成為發揮數字孿生應用的關鍵;
(3)目前數據安全的理論、政策和技術的研究與突破尤其迫切,區塊鏈技術的研究與應用將可更進一步推進數據安全管理[29,30],因此研究數據上鏈技術,成為數據安全管理的重要方向。