董晶,張天龍
(1.太極計算機股份有限公司,北京 100020:2.華北計算技術研究所,北京 100083)
我國大力推動的數字經濟、“新基建”對城市大數據治理和共享提出了很高的要求,如何構建安全高效的城市數據治理和共享平臺,解決智慧城市大數據治理、共享和服務中面臨的問題,是當前學術界和工業界共同的焦點。城市數據具有多源、海量、多模態等特點,城市治理和共享要解決數智融合、算力融合、多模態異構融合等問題,融合已成為重要特征和趨勢。數據治理與人工智能的發展日益相輔相成,城市數據治理為人工智能的應用提供高質量的合規數據,人工智能對數據治理提供諸多優化。城市數據大數據治理涉及不同領域、不同層級系統的可信跨域、跨層次對接互通問題。在城市數據治理領域,尚未實現完善可信高效的數據共享機制,大規模的區塊鏈數據共享仍處于探索階段[1]。目前,區塊鏈的跨鏈機制是實現城市數據跨域可信共享與有效監管的重要前提和基礎。國內外智慧城市建設縱橫推進,但城市數據治理和共享尚未沒有形成長效機制。我國尚未形成完整的城市數據治理與共享體系。長三角、粵港澳大灣區等啟動建設區域特色鮮明的智慧城市群,初步探索醫保、社保等鄰近區域的數據打通和業務協同。將若干中心城市的智慧城市數據治理與共享能力擴展到整個區域,實現大區域范圍內的城市群綜合治理,形成城市數據治理鏈、數據融合共享鏈和服務協同鏈,進行城市精細化管理服務,目前還處于起步階段。
基于復雜系統論,聚焦城市級多源異構數據采集、匯聚、管理、分析和共享過程,建立數據治理決策權和職責體系,覆蓋政府、企業、社會組織和公眾等多元治理主體。聚焦數據生命周期、數據質量、數據安全等治理客體,定義跨地域、跨層級、跨領域、跨業務、跨系統的多模態數據治理活動,形成城市數據治理模型。
以城市數據治理模型為基礎,構建包含治理要素控制、治理過程控制、治理層次控制和治理機制控制的多視域安全可信數據治理框架[2]。聚焦多源異構數據融合應用過程中涉及的權利責任利益分配問題,形成多層次的安全可信數據治理機制,形成宏觀、中觀和微觀層面融合的決策機制、責任機制、利益機制、監督機制、約束機制框架。
以城市數據治理與共享體系為基礎,通過可信可溯源的數據匯聚和服務匯聚,形成數據目錄與服務目錄、城市數據集與服務集,并通過城市數據與服務的網格化交互,構建城市服務圖譜,形成城市數據與服務的協同機制[3]。在此基礎上,構建城市數據治理與共享平臺,支持城市智能化的精細管理和服務。平臺框架如圖1所示。

圖1 跨域城市數據治理平臺框架
城市服務節點是城市數據治理共享平臺的支撐環境。根據城市行業和數據特點,基于城市基礎云平臺,對公共服務,形成核心資源節點;對專門業務服務,生成業務資源節點;對監管節點,生成城市公共服務和專門業務監管資源池。
城市數據分布在多行業,跨多個主體部門,相互獨立的系統通常都具有數據量大、復雜異構、隱私限制等特點。由于傳輸成本、數據所屬以及服務質量等問題,以云計算為代表的集中式處理模式無法高效地處理這些系統產生的數據[4]。采用基于邊緣智能的多源多模態城市數據接入方法,將智能算法與模型部署到邊緣設備中。利用邊緣設備直接進行處理而不上傳到云服務器,避免隱私泄露。對于非隱私數據,利用邊緣智能進行初步加工,將海量多模態的原始數據進行脫敏轉化,傳輸至云服務器,減少帶寬消耗。利用邊緣設備直接響應用戶產生的部分高頻率、低精度的智慧城市相關需求,增強服務的實時性。
數據治理的處理對象是海量分布在各個系統中的多模態數據。不同系統的數據代碼標準、數據格式、數據標識等往往不一樣,嚴重影響數據的可用性。基于跨模態特征度量,提取多領域多行業城市數據特征屬性,建立城市級分層次標準數據項和數據元庫,采用區塊鏈歷史記錄鏈式為主體的塊狀存儲技術和哈希算法實現標準數據項和數據元的不可篡改、城市級一致性、演變追溯性和跨系統互通性。
基于自然語言理解和標簽傳播算法抽取城市分領域數據轉換、數據校驗、數據拼接賦值等規則實體和事件實體等要素,實現多模態數據項、數據元、規約規則間關系的語義化表示,基于RDFS-Plus建立領域分片規約規則知識樹和規約事件知識邏輯模型[5]。對不同領域多模態數據,對數據項屬性基于機器學習進行認知和識別,提出基于有偏隨機游走的數據規約路徑生成算法,對數據自動對標和數據規約。
采用區塊鏈技術,通過規范的數據格式、數據傳輸格式以及統一加密算法,實現多機構主體系統間的互聯互通,并通過異構多鏈和異步多任務交互協議,形成數據共享與智能合約調用的基礎安全操作集,為城市應用提供靈活易用的調用接口。
不同領域系統通過數據授權管理智能合約的狀態轉移,并通過智能合約與鏈上鏈下協同進行跨域數據授權,數據授權方通過一次性對稱密鑰方式加密請求數據,以實現即便該部分數據被人獲取,其余數據的安全性依舊能夠得到保證。
通過設計角色權限模型對智慧城市不同領域系統用戶進行管理,通過劃分治理角色、監管角色、業務角色等,使得僅有部分角色能獲取數據授權密鑰。多機構主體的數據請求方與授權方通過智能合約和統一密鑰進行跨域數據授權。
海量城市數據和業務服務如何根據需求進行場景化交互協同是城市服務智能化和精細化基礎,城市服務圖譜建立城市數據與服務、服務與服務的關聯,形成城市服務脈絡。依據城市服務主題構建服務主題分面樹,通過主題間關系的語義化表示建立城市服務森林圖譜邏輯模型,并基于場景屬性的向量化表示與服務主題關聯拓撲特征進行城市“主題-分面”關系抽取、基于小樣本學習解決碎片化場景與主題分面的映射、基于認知關系進行服務圖譜場景導航。
基于區塊鏈的跨域交互,構建安全可信的數據治理鏈,提供不同應用鏈間業務數據相互訪問和交換能力,協同城市數據和服務,使城市數據可溯源、可信互聯和共享,支持跨域跨行業數據連通和場景協同。
跨域城市數據治理是一個復雜的系統工程,目前,大規模跨域可信數據共享還在探索階段。基于區塊鏈的大規模跨域數據交換的性能問題、安全問題和數據高效管理問題是未來進一步的研究重點。