陳宋彬,胡 聰,汪軍勇,成雨陽
(1.深圳市光明區政務服務數據管理局,廣東 深圳 518000;2.吉奧時空信息技術股份有限公司,湖北 武漢 430223)
近年來,隨著信息技術的飛速發展和數字化轉型的不斷推進,政務數據資源整合共享成為現代政府治理的重要議題,也成為數字政府建設的核心之一。通過有效整合與深入開發利用,發揮現有政務數據的真正價值,有助于推進政府治理流程優化、模式創新與履職能力提升,構建數字化、智能化的政府運行新形態,服務社會經濟發展,助力國家治理體系與治理能力現代化水平提升。
當前,全國31 個省(自治區、直轄市)均已結合政務數據管理和發展要求明確政務數據主管部門,初步形成覆蓋國家、省、市、縣等層級的政務數據目錄體系,人口、法人、自然資源、經濟等基礎庫初步建成,匯聚編制政務數據目錄超過300 萬條,信息項超過2 000 萬個,在調節經濟運行、改進政務服務、優化營商環境等方面發揮了重要作用[1]。然而,政務數據資源整合共享仍存在政務數據資源共享目錄內容不全面[2]、數出多源[3]、協同聯動乏力[4]、數據質量校正無法完整閉環[5]、數據整合形式單一[6]等問題。在需求時效、數據質量、工作制度、開展流程、組織協同等多個方面不確定的情況下,跨領域的數據互認度與整合度往往偏低,相關成果亦難以有效應對未來的數據規劃。因此,實現跨領域的政務數據整合,通過數據治理驅動流程改造,通過流程重組實現源頭治理是當今數據管理領域的熱點和難點之一。為此,本文提出一種基于城市數字化標識的一數一源、源頭治理、數據整合驅動業務的全新模式[7],從數據應用規劃入手盤點現狀、規劃未來,對人、房、企、時間、空間等關鍵要素進行治理與整合,實現跨領域數據整合能力的提升。
數字政府建設是在政務數據資源綜合開發利用的基礎上形成的一種新型政府管理和治理形態。要落實好數字政府建設就必須充分利用政務數據資源,首要工作就是對現有政務數據資源進行治理,消除當前政府部門之間的“數據孤島”和“數據鴻溝”,突破業務壁壘,重塑業務流程,促進業務協同,形成政府多部門間的業務聯動,使廣大群眾切身感受到信息技術帶來的利好。在不同數據治理目標、組織協同、系統聯通、數據應用的現狀下,馬廣惠等[8]深入研究分析統籌規劃與實踐應用構成的兩類政府大數據共享交換情境下的大數據治理路徑,并將其分為重數據架構和重數據應用兩種數據治理模式。
重數據架構的治理模式是一種自下而上的模式,旨在通過建立通用、全面的數據層及工具層,層層向上治理數據,直至數據應用層。該模式從底層數據切入,全面盤點現有數據基礎,建立類似數據倉庫的數據架構,在數據規劃、建設、治理、應用全流程的各個環節建立相關組件及標準,例如,鄒倩瑜等[9]提出基于中臺架構的“1+2+3+N”科技政務數據治理模式,從數據編目、數據匯聚、數據管理、數據共享與開放、數據應用等方面明確基于中臺架構的科技政務數據治理實施路徑。
重數據架構模式以現有數據為核心,試圖在數據層面做好組織與規劃,在一致的數據架構下逐層往上推進平臺、應用的建設,在實施過程中對數據治理的整體思維、水平要求較高,通常適用于數據量重、業務應用輕的大型技術部門。
重數據應用的治理模式是一種自上而下的模式,通常以現有應用需求為核心開展數據治理,聚焦各個業務領域的數據應用、數據治理需求,在有需求、有資源、有驅動力的前提下按需組織推進數據治理工作。例如,寧家駿[10]提出應以需求導向突破大數據應用關鍵技術,將大數據應用總體設計、關鍵技術研發、業務數據模型等作為推進大數據發展的首要任務,構建大數據應用服務平臺。其認為只有業務部門的深入參與才能做好數據治理,只有針對業務自身需求進行的治理才能得到業務部門的認可與支持。
重數據應用的模式以滿足業務需求為導向進行數據治理,通常適用于數據應用較強、業務部門較為強勢但整體數據認知較弱的部門。該模式的數據治理切入相對較為簡單,大部分組織數字化轉型初期會使用這種模式,慢慢探索組織的數據治理道路。該模式有助于拉齊數據部門、業務部門的認知,提升整體數據認知,為未來數據治理的開展奠定基石。
重數據架構模式是基于底層數據進行治理的,對數據治理水平要求較高。數據治理水平包括數據基礎(數據量、數據質量等)以及數據治理能力,其中數據治理能力主要體現在數據治理團隊專業度以及數據治理體系(組織、制度及流程)完善度方面。這種模式對政府部門協同度要求相對較低,主要靠數據治理團隊推動進行。整體而言,重數據架構模式能良好地匯聚、治理數據,但脫離應用,對執行團隊架構能力要求較高,成效慢。
重數據應用模式是基于明確的數據應用需求進行治理的,對政府部門的協同性要求更高,需要業務部門與數據部門配合實現。整體而言,重數據應用模式能比較方便地切入,數據價值更容易體現,但整體以需求為主,重應用、輕治理,容易出現重復治理的風險,對數據治理水平要求一般。
兩種模式主要著眼于歷史與現狀需求,難以有效應對跨領域的數據協同與治理,亦無法滿足未來規劃提出的新需求。當圍繞常規需求集中治理了某一類型數據,而業務需求范圍有了新的擴展,需要整合新的數據字段時,則需面向數據來源部門重新進行需求對接,原始數據也需要全面進行更新與對賬。此外,在治理過程中,部分數據安全性要求較高,無法進行統一歸集。由于無法提供良好的機制對數據進行分級共享,這一部分數據將無法有效利用。
國際社會圍繞科學數據開放共享體量、質量、權屬、風險采取了一系列治理對策。隨著科學數據開放共享程度逐漸加深,科學數據治理內容體系也隨之拓展,數據出版成為數據共享的重要途徑,可信任數據成為質量治理的關鍵準則,數據信托成為權利治理新方案,全球化、技術化治理成為國際趨勢[11]。本文提出的基于城市數字化標識的政務數據整合模式即為以上思路的一種具體實現路徑。基于城市數字化標識的政務數據整合模式立足全面的業務痛點盤點與未來規劃,以長遠的眼光覆蓋業務、數據雙層面以降低重建風險,通過聚焦業務充分挖掘數據價值,同時不斷完善數據管理制度以推進政府部門協同性的流程改造,將政府部門數據治理水平推向了一個新水平。
城市數字化標識是為城市每一個數據資源賦予的符合規則的“身份編碼”,即將數據作為城市管理對象。本文以城市數字化標識為基礎,通過“三步法”實現跨領域的政務數據整合:第一步將空間位置計算與文本語義計算相結合[12],建立位置表達的多模態;第二步通過城市數字化標識驅動數據治理流程改造,并通過流程重組實現源頭治理,進而重構治理體系;第三步與塊數據[13]相結合開展政務數據之間的整合,實現跨領域之間的數據整合共享,促進建立健全規范有序的數據共享體系,為推進國家治理體系和治理能力現代化提供有力支撐。城市數字化標識系統架構如圖1所示。

Fig.1 City digital identity system architecture圖1 城市數字化標識系統架構
空間位置是地球空間信息的一部分,統一地址需要自然語言處理,利用多模態數據融合的方法將空間位置計算與文本語義計算相結合,構筑出社會治理的第三大參照物體系,為每一個建筑物和房屋賦予唯一地址編碼,建立形成統一地址[14]。在政務數據整合過程中,以統一地址作為抓手,關聯各委辦局數據,一方面實現數據空間底數一致,即不同委辦局可在同一個空間底板上疊加業務數據,實現數據共建;另一方面利用空間位置的相對固定性實現政務數據空間可數、精準下沉。
統一地址文本數據預處理是指根據文本對所有地址進行分節解析,對來自規自、公安、民政等多個不同來源的數據進行地址匹配,對于地址描述不完整的數據進行標準化數據處理。空間位置計算與文本相匹配是指對帶有空間位置坐標信息的數據進行投影轉換工作后,通過空間位置坐標直接匹配集成;對部分自身沒有空間坐標信息,但在屬性項中蘊含了地名地址或只是蘊含了一些地名基因的數據,結合漢語分詞與數據比對技術,根據識別提取出的地名地址信息建立含有地名標識的切分序列與邏輯組合關系,開展基于分詞、本體和詞語相似性的多種匹配,采用局部模糊匹配后的歧義消除方法,通過基于語義和地理本體的統一認識提取地名譜特征,實現高效、進準、實用的地名地址匹配。依托空間基準,采用地名地址匹配方法,對用于城市數字化標識的信息內容進行時空定位尋址。
城市數字化標識通過盤點資產、制定規范、搭建平臺、建立機制等實現城市管理對象之間的萬物互聯、數據融合,并在此過程中對治理體系進行重構。
2.2.1 盤點政府部門城市管理對象及建立分類體系
在政府部門已開放的“三清單”的基礎上增加按管理對象梳理部門的數據清單,即在管理事項的基礎上進一步梳理政府部門的管理對象,以人、地、事、物、組織為參照,細化每一項包含的類別、屬性(含基本屬性、業務屬性等)以及責任部門[15]。城市數字標識與其他實體之間的邏輯關系如圖2所示。

Fig.2 Logical relationship between city digital identity and other entities圖2 城市數字標識與其他實體之間的邏輯關系
基于合并同類項的原則,按照管理對象的全生命周期信息(基本屬性信息、業務屬性信息、業務過程信息、責任主體信息等)對分散在不同部門的數據進行歸并,找到共同所附屬的管理對象,對列出的城市管理對象進行分級分類,按照不同需求進行共享。
2.2.2 構建統一數字化標識的編碼標準,建立“一碼關聯”的基礎
對需要進行數據管理的對象進行分類與身份數字化。參考地理實體編碼、城市部件編碼等國家、行業規范,根據大數據發展、共享、利用的趨勢制定一套統一的編碼體系,為每個城市管理對象賦予唯一標識碼,通過建立城市管理對象統一的分類與編碼規范,形成統一共享、唯一識別的編碼標準,各單位可使用唯一數字標識快速獲取跨層級、跨地域、跨系統、跨部門、跨業務的數據關聯信息[16]。
參考現有國家、地方、行業相關分類規范,重點考慮易讀性、簡潔性,采用“行政區劃碼+對象分類碼+順序碼”三部分組成的編碼方式,共23位。具體如表1所示。

Table 1 City digital identity coding standards表1 城市數字化標識編碼標準
第一段由12 位數字組成,表示基礎網格及以上的政區管理單元代碼,其中第1-6 位為縣級以上行政區劃代碼,執行GB/T2260 中華人民共和國行政區劃代碼標準;第7-9 位表示縣級以下行政區域,執行GB/T10114 縣級以下行政區劃代碼編制規則;第10-12 位表示社區代碼,執行SZDB/Z3 社區服務與綜合管理信息化技術規范。跨政區管理單元的地理實體采用其上級政區管理單元代碼,其余位置置0 表示。第二段由5 位數字組成,表示分類代碼。第三段由6 位數字組成,表示順序碼,具體代碼段為000001-999999。
2.2.3 建立規則一致的統一賦碼平臺,確保數字化標識建檔標準化
平臺提供自定義編碼規則的能力,并按照編碼體系標準定義出符合要求的編碼規則,提供自動化編碼服務,通過上報數據的種類及數量查看編碼過程進度以及完成結果提示,通過統一的賦碼平臺確保數字化標識建檔涉及的數據信息標準化。統一賦碼平臺支持存量數據處理、增量服務調用兩種模式,對于存量數據平臺采用批量對接方式統一賦碼,對于增量數據平臺采用接口服務方式提供賦碼。
2.2.4 建立數據協同平臺,驅動部門流程改造
以數字化標識的城市管理對象為紐帶,以政府部門管理對象的數據清單為基礎,通過建立數據協同平臺實現同一政務數據不同業務屬性之間的相互調用,使不同信息內容進行分級共享[17]。
數據協同平臺主要以接口的方式通過城市管理對象的統一編碼作為主體參數實現城市管理對象涉密屬性數據的獲取,接口支持數據落地托管與數據不落地托管兩種方式。其中數據落地托管是相關數據統一交換到政務數據主管部門,由政務數據管理部門統一提供接口;數據不落地托管則是由源頭部門根據數據協同平臺的技術標準開發定制規范接口,并掛接到數據協同平臺,由數據協同平臺統一進行質檢、管理、監控與授權。以人口信息為例,人口的統一編碼、證件類型、證件號、姓名、民族、性別、籍貫、戶籍地址作為基本信息統一交換到數據共享平臺后對外進行共享,人口的社保信息、住房信息、居民失信信息等則可以由各單位充分保留數據資產的權利不通過交換向數據共享平臺進行歸集,而是通過提供符合數據協同平臺標準的接口進行數據共享。在人口信息的場景中,分別由人力資源社會保障部門提供人口社保信息、房管部門提供人口住房信息、征信部門提供居民失信信息,服務數據可通過人口的統一編碼進行關聯與融合。
2.2.5 建立數據反饋機制,加快數據從使用到反饋的完整閉環
對城市管理對象進行全面梳理,建立業務屬性來源的責權部門清單。當使用部門對數據有異議時,可通過數據反饋機制對數據來源單位提供的法源現值、使用部門提供的參考值進行上報,數據來源部門對反饋問題進行核實,核實完成后對問題予以通過或拒絕并提供理由,確保了數據在使用過程中不斷完善。如此以來,數據的更新工作由被動推送到主動確認,較好地實現了數據更新的閉環。
2.2.6 建立城市管理對象責任主體檔案,定期更新考核
按照各單位梳理城市管理對象全生命周期的更新部門、更新時間、檢查機制,為每一個數字化標識碼明確來源,形成管理共識,促進業務協同[18]。
以多模態數據為基礎,城市數字化標識為核心,建立人口、房屋、法人、事件、城中村、小區、工地、物聯設備、視頻監控等數據的關聯,將各個行業條線上的條數據打造為具備各類關聯關系的塊數據[19]。
數據關聯入塊的流程為:首先在統一地址庫建設完成后進行基礎數據資源—地址庫的建設,實現基礎數據與統一地址數據的關聯。然后基于地址數據進行與地址有關的人、法人企業等相關基礎數據的建設,設置與地址關聯的人口、法人、企業等基礎信息的關聯關系,形成數據模型。塊數據基礎建模包圖如圖3 所示。最后基于要素的空間范圍構建要素實體之間的關聯關系。空間關系可以是由空間實體的幾何特性(包括空間物體的地理位置與形狀)引起的空間關系,如距離、方位、連通性、相似性等;也可以是由空間實體的幾何特性和非幾何特性(包括高程值、坡度值、氣溫值等度量屬性,地名、物體名稱等名稱屬性)共同引起的空間關系,如空間分布現象的統計相關、空間自相關、空間相互作用、空間依賴等。關聯關系建設完成后可直接用于計算。以數字孿生的建設為例,在模擬城市運行的過程中需要知道城市對象的關系,通過城市數字化標識則可以獲取城市一個個數字化的對象,通過與塊數據結合則可以獲取對象關聯的全量信息。

Fig.3 Block data fundamentals modeling package diagram圖3 塊數據基礎建模包圖
某沿海地區的政務數據主管部門落地實踐城市數字化標識開展數政務數據的整合,通過制定標識編碼規范、建設數字化標識對象全周期管理平臺、全面推廣使用服務使政務數據資源的管理對象新增了50 多類,數據量新增了20 多萬條。同時通過內外部系統的推廣使用打造了多個特色應用,有效提升了部門之間的協同效率、事件處置效率,例如“大圍合小分格”利用唯一數字化標識進行數據關聯的快速定位;基層治理綜合網格以塊數據的邏輯進行數據關聯,實現了“底數清、情況明”;使用標識工具構建視頻的可視區域,實現了關聯對象所在位置的視頻排查。具體介紹如下:
在數據賦能基層治理的應用場景中,針對大城市的城中村、小區具有人口密度大、聚集度高、流動性強、衛生條件差、“三小場所”多、管理難度大等特點,利用數字化標識對象采集工具與管理平臺將城中村、小區劃分為一個個小的空間分格,并通過唯一數字標識快速構建與實有人口、暫離人口、樓棟、房屋、法人、視頻等的數據關聯關系,具體如圖4 所示。數字化標識與塊數據的結合可實現數據秒查、任務秒派,減少了70%的數據治理工作量,助力指揮分撥提速50%以上。

Fig.4 Large enclosure and small division圖4 大圍合小分格
對公共基礎對象進行統一數字化標識與關聯,賦能城市精細化治理。以流動人口管理為例,對數據資源進行標識化重構治理,基于統一地址建立與街道、社區、片區網格、基礎網格等的關聯關系,以塊數據的邏輯實現對數據資源的分類(類型)、分級(級別)、分塊(責任),精準下沉至基層,使相關責任人第一時間掌握到自己的管理底數,即“底數清”;明晰事情的來龍去脈,掌握到人、地、事、物、組織的相互關系,即“情況明”。截至目前,該地區已提供33個數字化標識的API服務支撐基層治理綜合網格應用。
如圖5 所示,利用統一標識工具構建視頻可視區域關聯塊,即建立每一個公共安全視頻可以覆蓋的區域內統一地址、樓棟、房屋、城中村、小區、在建工地、物聯感知設備等的關系圖譜,建立各個要素之間的相互關系。當某地發生事件需要尋找附近的攝像頭協助案件辦理時,可通過發生地的地址、門樓牌、樹木編碼、燈桿編碼、交通設備編碼等任一信息秒知周邊有多少個攝像頭在可視范圍之內,避免由人工搜尋、排查攝像頭。如表2 所示,該操作能助力視頻排查效率顯著提升。此外,其還支持對重點區域與周邊視頻的可視區域疊加分析,可對重點區域的視頻覆蓋情況形成分析報告。

Table 2 Comparison of video efficiency related to urban management elements表2 城市管理要素關聯視頻效率比較

Fig.5 Video visual area association block圖5 視頻可視區域關聯塊
本文提出一種基于城市數字化標識的政務數據整合模式,通過空間位置多模態化、城市管理對象標識化、數據關系塊數據化建立了數據關聯的機制與方法。在工程中的實際應用表明,該模式有效打通了政務數據之間跨層級、跨地域、跨系統、跨部門、跨業務的關聯與整合,促進了數據要素的充分流通。然而,該模式的落地需要有具有遠見卓識且意志堅定的領導者牽頭,以及經驗豐富的人才推進。未來將進一步推進該模式在CIM(City Information Modeling)平臺、一網共享、一網統管等數字政府領域的應用。