文|濰坊市自然資源和規劃局 劉曉婧 王毅 李安亭 房德海 劉乾忠
2015年6月濰坊市被自然資源部(原國家測繪地理信息局)批準為“智慧城市時空信息云平臺”建設試點城市之一,2017年11月3日成為全國首個通過驗收的地級市試點,基本滿足了城市運行、管理與服務的自動化、智能化需求。隨著推廣應用深度不斷加深和應用需求不斷旺盛,在解決了省市縣一體化地理信息框架數據更新后,平臺專題數據更新問題浮出水面,適逢全市推廣應用政務資源信息共享交換平臺,如何基于地理信息推進政務資源共享以及保障重要地理信息數據安全成為擺在研究人員面前的重要課題之一。
課題啟動后,總體分兩步進行,智慧濰坊時空信息云平臺建設國家試點項目視為平臺建設一期,2020年濰坊成功申報“測繪自主可控專項”項目市級時空信息綜合服務重要場景的應用試點之一,為平臺建設兩期。在平臺建設和推廣應用實踐中,濰坊就政務資源共享方面開展了大量工作,兩期側重點有所不同,但能繼承性迭代升級,有效融合集成為一體。
在平臺建設一期階段,主要集中在政務專題數據的融合匯聚,重點集中在匯聚內容、匯聚方式和挖掘分析等方面。

圖1 時空大數據建設總體框架
匯聚內容方面,結合本地實際情況,在2019 版技術大綱的基礎上有針對性地編寫形成《濰坊市法人時空數據庫建設標準》和《濰坊市地名地址數據建設技術標準》等多個地方標準規范,為后續智慧濰坊時空大數據的持續建設和完善提供標準化的技術參考。
匯聚方式方面,通過濰坊市大數據局協調,分建共享法人、人口、宏觀經濟三類覆蓋全市的基礎性數據資源,并依托濰坊市電子政務共享交換平臺協調了公安、民政、自然資源、城管、銀行、衛計委、教育、旅游、公交、公共自行車、統計等部門,形成了43 個專題數據,根據數據的不同特性分別進行了相應的空間化處理。
2.1.1 時空法人數據
從市質監局獲取到19.6 萬的法人組織機構代碼數據、從市工商局獲取到 22.9 萬條工商登記數據、從民政局獲取到277 條社團法人數據、從社保局獲取到4 萬條社保企業法人數據,均以excel 表格形式提供共享。我們根據《濰坊市法人時空數據庫建設標準》將不同來源的法人數據整合成以組織機構代碼為唯一標識的法人時空數據,并導入時空信息大數據中心。
(1)數據比對融合
通過各類表中的“名稱”字段將不同類表進行關聯,按照《濰坊市法人時空數據庫建設標準》中規定的相關內容提取相關的屬性,合并4 類法人數據。
(2)法人數據空間化
①有詳細地址描述信息的數據
對于字段具有詳細的地址描述信息的數據,可通過地名地址引擎匹配轉為空間shp 數據。
②對于沒有詳細地址信息的數據
結合人工外業實地普查,以定位每條法人數據的空間位置,并記錄位置信息,最終形成空間數據。
(3)數據檢查
對空間位置一致的情況下存在多個同名法人單位、同一法人單位分散于多個空間位置上,分析其存在的原因,確定是否處理,同時利用檢查軟件對屬性數據完整性、一致性和邏輯性進行一定比例檢查。
(4)法人時空數據入庫
將空間化后的法人時空數據導入時空信息大數據中心。
2.1.2 人口數據和宏觀經濟數據
協調公安、人社等單位,獲取927 萬條非敏感人口信息構建人口庫。協調發改、財稅等部門,獲取19 萬條宏觀經濟數據完成經濟庫建設。
首先調用地名地址匹配引擎對人口、宏觀經濟數據進行空間定位,對于不能明確定位的登記戶址數據和統計數據,進行外業核實,并完成核實后的地址補充到相應的數據庫中。空間化后的數據,通過交換共享的方式共享到時空信息大數據中心統一管理。
2.1.3 專題數據
梳理分析各部門提供的專題信息,分為兩大類,一類是和地名地址信息提取的興趣點信息進行空間和屬性合并,成為公共興趣點信息;一類是保持各部門的專業屬性信息,成為專題興趣點信息。處理流程如下:
(1)數據清洗和空間定位
各部門提供的專題信息大多是表格或文檔,對數據加以充分分析,按照要求分類出兩類興趣點,同時對無效信息進行清除;然后通過地名地址引擎,對專題信息進行空間定位。
(2)整合數據和增加分類信息
地名地址信息中提取出有關的興趣點信息,與各部門提取的公共興趣點信息做整合,在空間和屬性上消除冗余的內容。同時按照分類信息增加數據的大分類和小分類信息。
(3)數據屬性加上時間標識
對所有的興趣點信息增加時間屬性。
(4)數據檢查
主要針對空間和分類信息的正確性上進行質檢。
2.1.4 智能感知實時數據
通過濰坊市政務資源信息共享交換平臺以及交通、環保、公安等部門協調,全市38 個空氣質量觀測點數據、109 個廢水實時監測數據、64 個污水處理廠監測數據,84 個監測點數據,256 個雨量實時監測點數據,以及城區1296 個公共自行車站點數據、公安、交通和市政的公共監控視頻流數據等物聯網和智能感知實時數據,在平臺上實現了集成共享。通過地名地址引擎匹配和人工核查相結合的方式對感知設備位置進行空間定位,并根據實時服務接口中的參數對每個點位進行屬性賦值。
大數據時代背景下的數據價值不再單純取決于它的基本用途,而是更多來源于它的再利用。在專題數據挖掘分析方面,我們選用單因子空間分析、多因子關聯分析、時序分析、主題分析、時空推演等多種空間分析挖掘技術,找出時空數據與專題數據之間的潛在關聯,客觀地分析出隱藏的有用信息,獲取了4 大類15 種知識服務,面向全市各部門單位開放。
平臺建設一期階段雖然在數據和平臺系統安全方面都采取了相應的技術手段,但離滿足地理信息在線需求還有差距。在平臺建設二期階段,我們按照涉密測繪地理信息保密處理方案,在涉密內網開展政務時空數據保密處理工作,并將處理完成后的非密但敏感的時空數據離線拷貝到政務外網中。
在時空數據脫密脫敏處理方面,采用國家認可的非線性保密處理技術對敏感的單層矢量數據進行機密性保護,在數據入庫后,通過調用密碼服務平臺的商用密碼接口,對數據中敏感字段進行加密,采用商用密碼對切片的柵格位置信息進行機密性及柵格圖片的完整性保護。
在時空大數據平臺分級服務方面,依據用戶的登錄方式對用戶權限進行管理,實現數據內容與精度的分級服務。對安全方式接入的授權用戶提供高精度數據服務,采用商用密碼技術來保證高精度數據服務的安全和定向可控;對普通方式接入的非安全認證用戶提供低精度數據服務,以滿足用戶的使用需求;對未授權用戶不提供服務,并采取安全管控措施防止數據被非法泄漏。如圖3所示。

圖3 時空大數據分級服務示意圖
在時空信息數據安全傳輸方面,時空信息數據直接以服務的形式對外提供,采用對時空大數據平臺透明的信道加密方式,通過集成商用密碼算法和SSL VPN 協議的安全認證網關,建立安全接入終端與時空大數據平臺之間安全通信鏈路,確保終端與時空大數據平臺之間數據傳輸的機密性、完整性。

圖2 政務時空數據加密處理總流程
立足于國產化的核心技術產品,重點利用互聯網在線抓取、物聯網實時感知、地理編碼、非結構化數據安全可控分發等成熟技術。
根據指定的主題(如火災、積水、盜竊等關鍵詞,或POI、地圖瓦片等Web 服務),自動從互聯網中抓取相關內容,計算關聯度,并進行數據清洗、質量評價、信息提取,用于時空大數據的變化發現與信息提取。
面向物聯網有線/無線多源、多種類傳感設備,突破了對接口、內容、格式等方面的自適應解析等技術,實現了可視化定制流程與參數調整,解決了物聯網實時接入、流信息獲取實時的難題。
提出了基于多樹索引的地名地址匹配技術。進行地址匹配時,程序首先通過地址要素詞典采用正向最長匹配算法,同時完成地址字符串切分和地址要素匹配。有時不同的地址包含同名地址要素,最終可能匹配到多條地址,程序再根據打分排序算法,對地址樹中匹配到的各條地址打分,確定最佳匹配結果。
基于操作系統的文件系統過濾驅動技術,實現空間數據文件的加密存儲保護和定向受控訪問。整個加解密過程對空間數據引擎和GIS 平臺是無感知的,不影響業務邏輯,最大限度的降低改造成本,并達到分發數據的安全保護。
構建集基礎地理信息數據、公共專題數據、智能感知數據、互聯網在線抓取數據等在內的智慧濰坊時空大數據資源體系,打造歷史現狀一體化、二三維一體化、室內室外一體化、地上地下一體化、虛實一體化、市縣一體化的“六位一體化”濰坊全時空,為全市政務信息化應用提供時空信息全域一張圖。
根據城市的地名地址數據的采集與應用特點,建設地名地址匹配服務引擎,建設全濰坊市標準地名地址庫,為各部門提供了專題數據自動匹配的服務支撐,大大縮短了各部門專題數據建設與應用的時間。
時空大數據不僅具備大數據的典型特性,還擁有豐富的語義特征和時空動態關聯特性。通過對時空信息的大數據知識挖掘分析,找出它們之間的相關關系,為我們提供新的視野和有用的預測,將政府部門決策由經驗決策提升為知識決策。
智慧濰坊時空大數據平臺集成了跨部門地理信息政務資源,極大地提高了數據資源應用價值,先后廣泛應用于發改委、稅務、公安、大數據、城管、農業、水利等近80個部門和單位140 個業務系統,為濰坊市脫貧攻堅、生態文明建設、鄉村振興等提供了數據服務支撐,成為“城市大腦”的一部分。
我們在時空大數據平臺建設與實踐中取得了一些初步成果,但隨著技術的不斷發展和應用需求的深入,智慧濰坊時空大數據平臺建設與推廣應用在政務資源共享方面依然任重而道遠,比如公共專題、物聯網實時感知數據涉及面廣,時效性不高、更新較緩慢,比如平臺數據更新發現機制不夠成熟,比如如何從海量時空數據中更有效地發現知識,運用知識等。這些都離不開政府部門的統一思想、統籌規劃、政策引導和協調推進,離不開各部門之間的密切合作,需要我們不斷去研究實踐,更需要我們擁有更好的數據洞察力和不斷探索創新的精神。