李東陽,方俊杰,許大璐
(浙江省地理信息中心,浙江 杭州 310012)
?
GIS技術支持下的多部門地名地址業務協同研究與實現
李東陽,方俊杰,許大璐
(浙江省地理信息中心,浙江 杭州 310012)
地名地址數據是民政部門重要的業務數據之一,也是測繪部門在數字城市地理空間框架項目建設過程中需要采集的重要數據之一,并且在工商、城管、公安等部門間發揮著強有力的作用。但是從現狀來看,各部門分頭采集、重復采集現象嚴重,且沒有統一標準。本文以數字城市地理空間框架項目中的測繪、民政、工商3個部門為例,提出了以GIS、物聯網等技術手段來實現多部門間業務協同式地名地址數據更新的機制,保證了數據的權威、統一、標準和及時更新。
地名地址;GIS;業務協同;數據更新;自生長
地名地址信息作為一種通用的地理空間表達方式,可作為大量的空間信息的載體[1]。地名地址數據是城市基礎信息的重要內容,地名信息的建設狀況是數字城市建設程度的重要評判指標。浙江省已開展過的地名普查數據和民政部門日常業務積累更新的地名數據由于缺乏精確的地理信息支撐,存在數據更新困難、不容易跨部門共享等缺陷。因此如何及時、準確地將地名地址數據減少純粹的外業采集工作量更新是民政、測繪等部門關注的目標。為實現這一目標,本文將以慈溪市地名地址為例,對該地區地名地址數據利用多部門業務協同的機制來實現數據自生長。
1. 民政部門對地名地址的需求
民政地名專題數據主要包含地名數據、地址數據、門牌數據、路名數據、路牌數據、勘界數據、行政區劃數據、民政檔案數據等。然而,浙江省內大部分地名辦對這些海量的地名數據普遍是以紙質的形式存儲、管理,查找歷史數據非常繁瑣,并且存在數據遺失的風險,因此需根據民政地名地址建庫標準建立GIS數據庫進行統一管理。
2. 測繪部門對地名地址的需求
測繪部門中的地名地址數據是對地名地址信息的結構化描述與標識。帶有空間坐標的地名地址數據以坐標點位的方式描述某一特定空間位置上自然或人文地理實體的專有名稱和屬性,以滿足各種專題信息空間定位要求。地名數據庫可以與其他地理信息資源數據庫之間通過技術接口連接,相互訪問,也可以作為單獨的關系型數據庫運行,因此其對地名地址的需求也非常巨大。
3. 工商部門對地名地址的需求
工商部門法人單位基礎信息庫項目建設是以法人單位組織機構代碼為統一標識的法人單位基礎信息庫,實現法人庫與各部門的信息交換。由于法人庫中的門牌地址字段是和其他部門共享交換的橋梁,因此,以地址門牌點來掛接法人庫以實現法人信息化是很有必要的。
由于測繪、民政和工商部門都對地名地址數據有強烈的使用需求,在使用中,逐步探索了一套數據共享和業務協同機制,測繪部門基于地理信息公共服務平臺,為民政和工商部門提供高精度的電子地圖數據,民政部門在線獲取電子地圖數據后,對地名和標準地址進行審核和更新,在線共享給測繪和工商部門。工商部門獲取民政部門權威的標準地址數據后,將法人數據進行空間化,并在測繪部門提供的底圖上進行管理與更新。最后,測繪部門對民政部門的地名、標準地址及工商部門的法人空間數據進行集成和發布,以實現地名地址數據的自生長和實時更新。如圖1所示。

圖1 多部門地名地址業務協同機制流程
1. 地理信息公共服務平臺
地理信息公共服務平臺是在基礎地理信息數據庫的基礎上,根據國家相關要求,對基礎地理信息數據進行提取、整合和重組,建成符合政務和公眾需求的共享服務數據庫;開發基于網絡應用的服務系統,提供地理信息“一站式”服務,為城市經濟社會的發展提供更完善的基礎測繪保障,為各政府部門管理、決策、協調能力的提高提供有效支持。系統界面如圖2所示。

圖2 地理信息公共服務平臺界面
2. 地名信息管理系統
地名信息管理系統是地理信息在數字民政應用中的一次嘗試。系統是按照數字城市的總體部署,根據地理信息公共服務平臺標準服務接口規范,實現對標準地名地址數據的服務封裝,開發共享與發布子系統,方便對地名地址有業務需求的各單位共享使用。
地名信息管理系統以地理信息公共服務平臺為基礎,擁有多尺度多維度的地理信息服務資源,包括0.5 m航攝影像、1∶500 DLG、1∶2000 DLG電子地圖數據,可分級詳細顯示道路、河流、建筑物等基礎地理信息數據。這為民政地名地址數據的空間化提供了準確的底圖基礎。地名信息管理系統主要具有地名增刪改查、路名增刪改查、勘界增刪改查、門牌增刪改查、路牌增刪改查、查詢定位、統計等功能。如圖3所示。

圖3 地名信息管理系統界面
3. 在線分級業務協作管理技術
根據民政業務的角色差異,系統設置了采集、檢查、審核等多業務管理級別,實現在同一張圖上構建相互協作的業務管理體系[2]。根據民政業務的管轄范圍,系統設置了按地域管理的方式,每級用戶的權限限制在本轄區。
地名管理應用子系統的用戶按其角色可分為游客、地名上傳人員、地名審核人員、管理員。游客只限定為查詢瀏覽地名數據,無法使用編輯、審核等功能。地名上傳人員可使用地名、門牌、路名的新增、變更、注銷等功能,但審核功能不予開放。審核人員的權限限定在數據審核業務。管理員擁有系統的所有權限。地名管理應用子系統的用戶按其地域可分為市級工作人員、縣級工作人員、鄉鎮(街道)工作人員。市級工作人員可在本市轄區范圍內進行地名管理,其他市的數據只有瀏覽查詢權限。縣級工作人員可在本縣轄區范圍內進行地名管理,其他縣的數據只有瀏覽查詢權限。鄉鎮(街道)工作人員可在本轄區范圍內進行地名管理,其他區域的數據只有瀏覽查詢權限。如圖4所示。

圖4 民政數據管理流程
4. 測繪部門與民政部門間地名地址的智能識別
民政、測繪部門通過地名信息管理系統實現地名、路名、門牌、勘界、路牌數據的信息化管理。測繪部門在數字城市地理空間框架項目中通過外業實地采集地址點、興趣點數據錄入到地名信息管理系統中,可作查詢展示。這些已經錄入的數據是按照民政部門規范要求進行采集處理,并且已做準確的空間化定位,但錄入的數據尚未掛接民政部門的詳細屬性字段,如產權人、所屬鄉鎮等字段。
以地名地址數據庫為基礎,將測繪部門采集的地名地址數據中的“MENPAI”字段與民政部門已提供的門牌地址進行模糊匹配和精確匹配。如果匹配的字段完全一致,則將民政部門的其他屬性直接掛接到系統中對應的完全匹配的數據上;如果匹配的民政數據字段中有部分字排列與測繪部門的數據一致,達到了預設標準,則將系統中對應的測繪部門采集的地址數據加上模糊匹配的字段,后期可讓民政部門審核人員逐一審核,減輕了民政部門的業務壓力,更保障了數據的準確性。
基于地名地址的智能匹配技術實現采用3步智能識別門牌號:①數據預處理:主要是對圖像進行灰度化、二值化、抑噪(濾波)等處理[3]。②字符分割:包括從驗證碼圖像中分割出字符區域和把字符區域劃分成單個字符兩個部分。如果采用統計特征匹配及神經網絡法識別,必須要先分割出單個的字符[4]。簡單的分割方法包括等距分割、積分投影分割、交叉點分割、求連通區等。其中,粘連字符的分割是一個難點,復雜的粘連情況下分割比較困難,是一個硬人工智能問題。③字符識別:是把處理后的圖片還原回字符文本的過程。可以分成基于字符分割的識別(包括采用神經網絡、SVM、各種統計距離的識別法)和模板匹配法識別[5-8]。字符識別的常用做法是:先獲取該字符的特征碼,然后使用各種分類算法對該特征碼進行分類,將其打上相應的類標簽。分類模型的訓練,是對字符庫中的每個字符進行特征化處理,得到每個字符的特征碼,該字符的標簽就是該字符本身,利用特征碼加上字符的標簽對字符庫中的所有數據進行訓練,得到相應的分類模型。當然,得到了待識別字符的特征碼后,也可以使用相似性度量和字符庫中的字符的特征碼進行比較,將該字符識別為與其特征碼相似性最高的字符。對二值化后的圖像進行分割,分割出來的圖像是單個的字符。
5. 地名地址數據庫實時更新
傳統地名地址數據更新中,測繪部門通過外業實地采集處理建庫的方式,耗時耗力、投入大,還可能會出現更新不及時、偏遠郊區采集范圍有限的情況。民政部門采用所屬辦事人員上門通過紙質文件申請審批的流程。因此傳統的新增更新地名地址數據流程無法滿足當今地名地址變更頻繁的需求,造成一定程度上各個部門重復投入。
現通過地名信息管理系統,開放街道辦事處及各鄉鎮的地名門牌管理員權限。可利用系統中豐富的地理信息數據作為地名地址更新的數據支撐,準確地在線上提交地名業務審批,并且由民政部門負責審核,保證數據的權威性。這減少了地名采集和業務辦理的工作量,提升了對相關地名應用部門的服務水平,保持了數據的持續更新和準確性。
6. 工商法人數據匹配與推送
根據工商數據中的地址屬性查詢到地址數據。將工商數據中的唯一標識碼插入到地址數據的工商字段(GONGSHANGIDID)上[9]。地址數據查詢時,輸入工商唯一序列號,根據地址數據的工商字段查詢到地址的詳細信息。如圖5—圖6所示。
本文項目以慈溪市和淳安縣兩地為試點,以測繪部門開發的地理信息公共服務平臺為核心,以民政部門開發的地名信息管理系統為應用,結合工商部門已有的綜合監管平臺,以3部門業務協同為典范,解決了之前各部門地名地址數據坐標、標準不統一的難題。通過這次嘗試探索了多部門間的地名地址業務協同的技術和機制,基本實現了地名地址數據的自生長和實時更新。但是,地理信息技術在業務協同中的應用不可能一蹴而就,今后將結合物聯網、移動技術、時空信息云平臺等新技術,串聯起其他部門,最終實現基于“一張圖”的應用,真正解決信息孤島的難題。

圖5 工商綜合監管平臺界面

圖6 法人數據匹配流程
[1]朱建偉,王澤民.地理編碼原理及其本地化解決方案[J].北京測繪,2004(2):24-27.
[2]徐開明. 地理信息公共服務平臺建設與現代測繪服務模式[J].地理信息世界,2016,4(3):41-48.
[3]劉宏偉,嚴妍.快速響應碼的識別和解碼[J]. 計算機工程與設計,2005,26(6):1560-1562.
[4]劉剛, 魏鋒. 基于 LDP算法的手寫數字串切分[J].北京郵電大學學報, 2003 , 26(1):14-18.
[5]任金昌, 趙榮椿, 張煒. 一種快速有效的印刷體文字識別算法[J].中國圖象圖形學報,2001,6(10): 1011-1015.
[6]鄒崇堯,朱貴方,趙雙明.基于搜索引擎技術的地名地址定制查詢研究[J].測繪通報,2014(8):92-94.
[7]張雪英,閭國年,李伯秋,等.基于規則的中文地址要素解析方法[J].地球信息科學學報,2010,12(1):9-16.
[8]馬照亭,李志剛,孫偉,等.一種基于地址分詞的自動地理編碼算法[J].測繪通報,2011(2):59-62.
[9]王丙義.信息分類與編碼[M].北京:國防工業出版社,2003.
Collaborative Research and Implementation of Multi-sector Address Business Based on GIS Technology
LI Dongyang,FANG Junjie,XU Dalu
李東陽,方俊杰,許大璐.GIS技術支持下的多部門地名地址業務協同研究與實現[J].測繪通報,2016(10):121-124.DOI:10.13474/j.cnki.11-2246.2016.0345.
2016-04-10
李東陽(1979—),男,高級工程師,主要從事數字城市和智慧城市建設工作。E-mail:10648340@qq.com
P208
B
0494-0911(2016)10-0121-04