胡 大 國,張 嘉
(1.廣州市房地產測繪院,廣東 廣州 510030;2.中國土地勘測規劃院,北京 100035)
?
基于地址匹配的城市行業用地調查研究與實踐
胡 大 國1,張 嘉2
(1.廣州市房地產測繪院,廣東 廣州 510030;2.中國土地勘測規劃院,北京 100035)
選取廣州市越秀區作為試點區域,利用數據庫規范地名地址數據,以地址匹配為核心實現宗地數據與經濟統計數據的融合,調查行業用地利用狀況、用地類型、面積與分布,形成顧及地名地址數據特點的越秀區行業用地調查數據庫,開展行業經濟、用地、從業人員情況統計與分析。研究與實踐表明:利用行業基本單位詳細地址與地名地址數據匹配開展城市行業用地調查是一有效方法;持續性開展城市行業用地調查有助于政府的經濟、用地宏觀決策。
土地利用;城市行業用地調查;地址匹配;SQL;空間分析;越秀區
行業用地是指用于產業活動的土地,是開展產業經濟活動的空間載體。以城鎮地籍調查數據為基礎,開展城市行業用地利用狀況調查,掛接宗地內的行業用地類型以及相關經濟指標,形成包含各類行業信息的城鎮地籍調查數據成果,對于摸清不同行業用地類型、面積、強度等情況,掌握重點行業用地的利用水平、潛力規模與分布,為產業結構調整提供基礎支撐,為經濟社會全面協調和可持續發展提供保障[1],具有重要意義。為此,國土資源部在全國范圍內開展了批次城市行業用地調查試點工作,第一批試點城市包括吉林省通化市、山東省德州市、福建省龍巖市、陜西省渭南市、江蘇省鎮江市和廣東省廣州市越秀區,力圖探索并形成適應不同地域、不同經濟社會發展水平的行業用地調查技術體系。
廣州市越秀區作為首批6個行業用地調查試點城市之一,是廣州市最繁華的中心城區,下轄22條行政街道,面積約33.8 km2,地籍區22個,法人單位和產業活動單位3.4萬多個,戶籍人口為115萬人,在土地利用現狀調查及年度土地利用變更調查中均為城市建設用地,地類代碼為201[2]。
1.1 數據分析及技術流程
行業用地調查的核心是建立行業基本單位(法人單位、產業活動單位)與宗地空間數據的關聯,解決行業經濟信息“落地”即空間化問題,從而實現經濟統計數據與地籍調查數據兩種異構數據的有效融合。結合廣州市試點區情況,行業用地調查基礎數據主要從國土、統計、公安等相關部門收集,包括1∶500地形地籍圖、地籍區數據、行業基本單位、行業經濟匯總數據、行業從業人口匯總數據等信息。上述數據存儲介質各異,格式不一,空間數據的坐標參考也不盡一致,雖然行業基本單位和宗地數據都具有空間坐落的表達,但兩者對同一對象的表達方式和語義描述存在較大差異,導致行業基本單位與其所坐落的宗地實體難以直接關聯。
行業基本單位數據和地名地址數據中均有地址信息,利用行業基本單位的詳細地址與地名地址數據進行地址匹配,可使行業基本單位具有空間坐標[3,4],然后與宗地進行空間疊加分析,即可實現行業基本單位經濟數據與宗地的用地范圍、用地面積等情況的關聯。對于地名地址數據無法查找到的行業基本單位,實地調查測繪該行業基本單位,并在1∶500地形地籍圖上采集地名地址點,補充完善地名地址數據庫,再進行地址匹配。主要技術流程如圖1所示。

圖1 行業用地調查技術流程
行業基本單位與地名地址數據中的地址信息有如下特點:1)地名地址數據為結構化數據,由街道、街坊、街路巷、門牌前綴、門牌號、門牌后綴6個字段組合表示,定義明確、統一,可以利用結構化查詢語言(SQL)批量處理。2)行業基本單位的詳細地址呈現半結構化特征,以唯一文本信息記錄,內容龐雜,描述不規范,存在錯別字、中文數字與阿拉伯數字混用、信息冗余等情況,難以進行批量處理。為實現兩類數據的高效管理與快速語義匹配,需對其進行數據建庫與規范化。
1.2 數據處理
1.2.1 數據庫設計 利用實體(Entity)-聯系(Relationship)模型設計行業用地調查數據庫,實體主要有行業基本單位(點)、宗地(面)、門樓牌(點)和房屋(面);聯系主要有多棟“房屋”坐落在一個“宗地”,一棟“房屋”擁有多個“門樓牌”,多個“行業基本單位”具有一個“門樓牌”,其比例關系為1∶N,利用空間關系關聯,無需設計單獨的聯系表。
1.2.2 數據規范化處理
(1)地名地址數據規范化。以實施行業用地調查試點項目為目標,與文獻[3,4]所述的地址標準化類似,但不進行地址解析處理,只對核心地址要素的含義、字段類型、長度及其組合進行統一規定,要求簡潔明了且易于操作。地名地址數據是具有地理坐標信息的矢量數據,其屬性由行政區、街道、街坊、街路巷、門牌前綴、門牌號、門牌后綴、X、Y字段組成。為便于與行業基本單位的詳細地址含義相匹配,綜合相關屬性設計“組合地址(ZHDZ)”字段,組合地址由“街路巷”、“門牌前綴”、“門牌號”、“門牌后綴”組成。
(2)行業基本單位詳細地址規范化。主要通過人機交互手工或半手工方式實現,以原始詳細地址為基礎,新增“提取地址(TQDZ)”字段作為“詳細地址”字段的派生字段,以期與“組合地址”進行匹配。派生“提取地址”的主要方法有:1)舍棄詳細地址的“廣東省、廣州市、越秀區”等冗余信息;2)修改詳細地址中的錯別字;3)將詳細地址中的中文數字改為阿拉伯數字;4)刪除詳細地址中多余的字;5)補充大地名或刪除多余的街路巷、樓宇名稱、房號。
地址匹配以數據規范和含義一致為基礎,在Access數據庫中利用SQL語句匹配,主要步驟如下:1)查詢符合條件的記錄數,將行業基本單位的 “提取地址(TQDZ)”與地名地址數據庫中的“組合地址(ZHDZ)”匹配,查詢相匹配的數據;2)更新行業基本單位數據,將“提取地址”與地名地址數據庫中的“組合地址”匹配,并將X、Y坐標信息賦值給行業基本單位;3)核查數據更新情況,保證數據更新的內容和數量無差錯。
地址匹配完成后,行業基本單位具有X、Y坐標信息,通過ArcGIS的“增加X、Y數據”功能[5],將行業基本單位轉換為點狀空間數據。在ArcGIS中,行業基本單位、宗地分別為點和面兩層數據,利用空間疊加分析[6]實現行業基本單位與宗地1∶N的關聯,然后導入Access中進行統計分析。
3.1 行業用地分類
在開展城鎮地籍調查時,土地分類通常按土地的批準用途、主要實際用途劃分和歸類,即一宗地只調查一個主要的利用類別,忽略了同一宗地的多種用地類型。《地籍調查規程》中雖顧及國民經濟行業分類調查,但是只填寫到大類名稱及編碼[7],不能反映同一宗地多種經濟活動的情況。為解決上述問題,行業用地調查試點依據國民經濟行業分類進行用地劃分,采用經濟活動的同質性原則定義行業用地類型,調查同一宗地的多種經濟活動及多種用地類型。國民經濟行業分類分為4個層次,即門類20個、大類96個、中類432個、小類1 094個。行業用地調查以小類為基礎,統計分析以門類為主。
3.2 行業用地分析
越秀區行業經濟數據[8]與用地信息關聯,形成空間經濟用地信息,可以進行三大產業用地分析、行業用地面積比重分析、單位面積營業收入分析、人均營業收入分析等。
(1)產業用地分析。越秀區無第一產業,第二產業地區生產總值為57.8億元,用地面積為0.9 km2,用地面積比例為5.3%;第三產業地區生產總值為1 839.3億元,用地面積為16.0 km2,用地面積比例為94.7%,第二、三產業單位面積地區生產總值分別為64.6億元/km2、115.1億元/km2,比例為1∶1.8(表1)。從經濟總量、單位用地面積產出量可以看出,第三產業對越秀區經濟的貢獻最大,居經濟行業的核心地位。

表1 產業用地情況統計
(2)按產業營業收入、從業人數統計分析。從門類單位面積營業收入看,每平方米營業收入最高行業為金融業(J門類,40.9萬元/m2),其次為建筑業(E門類,12.1萬元/m2)、交通運輸、倉儲和郵政業(G門類,8.4萬元/m2)、批發和零售業(F門類,8.2萬元/m2)等。結合整個產業的營業收入、從業人員數和用地面積比例看,越秀區第二、三產業營業收入比例分別為10.5%、89.5%,從業人員數比例分別為12.5%、87.5%,用地面積比例分別為5.3%、94.7%,作為廣州市的行政、商貿、金融、文化中心,越秀區第三產業用地所占比例相當高,其營業收入、從業人員所占比例均超過85%,用地面積近95%,可見越秀區第三產業發展水平很高(表2)。

表2 產業營業收入及從業人員數現狀
城市行業用地調查試點中,采用行業基本單位詳細地址與地名地址數據匹配,具有準確性高、速度快的特點。精心設計城市行業用地調查試點項目數據庫,組合運用Access數據庫的查詢統計功能和ArcGIS的空間分析功能,有助于行業用地調查試點工作的完成。持續性開展城市行業用地調查[1],與統計部門年度經濟普查保持同步,有助于政府的經濟、用地宏觀決策支撐。
[1] 路曉明,付治河,張高,等.行業用地調查成果應用研究[J].河南科技,2011,10(上):20-21.
[2] TD/T 1014-2007,第二次全國土地調查技術規程[S].北京:中國標準出版社,2007.
[3] 宋子輝.自然語言理解的中文地址匹配算法[J].遙感學報,2013,17(4):795-801.
[4] 胡青,徐建華,王志海.GIS數據庫中地址自動匹配方法研究[J].測繪與空間地理信息,2008,31(6):50-52.
[5] 黨安榮,賈海峰.ArcGIS 8地理信息系統應用指南[M].北京:清華大學出版社,2003.54-55,291-293.
[6] 陳述彭,魯學軍,周成虎.地理信息系統導論[M].北京:科學出版社,2001.125-126.
[7] TD/T 1001-2012,地籍調查規程[S].北京:中國標準出版社,2012.
[8] 廣州市越秀區統計局.2011越秀區國民經濟和社會發展統計資料[EB/OL].http://tongji.yuexiu.gov.cn/inc/op_win.jsp?id=12509.2013-12-31.
2014-08-06;
2014-11-05
國土資源部試點地區行業用地調查項目(DCPJ121702-02)
胡大國(1972-),男,高級工程師,注冊測繪師,主要從事土地調查和測繪技術管理工作。E-mail:daguoh@21cn.com