尹言軍,葉琳,劉玉春,余詠勝,秦艷華
(武漢市測繪研究院,湖北 武漢 430022)
地理國情主要是指地表自然和人文地理要素的空間分布、特征及其相互關系,是基本國情的重要組成部分。地理國情普查是一項重大的國情國力調查,是全面獲取地理國情信息的重要手段,是掌握地表自然、生態以及人類活動基本情況的基礎性工作。在地理國情普查中,對專題數據資料的性準確性、現勢性都提出了較高的要求:需要搜集并利用各專業部門擁有的現勢性較好、規范程度較高的行業專題數據,為普查工作提供重要參考依據,特別是一些專業性較強的專題屬性內容,行業專題數據可以發揮重要作用,應盡可能收集利用。
武漢市地理國情普查收集到了武漢市發改委、市教育局、市公安局等28 家委辦局的專題數據資料。這些數據資料具有數量大、來源復雜、時間跨度大等特點,且多為文本資料,經整理分析后需要將大部分數據資料進行空間定位表示,如學校、醫院、旅游景點、酒店等。為進一步提高專題數據空間定位的作業效率,改善目前人工定位耗時長,縮短作業周期,本文利用百度地圖API 和FME(Feature Manipulate Engine)軟件中對專題數據處理技術進行了研究和探討。
當前,百度地圖提供免費的API,且百度地圖API是一套由JavaScript 語言編寫的應用程序接口,通過這些接口可以在網站中構建功能豐富、交互性強的地圖應用等功能。百度地圖API 不僅包含構建地圖的基本功能接口,還提供了諸如地址信息查詢、本地搜索、路線規劃等數據服務。利用百度地圖API 可對專題數據中的單位進行地址解析和逆解析,從而實現空間定位。FME 軟件是一個空間數據的提取、轉換、處理的強大工具,提供了多源數據處理和應用的解決方案,用戶可以根據項目實際需求建立具有特色的空間數據處理模型,實現數據之間的轉換、處理;它還提供網絡地圖訪問服務,可批量實現專題數據中單位的空間定位。
百度地圖上單位也就是POI(Point of Interest),這些POI 主要分布在道路周邊,基本上涵蓋了地理國情普查中的單位院落,但由于現勢性參差不齊,名稱更新不及時、數據加密等原因造成名稱錯誤、定位精度降低,且定位點的要求與地理國情要素中的定位要求、精度要求存在不同。
地理國情普查中對要采集的專題數據的空間定位要求如下,其定位點一般定位在城鎮綜合功能單元的主要出入口或大門口的中心處。當一個單位院落同時包含學校、醫院、政府、社會福利機構等四類單位院落時,行業代碼需表示相關分類,用“/”分隔開;如同一個地址包含多個單位院落(分別掛牌,如醫院與社會福利機構共用一個地址)時,采集一個定位點并賦不同屬性,用“/”隔開。除該四類單位院落外,幾個單位院落共用同一個地址時,一般只采集一個點,屬性填寫行政等級最高或規模最大、最主要單位的相關屬性值。
盡管百度地圖在定位點要求和現勢性方面存在不足,但在專題數據整理時,可以參考利用百度地圖中的POI 信息,提高專題資料整理和空間定位的效率。
專題數據作為地理國情普查數據的重要來源之一,具有很強的現勢性、權威性,專題數據的定位和應用進一步增強了地理國情數據的權威性和現勢性,但收集到的專題數據與大部分是文本形式,多為描述性信息如名稱、地址、電話等信息,給專題數據的整理和空間定位帶來了極大的挑戰。
以學校專題數據為例,所收集到的學校專題數據(如圖1 所示),包含序號、學校名稱、所屬區、學校標識碼、學校地址、組織機構代碼、學校屬地管理教育行政部門名稱、學校所屬主管教育行政部門代碼、辦學類型、規模屬性信息,這些資料信息中學校名稱、所屬區、辦學類型可以利用并轉換應用到城鎮綜合功能單元中的NAME(名稱)、ADMNGD(歸屬)、TYPE(行業代碼)屬性中去。

圖1 學校專題數據內容
FME 軟件中提供了HTTPFetcher、JSONExtractor、2DpointReplacer、EsriReprojector 等轉換器,可以進行地名地址的查詢,將查詢后的地址分離過濾后生成坐標點,并使投影轉換后與所使用基礎數據的坐標系保持一致;具體方法如下:
首先,根據數據資料利用StringConcatenator 函數生成查詢語句,格式類似于http://api.map.baidu.com/geocoder?address=@ Value(名 稱)&output=$(output)&key(key)&city=$(city);并將該字段賦給HTTPFetcher 進行地名查詢。利用JSONExtractor 提取獲取到的經緯度坐標信息,并添加語句json["result"][" location"][" latitude"],查詢出緯度(latitude),經度(Longitude)的查詢也類似。
其次,利用tester 過濾掉經緯度不在測區范圍內的數據,然后生成點坐標。
最后,利用EsriReprojector 進行投影轉換,Offsetter進行平移、調整到大概位置,并輸出成初步結果。專題數據處理模型如圖2 所示。

圖2 專題數據處理模型
百度地圖是公開版電子地圖,其表示要符合《公開地圖內容表示若干規定》、《公開地圖內容表示補充規定(試行)》、《基礎地理信息公開表示內容的規定(試行)》《導航電子地圖安全處理技術基本要求》等規范和要求,其中要求位置精度不得高于50 m,經過加密處理會有偏移,且分布不均勻,因而需要對初步成果數據進行校正。該處理方法雖不能還原百度地圖數據的精度,但可以極大地接近其真實地理位置。
在同一坐標系下,均勻選取一定數量的初步成果數據和真實坐標位置的公共點,并記錄兩者之間的坐標偏移信息,生成矢量數據格式或在FME 軟件中用相應的轉換器進行轉換,再使用AffineWarper 進行坐標轉換,即可得到較為準確的數據結果。專題數據坐標校正處理模型如圖3 所示。

圖3 專題數據坐標校正處理模型
為驗證本文提出的專題數據處理技術的效率、準確程度及本文本方法的可行性,以學校、醫院這兩類專題數據進行了對比和實驗。
學校專題數據包含大學、中學、小學、幼兒園等,總共有1 112所學校,程序運行時間5 min,匹配成功876所,成功匹配率78%;醫院專題數據包含480 個,程序運行時間2.5 min,匹配成功336 個,成功匹配率70%。
利用匹配成功后的專題數據根據地理國情普查中的城鎮綜合功能單元定位要求,將定位點定位到主要出入口或大門口的中心處。利用整理后的數據成果和整理前同一單位進行對比分析,按距離大于100 m(含)、50 m(含)~100 m、小于50 m進行分析,分析結果如表1 所示:

專題數據整理后和整理前的比較分析(單位/個) 表1
通過實際利用比較匹配成功率70%以上,由于百度數據源的現勢性、全面性不得而知,部分單位定位不成功,故匹配成功率、各個分段的比例也不完全一致。總體而言,其利用百度地圖API 技術處理專題數據的結果比較理想,該技術實現批量化操作,很大程度上減少了專題數據處理的復雜性,提高了專題數據處理的準確性、高效性和實用性。對于未匹配成功的數據需要根據多方資料進行核實定位,必要時根據外業調查進行核查確定。
本文利用百度地圖API 在FME 軟件中實現地理國情普查中專題數據的空間定位,充分發掘和利用了搜集到的專題數據資料的價值和利用程度,有效地改善目前專題數據定位效率低下,提高了工作效率。實際生產應用過程中,大部分專題資料可以利用百度地圖中的POI 數據信息進行定位,但需要逐一核實檢核,以免地圖現勢性不夠造成定位錯誤;對于沒有匹配成功的數據,需要進一步搜集多方數據進行定位,也可在外業調查核查時重點核查。
該方法在地理國情普查項目生產中彌補了現有基礎地理信息數據現勢性不足。與常規專題數據定位方式相比,本文方法利用公開版網絡地圖提供的數據接口進行空間定位,明顯地提高了生產效率,縮短了作業周期,同時最大限度地減少了重復工作,可以為地理國情普查工作中專題數據空間定位提供了一種技術解決方法;同時該方法有效地利用了多源地理信息,做到了多源數據的互補和融合利用,也是多源數據融合應用的一次嘗試,具有較強的實際應用價值。
[1]羅名海.地理市情監測研究[J].地理空間信息,2012,10(5):1~4.
[2]使用FME 實現電子地圖應用之地址解析.[EB/OL].2013-09-02:http://blog.163.com/antufme@126/blog/static/140492492201382921340/
[3]張志軍,李霖,于忠海等.多尺度地理市情監測專題地圖表達研究[J].測繪通報,2014(9):115~118.
[4]李德仁,眭海剛,單杰.論地理國情監測的技術支撐[J].武漢大學學報·信息科學版,2012,37(5):505~512.
[5]劉成寶,杜洪濤,張坤.面向地理國情普查的濟南市地理信息數據庫建設[J].測繪與空間地理信息,2014,37(9):66~68.
[6]國務院第一次全國地理國情普查領導小組辦公室.地理國情普查內容與指標[M].北京:測繪出版社,2013.