劉帥,王佳
(1.南京市城市與交通規劃設計研究院股份有限公司,江蘇 南京 210018;2.長沙理工大學 交通運輸工程學院,湖南 長沙 410114)
隨著大數據的發展,電子地圖提供的各類興趣點(point of interest,簡稱為POI)為交通規劃設計提供了一種新的數據支撐。國外對于POI 數據的獲取和應用研究較早。Mummidi[1]等人通過分析用戶在地圖上注釋的標簽,發現興趣點,增加了POI 數據的獲取途徑。Xie[2]等人提出網絡核密度分析,將線要素引入核密度分析,提高了核密度的運算效率。Lian[3]等人將POI 簽到信息劃分權重,通過用戶的簽到頻率增大POI 的影響區域,幫助用戶推薦感興趣的POI 信息。李偉[4]等人通過GIS 平臺對POI 數據進行處理,對廈門島內常規公交線路的可達性進行了評價。于浩川[5]等人以公交線路數據和POI 數據為基礎,通過開發軟件對城市公交線路進行規劃。這些研究成果表明:國外研究主要集中于POI數據分析,而國內主要集中于POI 應用,但POI 數據在交通規劃應用中還有諸多缺陷。因此,作者通過分析POI 數據的獲取和處理,擬構建研究區域格網坐標,提取模型和分區導出模型,提高POI 數據扒取的準確性和處理效率,以期為交通規劃提供前期的基礎數據。
POI 與人們的日常生活息息相關[6],其含有地理信息的空間實體[7],是可以通過計算機編程語言從電子地圖檢索和扒取的位置大數據來獲取。通常包含ID、名稱、經緯度、類別等相關信息,其中經緯度是POI 數據的核心屬性。
POI 數據具有樣本量大、獲取成本低、更新速度快、位置精度高及涵蓋信息詳細等優勢[8]。POI的空間分布可以反映城市的空間結構。POI 數據越密集,城市功能越集中,則該區域可獲得的機會越多。POI 的空間分布對交通規劃設計和交通基礎設施的布局有重要指導作用[9]。
本研究采用高德地圖POI 三級分類標準,一級分類23 種,二級分類264 種,三級分類869 種。通過分析各分類POI 對交通規劃影響程度的大小,基于居民使用頻次和設施點數量,對電子地圖POI各類設施進行篩選和分類,篩選出與交通規劃相關程度較大的設施類型。從一級分類中,選出12 個POI 類型,見表1。

表1 溆浦縣城區主要POI 數量表Table 1 Quantity table of main POI in Xupu County
傳統的POI 獲取方式是實地調研采集,但數據量小不能大范圍的進行數據分析。隨著地理信息大數據的發展,人們對全球地理信息數據的需求也日趨增加,獲取方式也更加便利。
目前,POI 獲取主要有3 種途徑:①通過爬蟲代碼從電子地圖扒取;②通過電子地圖開放平臺(百度地圖API、高德地圖API 等)來扒取POI,這些網站開放了較為完善的開發接口[10];③通過集客大數據、Geosharp、火車頭和八爪魚等軟件,直接采集POI 數據。利用Geosharp 軟件獲取POI 數據的操作相對簡單、可行性高,并且POI 數據的準確率高,因此,通過它獲取研究區域的POI。
Geosharp 是一種網絡地圖數據采集軟件,主要包括地理編碼、坐標轉換和數據采集3 個模塊。地理編碼模塊可以把地址信息解析為經緯度;坐標轉換提供百度、WGS84 和火星坐標系之間的轉換;數據采集模塊可采取所有類型的POI 數據和天氣預報數據。
Geosharp 獲取POI 數據可分為3 個步驟:①選擇需要獲取的POI 類型。根據高德地圖分類標準,采用POI 的一級分類獲取。②確定研究區域,設置研究區域的經緯度。如果研究范圍不大,則可以直接獲取。但研究范圍過大,需要進行格網劃分,分區獲取。③確定數據保存路徑。
Geosharp 的“高德地圖POI 采集工具”只需研究范圍的經緯度,即可采集該矩形范圍內所有POI數據,根據需要導出到Excel 中。通過經緯度在地圖上添加X,Y 坐標,生成位置信息。通過POI 類別,研究各類型POI 的出行特征。通過ID,確定POI的唯一性。
POI 數據在進行大范圍采集時,由于研究區域過大,如果一次輸入整個范圍的經緯度,不僅會花費大量時間,而且容易造成軟件異常和數據丟失。因此,會增加獲取數據的難度,其結果的誤差也較大。其解決辦法是對該區域劃分成格網單元[11],按照每個網格的經緯度坐標扒取POI,再對數據進行合并。通過多種區域格網劃分方法進行比較,發現FME[12]數據的交換與處理操作最簡單,自動化程度高。因此,采用FME 對區域進行格網劃分,并自動提取格網坐標。FME 可以實現超過200 種不同空間數據格式(模型)之間的轉換,是一款無縫連接多平臺空間數據的操作工具。FME 的操作流程主要分為讀模塊、轉化器模塊和寫模塊3 個部分。讀模塊可以從外部數據源讀取要素數據。轉換器可以在使用者的控制下,將這些數據合并或分割,從一種表達格式轉換為另一種表達格式,也可以將這些要素掛接到外部數據庫上。寫模塊將這些要素以一種支持的格式進行輸出。
本研究通過FME 軟件進行建模,自動對城市的格網進行劃分,提取格網坐標。具體流程:
1) 通過讀模塊將研究范圍地理文件進行導入;
2) 通過2DGridAccumulator 轉換器生成格網,按照行列數進行拆分,創建格網類型,選擇Polygons;
3) 通過GeometryCoercer 轉換器將研究范圍面轉換為線,幾何對象類型改為fme_line;
4) 通過BoundsExtractor 轉換器提取格網坐標;
5) 通過AttributeManager 轉換器將經緯度合并成一個單元格;
6) 通過counter 轉換器進行計數,設置計數從1 開始;
7) 通過寫模塊將格網經緯度輸出到 Excel文件。
根據FME 構造模型,將研究區域進行自動化劃分格網,得到每個格網左上角和右下角的經緯度坐標。再將經緯度坐標依次輸入Geosharp 高德地圖的POI 采集工具。最后,通過Geosharp 分區獲取POI 數據,得到整個研究區域所有的POI 數據。
通過Geosharp,從高德地圖中采集POI 數據類型較多,但采用手動方法對各類Excel 進行合并的,操作比較繁瑣。因此,采用FME 進行建模,自動將各類型POI 進行合并。FME 模型構建流程為:
1) 讀取文件夾,將POI 的Excel 文件通過讀模塊進行導入。
2) 通過AttributeSplitter 轉換器,對POI 類別進行拆分,創建3 個屬性。Attribute Value 值分別為type_list{0},type_list{1},type_list{2}。
3) 通過寫模塊將所有數據輸出到Excel。
通過ArcGIS for Desktop 實現POI 數據和地圖的關聯。ArcGIS for Desktop 作為GIS 中的主流產品,其特點是數據管理效率高、空間分析能力強、可視化程度高。ArcGIS 為大數據的管理、分析和可視化提供了有效的處理工具。ArcGIS for Desktop主要由ArcCalalog (管理空間數據)、ArcGlobe(大型三維場景處理與分析)、ArcMap(二維數據的處理、管理和分析)和ArcScene(小型三維場景處理與分析)4 個部分構成。
通過FME 數據合并模型對POI 數據進行整合,導入到ArcMap 中,按照經緯度屬性添加X,Y 坐標,生成位置信息,設置坐標系統,將POI 地理信息數據可視化,得到整個研究區域的POI 分布情況。POI 數據可視化結果如圖1 所示。

圖1 POI 點數據空間分布示意Fig.1 Spatial distribution of POI point data
如果將每個POI 點均作為一個功能單元,POI密度越高,表明該地區城市功能越集中。為了分析POI 的聚集特征,了解各類服務設施的空間分布狀況,利用ArcMap 10.2 的密度分析工具,對研究區域內的各類興趣點進行分析。
3.3.1 核密度分析原理
密度分析是通過輸入數據的數量計算數據的集散程度,生成一個連續的密度分析面。通過計算得到密度,將每個點的密度值分布在研究區域上,最后得到每個柵格的像元值[13]。
密度分析中,最為重要的是核密度分析。核密度分析一般用于計算要素周圍鄰域的密度。既可以計算點要素的密度,也可以計算線要素的密度。核密度分析示意圖如圖2 所示。
根據概率理論,核密度分析模型為[14?15]:


圖2 核密度分析輸出要素示意Fig.2 Schematic diagram of output elements of kernel density analysis
式中: k( )為核函數;h 為帶寬,h > 0; x - Xi為估值點x 到事件Xi處的距離。
核密度分析可以體現POI 數據點的空間分布,對點狀數據進行分析尤為有效。通過核密度分析,計算每個輸出柵格像元周圍點要素的密度,生成POI 數據點熱力圖。
核密度分析中,需要設置輸出像元大小和搜索半徑2 個參數。設置的搜索半徑越大,生成的密度柵格越平滑,概化程度越高;搜索半徑值越小,生成柵格顯示的信息越詳細。
3.3.2 交通小區劃分
交通規劃需要全面了解POI 對各類交通源的吸引程度。由于不可能對每個POI 單獨進行研究,因此,分析POI 時,需要根據交通小區對POI 進行合并處理。
為了將所有POI 數據按照交通小區依次導出,得到每個小區的各類POI。傳統的方法是劃分好交通小區,依次裁剪,導出POI 數據。但當數據量較大,該方法費時費力,效率較差。ArcMap 可提供一種自動化處理工具—ModelBuilder,通過ArcMap的模型構建器,輕松實現批處理工作。
ModelBuilder 是創建、編輯和管理模型的應用程序[16]。其原理是將一系列地理處理工具串聯在一起的工作流,它將其中一個工具的輸出作為另一個工具的輸入。可將ModelBuilder 看作一種簡單創建、可循環操作的可視化編程語言。進行模型構建時,可以直接將工具箱的各種地理處理工具和需要處理的數據集拖動到模型構建器界面中。然后,有序地把它們連接起來,實現批處理工作。
模型構建器的優勢:①ModelBuilder 可以集合ArcToolbox 各種工具,進行創建,并且自動化處理所構建的工作流;②結合使用ModelBuilder 和腳本,可將ArcGIS 與其他應用程序進行集成;③Model?Builder 創建的自動化模型,可以在Python 腳本中使用。
本模型構建中,將劃分好的交通小區在ArcMap 按字段依次導出,添加裁剪工具,輸入要素為POI 點數據,裁剪要素為交通小區面數據,得到各個交通小區的POI 數量。
通過ArcMap 中ModelBuilder 構造,批量導出模型,將整體POI 數據按照交通小區進行劃分,依次導出。交通小區內,不同類型的POI 對于交通規劃的影響程度不一。通過結構熵權法,確定各類POI對公交出行的影響權重,依次對不同類別POI 進行量化計算,得到各個小區的當量POI 數據,為后續交通規劃、公交線網優化[17]提供數據支撐。量化公式為:

式中:Di為交通小區i 的當量POI;E 為獲取的POI類型數;we為第e 類POI 的權重;die為交通小區i第e 類POI 數量。
以溆浦縣為例,通過Geosharp 軟件和高德地圖,獲取城區各類POI 數據。獲取POI 之前,避免區域過大,造成數據丟失,對研究區域進行格網劃分,采用FME 格網劃分模型對溆浦縣城區進行格網劃分,如圖3 所示。
通過Geosharp,由高德地圖分區,獲取格網小區POI。根據FME 的數據合并模型,將格網小區POI 數據進行合并、數據清洗,為ArcGIS 建立POI地理數據庫進行前期數據準備。本試驗獲取了12個POI 類型,有效POI 數量為1 800 條,見表1。

圖3 溆浦縣格網劃分示意Fig.3 Grid division diagram of the Xupu County
先將POI 數據導入ArcGIS,添加經緯度信息,設置地理坐標系為WGS 1984,導入溆浦縣中心城區用地現狀圖,進行地理配準。再將POI 數據加載到溆浦縣中心城區用地現狀圖進行核密度分析。設置熱力圖顏色,顏色越深,表示POI 數據比較密集;顏色越淺,表示POI 聚集程度較為稀疏。溆浦縣POI數據空間分布如圖4 所示。

圖4 溆浦縣POI 空間分布熱力Fig.4 Thermal map of of POI in the Xupu County
根據溆浦縣城區道路現狀和城市規劃分區情況,將該區域劃分為22 個交通小區,小區劃分示意圖如圖5 所示。
通過ArcMap 的ModelBuilder 構造,批量導出模型,將所有POI 數據按照劃分的交通小區依次導出,得到每個小區的POI 類別和數量,通過權重進行量化見表2。

圖5 溆浦縣交通小區劃分示意Fig.5 Division diagram of traffic district of the Xupu County

表2 量化后交通小區POI 數量Table 2 Number of POI in traffic area after quantification
通過FME 構造格網坐標提取模型,對研究區域進行格網劃分,再采用Geosharp 軟件獲取POI數據,最后基于ArcGIS 模型構建分區導出模型,將POI 數據分區導出,并進行量化處理。通過采用格網坐標提取模型和分區導出模型進行自動化處理,再導出各類POI 數據。該方法比原有裁剪導出操作更節省時間,也更有效率。