【摘 要】城市規劃,涉及到社會的方方面面,并對生活在其中的人們產生千絲萬縷的聯系,它并不是靜態的設計,而是為社會動態發展,人類動態生活而服務的。本文介紹了網絡開源數據在規劃編制中的應用前景,分析討論了幾種可行的網絡開源數據的獲取方法,就開源數據的的安全性及具體在在Gephi軟件的展示應用進行了簡單的介紹。
【關鍵詞】開源數據 規劃編制 數據獲取 數據展示
隨著這些年互聯網的蓬勃發展,已經積累了相當量級的待挖掘數據。這些數據產生于人們日常生活中依賴互聯網工作、生活留下的痕跡,將人們生活的形態在大尺度上向世人展示。基于這些特點,我們幾乎可以斷言 “網絡開源大數據”應該會成為城市規劃未來發展提供有利的分析基礎和條件。而實際上,有很多研究學者已經就大數據挖掘出的數據信息應用于城市規劃中。大數據的產生獲取途徑繁多,很多并不源于規劃部門,如通信、電商、交通、社交媒體、醫療、銀行等。如何獲取這些數據,獲取后如何應用? 本文就大數據的獲取及應用舉例如下。
1 大數據獲取應用
1.1 百度地圖API獲取開源免費數據
百度地圖API是為開發者免費提供的一套基于百度地圖服務的應用接口,包括JavaScript API、Web服務API、Android SDK、iOS SDK、定位SDK、車聯網API、LBS云等多種開發工具與服務,提供基本地圖展現、搜索、定位、逆/地理編碼、路線規劃、LBS云存儲與檢索等功能,適用于PC端、移動端、服務器等多種設備,多種操作系統下的地圖應用開發。
我們通過對百度地圖Place API接口的調用,在Visio Studio 2010編譯軟件中,通過以下程序提取調用出四川周邊城市,如瀘州、綿陽、自貢等地的銀行、醫院、學校等公共配套設施的分布地理坐標及其他詳細信息,以便于日后對這類地區規劃分析提供參考。Place API 是一類簡單的HTTP接口,用于返回查詢某個區域的某類POI數據,且提供單個POI的詳情查詢服務,用戶可以使用C#、C++、Java等開發語言發送HTTP請求且接收json、xml的數據。返回的Xml數據可直接在程序中處理后存入MS Sql數據庫中,以備后續使用。百度地圖提取部分程序代碼 圖1所示。
圖1 百度地圖提取部分程序代碼
1.2 新浪微博數據提取與應用
新浪微博擁有數量巨大的用戶群基礎,用戶狀態、用戶關注及粉絲等已經形成非常龐大且具有價值的數據,如何獲取及處理這些數據,已經成為十分熱門且值得關注的研究方向。
此外,隨著越來越多的規劃師開始使用微博等新媒體,新浪微博上規劃師成為一個活躍的群體,2012年黃虎對北上廣深的規劃師群體進行調查,發現規劃師群體微博使用比例明顯高于整個網民群體中的微博使用比例。如何突破傳統方法,通過新興媒體數據積累分析出規劃師群體間的交流及人脈關系? 北規院的茅明睿[1]給我們提供了一個新的思路與解決方案,即通過新浪微博api數據接口對微博上中規院、清規院、和北規院的三院用戶的粉絲和好友數據進行可視化分析,總結比較出三個院的用戶的粉絲和好友數據進行可視化與分析,總結比較三個院的人脈特征、組織特征和相互聯系與影響的情況,從而實現傳統技術手段難以達成的分析效果,成功給予我們對規劃行業利用大數據進行分析的啟示。
從數據的獲取手段來看,目前主要有兩種方法獲得新浪微博的數據,一是利用爬蟲程序通過解析微博頁面獲得微博數據;二是通過創建應用,利用新浪官方API獲取微博數據,步驟如下:
(1)下載weibo 開發的SDK開發幫助包;(2)注冊用于獲取數據的新浪微博賬號;(3)在新浪微博開放平臺注冊應用,并獲取APP Key和App Secret;(4)由App Key和App Secret 得到PIN值碼,并得到token 和密碼。
利用新浪API接口進行獲取數據更加簡潔高效,在OAuth2.0標注下調用新浪微博APi,返回均為Json格式的數據。Json是一種輕量級的數據交換格式,文件不具有明顯的強結構特征。但在使用API之前,需要了解新浪微博API的接口定義及各個參數含義。新浪微博接口限制用戶每個小時請求的次數。為了避免過高頻率的訪問新浪API接口,一方面可以通過接口實時查詢當前剩余的訪問次數,另一方面,需要對程序進行線程控制,以品均訪問頻率。
1.3 網絡爬蟲工具獲取開源數據
以上例子均需要借助一定的計算機編程實現,但也有一些互聯網上的網絡數據抓取軟件,只要對計算機的正則表達式掌握和了解,也可以自行配置進行抓取目標網站的數據。如火車頭采集器、網絡快車、gooseeker等。
2 數據分析展示工具——Gephi簡介
在我們得到了一定量的數據后,往往需要進行對數據的分析和展現, 在此介紹一個非常強大的可視化展現工具——Gephi。被稱為數據可視化領域的photoshop。 它是一款開源免費跨平臺基于JVM的復雜網絡分析軟件, 其主要用于各種網絡和復雜系統,動態和分層圖的交互可視化與探測開源工具。可用作:探索性數據分析,鏈接分析,社交網絡分析,生物網絡分析等。gephi是一款信息數據可視化利器。Gephi 內嵌數據展示算法,只需要通過導數將不同數據賦予其邊和點的信息,就可進行強大的分析和展現。 在上文我們介紹的新浪微博展現三個規劃院的人脈分析,也是通過Gephi 軟件分析得出的。以下是一些用Gephi做出的數據分析效果圖2-3所示。
圖2 某社交網站用戶注冊情況 圖3 個人郵件可視化來往分析
3 結語
大數據的獲取有許多不同的方式,大數據的展現也將帶給我們新的思路和啟迪。只要我們細心抓取數據,并通過再加工和生產,大數據定能為規劃編制做出更好的服務!
參考文獻:
[1] 茅明睿.北京城市規劃設計研究院.規劃行業微博人脈特征分析——以中規院、清規院和北規院為例,10045.
作者簡介:李楠(1988—)女,四川成都,碩士研究生,助理工程師,研究方向:規劃信息化、規劃編制的知識管理。