朱晨曦,晏王波
(1.江蘇省土地勘測規劃院,江蘇 南京 210098; 2.江蘇省測繪研究所,江蘇 南京 210098)
基于微博簽到的地理空間信息研究
朱晨曦1,晏王波2
(1.江蘇省土地勘測規劃院,江蘇 南京 210098; 2.江蘇省測繪研究所,江蘇 南京 210098)

隨著Web2.0時代的來臨,志愿者地理服務(VGI)逐漸改變了傳統的地理信息服務模式。以新浪微博為例,從網絡社會空間入手,實現了數據的獲取、清洗、可視化及空間分析,對南京市熱點地區進行了研究。研究表明,南京市轄區的鼓樓、建鄴、秦淮等老城區和浦口、江寧、棲霞等地區分別由于商業聚集地吸引大量人流和大學城聚集成為整個城市的熱點地區,集聚程度高,人流量相對較大。該模式為城市應急、城市規劃、基礎設施建設提供了依據,也為VGI模式下的地理空間信息研究提供了可能。關鍵詞:空間分析;熱點分析;VGI;南京市
隨著互聯網技術的不斷深入,特別是移動互聯網的蓬勃發展,社會化媒體已成為人們日常生活的重要部分[1]。微博是結合了社會化網絡、空間信息、微型博客的一種新應用模式。它讓空間位置信息可以被實時記錄,是Web2.0時代社會化媒體的代表[2]。與Web1.0側重點不同,Web2.0更注重用戶的交互作用,用戶既是互聯網的讀者,也是網站內容的制造者。
2007年,Goodchild院士[3]首次提出了VGI的概念,指出傳統的單向地理信息服務模式將逐漸向交互式的協同模式轉變,用戶既是地理信息的使用者,同時也是提供者。普通用戶可以參與、共同完成地理信息數據創建和交叉引用,極大地縮短了地理信息獲取和傳播的時間,提高了數據生產效率,豐富了數據類型[4]。
2012年,新浪微博基于位置服務(LBS)平臺開放,正式開啟了LBS2.0時代。其最具特色的是基于用戶和基于興趣點(POI)的接口,基于用戶的相關接口,使用戶能獲取單個人的時間線動態,包括微博信息、點評簽到等,有點類似Twitter的時間線功能,用戶可以查看自己或好友的時間縱線動態;基于POI的接口是基于某個具體位置的接口,用戶可以按興趣、標簽進行分類查找,獲取該地點所有微博用戶、微博信息、照片、商家等,同時支持查詢地點和獲取地點詳情。
本文基于新浪微博開發者平臺的API接口,獲取覆蓋整個南京市的簽到數據,并對具有空間信息的數據進行數據清洗,進行可視化,再在此基礎上進行空間分析,探索地理空間聚類和熱點地區信息。
如圖1所示,本文研究步驟主要分為申請準備、數據獲取、空間分析3個部分。其中,申請準備主要是調用微博API所需的準備。先進行微博開發者注冊,向新浪微博提交申請,待申請通過后會返回一個App Key和App Secret。數據獲取是基于申請返回的App Key和App Secret,調用新浪微博開發平臺提供的API接口獲取數據。由于API接口返回的是json結果,還需對結果進行抽取、格式轉換并進行數據清洗、剔除重復的記錄,形成最終結果,存入數據庫。空間分析是將獲取數據中包含的空間位置信息可視化,依據空間分析理論,對獲取的數據進行聚類分析及熱點分析。

圖1 研究方法流程圖
2.1 OAuth授權
新浪微博開發平臺采用的是OAuth認證和授權方式。用戶獲得授權后,才能通過微博開發平臺提供的API獲取平臺資源。
OAuth授權過程主要包括以下步驟:①用戶登錄客戶端向服務提供方請求一個臨時令牌;②服務提供方驗證客戶端身份后,授予一個臨時令牌;③客戶端獲得臨時令牌后,將用戶引導至服務提供方的授權頁面請求用戶授權,在這個過程中將臨時令牌和客戶端的回調鏈接發送給服務提供方;④用戶在服務提供方的網頁上輸入用戶名和密碼,然后授權該客戶端訪問所請求的資源;⑤授權成功后,服務提供方引導用戶返回客戶端的網頁;⑥客戶端根據臨時令牌從服務提供方處獲取訪問令牌;⑦服務提供方根據臨時令牌和用戶的授權情況授予客戶端訪問令牌;⑧客戶端使用獲取的訪問令牌訪問存放在服務提供方上的受保護資源。
2.2 微博API
目前,微博API提供了包括粉絲服務接口、微博接口、評論接口、用戶接口、關系接口、帳號接口、收藏接口、搜索接口、提醒接口、超鏈接口、公共服務接口、位置服務接口、地理信息接口、地圖引擎接口、支付接口和OAuth2授權接口等16個接口供開發者調用微博資源。就開發工具而言,微博開發者平臺提供了支持目前主流的編程語言SDK,如Java、JavaScript、C++、C#、Ruby、Python等。
2.3 數據獲取
本文選擇Python語言作為開發語言,在安裝必要的運行環境和微博提供的Python SDK后,調用位置服務接口中2/place/nearby/pois的API,該API的作用是以經緯度形式定點查詢以此點為中心,一定范圍內的POI(默認為2 000 m,最大可設置為10 000 m),返回POI點ID、POI坐標、地址和簽到總次數等信息。需要注意的是,若返回結果較多,默認只返回第一頁的結果,因此,針對這種情況要將結果分頁展示。
由于本文只針對簽到數據,因此只將POI的經緯度、簽到總數及地址信息保存下來,通過遍歷南京市的市域范圍,返回得到覆蓋整個南京市的POI信息及簽到信息,如表1。

表1 API返回的結果示例
2.4 數據可視化
經過對南京市整個市域范圍的遍歷,最終獲取簽到點28 965個。由于返回結果有經緯度的空間屬性,因此將結果進行可視化,如圖2所示。
空間熱點檢測是通過監測空間數據的總體模式和趨勢來進行熱點評估[5-8]。當高值和低值同時聚類時,它們傾向于彼此互相抵消,如果低值和高值同時聚類時量測空間聚類,則使用空間自相關工具;當存在完全均勻分布的值且要查找高值的異常空間峰值時,首選Getis-Ord General G 工具。
為了匯總空間集聚程度,檢查南京市市域范圍微博活動的程度,選取Getis'G指數(),Getis-Ord標準化處理,的公式為:

圖2 研究區數據可視化(審圖號:GS(2010)6011)

標準化處理后的公式為:

式中,xj為樣本;Wij為研究對象i、j之間的空間鄰接矩陣,反映了空間單元的鄰近關系;和分別是的數學期望值和方差。如果為正且顯著,表明位置i周圍的值相對較高,屬高值空間集聚,即熱點區;如果為負且顯著,表明位置i周圍的值相對較低,屬低值空間集聚,即冷點區。
首先,將整個南京市打上1 km×1 km的格網,然后利用疊加分析進行POI與格網的裁切,統計落入每個格網中的POI點數,通過每個格網的ID唯一屬性與POI屬性進行掛接匹配,再綜合每個格網內的點的簽到總和,計算Getis’G指數,最后按屬性分類出圖。圖3中紅色代表簽到次數較多的區域,即熱點區域,也是空間聚類較為明顯的區域。
從空間的角度來說,紅色區域主要集中在鼓樓、秦淮、建鄴等老城區,但浦口因為有南京大學金陵學院、南京審計學院、南京工業大學、東南大學成賢學院等多所高等院校,簽到次數相對較多,同樣江寧、棲霞與浦口類似,因此也成為了新熱點。而溧水、高淳則更集中于主城區,其余農村則集聚程度較差。

圖3 熱點分析(審圖號:GS(2010)6011)
從人口分布角度來說,依據《中華人民共和國全國分縣市人口統計資料2014》南京市的統計結果,鼓樓、江寧、秦淮3區的常住人口已超100萬人,而棲霞、浦口也已超70萬人,人口基數非常大,盡管建鄴只有40萬常住人口,但其轄區有萬達商貿圈、奧體等各類生活化設施,聚集程度非常高,因此簽到次數也較多,無疑成為南京的熱點地區,監測的結果與人口統計分布的結果一致性較高。
本文從社會空間的視角,借助微博簽到研究了城市的熱點地區。這對信息化影響下的城市熱點或集聚度分析是一個新的嘗試。基于對新浪微博的分析,從簽到總和來說,數量較高的地點主要出現在車站(南京南站、南京站)、各大高校、著名景點,正是由于車站等地的人流量巨大,因此簽到的次數一般也會較高。當然,微博的出現使得記錄人群的集聚效應更為便捷,從事數據挖掘或信息挖掘的研究者可從顯式信息中發現隱式信息,這也為應急預警、城市規劃、大型基礎設施建設等方面提供了參考依據。
當然,針對微博的研究也有其局限性,微博的使用并未完全實現大眾覆蓋,仍然存在一部分人沒有或從不使用微博簽到,因此,本文的研究只能代表一定程度上城市熱點的聚集程度。隨著微博的用戶量呈量級指數上升,結果依然是可靠的。
[1] 彭蘭.社會化媒體、移動終端、大數據∶影響新聞生產的新技術因素[J].新聞界,2012(16)∶3-8
[2] 甄峰,王波,陳映雪.基于網絡社會空間的中國城市網絡特征∶以新浪微博為例[J].地理學報,2012,67(8)∶1 031-1 043
[3] Goodchild M F. Citizens as Sensors∶the World of Volunteered Geography[J].GeoJournal,2007,69(4)∶211-221
[4] SUI D Z, Elwood S, Goodchild M F. Crowdsourcing Geographic Knowledge∶ Volunteered Geographic Information (VGI) in Theory and Practice[M]. New York∶ Springer, 2012
[5] Anselin L. From SpaceStat to CyberGIS, Twenty Years of Spatial Data Analysis Software[J]. International Regional Science Review, 2012,35(2)∶131-157
[6] 王勁峰,李連發,葛詠,等.地理信息空間分析的理論體系探討[J].地理學報, 2000,55(1)∶ 92-103
[7] 王勁峰.空間分析[M].北京∶ 科學出版社, 2006
[8] 晏王波,張曉祥,姚靜,等.基于GIS 的鹽城市區域發展時空特征研究[J].地理空間信息,2013,11(2)∶106-110
P208
B
1672-4623(2016)05-0028-03
10.3969/j.issn.1672-4623.2016.05.009
朱晨曦,工程師,主要從事GIS與空間分析研究。
2015-07-28。
項目來源:國家自然科學基金資助項目(41201394)。