999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于新浪微博數據的時空分布特征研究

2017-05-16 19:24:37盧宇航
科教導刊·電子版 2017年7期
關鍵詞:可視化用戶信息

盧宇航

摘 要 社交網絡的位置分享服務增加了社交數據的信息維度,使得社交網絡中存儲了豐富的位置信息資源。本文以新浪微博作為主要數據源,利用爬蟲技術采集數據,通過對數據的處理分析以及可視化,得到西安市范圍內微博數據的分布規律。

關鍵詞 社交網絡 地理信息 數據可視化 時空分布

1引言

在移動互聯網技術高速發展、移動通訊網絡環境日益完善以及移動終端設備不斷普及的背景下,移動互聯網應用逐漸滲透到人們生活的方面。根據中國互聯網絡信息中心發布的第39次《中國互聯網發展狀況統計報告》,截至2016年12月,我國總體網民規模達7.31億,其中手機網民規模達6.95億,占比95.1%,且處于穩步增長的態勢。社交網絡應用與移動互聯網相結合,各大社交應用為廣大用戶提供了一個開放性的服務平臺,為用戶的信息的交流與分享帶來了更為便捷和有效的方式。在社交網絡中,龐大的用戶基數產生了海量的數據,這些來自用戶的數據已經被視為軍事或是商業情報的重要來源。尤其是基于位置分享的社交網絡應用,將用戶的分享信息與地理位置的實時記錄關聯起來,從而實現虛擬的網絡空間與現實世界的相互映射,為研究社交數據與現實世界之間的關系提供了機會。

本文以新浪微博數據作為對象,利用爬蟲技術進行數據采集,在對原始數據進行預處理后,得到西安市范圍內的微博數據,在此基礎上對微博數據進行統計分析,構建熱力圖模型,并實現數據可視化,探索西安市范圍內微博數據的分布規律。

2數據的采集與預處理

本文使用基于Python的scrapy框架構建數據爬蟲系統,采用MongoDB作為存儲數據對微博數據進行采集。在采集過程中,通過制定過濾規則對原始數據進行預處理,從而獲得研究所需的目標數據。具體操作方式:1. 檢測采集的數據中是否包含位置分享信息;2. 通過MongoDB的空間索引特性,利用西安市行政區劃的GeoJSON數據檢測所包含的位置是否屬于西安市范圍。將同時滿足以上兩點的數據視為可用數據存儲至數據庫中。

3數據的處理與可視化

3.1統計數據的時間分布

將每天的時間從0點開始按照一個小時的間隔分為24個時段,解析每條微博的發布時間,分別統計各個時段的微博發布數量。由于各個時段的微博在發布數量上存在著巨大的差異,因此,在此基礎上,將每個時段的統計值均除以總的微博發布數量,得到每個時段的微博發布頻率,便于進行數據的可視化。

3.2統計數據的空間分布

將所有微博數據的坐標信息解析GeoJSON的標準格式,利用MongoDB在數據存儲層面建立空間索引。然后使用MongoDB的空間查詢命令統計西安市范圍內微博數據在空間上的分布密度

3.3數據可視化

本選取了ECharts和Leaflet作為數據可視化工具,構建可視化的靜態頁面。

4微博數據的分布規律

4.1在時間上的總體分布

如圖1,顯示了西安市范圍內微博發布數量頻率的各個時段分布情況,從圖中我們能夠直觀地看出微博發布頻率在時間上的變化趨勢,從0點開始用戶發布微博的頻率逐漸下降,進入“休息時間”,在上午的5點至6點達到最低值;上午6點以后,直至夜里12點,用戶發布微博的頻率總體呈現上升趨勢,其中在6:00 – 12:00與18:00 – 次日0:00這兩個時間段內用戶的發布頻率顯著上升,在12:00 – 18:00的時間段內微博發布頻率則相對平穩。

綜上所述,用戶發布微博的頻率在一天之內的變化趨勢是顯著的。通過對用戶發布微博頻率的觀察,結合其所在的地理位置信息,可以了解到用戶在微博平臺上的使用習慣,根據用戶的活躍時間,適時而有針對性地進行營銷推廣或是輿情監測,實現相關資源的合理分配和有效利用具有一定的參考價值。

4.2在空間上的分時段分布

由于單個小時時間內的數據量相對要小且每個小時之間的數據變化不明顯,不適合綜合分析各個時段的空間分布規律,因此,從0點每隔4個小時劃分一個時段,將24個小時重新劃分為6個時段,得到西安市范圍內微博數據分時段空間分布圖,如圖 2所示。

從微博數據的空間位置分布來看,在0:00-4:00時段,微博數據主要沿地鐵二號線周邊分布,呈線狀和散點狀分布;在4:00-8:00時段,微博數據的分布的熱力度值進入一天中的最低值,呈現零星散點分布;在8:00-12:00時段,微博數據的熱力度開始進入“活躍狀態”,在地鐵二號線南段沿線、綜合商業娛樂中心、高校等區域聚集;在12:00-16:00、16:00-20:00的兩個時段,相較于上個時段分布范圍更加趨向于向西安市“中軸線”區域集中;在20:00-24:00時段,“中軸線”區域的熱度得到提供且向外擴散,同時,其他區域的散點分布也得到了提高,微博數據的熱力度進入一天中的峰值時段。

通過對分時段空間分布情況的總結,在一定程度上反映了城市人群活動的時空規律。從微博數據的熱度分布上,我們能夠分析得到西安市微博人群活動的熱點區域和活動時間;從另一方面,也可以了解到城市不同區域現實發展水平。在城市規劃、城市管理等方面具有一定的指導意義。

5總結

本文以新浪微博數據為研究數據,以西安市為研究區域,通過對微博數據的采集、存儲、處理和可視化展示,實現對西安市微博數據分布規律的探索和分析,其中隱含的人群活動信息對營銷推廣、輿情監測以及城市規劃等方面具有輔助決策支持的意義。

參考文獻

[1] 王紅梅. 移動互聯網現狀與趨勢淺析[C]// 中國通信學會信息通信網絡技術委員會2011年年會. 2011:74-79.

[2] 中國互聯網絡信息中心.中國互聯網絡發展狀況統計報告[EB/OL].(2017/01) http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201701/P020170123364672657408.pdf

[3] Goodchild, Michael F. Citizens as Sensors: The World of Volunteered Geography[J]. GeoJournal, 2007, 69(4):211-221.

猜你喜歡
可視化用戶信息
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 亚洲A∨无码精品午夜在线观看| 黄色国产在线| 欧美国产另类| 女人18一级毛片免费观看| 欧亚日韩Av| 亚洲综合国产一区二区三区| 1级黄色毛片| 在线a网站| 婷五月综合| 久久亚洲国产最新网站| 五月婷婷精品| 欧美中出一区二区| 露脸国产精品自产在线播| 福利国产微拍广场一区视频在线| 97人人做人人爽香蕉精品| 国产精品yjizz视频网一二区| 国产日本欧美在线观看| 色综合久久久久8天国| 国产在线97| 婷婷五月在线| 人人澡人人爽欧美一区| 国产丝袜无码精品| 成人欧美日韩| 国产精品一线天| 色精品视频| 天天操精品| 久久亚洲国产视频| 欧美自拍另类欧美综合图区| 亚洲大尺度在线| 精品视频免费在线| 国内精品久久久久久久久久影视| 国产无码精品在线播放 | 亚洲九九视频| 亚洲第一极品精品无码| 一级毛片网| 国产浮力第一页永久地址| 成人91在线| 在线亚洲天堂| 亚洲第一黄色网| 亚洲无码高清视频在线观看| 亚洲不卡影院| 国产成人免费手机在线观看视频| 福利国产微拍广场一区视频在线 | 日本人真淫视频一区二区三区| 成人亚洲视频| 国产丰满成熟女性性满足视频| 一区二区三区四区精品视频| 国产精品免费露脸视频| 亚洲国产精品无码久久一线| 色婷婷成人| 国精品91人妻无码一区二区三区| 色综合久久88色综合天天提莫 | 热伊人99re久久精品最新地| 九九这里只有精品视频| 亚洲熟女中文字幕男人总站| 香蕉色综合| 丁香五月亚洲综合在线| 伊人久综合| 动漫精品啪啪一区二区三区| 都市激情亚洲综合久久| 国产农村妇女精品一二区| 亚洲无码不卡网| 五月天久久婷婷| 欧美成人一级| 亚洲综合狠狠| 亚洲—日韩aV在线| 久久男人资源站| 伊人久久婷婷| 久久精品人人做人人综合试看| 麻豆AV网站免费进入| 老司机精品一区在线视频| 一本一道波多野结衣av黑人在线| 直接黄91麻豆网站| 国产精品九九视频| 无码'专区第一页| 成人精品区| a毛片在线播放| 国产成人精品免费视频大全五级| 国产区免费精品视频| 免费一级成人毛片| 成人免费黄色小视频| 黄色网页在线观看|