999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

移動社交網絡中大學生用戶行為特征分析與實證研究

2021-09-16 19:15:16張浩飛袁夢宇胡振坤
科技創新導報 2021年14期

張浩飛 袁夢宇 胡振坤

摘? 要:為更客觀、全面地了解目前大學生用戶的行為特征情況,本文從特定大學生用戶的關注和被關注關系出發爬取新浪微博大學生用戶數據并存儲,利用xpath庫對數據進行解析得到大學生用戶的微博地址、微博名稱、用戶性別、用戶所在地、關注和被關注數量、粉絲數量、微博數量等信息,并對這些數據信息進行可視化分析從而得到大學生用戶的行為特征。新浪微博作為國內最大、最有價值的移動社交平臺,對其大學生用戶群體進行研究分析將有助于人們更全面地理解大學生日常網絡行為,有利于移動社交平臺及時掌握大學生用戶的需求,為用戶提供更優質的服務,穩定平臺客戶群。

關鍵詞:移動社交網絡? 大學生用戶? 特征分析? 數據可視化分析

中圖分類號:G252;TP311.56? ? ? ? ? ? ?文獻標識碼:A文章編號:1674-098X(2021)05(b)-0140-06

Analysis and Empirical Behavioral Characteristics of College Students in Mobile Social Networks

ZHANG Haofei? YUAN Mengyu? HU Zhenkun

(School of Information and Engineering, Henan Institute of Science and Technology, Xinxiang,

Henan Province, 453003? China)

Abstract: In order to understand the behavior characteristics of college students users more objectively and comprehensively, this paper climbs and stores Sina Weibo university student user data from the concern and concern relationship of specific college students users, uses xpath library to analyze the data to obtain the information of college students' micro-blogging address, MicroBlog name, user gender, user location, number of followers and followers, number of fans, number of MicroBlogs, etc., and makes a visual analysis of the data information to obtain the behavior characteristics of college students. Sina MicroBlog, as the largest and most valuable mobile social platform in China, will help people to understand the daily network behavior of college students more comprehensively, help mobile social platform to grasp the needs of college students in a timely manner, provide users with better service and stabilize the platform customer base.

Key Words: Mobile social network; College users; Feature analysis; Data visualization analysis

隨著5G技術的不斷發展和成熟,用戶使用移動社交網絡在線交流的方式發生了巨大的變化,從最初的在線留言、博客、說說等非即時通信形式到現在的實時音頻、實時短視頻、視頻直播、實時地理位置分享等即時通信形式,尤其是青年用戶群體更愿意使用簡單易操作且節省時間的方式發布自己的動態。在移動社交網絡用戶群體中大學生用戶是其中最為活躍的用戶群體之一,他們熱衷于向同齡人展示自己的出行、用餐、就醫、聚會、購物、學習等方面的動態信息,并從中獲取更多的關注和肯定,因此選取移動社交網絡中大學生用戶作為研究分析對象將有助于平臺精準定位用戶的需求,有助于高校深入了解用戶的網絡行為特征。

近年來,微博作為重要的社交平臺和信息傳播平臺迅速融入人們的生活。根據新浪微博在2021年3月18日發布的2020年第四季度及全年財報顯示,微博的用戶規模、活躍度和收入均實現高速增長。截止四季度末,微博凈營收5.134億美元,同比增長10%,依據去年同期匯率計算同比增長3%。2020年12月的月活躍用戶數為5.21億,較上年同期凈增約500萬。月活躍用戶數中約94%為移動端用戶。2020年12月平均日活躍用戶數為2.25億,較上年同期凈增約300萬[1]。因此,本文以新浪微博為例,從中選取大學生用戶樣本,分析微博中大學生用戶的行為特征。

1? 國內外研究現狀

隨著5G技術的出現和移動社交網絡的進一步飛速發展,國內外學者也越來越重視對用戶社交行為和信息傳播影響力的分析和研究。

早在2009年國外學者就開始對用戶的社交網絡行為進行研究,當時主要是圍繞社交網絡中用戶之間的互動關系和發帖行為進行研究的,而在2011年后學者則側重于用戶的個人興趣特征偏好、個人傳播的影響力、社交行為預測等方面的研究[2-4]。國內對移動社交網絡用戶行為研究則是從2010年開始,在2013年進入高峰期。張勝兵等人采用 Log-linear模型來擬合各個用戶特征間系數,并基于這些系數對微博用戶轉發行為形成的內在原因進行分析[5]。彭希羨等人以新浪微博為例,使用計量學方法,對用戶特征進行統計分析發現3種類型的用戶群體之和占用戶總體的85%以上,為微博客用戶特性的深入研究提供參考依據[6]。薛飛從通信的角度出發,利用移動通信的信令系統,實時識別捕捉移動用戶呼叫記錄、上網信息和駐留位置等多種行為特征,通過大數據和社交網絡建模等技術,預測用戶發展并對用戶流失進行提前預警[7]。丁陽通過全面分析知乎用戶的各種行為,并設計實現能體現用戶行為的影響力評價算法,可以有效識別出知乎數據中行為數據表現較為突出的高影響力用戶[8]。于亞新等人基于此,提出用戶-時間-活動模型和和用戶-時間-區域模型可以深刻理解用戶行為規律;同時將服務地點屬性內耦合性納入考慮提出了基于耦合和距離的矩陣分解算法,用于提高用戶個性化推薦質量[9]。

在移動社交網絡中大學生是一群比較特殊的用戶,他們在移動社交網絡中的行為特征也具有一定的特殊性,但關于這方面的研究卻很少。在早期,張雪分析了大學生群體使用社交網絡的行為特征,并且利用機器學習的方法構建出大學生用戶分類器,為高校學生教育管理提供支持[10]。張輝等人利用微博中高校標簽篩選出大學生用戶,分析了在校大學生于社交網絡平臺上的時間、空間方面的行為模式[11]。隨著5G技術的出現和迅速發展,更多大學生用戶借助音頻、短視頻、視頻直播、實時位置分享等即時通信方式分享個人動態。大學生用戶在移動社交網絡中所體現出的特征、表現出的興趣偏好及個人影響力等方面都發生了巨大的變化,因此本文將繼續研究大學生用戶在大數據背景下的移動社交特征。

2? 微博用戶數據采集與預處理

2.1 爬取流程

網絡爬蟲能夠持續爬取大量數據主要是借助網頁之間的鏈接關系,從最初若干個網頁開始,獲取其中的其他網頁鏈接,并將其組織成一個鏈隊列,然后依次從隊列中讀取網頁鏈接,并不斷從網頁中識別新的網頁鏈接入隊,直至爬蟲滿足系統設置的結束條件時結束。本文使用Python開發的爬蟲爬取數據的流程可分為6個步驟,如下所示。

(1)設置初始網頁鏈接,從設置網頁鏈接開始爬取。

(2)根據爬取算法,首先爬取對應鏈接中所有的網頁鏈接,并將鏈接地址存入鏈接列表。

(3)通過去重比較操作,去除列表中重復鏈接;同時在爬取網頁鏈接若發現新的鏈接,則將其存入鏈接列表。

(4)依次將去重后的鏈接列表的網頁鏈接插入到鏈接隊列和數據庫中。

(5)從鏈接隊列取出一個鏈接,轉至步驟(2)。

(6)當爬取數量達到設定的閾值時,爬取過程結束。

2.2 數據爬取

本文從河南科技學院信息工程學院計算機科學與技術專業4個年級的本科生中選取18位在新浪微博上的注冊用戶,且長時間狀態是活躍狀態的,如經常進行更新微博、“@”或“被@”、參與話題討論等一些社交行為,將這18位作為大學生種子用戶數據集;然后根據大學生用戶在微博上的好友關注關系和被關注關系出發,爬取從2021年3月2日—2021年4月13日時間段內的37115個用戶及其信息;再根據目標頁面url的特點,本文采用“固定地址”+“不同數字碼”的方法來獲得所有頁面的url,并用request庫的get方法獲得原網頁代碼;然后利用xpath庫解析源代碼,并用正則等方法篩選出目標數據信息;最后獲得的原始用戶數據集,包括:用戶id、用戶名、用戶性別、用戶位置、用戶所在地區、關注數、粉絲數、微博發文數、第一篇微博發文時間、用戶簡介、教育信息、用戶標簽等屬性信息。

2.3 數據預處理與存儲

對原始用戶數據進行預處理,清洗掉其中的噪音數據,主要操作有去除重復的記錄、缺失值填充、修復異常值、數據轉換和標準化處理等。首先去除用戶id字段重復的記錄;再去除教育信息字段值為空的記錄;然后根據用戶發第一篇微博的時間計算用戶的博齡,并從中去除博齡值大于3年的用戶;接著從省份的角度轉換微博用戶地址,例如從原數據“北京-朝陽區”“上海-黃浦區”中拆分得到“北京”和“上海”等數據,最后對用戶記錄中的性別、省份等字段進行規約處理。

將數據進行預處理之后,利用xlrd庫和xlutils中的方法將所有數據按行存儲到excel表格中,如圖1所示。

3? 微博大學生用戶的識別

3.1 大學生用戶識別算法

本文采用文獻[12]中的聚類算法識別微博大學生用戶。首先根據相似度公式計算種子用戶與原始數據集中其他微博用戶的初始相似度,若相似度大于等于設置的閾值,則初步認為這些用戶是大學生用戶,然后再根據識別算法對大學生用戶進行聚類,將原始數據集分為n個子集,之后通過不斷的聚類分配,直到n個子集的中心不再變化,算法實現的主要步驟如下所示。

Input:微博信息系統WS=,其中U為大學生用戶集,分為種子用戶集U1和其他用戶集U2,A為用戶屬性集,R為用戶關系集,f為映射函數,且相似度閾值為thp。

Output:n個大學生用戶簇。

Step1:根據相似度公式計算U1所有大學生用戶到U2中任一用戶的相似度,若相似度≥thp,則將該用戶加入集合U中。

Step2:計算大學生用戶集合U中任意兩個用戶之間的相似度。

Step3:從U中選擇相似度最小的兩個用戶,并將其作為初始聚類中心,記為c1=u1和c2=u2,然后將c1和c2并入初始聚類中心集合C中。此后繼續尋找與C中用戶相似度小于thp的對象ui,將其加入至C中,直到找不到相似度小于thp的用戶為止,由此得到初始聚類中心集合C={c1,c2,…,c|c|}以及簇數n=|c|。

Step4:重新計算用戶集U中各個用戶到各簇中心的相似度,將用戶分配到相似度距離最近的簇中。

Step5:計算由步驟4所生成的所有簇中所有用戶與其所在簇的中心的相似度之和J1。

Step6:計算子集中各維度的平均值作為新的簇中心。

Step7:重復步驟4。

Step8:計算新生成簇的相似度之和J2,若J1=J2,則該算法結束,輸出n個大學生用戶子集;否則轉至步驟5。

3.2 大學生用戶聚類分析

首先計算選取的18位微博大學生用戶記錄到原始數據集中其他用戶之間的初始相似度,并篩選出thp≥0.6用戶記錄,共計20601條,記為Dcu;接著以用戶的5個屬性:性別、關注數、粉絲數、是否認證、微博創建時間作為分類屬性,根據上述算法對各個數據集進行初始聚類,生成不同的初始聚類集合分別為Dgr、Dnc、Dnf、Dct、Dye;再使用上述算法對這各個聚類集合進行多次聚類,直至每個聚類集合穩定位置,從中將閾值>0.6的用戶記錄去除,最終得到16550個用戶記錄。不同聚類集合的基本情況如表1所示。

4? 大學生用戶特征分析

4.1 大學生用戶性別對比情況分析

根據清洗后的數據集,采用餅圖對微博的用戶的性別占比情況進行分析,如圖2所示。由此可知新浪微博大學生用戶中男生占比約為45%,女生占比約為55%,說明在大學生用戶群體中處于活躍狀態的女生用戶數量高于男生用戶數量。

4.2 大學生用戶地域分布情況

本文采用將我國分為34個省市地區的劃分方法,包括23個省、4個直轄市、5個少數民族自治區、2個特別行政區,并以折線圖的方式比對分析我國各個地區大學生微博用戶數量,如圖3所示。

從圖3可知在新浪微博中北京地區的大學生用戶數量最多,有3526名用戶,其次是廣東,有2290名用戶;再次是上海,有1605名用戶。用戶數量較少的是西藏、澳門和內蒙古。由此可見大學生用戶主要集中在經濟發達的一二線城市,合計比例超過5成,而經濟發展緩慢的地區用戶數量偏少,這說明了微博大學生用戶數量和當地的經濟發展情況有密切的關系。

4.3 大學生用戶擁有不同粉絲段人數的對比分析

由于微博用戶數據量龐大,用戶與用戶之間的粉絲數量差異較大,本文采用直方圖分析微博用戶粉絲數量情況,根據數據集設定直方圖組距為210萬,如圖4所示。

由圖4可知擁有0~210萬粉絲的大學生微博用戶最多,其次是210~420萬的微博用戶,整個直方圖呈下降的趨勢,由此可以推測,粉絲數越大,大學生微博用戶數量越少,這與實際情況相符合,擁有龐大粉絲數量的只有少數微博用戶。

4.4 對微博用戶教育程度的分析

本文只分析教育程度是大學的用戶,剔除掉沒有填寫教育信息的用戶或者填寫的跟教育無關的信息,從中選出教育程度最為明顯的4300條用戶記錄進行分析,本文采用樹形圖進行結果展示,如圖5所示,所占面積越大,顏色越深,表示受過此教育的微博用戶數量越多。

由圖5可知教育程度是北京大學的人數最多,有90人;其次是清華大學,有63人;再次是中國傳媒大學,有56人。說明微博用戶的受教育程度較高,這為營造良好的網絡環境提供了一定的基礎。

5? 結語

本文以新浪微博為例,以河南科技學院大學生種子用戶的關注與被關注關系出發,爬取微博大學生用戶數據信息作為樣本,經過預處理后從性別、地區、粉絲數和受教育程度等方面對微博用戶數據進行的特征分析。數據結果表明,從用戶的性別角度來看,女生用戶數量略高于男生用戶數量,說明微博男女生用戶數量較為平衡;從地區的角度來看,經濟發達地區的省份大學生微博用戶更多,而那些經濟發展緩慢的地區使用微博的大學生數量較少,說明微博的使用與地區的經濟發展情況和高校地域分布情況都有一定的關系;從粉絲數量分布的角度來看,粉絲數量越大,微博用戶數量越少,與實際情況相符合,微博大部分用戶的粉絲數量較少,擁有龐大粉絲數量的只有少數微博用戶;從用戶受教育程度角度來看,北京、清華大學、中國傳媒大學等名校占居高位,說明微博用戶的受教育程度較高,這為營造良好的網絡環境提供了一定的基礎。

參考文獻

[1] 新浪微博.2020年第四季度及全年財報[EB/OL].http://finance.sina.com.cn/stock/usstock/c/2021-03-18/doc-ikkntiam4887520.shtml?source=cj&dv=1&source=hfquote&wm=3049_0005494002016.

[2] Mican Daniel,SitarT?utDanAndrei,Mihu?IoanaSorina. User Behavior on Online Social Networks: Relationships among Social Activities and Satisfaction[J]. Symmetry, 2020, 12(10) : 1656-1656.

[3] Hongxia Wang. Research on User Behavior with Collaborative Recommendation Based on Social Network[J]. Journal of Physics: Conference Series, 2020,1575(1):012133.

[4] XuYongshun,Liu Yuan,Zhang Xiaoshuang. Analysis of social network user behaviour and its influence[J]. Journal of Intelligent & Fuzzy Systems,2020,38(2):1159-1171.

[5] 張勝兵,蔡皖東.用戶關系特征對微博轉發行為影響分析研究[J].計算機工程與應用,2014,50(11):11-16,20.

[6] 彭希羨,朱慶華,劉璇.微博客用戶特征分析及分類研究——以“新浪微博”為例[J].情報科學,2015,33(1):69-75.

[7] 薛飛.基于用戶行為特征的移動社交網絡分析與應用[J].移動通信,2017,41(23):79-83.

[8] 丁陽.基于用戶行為的社交網絡用戶影響力評價[D].大連:大連海事大學,2019.

[9] 于亞新,劉夢,張宏宇.Twitter社交網絡用戶行為理解及個性化服務推薦算法研究[J].計算機研究與發展,2020,57(7):1369-1380.

[10] 張雪.微博上大學生用戶特征分析與識別研究[D].哈爾濱:哈爾濱工業大學,2014.

[11] 張輝,劉成.基于微博的在校大學生用戶行為分析[J].信息安全與通信保密,2016(9):90-96,101.

[12] 王全蕊,張浩飛,袁夢宇.大數據背景下移動社交網絡中大學生用戶信息泄露的研究分析[J].現代計算機,2020(26):21-26.

主站蜘蛛池模板: 狠狠色噜噜狠狠狠狠色综合久| 中文无码毛片又爽又刺激| 成人综合网址| 日本国产一区在线观看| 国产精品久久久久久搜索| 亚洲 欧美 偷自乱 图片 | 亚洲三级视频在线观看| 思思热在线视频精品| 激情亚洲天堂| 青青热久免费精品视频6| 无码视频国产精品一区二区| 白浆免费视频国产精品视频| 亚洲一级毛片在线播放| 久久 午夜福利 张柏芝| 国产真实乱人视频| 中文字幕亚洲综久久2021| 国产丝袜精品| 亚洲首页在线观看| 91美女视频在线观看| 免费黄色国产视频| 亚洲AⅤ波多系列中文字幕| 亚洲国产日韩在线成人蜜芽| 免费99精品国产自在现线| 任我操在线视频| 91麻豆精品国产高清在线| 成人第一页| 无码国产伊人| 欧美三级自拍| 欧美一级大片在线观看| 日韩大乳视频中文字幕| 在线免费亚洲无码视频| 色偷偷一区二区三区| 91精品视频在线播放| 久久精品国产电影| 欧美另类精品一区二区三区| 国产亚洲精久久久久久久91| 久久香蕉国产线看精品| 日韩福利视频导航| 亚洲无线一二三四区男男| 亚洲色成人www在线观看| 又粗又硬又大又爽免费视频播放| 国内精自视频品线一二区| 国产又爽又黄无遮挡免费观看| 亚洲日韩国产精品无码专区| 成人噜噜噜视频在线观看| 国产草草影院18成年视频| 人妻丰满熟妇av五码区| 在线精品自拍| 亚洲欧美人成人让影院| 免费观看成人久久网免费观看| 国产精品手机视频一区二区| AV老司机AV天堂| 久久天天躁狠狠躁夜夜2020一| 精品第一国产综合精品Aⅴ| 人人91人人澡人人妻人人爽| 免费看av在线网站网址| 丁香亚洲综合五月天婷婷| 欧美性久久久久| 欧美日一级片| 亚洲成人高清无码| 又粗又硬又大又爽免费视频播放| 国产人妖视频一区在线观看| 免费日韩在线视频| 精品久久高清| 亚洲综合九九| 啦啦啦网站在线观看a毛片| 亚洲成人一区二区| 呦女亚洲一区精品| 欧美亚洲中文精品三区| 久久美女精品国产精品亚洲| 中日韩一区二区三区中文免费视频 | 欧美精品在线看| а∨天堂一区中文字幕| 国产无套粉嫩白浆| 久久久四虎成人永久免费网站| 久久国产香蕉| 中文字幕在线视频免费| 日韩精品一区二区三区视频免费看| 91麻豆国产视频| 日本人妻一区二区三区不卡影院| 人妻精品全国免费视频| 久996视频精品免费观看|