999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網絡爬蟲和社會網絡分析的嗶哩嗶哩用戶關注行為研究

2022-04-29 20:16:50高悅
計算機應用文摘 2022年15期

摘要:文章利用網絡爬蟲,通過“滾雪球”的方法在嗶哩嗶哩官網爬取了42位百萬粉絲以上的up主的關注列表,經提取和整理,將其繪制成42x42的up主關注矩陣,并利用社會網絡分析法和Ucinet軟件對其進行了密度和意見領袖分析。

關鍵詞:網絡爬蟲;社會網絡分析;意見領袖;嗶哩嗶哩

中圖法分類號:G25文獻標識碼:A

Research on user attention behavior of bilibili based onWeb crawler and social network analysis

GAO Yue

(College of Information Management, Nanjing Agricultural University,Nanjing 210095,China)

Abstract:This paper uses the Web crawler to climb the attention list of 42 up masters with more than one million fans on bilibili official website through the “snowball” method. After extraction and sorting, it is drawn into a 42x42 up master attention matrix, and its density and opinion leader are analyzed by using social network analysis method and Ucinet software.

Key words: Web crawler, social network analysis, opinion leaders, bilibili

嗶哩嗶哩( bilibili)簡稱 B 站,創建于2009年6月,是當下最受歡迎的彈幕網站,其主要面向中國年輕一代,并將其核心用戶群體定義為 Generation Z ( Z 世代),即1995~2009年出生的一代,也指喜歡玩樂、喜歡學習和喜歡分享生活的年輕一代。起初,嗶哩嗶哩主打動漫二次元分化和視頻分享,近年來,逐漸發展成集動漫、視頻、游戲、直播等于一體的綜合性網站。2018年末,其被 QuestMobile 研究院評為了“Z 世代偏愛 APP”和“Z 世代偏好泛娛樂 APP ”的首位,可見嗶哩嗶哩已經成為中國青年一代喜愛的一個高度集中的文化社群和視頻平臺。嗶哩嗶哩用戶可分為 up 主用戶和普通用戶,其主要是基于關注、點贊、投幣、收藏、評論和分享等關系構建社會網絡,用戶通過對 up 主投遞的視頻進行觀看、點贊、投幣、收藏和分享等行為進行傳播,也可以通過評論與 up 主或其他用戶進行交流。因此,關注數多的 up 主也會像微博“黃 V “紅 V 的用戶一樣具有名人效應。同時,根據嗶哩嗶哩于2020年8月27日發布的“2020年第二季度財報(2020Q2財報)顯示,其月活躍用戶數已上億,其中移動端占了絕對的比重,日活躍用戶數達到五千萬以上,平均用戶年齡為21.5歲。由此可知,嗶哩嗶哩用戶所產生的信息量是十分巨大的,且對年輕人具有很大的影響力,如何高效、快速的獲取有價值的內容以及發現具有名人效應的用戶是值得探究的。因此,本文從用戶的關注行為出發,利用網絡爬蟲,通過“滾雪球”的方式爬取了 up 主的關注列表,并選取了42位100萬粉絲數以上的 up 主,利用社會網絡分析法對他們的互關注情況進行了密度和意見領袖分析。

1相關概念

1.1網絡爬蟲

網絡爬蟲,也就是所謂的“網絡蜘蛛”或“Web 機器人”,是一種能夠根據特定的規律,自動獲取網絡上的信息的一種程序或腳本,是網絡信息收集的基礎[1],是目前搜索引擎和大數據分析的技術基礎,其爬取內容主要包括網絡上的文本、圖片、音頻等數據。根據網絡爬蟲的體系結構及實現技術,可以把爬蟲劃分為一般型、聚焦型、增量型和 Deep Web 型[2]。網絡爬蟲的基本結構包括:(1)爬蟲調度。它啟動、執行、停止和監控爬蟲的運行;(2)爬蟲核心模塊。主要包括 URL 管理器、網頁下載器、網頁分析器3個部分, URL 管理器用于管理正在等待爬行的 URL,網頁下載者負責下載與 URL 相關的網頁,網頁分析器則負責分析網頁中有價值的數據,或者將網頁中的 URL 解析并添加到 URL 管理器中;(3)有價值的資料存儲。本系統不但對網絡爬行器進行了詳細描述,同時對其工作流程進行了詳細闡述。

1.2社會網絡分析

社會網絡是指社會行動者及他們之間關系的集合,是由多個節點(社會行動者)和各個節點(關系)之間的連線所組成的集合[3]。在本文中,up 主就是節點,up 主之間是否存在關注與被關注就是節點之間的連線,由 up 主和他們之間的關注情況構成本次研究的社會網絡。

社會網絡分析是一種用圖論工具來分析社會關系結構和性質的一系列標準與方法,群體成員之間的關系網絡被概念化為代表成員的節點之間的連接網絡[4],經常表現為社群圖的形式。其分析內容有很多,本文主要對其包含的以下內容進行分析。

密度是衡量個體與社群中其他個體之間聯系程度的指標,通過測量社群密度可以確定一個社群是否由相互作用形成。在一個社群分析中,密度可以用來判斷一個社群關系是否緊密。

中心性是衡量參與者在自己的社交網絡中的核心地位和影響力的一個評價指標,反映的是他們在社交網絡中的位置和影響傳播能力的不同。在一個社群分析中,中心度可以判斷出一個社群中處于核心地位的行動者。

結構洞是一種通過三個行為體的關系而獲得“信息利益”與“控制利益”的特定結構,因而在結構洞位置上的行為體比在社交網絡中其他地方的行為體更有競爭力。在一個社群的社會網絡分析中,結構洞可以和中心度一起分析社群中的意見領袖。

2數據獲取與處理

2.1數據獲取

本文的數據來源于嗶哩嗶哩官網,利用網絡爬蟲,通過“滾雪球”的抽樣方法爬取了百萬粉絲以上的 up 主關注列表,即隨機爬取一位關注人數在100萬以上的 up 主所關注的用戶及其關注用戶的粉絲數和關注列表,觀察其關注用戶,經篩選保存粉絲數在100萬以上 up 主的獲取數據,得到第一組數據;然后從該組數據中再隨機抽取一位關注人數在100萬以上的 up 主重復上述過程。為了便于分析,本文最初擬定爬取夠40位百萬粉絲以上的 up 主關注情況,經過上述方法,最終爬取了42位百萬粉絲以上的 up 主關注列表。其中,爬取數據以“被關注者名稱”“關注者名稱”“關注者粉絲數”的形式保存至 Excle 文檔中,共爬取8631條數據,經去重與篩選后,剩余2581條數據。

2.2數據處理

通過對最終保存的2581條數據進行提取和整理后,將42位 up 主的互關注情況統計為42×42的 Excle 矩陣形式。其中,矩陣的行代表被關注者,列代表關注者,矩陣中的元素代表關注情況,即如果某一位 up 主被另一位 up 主所關注,則對應行列的矩陣元素值取1,否則取0。

3結果分析與討論

本節主要通過使用社會網絡分析軟件— Ucinet,對所獲取的42×42的二值矩陣進行密度、意見領袖及小團體分析。在進行上述分析之前,首先將42×42的二值矩陣導入進社會網絡分析軟件 Ucinet 中,然后利用 Ucinet 的可視化繪圖軟件工具 Netdraw 繪制出該矩陣社群內交流網絡的社群圖,其中箭頭指向的方向是由關注者指向被關注者,雙箭頭表示兩人是互相關注的狀態。社群圖顯示,該社會網絡中沒有孤立點,所有人都存在關注與被關注關系,即社會網絡成員之間關系較為緊密,而且“老番茄”“中國 boy 超級大猩猩”“小潮院長”等人更是處于該圖的核心位置,且擁有很多的關注者,有可能為該社會網絡的意見領袖,但仍需進行后續研究分析。

3.1密度分析

首先,使用 Ucinet 軟件,選擇“變換→轉換→ Maximum”路徑對42×42的二值矩陣進行對稱化處理,以便后續研究分析。然后選擇“網絡→凝聚力→密度→密度”路徑對由42位 up 主組成社會網絡進行密度分析,得出該社會網絡密度為0.3171。在社會網絡分析之中,密度的取值范圍為[0,1],值越接近1則代表社會網絡中的行動者彼此間關系越緊密,但在實際網絡中能得出的最大網絡密度為0.5[5]。相較之下,本文所研究的社會網絡成員之間的關系緊密。

3.2意見領袖分析

在網絡環境中,意見領袖是社會網絡中傳播信息的橋梁,具有一定的影響力。在社交網絡中,通常處于中間位置的行為主體為觀點領導者,而處于結構空穴狀態的行為主體,因其在社會網絡中能在信息傳遞過程中獲取信息利益和控制利益,具有成為意見領袖的優勢。所以,在社交網絡中,對網絡中的節點進行中心分析和結構洞分析即可。

3.2.1中心性分析

關于社會網絡中節點中心性的度量,共有三個度量指標:點度中心度、中介中心度和接近中心度,在本文中,僅采取點度中心度和中介中心度進行分析。

點度中心度用來衡量社交網絡中參與者和其他參與者之間的聯系數目,以描述各個參與者在社交網絡中的位置中心指標,進而衡量出每個行動者在社會網絡中的地位。點度中心度的值越大,行動者就越處于社會網絡的核心地位。在 Ucinet 軟件中,選擇“網絡→中心度→度”路徑對42×42的對稱矩陣進行點度中心度分析可知,本文所研究的社會網絡中點度中心度值排在前五位的成員分別為“中國 boy 超級大猩猩”“老番茄”“某幻君”“小潮院長”和“逍遙散人”。其中,“中國 boy 超級大猩猩”的點度中心度值為28.000,是社會網絡成員中最高的,排在第一位,“老番茄”以25.000位居第二位,其余三人均以22.000并列第三。所以,通過點度中心度分析可知,“中國 boy 超級大猩猩”處于該社會網絡的核心位置,“老番茄”“某幻君”“小潮院長”和“逍遙散人”處于較中心的位置。

中介中心度是通過計算社會網絡中一個行動者處在其他兩個行動者直接連接之間的數量,用來測量社交網絡中參與者是否處于中心位置的測量方法。正如點度中心度,中介中心度值愈大,參與者在社交網路中的地位愈高。在 Ucinet 軟件中,選擇“網絡→中心度→ Freeman 中間度→節點中間度”路徑對42×42的對稱矩陣進行中介中心度分析可知,本文所研究的社會網絡的中介中心度值排在前五位的成員分別為“某幻君”“中國 boy 超級大猩猩”“逍遙散人”“老番茄”和“陳?!薄F渲?,“某幻君”以75.170的中介中心度值排在第一位,“中國 boy 超級大猩猩”和“逍遙散人”分別以63.727和57.561中介中心度值位居第二和第三。所以,在中介中心度分析中,“某幻君”處于該社會網絡的核心位置,“中國 boy 超級大猩猩”“逍遙散人”“老番茄”和“陳?!眲t處于較中心的位置。

綜合上述中心性分析結果,“中國 boy 超級大猩猩”“某幻君”和“逍遙散人”均處于社會網絡的中心位置,但“中國 boy 超級大猩猩”和“某幻君”更靠近核心位置。

3.2.2結構洞分析

對社交網絡中的節點結構空洞的度量,主要是通過對網絡中參與者的網絡限制和有效規模的測算。其中,網絡限制系統的大小決定了結構空洞的存在與否,而網絡限制系統的越小,則其存在的可能性也就越大。而網絡的有效規模愈大,則更有可能存在結構空洞。處在結構洞位置的行動者能影響社會網絡中的信息共享,并具有成為意見領袖的優勢。

根據結構洞分析結果,按限制度從小到大排序,排名前三的成員為“中國 boy 超級大猩猩”“老番茄”“某幻君”和“逍遙散人”,其限制度值分別為0.134、0.150、0.162和0.162。而按有效規模從大到小排在前三的成員仍為“中國 boy 超級大猩猩”“老番茄”“某幻君”和“逍遙散人”,其有效規模值分別為16.929、14.840、14.818和14.818。其中,“中國 boy 超級大猩猩”的限制度值為0.134,有效規模值為16.929,分別是限制度最小值和有效規模最大值,所以“中國 boy 超級大猩猩”占據該社會網絡中大量的結構洞位置。而“老番茄”“某幻君”和“逍遙散人”也占據了較多的結構洞位置。

經過上述中心性分析和結構洞分析可知,“中國 boy 超級大猩猩”不僅在社會網絡中更接近核心位置,還占據著大量的結構位置。因此,“中國 boy 超級大猩猩”為本文所研究的社會網絡中的一級意見領袖,在該社會網絡中影響力很大,具有更多的威望和權利。而“某幻君”和“逍遙散人”也因其在社會網絡中處于較為中心的位置和占據較多的結構洞位置,成為該社會網絡中的二級領袖,也具有較大的影響力。

4結語

本文利用網絡爬蟲,爬取了42位嗶哩嗶哩百萬粉絲以上的 up 主的關注列表,經提取和整理,將獲取的數據繪制成了42×42的關注矩陣,進而對其進行了社會網絡分析,分析了由這42位 up 主所構成的社會網絡的密度和其中的意見領袖。結果顯示,該社會網絡成員間關系緊密,且具有多位意見領袖。但研究仍存在些許局限:一是人數較少,僅分析了42位百萬粉絲以上的 up 主,但在嗶哩嗶哩 up 主中百萬粉絲以上的有很多,今后可進一步爬取全面的百萬粉絲以上的 up 主的關注列表或爬取嗶哩嗶哩年度評選的百位最具影響力的 up 主的關注列表進行分析;二是本研究僅對密度和意見領袖進行了分析,而社會網絡分析中的小團體分析也具有重要意義,今后可對嗶哩嗶哩 up 主進行小團體分析,進而綜合本次研究提出相應建議。

參考文獻:

[1]黃岷昊,丁浪,張雪蓮.基于 Python 的網絡爬蟲及文本可視化[J].電腦編程技巧與維護,2020(7):24?25.

[2]溫佐承,侯帥.基于 Python 的網絡爬蟲設計與實現[ J].電腦編程技巧與維護,2020(7):21?23+42.

[3]姜鑫.社會網絡分析方法在圖書情報領域的應用研究[M].北京:知識產權出版社,2015.

[4] Pollack J ,Matous P.Testing the impact of targeted team building on project team communication using social network analysis[ J ].International Journal of Project Management,2019,37(3):473?484.

[5]田麗麗,趙穎.基于社會網絡分析的學習者在線交互行為研究[J].軟件導刊,2018,17(4):222?226.

作者簡介:

高悅(1997—),碩士,研究方向:用戶信息行為。

主站蜘蛛池模板: 日韩人妻精品一区| 五月婷婷综合在线视频| 不卡的在线视频免费观看| 国产菊爆视频在线观看| 中文字幕亚洲无线码一区女同| 欧美亚洲国产视频| 国产成人免费观看在线视频| 久久久久久久久18禁秘| 成人在线天堂| 无码aaa视频| 成人日韩视频| 无码aaa视频| 青青草a国产免费观看| 少妇精品在线| 免费一级α片在线观看| 亚洲乱伦视频| 大学生久久香蕉国产线观看| 天天干天天色综合网| 国产一区二区精品福利| 五月激激激综合网色播免费| 中国毛片网| 日本不卡视频在线| 在线播放91| 亚洲无码A视频在线| 亚洲天堂福利视频| 亚洲中文字幕无码爆乳| 免费毛片a| 99这里精品| 亚洲欧美极品| 日韩亚洲综合在线| 中国丰满人妻无码束缚啪啪| 亚洲综合专区| 免费中文字幕一级毛片| 狠狠综合久久| 国产va免费精品| 亚洲精品中文字幕无乱码| 久久99精品国产麻豆宅宅| 欧美亚洲日韩不卡在线在线观看| 日韩精品一区二区三区大桥未久| 韩日午夜在线资源一区二区| 人妻中文久热无码丝袜| 亚洲小视频网站| 国产三级精品三级在线观看| 日本一本在线视频| 亚洲国产av无码综合原创国产| 国产成人调教在线视频| 亚洲欧美日本国产综合在线| 亚洲国产AV无码综合原创| 91久久国产成人免费观看| 99精品国产自在现线观看| 色综合成人| 啪啪国产视频| 五月丁香在线视频| 国产浮力第一页永久地址| 一级一级一片免费| 成人午夜天| 亚洲女同欧美在线| 亚洲午夜国产精品无卡| 最新国产网站| 日韩亚洲综合在线| 91尤物国产尤物福利在线| 国产精品亚洲一区二区三区z| 亚洲国产精品一区二区高清无码久久| 国产成人无码AV在线播放动漫| 国产丝袜91| 亚洲AⅤ综合在线欧美一区| 国产在线97| 国产精品偷伦在线观看| 亚洲欧美一区在线| 国产精品手机在线观看你懂的 | 国模沟沟一区二区三区| 欧美成人精品高清在线下载| 国产美女一级毛片| 国产综合欧美| 91亚洲精品第一| 九九香蕉视频| 欧美黄网在线| 国产一在线| 99视频在线免费| 中文字幕永久视频| 免费国产好深啊好涨好硬视频| 色爽网免费视频|