程秀峰 張夢圓 丁芬 陸穎穎



摘要:[目的/意義]對開發者社區中意見領袖行為數據進行分析,解釋這些特征值對其他用戶行為的影響力,探究意見領袖影響力形成的原因,為提升該類社區用戶參與度提供最佳實踐路徑。[方法/過程]依據社區的綜合排名,篩選出意見領袖,將他們的特征分成3類(成就、互動、貢獻),基于每類特征值對意見領袖進行聚類(權威型、新晉型、傳播型),利用網絡結構可視化方法揭示意見領袖的影響力要素,并從用戶發展、平臺建設及機構資源利用3個視角提供參考建議。[結果/結論]可以通過這種方式動態確定特征值分布對關鍵用戶提升影響力的最佳路徑。典型開發者社區中權威型意見領袖的粉絲數、原創數特征,傳播型意見領袖的等級值、原創數特征,新晉型意見領袖的收藏數、碼齡、博客數等特征,對用戶學習意愿的影響較大。
關鍵詞:開發者社區;意見領袖特征;影響力;用戶學習意愿
DOI:10.3969/j.issn.1008-0821.2022.07.010
〔中圖分類號〕G203〔文獻標識碼〕A〔文章編號〕1008-0821(2022)07-0114-11
Research on the Influence of Characteristic Values of
Opinion Leaders in Developer CommunityCheng XiufengZhang MengyuanDing FenLu Yingying
(School of Information Management,Central China Normal University,Wuhan 430079,China)
Abstract:[Purpose/Significance]Analyzing the behavior data of opinion leaders in the developer community,explaining the influence of behavioral characteristics values on other users' behaviors,exploring the reasons for the formation of opinion leaders' influence,and providing the best practice path for improving user participation in such communities.[Method/Process]Firstly,opinion leaders were selected according to the comprehensive ranking of the community.Then,the characteristics were classified into three categories(achievement,interaction and contribution);Then,the opinion leaders were clustered based on the values of each category(authoritative,upstart,dissemination).Finally,the network structure visualization method was used to reveal the influence factors of opinion leaders,and suggestions were provided from the perspectives of user development,platform construction and institutional resource utilization.[Result/Conclusion]In this way,the optimal path of eigenvalue distribution to enhance the influence of key users can be determined dynamically.In the typical developer community,the characteristics of authoritative opinion leaders' number of fans and originality,the grade value and originality of communication opinion leaders,and the collection number,code age and blog number of newly emerging opinion leaders have a great influence on users' learning intention.
Key words:developer community;characteristics of opinion leaders;influence;user's learning intention
隨著互聯網特別是Web2.0技術的迅速發展,技術社區(Technology Communities,或稱為開發者社區、技術問答社區等)已成為技術知識交流和技術成果共享的重要平臺[1]。
從知識交流角度看,技術知識的交流方式一直在變化。從傳統的交流方式(如專利、文獻、會議、咨詢),到以信息為中心的集中發布方式(如科技網站、技術論壇、產品知識庫),再到以用戶為中心的協同傳播方式。可以看出,這種交流的模式正逐漸向網絡化、扁平化、去中心化方向演變[2]。在軟件開發領域,開發者社區(Developer Communities)已成為開發者之間交流的主要渠道,它類似于社交平臺,但其交流內容的專業性、交流方式的規范性、交流功能的多樣性,往往要比一般社交平臺更加豐富[3]。B6237AF0-8D99-4A16-BA51-8F0507032B41
從信息傳播角度看,開發者社區作為一種典型技術社區,其知識資源集中在“主要貢獻者”上,這些貢獻者在現實中可能是領域專家,但更多的則是對某項技術十分精通,且僅在該項技術領域享有一定聲望的用戶。這些用戶往往成為相應社交網絡中的重要節點[4]。具體表現為:對大眾傳播的接觸頻度高、影響力強、信賴者多等。因此,傳播學將這些貢獻者定義為“意見領袖”(Opinion Leaders)[5]。意見領袖在開發者社區中扮演著不可忽視的“中介”作用,可以使社區用戶參與程度增加,從而增強整體社區活力[6]。有研究發現,開發者社區中用戶參與項目合作的意愿不僅受項目內容、用戶期望等主觀因素影響,也會受到其關注主體的特征的影響[7-8]。例如,一個碼齡超過10年、粉絲上萬、每日更新的開發者,往往會贏得更多的關注,其項目也會有更多人參與。
從文獻分析中可以看出,國內外對開發者社區的專門研究正在增多,而專門針對社區中用戶特征的影響力研究較少,且多是分散于知識(問答)社區[9-10]、社交網絡[11]或是特定行為特征的研究。另外,由于每個平臺的功能設置不盡相同,對宏觀觀察用戶特征的影響力也造成了一定偏差。總之,研究開發者社區中特征的影響力,可以幫助相關平臺深入了解用戶興趣點,增加社區資源的有效流動,為該社區發展提供借鑒。本文選取國內最大的開發者社區CSDN為研究對象,對該社區的用戶特征進行分類,再利用無監督聚類算法確定該社區中存在的意見領袖類型及特點,隨后分析不同類型意見領袖的特征值對用戶學習意愿的影響力,并結合可視化的網絡結構,分析出提升意見領袖影響力的路徑,并為該類社區的平臺建設與相關機構的資源利用提供一定的參考。
1相關研究
1.1開發者社區
典型的開發者社區是軟件開發人員進行代碼共享、知識交流的開放式平臺,主要由代碼托管網站發展而來。目前,國外主要平臺有GitHub、GitLab、BitBucket、SourceForge等[12];國內的平臺主要包括CSDN、碼云(gitee.com)等。除了基本的社交功能外,它們還具備代碼托管、協同開發等一系列技術性交互功能。因此,其行為特征屬性極為豐富,例如,Commit(提交/上傳次數)、Fork(分支數)、Issue(問題討論數)等。對該類社區的研究主要落腳在信息內容[13]、網絡結構[14]以及用戶行為研究等方面。其中,用戶行為研究主要揭示行為特征與行為規律,分析用戶影響力等。比如,Yan D C等[15]解釋了開發者的活動在社區中滿足長尾效應;Yu Y等[16]對GitHub的關注網絡進行分析,發現了獨立、群體、星型、中心這4種社交行為模式,從而幫助平臺管理者設計相應的輔助功能。可見,該類研究主要集中于用戶的行為模式、行為規律挖掘,缺乏對關鍵節點特征屬性的影響力的量化分析。
1.2用戶群體聚類研究
對社區中的用戶進行聚類,分析不同群體的特征,是用戶行為研究的常用方法。然而,其中大多數聚類對象均是普通社交平臺,例如主題模型聚類[17-18],利用各種聚類算法進行推薦、比較聚類算法的性能等。K-means算法本身具有優化迭代的能力,有助于減少在樣本量少的情況下聚類的不準確性,因此得到了廣泛的應用[19]。另外,也有少量研究利用EM聚類算法[20]、超網絡譜聚類算法[21]等,更適合企業級大規模群體聚類。開發者社區中的意見領袖屬于小樣本群體,無監督的K-means聚類算法依然適合基于特征值的個體歸類。
1.3意見領袖特征影響力研究
“意見領袖”一詞源于市場營銷學中的兩級傳播理論(Two-step Flow of Communication)[22]。通常指社交網絡中對他人施加影響的“活躍因子”。有研究表明,在傳統社交網絡中,意見領袖的影響力有一定的差異性[23],但除了主觀因素,還有哪些因素導致這些差異性?在開發者社區中,大部分的用戶關注集中于項目和代碼而非用戶[3],但是意見領袖本身特征對他們的影響是否存在?影響程度又如何細分?相關研究并不多見。
在意見領袖特征影響力研究方面,主要用到層次分析法[24]和回歸分析法[25]。由于前者帶有一定主觀性,而后者通過統計模型來觀察變量之間的影響程度,分析過程更具客觀性和可量化性。因此,本文將采用回歸分析法來探究意見領袖特征對其他用戶學習意愿的影響力。
2分析過程
2.1數據采集與整理
開發者社區的用戶排名通常能夠反映用戶的活躍性與重要程度。考慮到數據的代表性與多元化,本文綜合采用CSDN中總排名、周排名、全站綜合熱榜、領域內容榜、熱門專欄榜、歷史貢獻榜中的用戶,采集這些用戶的碼齡、原創數、訪問數、等級值、粉絲數、點贊數、評論數、收藏數、博客數以及關注信息。在過濾重復榜單用戶后,最終得到907名用戶,將其視為意見領袖。數據采集時間為2021年9月16日—17日。
2.2特征屬性分類
筆者對上述意見領袖的特征值進行主成分分析,其結果中顯著性(0.000<0.05)與KMO(0.745>0.7)表明該分析具有顯著性與有效性。分析結果將9個特征分為3個主成分,圖1中數值代表每個特征與3個主成分的相關程度,各個特征選擇最高數值所對應的主成分作為其成員,且同一主成分中的特征之間具有高度相關性,但與其他主成分中的特征互為獨立。
隨后,通過以上分析,并結合前人對網絡用戶的特征劃分的語義說明[26],本文將意見領袖的特征分為3類(成就類、互動類、貢獻類)。其分類具體描述如表1所示。
其中,“成就”類特征在一定程度上反映了意見領袖文章的價值以及在社區中取得的成果,本文用等級值、碼齡與訪問數來衡量;“互動”類特征體現的是意見領袖與其他用戶的交互情況,由獲贊數、收藏數、評論數與粉絲數來衡量;“貢獻”類特征反映的是意見領袖為社區提供與傳遞知識、思想、文章等貢獻內容,通過原創數與博客數來體現。B6237AF0-8D99-4A16-BA51-8F0507032B41
2.3意見領袖聚類
基于每種特征的具體數值對意見領袖進行K-means聚類,將意見領袖數據集記為X={x1,x2,x3,…,x907},將意見領袖特征集記為A={a1,a2,a3,…,a9},則第n名意見領袖的特征向量為Xn=(an1,an2,an3,…,an9),其中an1表示第n名意見領袖的第1個特征的值。現將數據集X擬聚為K個類別,具體過程如下:表1意見領袖類別、特征及描述
社區特征類別特征特征描述CSDN成就類等級值意見領袖通過其成果獲得的數值碼齡意見領袖在平臺中持續時間訪問數反映用戶對意見領袖文章的學習意愿與吸引力互動類獲贊數反映用戶對意見領袖文章的認可收藏數反映用戶對意見領袖文章的認可評論數反映用戶對意見領袖文章的交互情況粉絲數反映意見領袖的受歡迎程度貢獻類原創數意見領袖的原創文章數量博客數意見領袖的所有文章累積數量
這里利用肘部法來確定聚類中心數K,根據圖2中SSE(誤差平均和)肘部圖可看出,K取值為3時出現拐點,則確定最終的聚類數目為3。其聚類結果如表2所示。
依據表2中聚類結果來確定意見領袖的類型。雖然簇1內意見領袖的貢獻類均值居中,但其成就類(等級值、訪問數)與互動類均值遠大于簇2與簇3,表明簇1內意見領袖的相關成果得到了廣泛用戶的喜愛與認可。因此,將這類意見領袖歸類為“權威型”;簇2內意見領袖的成就類、互動類、貢獻類均值均遠低于簇1與簇3,但其原創率比較高,與簇1相對持平,這說明簇2內意見領袖在社區中深造時間不長,還未被用戶廣泛關注,因此,將這類意見領袖歸類為“新晉型”;簇3內意見領袖的成就類與互動類均值居中,但貢獻類均值最高,且原創率最低,這說明簇3內意見領袖更熱衷于在社區中轉載他人文章與資源,更傾向于依靠傳播來獲得更多訪問數、獲贊數等數值,以提升影響力,因此,將這類意見領袖歸類為“傳播型”。意見領袖類型的具體定義說明如表3所示。
根據表2互動類特征與表3定義可知,權威型與傳播型這兩類意見領袖吸引了大部分用戶的關注,
這一現象不僅與意見領袖文章質量相關,還可以推斷出大多數用戶在選擇學習資源時會傾向于跟隨他人,這也是“主觀規范”的體現[3]。
2.4意見領袖特征對用戶學習意愿的影響力分析
為用戶貢獻開放的學習資源,是開發者社區的設立本意。意見領袖是該社區的主要活躍節點,其特征屬性對其他用戶具有吸引力,可以看做其他用戶學習其所貢獻的資源,參與其項目的重要影響因素。分析不同類型意見領袖特征對用戶學習意愿的影響程度,為提升該類社區中意見領袖影響力提供針對性依據。有研究[27]表明,用戶的瀏覽行為是反映用戶興趣偏好及學習意愿的隱式反饋。由于開發者社區中文章的標題往往能夠向用戶直觀地傳達文章的核心內容,若用戶對其產生繼續學習的意愿,則會“點擊”該文章(即增加了“訪問數”),并且用戶的“瀏覽”行為是產生“點贊”“評論”“收藏”等其他行為的前提。因此,筆者選取特征中“訪問數”來表征其他用戶學習博文的意愿,并通過回歸分析法,來深入挖掘不同類型意見領袖的不同特征類型對用戶的影響。
1)分析方法的選擇
回歸分析法要求變量間不存在多重共線性,否則將導致回歸模型缺乏穩定性。逐步回歸法是解決此問題的常用方法,它將變量逐個引入模型進行檢驗,最后剔除引起多重共線性的變量以優化模型。但在本研究中,權威型意見領袖的樣本數(7個)小于變量個數(9個),不滿足逐步回歸法的適用條件,為解決此特殊情況,筆者引入偏最小二乘回歸法,且該方法能有效克服變量間的多重共線性問題[28]。除此之外,根據新晉型、傳播型意見領袖的樣本數據的分布情況,如圖3、圖4所示,若構建偏最小二乘回歸模型,會剔除橢圓外數據,這樣可能會失去一些有效結果。綜上,筆者將采用逐步回歸法分析新晉型與傳播型意見領袖的特征的影響力,采用偏最小二乘回歸法分析權威型意見領袖的特征的影響力。
2)分析過程
首先,筆者采用逐步回歸法分別分析新晉型、傳播型意見領袖的特征值對用戶學習意愿的影響,該分析只保留了顯著性變量,其結果如表4所示。
在表4中,根據各變量的VIF值(<10)可知,該模型有效解決了變量間的多重共線性問題;根據DW(接近2)可知模型不存在殘差自相關,即該模型不存在遺漏變量。因此,該分析結果具有統計學意義。
然后,筆者借助SIMCA對權威型意見領袖的樣本數據構建偏最小二乘回歸模型。其分析結果如表5所示。根據R2X、R2Y、Q2可知該模型可靠性強、預測能力較好。
通過偏最小二乘回歸法對權威型意見領袖的樣本數據進行特異點檢測,如圖5所示,所有樣本點都均勻分布在T2橢圓圖內,即樣本質量得到了保證。
3)分析結果
綜合表4、表5中Beta值,將結果繪制成如圖6所示的雷達圖,以更直觀地比較分析3類意見領袖的不同特征對用戶學習意愿的影響程度,這里統一將不顯著變量的系數記為0。
圖6中的數字代表3類意見領袖各個特征的Beta值,記該值的絕對值為B=Beta,則B值越大,表明該特征的變化對用戶的學習意愿具有更顯著的影響(當Beta值為正數時,則為正向影響;當Beta值為負數時,則為負向影響)。對于“等級值”特征,傳播型意見領袖的B值最大(0.286);對于“博客數”特征,新晉型意見領袖的B值最大(0.258);對于“原創數”特征,權威型意見領袖的Beta值為正數(0.235),傳播型意見領袖的Beta值為負數(-0.168);對于“粉絲數”特征,權威型意見領袖的B值最大(0.275);對于“收藏數”特征,新晉型意見領袖的B值最大(0.190);對于“碼齡”特征,新晉型意見領袖的B值最大(0.125);而對于“評論數、獲贊數”特征,3類意見領袖的B值均為0,則表明這兩個特征對用戶的學習意愿沒有顯著的影響。B6237AF0-8D99-4A16-BA51-8F0507032B41
由圖6可知,對于權威型意見領袖而言,其互動類(粉絲數)(Beta=0.275)、貢獻類(原創數)(Beta=0.235)的變化對用戶的學習意愿具有更顯著的正向影響,這表明,用戶更加關注與認可權威型意見領袖的原創文章中所呈現的知識與思想,這一現象與Agrawal J等[29]得出的“用戶更傾向于信任專家所產出的內容”一致。對于新晉型意見領袖而言,成就類(碼齡)(Beta=0.125)、貢獻類(博客數)(Beta=0.258)、互動類(收藏數)(Beta=0.190)對用戶的學習意愿具有更顯著的正向影響,這表明,對于關注度不高的新晉型意見領袖而言,用戶更傾向于關注深造時間長、產出成果數量多且認可程度高的新晉型意見領袖的文章與資源,這一現象可以被盧恒等[26]得出的“用戶留存在社區中的時間越長,知識的貢獻程度越大,越容易吸引更多其他用戶的關注”所解釋。對于傳播型意見領袖而言,成就類(等級值)(Beta=0.286)特征對用戶的學習意愿呈現更顯著的正向影響,而貢獻類(原創數)(Beta=-0.168)特征對用戶的學習意愿具有更顯著的負向影響,這意味著,傳播型意見領袖的等級值越大,越能激發用戶的學習意愿。此外,傳播型意見領袖的原創數越高,越不容易激發用戶的學習意愿,即用戶更傾向于瀏覽傳播型意見領袖的轉載文章,這是因為經過轉載的文章大多經過了用戶的主觀過濾,其內容和價值被主觀認可,從而使得客觀可信度更高,這一現象與Keib K等[30]得出的“被轉發的推文內容往往具有重要價值”一致。
2.5社會網絡分析
LeaderRank算法是Lü L等[31]基于PageRank算法提出的,用于探測社交網絡中節點的重要性,具有更快的收斂性,更強的魯棒性,能更準確地識別出網絡中具有影響力的節點。因此,筆者采用LeaderRank算法探測3類意見領袖在社交網絡中的相對重要程度,觀察其在網絡中呈現的特點,并識別意見領袖影響力的形成原因,為發現意見領袖影響力提升的路徑提供參考。
在本研究907個樣本中,共有198名意見領袖之間不存在關注關系,因此去除他們的關注鏈接,最終得到有效節點709個,把這些意見領袖編號,將其視為關注關系網絡中的節點。計算每名意見領袖的LR值。然后利用Gephi工具中的Force Altas(力引導算法)對網絡關系進行重構,使“重力”(相對重要程度)大的節點向中心聚攏,使每個節點處于相對平衡狀態,最終形成的關系網絡的可視化形式,如圖7所示。
圖7中,紅色代表權威型意見領袖、藍色代表傳播型意見領袖、橙色代表新晉型意見領袖。節點大小對應意見領袖的LR值,節點大小越大,表示其LR值越大,即影響力越大。邊的3種顏色代表意見領袖的關注目標情況,例如,紅色的邊表示意見領袖的關注目標為權威型意見領袖。由圖7可得以下結論:
1)在開發者社區中,只有少部分意見領袖在一定領域中具有重要影響力,且高影響力的意見領袖集中于權威型意見領袖、少部分傳播型意見領袖以及個別新晉型意見領袖中,這一現象也是帕累托定律在人才分配中的體現。
2)3類意見領袖關注各自類型的比例更大,比如權威型意見領袖關注權威型意見領袖的比例更大,這說明不同類型的意見領袖具有各自的關注網或“朋友圈”,他們在各自的關注網中學習與獲取相關資料。
3)具有密切關注關系的意見領袖在圖中集中分布,因此可得出高影響力的意見領袖之間存在密切關注關系,而低影響力的意見領袖很少關注高影響力的意見領袖。此外,傳播型意見領袖更傾向于關注高影響力的意見領袖,這表明,意見領袖不僅需要提高其原創資源的質量,還需要重點關注高影響力的意見領袖文章。
3意義與啟示
3.1用戶發展視角
根據文中第2部分的分析,3種類型的意見領袖特征對用戶學習意愿的影響程度有所不同,因此,可為每類意見領袖提供具有針對性的提升其影響力的策略。
1)權威型意見領袖:挖掘前沿知識領域,打造自身“品牌”特色
由于權威型意見領袖的貢獻類(原創數)及互動類(粉絲數)特征對用戶的學習意愿具有更顯著的影響,因此,該類意見領袖應該將重心放在原創數與粉絲數這兩個特征的提升上。首先,該類意見領袖在一定領域中擁有其獨特見解與領悟,用戶更傾向于從他們的文章中獲取和自身知識需求相近的技術性資源。因此,以敏銳的洞察力來捕捉技術領域中的前沿思想與動態,以專業的視角來挖掘開發者社區中潛在的知識與方法,以創新的思維來預測未來技術發展的趨勢與新格局,是權威型意見領袖的核心任務。其次,幫助用戶解決有針對性的技術問題,形成良好的社區生態,是開發者社區的一貫目標。這意味著權威型意見領袖應該明確自身吸引用戶關注的特點,從自身影響力優勢出發,專注技術內容質量,形成“品牌”效應,為用戶及其他意見領袖的學習和研究提供啟發性思維與指引性技術參考是其重要標準。最后,該類意見領袖可結合自身技術特色,將同類型的解答以知識總結的形式匯集成“知識庫”,并積極推廣。例如通過公眾號、小程序等,吸引更多用戶的關注,從而提升影響力。
2)傳播型意見領袖:促進知識高效流通,增強互動交流
由于傳播型意見領袖的成就類(等級值)特征對圖7意見領袖關系網絡圖
用戶的學習意愿具有更顯著的正向影響,而貢獻類(原創數)特征對用戶的學習意愿具有更顯著的負向影響。因此,對這兩類特征的調節,是該類意見領袖提升其影響力的關鍵。一方面,該類意見領袖可延續自身特點,堅持傳播優秀文章,增加轉載過濾質量,從而提高資源的曝光率與采納率,加速社區的知識流通;另一方面,根據CSDN社區中有關等級值的介紹,除了發布原創文章外,與其他用戶在評論區互動交流等行為也可增加等級值。開發者社區中的評論信息在一定程度上反映了文章的質量及創作者水平,對于權威性不太高的意見領袖,用戶往往通過瀏覽其文章的評論信息來判斷其水平。因此,該類意見領袖可在評論區多與用戶進行互動交流,耐心回復評論區中用戶反饋的信息,了解用戶的真實需求。B6237AF0-8D99-4A16-BA51-8F0507032B41
3)新晉型意見領袖:打破“封閉”關注圈,擴充知識儲備
由于新晉型意見領袖的成就類(碼齡)、互動類(收藏數)、貢獻類(博客數)特征對用戶的學習意愿具有更顯著的正向影響。因此,作為未被用戶廣泛關注的新晉型意見領袖而言,需要堅持學習相關知識,夯實理論基礎,豐富實踐經驗,擴充知識儲備,為創作高質量的文章奠定基礎。有研究發現,內容結構越清晰、情感傾向越積極的文章,越能獲得用戶的認可與關注,據此,新晉型意見領袖可以重點增強文章結構的嚴謹性,以提升創作質量。此外,該類意見領袖需打破“封閉”關注圈,多關注高影響力意見領袖的文章與資源,掌握權威性文章的創作精髓,還可轉發優秀資源,從而在短時間內提升影響力。
3.2平臺建設視角
相較于一般的網絡社交平臺,開發者社區平臺的社交功能偏重于技術交流。因此,分析不同類型重要用戶的行為特征的影響力,可為平臺建設提供有價值的參考信息。由前文分析可知,平臺中資源的共享模式主要有兩種:一是高影響力用戶的原創資源的直接共享,這種模式在技術交流中扮演著核心傳播角色;二是中低影響力用戶的轉載資源的間接共享,這種模式在技術交流中扮演著輔助傳播角色。因此,對于其所代表的不同價值傳播鏈,可以采取不同的資源優化策略。例如,平臺服務商可以針對不同的傳播鏈,構建多樣化的激勵機制,設計互動性、趣味性的交流策略,比如針對不同人群設置知識競賽等活動,并結合評價指標,對優質用戶給予一定獎勵。此外,用戶間的互助性獎勵,例如“打賞”“有償咨詢”等,也可以提高社區活躍度,促進知識生產。總之,如果平臺服務商能夠掌握優質用戶的傳播特征,則可以提供個性化的知識服務,包括開展專題研討、專題競賽、專家交流等活動,更可以基于用戶興趣為其推薦專家列表與資源列表,輔以知識圖譜等方式呈現給用戶,從而提升用戶粘性與歸屬感。
3.3機構資源利用視角
開發者社區中蘊含著豐富的知識資源,同樣蘊藏著專業性人才和智力資源,從教育機構、科研機構及企業的視角來看,這些資源都是可以加以組織和利用的。第一,從機構對網絡資源的管理和利用的角度來看,根據屬性特征,對社區中的核心用戶進行分類,將其創造的知識線性化、網格化、標簽化,這些措施均可以促進知識交流的規范性和完整性。第二,從機構自身知識獲取角度來看,可以基于行為分析的手段,梳理知識傳播鏈條,針對不同知識鏈條獲取機構自身所需要的技術性資源,這對構建完善的機構知識庫具有重要意義。第三,從機構人才戰略角度來看,企業、高校等可更多關注具有高影響力的用戶,將其視為人才儲備,也可以在社區中提供項目需求,輔以一定的獎勵條件,吸引這些用戶參與機構建設。從長遠來看,開發者社區中的人才和知識資源是為機構增加智力價值、實現其人才發展戰略的有利保障。
4結語
社交網絡中,核心用戶影響力形成的原因往往是多方面的,而其中一方面便是用戶本身特征值對于其他用戶的吸引力。本文以此為出發點,利用定量方法分析開發者社區中意見領袖的各類特征屬性對其他用戶的影響力,并從傳播學角度闡述這種吸引力的類型、特點和作用。在屬性分類及用戶聚類的基礎上,定量分析了CSDN的意見領袖的每種類型的特征屬性的影響程度。基于分析結果,結合社會網絡分析觀察意見領袖在網絡中呈現的特點,從用戶發展、平臺建設、機構資源利用3個角度,闡述了在開發者社區中挖掘用戶行為的價值和意義。
本研究仍存在一定的局限性與不足,主要表現在以下兩點:第一,僅以CSDN數據為研究樣本,缺乏開發者社區的全樣本分析;第二,開發者社區區別于其他傳統網絡資源的一個重要特點是包含了豐富的用戶行為與關系,而本研究只分析了意見領袖的外部屬性特征,未結合文章內容、評論信息等內部特征,對社區中知識的動態演化規律進行深入挖掘。后續研究可加入主題演化模型等文本挖掘技術,從內容層面進行影響力分析,從而得出更加豐富且深入的結論,為開發者社區構建更全面、更系統的知識共享機制。
參考文獻
[1]李勝利,鐘瀅.中外技術問答社區的實證對比研究與啟示——以CSDN和Stack Overflow為例[J].情報學報,2020,39(9):989-1000.
[2]甘春梅,王偉軍,田鵬.學術博客知識交流與共享心理誘因研究[J].中國圖書館學報,2012,38(3):91-99.
[3]Cheng X,Zhang Z,Yang Y,et al.Open Collaboration Between Universities and Enterprises:A Case Study on GitHub[J].Internet Research,2020,30(4):1251-1279.
[4]張寶生,張慶普.基于扎根理論的社會化問答社區用戶知識貢獻行為意向影響因素研究[J].情報學報,2018,37(10):1034-1045.
[5]Venkatraman M P.Opinion Leaders,Adopters,and Communicative Adopters:A Role Analysis[J].Psychology and Marketing,1989,6(1):51-68.
[6]查先進,張晉朝,嚴亞蘭,等.網絡信息行為研究現狀及發展動態述評[J].中國圖書館學報,2014,40(4):100-115.
[7]Chen S C,Yen D C,Hwang M I.Factors Influencing the Continuance Intention to the Usage of Web 2.0:An Empirical Study[J].Computers in Human Behavior,2012,28(3):933-941.
[8]王楠,張士凱,趙雨柔,等.在線社區中領先用戶特征對知識共享水平的影響研究——社會資本的中介作用[J].管理評論,2019,31(2):82-93.B6237AF0-8D99-4A16-BA51-8F0507032B41
[9]李長玲,徐璐,范晴晴,等.基于引文網絡的當采跨學科知識交流中間人識別——以圖書情報領域為例[J/OL].情報理論與實踐:1-15[2021-10-13].http://kns.cnki.net/kcms/detail/11.1762.g3.20210823.1729.004.html.
[10]范文潔,鄧衛華.電商用戶及時性反饋行為特征及影響因素研究[J].農業圖書情報,2019,31(11):64-71.
[11]陳云偉.社會網絡分析方法在情報分析中的應用研究[J].情報學報,2019,38(1):21-28.
[12]前端小學生.除了GitHub,你還知道哪些免費源代碼托管網站?[EB/OL].https://zhuanlan.zhihu.com/p/43357962,2021-10-20.
[13]Barua A,Thomas S W,Hassan A E.What are Developers Talking About?An Analysis of Topics and Trends in Stack Overflow[J].Empirical Software Engineering,2014,19(3):619-654.
[14]Ichimura T,Uemoto T.Analysis of the Social Community Based on the Network Growing Model in Open Source Software Community[C]//2015 IEEE 8th International Workshop on Computational Intelligence and Applications(IWCIA).IEEE,2015:149-153.
[15]Yan D C,Wei Z W,Han X P,et al.Empirical Analysis on the Human Dynamics of Blogging Behavior on GitHub[J].Physica A:Statistical Mechanics and its Applications,2017,465:775-781.
[16]Yu Y,Yin G,Wang H,et al.Exploring the Patterns of Social Behavior in GitHub[C]//Proceedings of the 1st International Workshop on Crowd-based Software Development Methods and Technologies.ACM,2014:31-36.
[17]Qiu Z,Shen H.User Clustering in a Dynamic Social Network Topic Model for Short Text Streams[J].Information Sciences,2017,414:102-116.
[18]張濤,孫瑞英,李鐘雋.中國輿情文獻主題聚類及演化趨勢研究(1998—2019年)[J].農業圖書情報學報,2020,32(2):14-21.
[19]Nezhad M M,Moghaddam M H Y,Asadi M.Joint Peak Clipping and Load Scheduling Based on User Behavior Monitoring in an IoT Platform[J].IEEE Systems Journal,2020,15(1):1202-1213.
[20]Ren J,Wang Z,Xu M,et al.An EM-based User Clustering Method in Non-orthogonal Multiple Access[J].IEEE Transactions on Communications,2019,67(12):8422-8434.
[21]席運江,杜蝶蝶,廖曉,等.基于超網絡的企業微博用戶聚類研究及特征分析[J].數據分析與知識發現,2020,4(8):107-118.
[22]Katz E.The Two-Step Flow of Communication:An Up-To-Date Report on an Hypothesis[J].Public Opinion Quarterly,1957,21(1):61-78.
[23]郭博,許昊迪,雷水旺.知乎平臺用戶影響力分析與關鍵意見領袖挖掘[J].圖書情報工作,2018,62(20):122-132.
[24]楊長春,王天允,葉施仁.微博意見領袖影響力評價指標體系研究——基于媒介影響力視角[J].情報雜志,2014,33(8):178-183,202.
[25]馬俊,周剛,許斌,等.基于個人屬性特征的微博用戶影響力分析[J].計算機應用研究,2013,30(8):2483-2487.
[26]盧恒,張向先,吳雅威,等.專業虛擬社區用戶知識貢獻行為的多重動因及其效應研究[J/OL].圖書館建設:1-13[2021-10-26].http://kns.cnki.net/kcms/detail/23.1331.g2.20210315.1207.013.html.
[27]劉洪偉,高鴻銘,陳麗,等.基于用戶瀏覽行為的興趣識別管理模型[J].數據分析與知識發現,2018,2(2):74-85.
[28]王惠文.偏最小二乘回歸方法及其應用[M].北京:國防工業出版社,1999:200-233.
[29]Agrawal J,Kamakura W A.The Economic Worth of Celebrity Endorsers:An Event Study Analysis[J].Journal of Marketing,1995,59(3):56-62.
[30]Keib K,Himelboim I,Han J Y.Important Tweets Matter:Predicting Retweets in the# BlackLivesMatter Talk on Twitter[J].Computers in Human Behavior,2018,85:106-115.
[31]Lü L,Zhang Y C,Yeung C H,et al.Leaders in Social Networks,the Delicious Case[J].PLOS ONE,2011,6(6):e21202.
(責任編輯:陳媛)B6237AF0-8D99-4A16-BA51-8F0507032B41