?
微信用戶活躍度影響因素分析
黃煒1 ,2, 李總苛1, 李岳峰1
(1 湖北工業大學經濟與管理學院, 湖北 武漢 430068; 2 武漢理工大學管理學院, 湖北 武漢 430072)
[摘要]通過主成分分析法,應用SPSS統計分析軟件,從 11個調查指標中,選取了3個主成分,建立主成分綜合分析模型,進而對微信用戶活躍度進行分析。經過實際數據驗證顯示,所選取的3個主成分可以很好區分微信用戶的活躍度,進而達到了對微信用戶進行甄別的目的。
[關鍵詞]微信; 主成分分析; 統計產品與服務解決方案
微信將通信、社交、平臺化三者融為一體,很大程度上改變著人們的通信和社交方式,也改變著人們的思維和行為方式[1]。微信也成為了獨特的傳播媒介,被廣泛應用于企業的管理、營銷、宣傳中。微信一經出現,就迅速占領市場,在近四年里注冊用戶已經突破6億,如今仍有倍增趨勢[2]。然而,部分微信用戶對于微信功能的應用并不完全了解,所以其微信活躍度不高。本文將微信活躍度界定為用戶微信在線使用的頻率及對微信功能的使用程度,再運用SPSS統計分析軟件,通過主成分分析法,從11個指標中選取3個主成分,進行微信活躍度的分析[3]。
1微信用戶活躍度的分析
統計產品與服務解決方案(Statistical Product and Service Solutions,SPSS)適用于統計、經濟、教育、心理、管理、醫學、基礎設施建設等領域[3]。而主成分分析法是利用降維的思想,在損失很少信息的前提下把多個指標轉化為幾個綜合指標的多元統計方法。將SPSS和主成分分析法進行結合,不僅有助于指標的選取,也有助于構建出特定的指標體系[4-6]。
選用2014年湖北工業大學知識管理與創新研究中心實驗室調查取得的數據,應用Excel處理11個用戶個體的各項指標:V01為好友數,V02為群總數,V03為關注的公眾平臺數,V04為用戶資料完整度,V05為一周內用戶發布朋友圈消息數,V06為一周內好友對話數,V07為一周內朋友圈好友發布消息總數,V08為用戶收藏總數,V09為使用的功能數,V10為銀行卡使用頻率,V11為用戶注冊時間。其中,用戶注冊時間作為一個時間變量,無法直接進入建模數據集,所以需要對數據進行轉換,本文以2011年(微信推出時間)作為基準時間對統計數據進行轉換,即2011年表示為0,2012年表示為1。
運用SPSS17.0簡體中文版軟件的因子分析對影響微信活躍度的指標進行主成分分析,具體操作步驟如下:
第一步,將Excel中的數據導入SPSS,保證各數據類型為數值型;
第二步,選擇“降維”中的“因子分析”,彈出“因子分析”對話框,把V01—V11選入變量框;
第三步,在相關矩陣對話框中選中“系數”,然后點擊“繼續”,返回因子分析對話框;
第四步,點擊“確定”,輸出結果如表1所示。由于SPSS在調用因子分析進行分析時,SPSS會自動對原始數據進行標準化處理,所以計算得到的變量都是指經過標準化處理后的變量,但SPSS不會直接給出標準化后的數據,如需要得到標準化數據,則需調用“描述性”過程進行計算,計算結果如表2所示。

表1 輸出結果

表2 經標準化處理后的部分數據
將數據進行標準化處理,在處理后的數據基礎上計算的特征值結果如表3所示。

表3 方差分解主成分提取分析
特征值在某種程度上可以被看成是表示主成分影響力度大小的指標,主成分個數提取原則為主成分對應的特征值大于1的前幾個主成分[7]。從表2可以看出,當初始特征值的累計方差大于60%時,只要選取3個主成分,信息量就足夠了。在計算完特征值之后,進一步通過計算各變量與有關主成分的相關系數,計算結果如表4所示。

表4 初始因子載荷
表4中的每一列都顯示了各個變量與有關主成分的相關系數。以第一列為例,0.877是“好友數”與第一個主成分的相關系數,這是它在第一主成分上的載荷,如在第一主成分上載荷較大,即相關程度較高。
由初始因子載荷矩陣表可知,好友總數、群總數、一周內好友對話數、一周內朋友圈好友發布消息總數、用戶收藏總數、使用的功能數、銀行卡使用頻率在第一主成分上有較高載荷,說明第一主成分基本反映了這些指標的信息,用戶關注公眾平臺總數、一周內用戶發布朋友圈消息數在第二主成分上有較高載荷,說明第二主成分基本反映了這一指標的信息,用戶資料完整度、用戶注冊時間在第三主成分上有較高載荷,說明第三主成分基本反映了這兩個指標的信息。提取3個主成分可以基本反映全部指標的信息,所以決定用3個新變量來代替原來的11個變量,代替后的結果如表5所示。

表5 主成分代表
用表2中的數據,除以每個主成分所對應的特征值開平方根可以得到3個主成分中每個指標對應的系數。最后可以得出主成分表達式:
F1=0.45415427ZX1+0.568561877ZX2+
0.056067827ZX3+0.28686188ZX4-
0.00441457ZX5+1.036524344ZX6+
0.86596324ZX7+0.901473744ZX8+
1.047221549ZX9+1.197220657ZX10-
0.372015001ZX11
F2=-0.045052932ZX1-0.099596356ZX2+
0.603807364ZX3-0.24172627ZX4-
0.767031547ZX5-0.152257813ZX6-
0.314199052ZX7+0.641189072ZX8+
0.412641458ZX9+0.472115301ZX10+
1.309152028ZX11
F3=0.045570782ZX1+0.276046594ZX2-
0.250148765ZX3+0.473422404ZX4-
0.402829517ZX5+0.215503366ZX6-
0.504506607ZX7-0.842750983ZX8-
0.095351413ZX9+0.207172959ZX10+
1.519297907ZX11
以每個主成分所對應的特征值占所提取主成分總的特征值之和的比例為權重,計算主成分綜合模型:

(1)
其中,β1=3.729,β2=1.626,β3=1.344,β1+β2+β3=6.699,帶入式(1)即為主成分綜合模型:

(2)
由式(2)可見,F1值對綜合主成分值影響比重較大,其次為F2,F3對綜合主成分值的影響比重較小。
2實驗分析
為了了解影響微信用戶活躍度的因素,同時驗證本文的指標體系,仍繼續沿用實驗室數據,樣本來源于實驗室通過問卷調查的方式收集的原始數據,選取的樣本量為60份,收集了用戶的好友總數、群總數、用戶關注公眾平臺總數等共11類數據。
首先對數據進行標準化處理,然后根據主成分表達式、主成分綜合模型,計算出綜合主成分值,并對其按綜合主成分值(即F值)進行降序排列。部分結果見表6所示。
F值>0,說明該用戶活躍度在該組樣本用戶活躍度平均水平之上;相反,F值<0,說明該用戶活躍度在該組樣本用戶活躍度平均水平之下。根據統計結果,該組樣本中,有28位微信用戶的綜合得分在0以上,有32位微信用戶的綜合得分在0以下,即約2/3的微信用戶活躍度水平偏低。

表6 部分用戶的綜合主成分值排序表
F1為第一主成分,F2為第二主成分,F3為第三主成分,F為綜合主成分
其中,排名第一的用戶“曹”在F1上得分最高,這意味著相對于其他用戶,“曹”微信人脈較廣,且互動頻繁。排名第三的用戶“項靜”在F1、F2上的得分均較高,表明“項靜”不僅微信人脈較廣互動較多,其關注的公眾平臺總數也比其他用戶較多。由此,可以發現排名靠前的用戶在三類分值上具有共同特點,即F1值偏高,排名靠后的用戶,其F1值偏低,說明F1值對F值的影響較大。從圖1中可以得到驗證,當用戶的活躍度明顯低于平均水平或明顯高于平均水平時,其F1值與F值同負或同正。從樣本用戶的整體變動趨勢上來看,F1值與F值的變動趨勢大體相同,即F1值對F值的影響較大。微信用戶可以從增加好友數、群總數、好友對話數、用戶收藏總數、使用的功能數,以及銀行卡使用頻率來提高自身的活躍度。

圖 1 微信用戶F1值F值比較分析圖
根據計算出來的60個用戶的綜合主成分值,繪制出用戶分布散點圖(圖2)。

圖 2 用戶分布散點圖
綜合主成分值從高到低,依次劃分為活躍性用戶、普通用戶、缺乏活躍性用戶。從圖2可見,在該組樣本用戶中,大部分用戶為普通用戶,少數用戶為活躍性用戶和缺乏活躍性用戶。
3結束語
對于微信用戶活躍性的界定方法并不只有此一種,本文也只是對微信用戶活躍度進行探索。隨著微營銷等微信用途的發展,指標體系也會不斷完善,本文僅是通過這一種方法,對于微信用戶活躍度評價指標體系進行探討。
[參考文獻]
[1]孔云,廖寅,資蕓,等.圖書館微信服務平臺的設計與實現[J].圖書館論壇2014,34(02):90-95.
[2]新浪科技. 騰訊公布2015年第二季度財報:凈利同比增32% [EB/OL]. [2015-08-15].http://tech.sina.com.cn/i/2015-08-12/doc-ifxftvni8992173.shtml.
[3]王沙沙,艾萍.基于SPSS的主成分分析法的水利信息化評估[J].信息技術,2014(03):10-11.
[4]許淑婷,關偉.中國沿海地區海洋經濟競爭力研究[J].生產力研究,2014(07):26-29.
[5]李占波,白全海,申義彩.基于主成分分析的網絡入侵檢測算法[J].計算機工程,2013,39(05):152-155.
[6]楊仲瑋.主成分分析法在農村環境質量評價中的應用[J].甘肅科學學報,2015,27(01):72-75.
[7]齊欣,陸佳瑩.國外機構知識庫研究狀況計量分析[J].圖書與情報,2014(06):94-101.
[責任編校: 張眾]
Analysis of Factors Affecting Active Degree of WeChat Users
Based on Principal Component Analysis
HUANG Wei1,2, LI Zongke1, LI Yuefeng1
(1SchoolofEconomicsandManagement,HubeiUniv.ofTech.,Wuhan430068,China;
2SchoolofManagement,WuhanUniv.ofTech.,Wuhan430072,China)
Abstract:The article analyzed the active level of WeChat users based on the principal component analysis. By means of principal component analysis and SPSS statistical analysis software, 3 main components were selected from the 11 survey indicators, and then the main component analysis model was established. The data validation shows that the 3 main components can well distinguish WeChat users, and then to achieve the screening purpose of WeChat users.
Keywords:WeChat; principal component analysis;SPSS
[中圖分類號]G353
[文獻標識碼]:A
[文章編號]1003-4684(2015)06-0029-04