張碩碩

摘 要:電子商務發展帶來的經濟效益越來越受到重視,以全國31省市為基礎,通過改進主成分聚類法探究各省市電子商務發展水平。首先對評價的指標進行選取,建立合適的評價指標體系,其次對原始數據進行均值化處理,用改進后的主成分分析提取主成分,再次用主成分綜合得分與聚類分析相結合對各地區發展水平進行分析,最后與傳統主成分分析進行比較得出模型的有效性。
關鍵詞:改進的主成分;電子商務;綜合評價
中圖分類號:F27 文獻標識碼:A doi:10.19311/j.cnki.1672-3198.2018.35.036
1 引言
根據國家統計局數據顯示,2017年全國電子商務交易額達到29.16萬億元,同比增長11.7%,電子商務發展帶來的經濟效益不言而喻。目前電子商務水平測度及評價體系主要運通因子分析法、聚類分析法、熵值法等對電子商務發展水平進行綜合評價,本文將使用改進的主成分聚類法對電子商務發展水平進行綜合評價,解決單一的評價帶來不準確。
2 傳統主成分分析原理
3.3 改進后主成分分析過程及結果
把經過均值化后的數據導入SPSS進行主成分分析。從相關系數矩陣可以看到原始數據大部分變量之間的相關系數都大于0.3且KMO為0.813>0.8,Bartlett球形檢驗的顯著性P值為0.000<0.05,明數據適合做因子分析。表2為方差貢獻表,由表2可以看出,提取了特征值大于1的三個主成分,三個主成分的特征值分別為13.564、3.696、1.328,方差貢獻率分別是64.590%、17.601%、6.325%,累積方差貢獻率達到88.516%。
表3為因子載荷矩陣。由表可看出企業數x1、企業擁有網站數x3、地區生產總值x9、網上零售額x13、社會消費品零售總額x14第一主成分上有較高載荷,相關性強。第一主成分集中反映了基礎設施及經濟狀況,電子商務發展水平主要體現在基礎設施與經濟狀況;互聯網普及率x5、人均GDPx10、居民消費水平城鎮人口比重x11在第二主成分上有較高載荷,第二主成分反映了人口因素;有電子商務交易的企業比重x2在第三主成分上載荷較高,反映了從事電子商務交易企業比例對電子商務發展水平做的貢獻。
由表3的因子載荷除以對應的特征根(λi,i=1,2,3)得到主成分系數矩陣,用T表示。根據得到的主成分系數表,及公式y=Zx*T,可以得到主成分得分其中Zx為均值化后的矩陣。再通過表2方差貢獻率64.590%、17.601%、6.325%,計算出綜合得分函數,其公式為:
y綜*=0.6459y1*+0.17601y2*+0.06325y3*
其中y1*,y2*、y3*為提取的三個主成分的得分,y綜*為綜為綜合得分。
另外把標準化后的數據導入SPSS進行傳統主成分分析,y綜為傳統主成分綜合得分。對比傳統主成分分析,得到表4。我們可以看到,整體排名大致相同,但是部分地區電子商務發展水平綜合評測結果有差異,比如廣西在改進后的主成分分析排名19,傳統主成分分析排名20,內蒙古在改進后的主成分分析排名23,傳統主成分分析中排名19,對比原始數據,內蒙古除了在企業擁有網站數、互聯網普及率、人均GDP、居民消費水平、城鎮人口比重5個指標上比廣西高外,其他指標均低于廣西,而這五個指標在因子載荷矩陣中的因子載荷值較小,也就是說這幾個指標在電子商務水平綜合評價中并不是最重要的指標,故廣西的電子商務發展水平應該高于內蒙古,改進后的主成分分析結果優于傳統的主成分分析。
3.4 聚類綜合評價
對主成分綜合得分進行聚類分析,同時參考各類中各地區的綜合主成分得分以此對類進行排序,最終得到綜合的評價結果。系統聚類圖如圖1所示,求得這五類中樣本的平均得分并排序。
第一類{廣州},廣州的綜合得分遠遠高于其他地區,為電子商務最發達的地區;第二類{浙江、江蘇、上海、北京},發展水平低于廣州,為電子商務較發達地區;第三類{山東、福建},為電子商務發展水平一般發達地區;第四類{河南、四川、湖北、河北、遼寧、湖南、安徽、天津},根據福建省和河南省綜合得分,有一個較大差別,為電子商務發展水平一般地區;第五類{陜西、重慶、江西、廣西、黑龍江、山西、云南、內蒙古、吉林、貴州、海南、新疆、甘肅、寧夏、青海、西藏},主要為中西部地區,為電子商務不發達地區??傮w來看,東部沿海地區電子商務發展水平普遍高區中西部地區。
4 結論
與傳統的主成分分析相比,改進的主成分聚類分析方法能夠在很大程度上克服主觀因素的影響,同時在對原始信息的處理中采用了均值化處理方法,使挖掘的結果更加準確,在此基礎上運用聚類分析方法,將電子商務發展水平相近的地區聚為一類,為準確評估電子商務整體水平和有針對性的尋求解決方案提供更可靠的依據。
參考文獻
[1]王國祝.聚類分析及算法研究[J].現代商貿工業,2017,(22).