夏名首++劉玉林
◆ 中圖分類號:F272 文獻標識碼:A
內容摘要:本文在對電商店鋪商品價格、相關商品數和月銷量等數據的挖掘中,建立基于K-MEANS的店鋪聚類研究模型,深入分析電商店鋪的經營策略和效果。結合天貓碧根果店鋪案例,該模型發現商品不同價格區的紅海藍海競爭格局、鋪貨的4種經營策略和效果,進一步證明該模型的有效性。
關鍵詞:電商 K-MEANS 經營策略 效果
現今,電子商務擁有廣闊的銷售區域和大量消費人群,成為越來越多商家進行商品銷售的選擇。當然,電商商品在獲得更多銷售機會的同時,也面臨著商家眾多、商品同質化、價格等方面的競爭。“解析經營策略,評估經營效果和識別競爭狀況”成為電商商品經營管理的重要方向(郭承龍,2015)。
研究模型
電子商務商品經營以店鋪為單位,提供每家店鋪的相關商品數、價格、月銷量、總評價、產品名稱、店鋪所在地、產品描述評分、物流描述評分、服務描述評分、顧客購后打分和文字評價等。對電商店鋪經營策略研究應該對上述屬性指標有所取舍,采用圖1的研究模型。
首先,商業目標的核心是解析經營策略和效果,因此電商店鋪經營中價格、不同價格下經營的相關商品數、每款商品的月銷量成為關鍵屬性指標,是本次研究的目標數據。其次,在數據準備階段對某一時期的電商店鋪商品數、價格和月銷量數據進行數據爬取,并對數據開展清洗和聚合等預處理。再次,在數據挖掘階段,開展統計總體分析發現數據特征,在價格和商品數基礎上基于K-MEANS進行店鋪聚類;同時在數據分析中,分析不同店鋪類別的價格和商品數經營策略,結合月銷量分析經營效果。最后,在后處理中給出對策建議。
數據準備及統計分析
選擇電子商務平臺中天貓商城以“碧根果”為主要銷售對象的電商店鋪為對象,進行統計總體分析和K-MEANS聚類,分析碧根果電商店鋪經營策略和效果,驗證基于K-MEANS聚類的電商店鋪經營策略研究方法的有效性。
(一)數據準備
首先,在天貓搜索頁面中以“碧根果”為關鍵詞搜索,按照店鋪進行綜合后對搜索結果爬取,該過程主要爬取店鋪名稱、所在地、相關商品數等;其次,以“大圖”方式顯示關鍵詞搜索結果,爬取店鋪名稱、商品名稱、商品價格、斤價(轉化成500克后的商品價格,即元/500克)、月成交等。對爬取數據進行數據清洗,去除非“碧根果”商品數據和缺失數據商品,最終店鋪數有523家,相關商品數1628件。同時,對兩次爬取結果根據相同店鋪名稱進行聚合。本次爬取時間為2016年3月31日23時,各項數據代表該時點的結果。
(二)數據統計總體分析
地理分布。根據店鋪所在地,按照行政區域進行統計,以此得出經營“碧根果”電商店鋪的地理分布狀況,從中可知電商企業分為四個等級:以浙江為代表的店鋪高密度區,該區擁有最多店鋪數;以上海、北京、江蘇、山東、安徽、廣東、新疆為代表的較高密度區,該區店鋪數也較多;以黑龍江、陜西等22個省為代表的低密度區,該區店鋪數較少;以內蒙古、青海、西藏、貴州、海南為代表的無密度區,該區沒有經營“碧根果”的電商店鋪。該地圖進一步反映出店鋪數量呈現出“東西兩頭翹,南北也較好,中線顯不足”的態勢。在按照城市統計中,共計117個城市有經營“碧根果”的電商店鋪,前三位城市分別為上海(76家)、杭州(64家)、北京(33家),統計結果體現出一線城市在電商店鋪數量方面有著明顯的優勢。
數據描述性分析。在SPSS中對店鋪評價、商品價格、月銷量等數值型屬性進行描述性統計,統計結果如表1所示。
表1顯示,商品價格范圍非常大,最低1元,最高2396元,標準差達到77元。經過分析發現主要由于所售“碧根果”商品的重量和活動力度不一樣,1元商品為活動特價,并且僅僅含有120克;2396元商品為正常售價,但是重量為20斤。由于商品價格在商品重量方面的不一致性,在數據挖掘店鋪聚類中將不選擇商品價格作為數據分析對象。
在表1中可知,斤價最小值為4元,最大值為596元,標準差為41.124元,同樣波動較大,但是由于斤價是消除商品重量差異,都轉化為500克的標準價格,在分析時有很好的可比性,由此后續分析中以此屬性作為重要的衡量指標;表1中還反映出商品月銷量、該店鋪相關商品數的描述統計量結果,從結果中都體現了“區間范圍大,波動劇烈”,這說明“碧根果”店鋪和商品有很大的差異性,通過差異進行聚類和類群研究有很大的社會價值。
在SPSS中對商品價格、斤價和月銷量進行相關性分析,結果如表2所示。表2顯示3個屬性之間都表現為非常低的相關性。
基于K-MEANS的店鋪聚類分析
(一)斤價分區與描述
在通過斤價、相關商品數和月銷量研究店鋪分析時,由于一個店鋪相關商品較多,如果僅以多個商品斤價的均價來替代該店鋪的所有商品合理性不強。因此在研究時主要利用斤價分區和該區間的店鋪商品數來研究。在斤價區間分辨率上選用“0-10元、10-20元、20-30元、……、90-100元和100元以上”進行區分(按照下限不在內原則統計),斤價分區后統計每個斤價區間上的店鋪商品數和月銷量總計。經過統計后圖形顯示結果如圖2所示。在研究中,根據斤價數據分布和市場上的價格格局,將斤價分區分為“0-10元、10-20元、20-30元”三組定義為活動價區,該區域多為商品活動時期的斤價;“30-40元、40-50元、50-60元、60-70元”四組定義為普價區,該區域為多數商品普遍銷售斤價區;“70-80元、80-90元、90-100元”三組定義為優質價區,該區域商品數量一般,但斤價較高;最后“100元以上”定義為高價區,該區域商品斤價最高,是高端市場領域。
圖2顯示商品數競爭最激烈的為普價區,其次競爭較激烈的為高價區;活動價區、優質價區商品數競爭都較少。在月銷量方面普價區最好,尤其是40-50元斤價區最好,優質價區也表現不俗,尤其是80-90元斤價區為第二,其它斤價區表現一般。圖中“月銷量除以商品數”后的商品單品月銷量曲線顯示最好區間為包含80-90元的優質價區,其次為10-20元所在的活動價區,最差的是商品數最多的30-40元所在的普價區。
通過以上分析可以看出:優質價區店鋪商品數較少,有一定規模的月銷量,最終單品月銷量最好,是理想的高優質鋪貨區;普價區店鋪商品數最多,月銷量最高,但是相比單品月銷量最低,并非是理想的優質鋪貨區,但也表現為最好的高銷量鋪貨區;高價區店鋪商品數也較少,月銷量表現較好,單品月銷量也很不錯,是電商店鋪值得考慮的高利潤鋪貨區;活動價區商品數和銷量都較少,但由于活動和價格因素,也促使該區成為消費者注意力和購買力高吸引鋪貨區。
(二)K-MENAS店鋪聚類店
為了更清楚區分店鋪類群,進一步了解不同店鋪類群的差異和特色,因此在斤價分區和分區內商品數基礎上進行K-MENAS聚類。首先通過SPSS軟件中系統聚類結果粗略分析K-MENAS聚類中K值為4,再進行K-MENAS聚類。其中,迭代歷史記錄顯示經過6次迭代,各類中心變化趨于0,初始中心間的最小距離為 11.619。經過聚類,1-4類案例數分別是29、485、3和6個店鋪。
(三)店鋪類群商品經營特色分析
根據最終聚類中心和斤價分區關系,從店鋪類群商品數進行特征分析。首先,根據表3聚類中心每類商品數和斤價分區關系進行可視化,結果如表4所示。最終聚類中心即是每個類的中心點數據,同時根據K-MEANS聚類規則也是該類商品數的均值。
因此表4顯示:店鋪1類主打普價區商品,同時兼顧活動區價區;店鋪2類僅以普價區商品為主;店鋪3類以普價區和高價區為主,同時活動區和優質價區也有商品鋪貨,可以說是有全系列商品銷售;店鋪4類主打高價區,同時鋪貨普價區和優質價區。因此,4類店鋪各有不同,反映了經營管理特色。比如店鋪3類,僅有3個店鋪,即天貓超市、天貓超市華北站、天貓超市華南站,但該類商品數眾多,分別為36、33和29個相關商品,雖不是自有品牌,但確實反映出在斤價區間上存在全系列鋪貨的經營特色。
(四)店鋪類群商品經營效果分析
經過K-MEANS聚類后店鋪1-4類在商品數和價格上有著明顯的經營管理特色,現將4類不同特色的店鋪類型與月銷量進行關聯分析,同時比較“月銷量/商品數”的狀況,以此得出經營效果。
圖3顯示每個類別的商品總數和月銷量總數以及月銷量總數/商品總數的關系。從月銷量規模上比較,店鋪2類在商品總數和月銷量總數上遙遙領先,商品4類在商品總數和月銷量總數兩個指標上都呈現出低開低走的態勢,店鋪3類商品總數較多但月銷量相比較少,店鋪1類商品總數較少但月銷量表現不俗。
從月銷量總數/商品總數有效性上比較,店鋪3類表現最好,商品單件月銷量有效性最高;店鋪2類次之,商品數最多,但是商品單件月銷量有效性落后店鋪3類很多;店鋪1類和4類都表現出商品單件月銷量有效性很低的情況。
結合店鋪經營特色發現,店鋪1類主打普價區商品,但兼顧活動價區,說明活動價區商品對月銷量有很大促進作用;店鋪2類僅僅主打普價區商品,呈現“以量換量”的態勢,即以店鋪和商品數量多換月銷量多;店鋪3類主打全系列價區商品,由于僅有3家店鋪商品總數體現不多,因此月銷量也表現一般,但在月銷量/商品總數中卻是表現最好的;店鋪4類主打高價區商品,因此商品總數和月銷量均不高。
結論與建議
在電商店鋪商品數據基礎上,通過K-MEANS聚類的經營策略研究方法,能夠幫助電商店鋪了解經營管理策略,并檢驗經營管理的效果。實證表明,基于K-MEANS聚類的電商店鋪經營策略研究模型在天貓“碧根果”電商店鋪商品斤價、商品數和月銷量等數據分析中有非常好的分析效果:通過統計斤價分區后商品數和月銷量的表現,從而發現競爭的紅海藍海等狀況;通過斤價分區后商品數K-MEANS店鋪聚類,聚焦店鋪商品鋪貨策略,能夠發現不同店鋪類型的經營管理效果和特色。
(一)電商店鋪經營策略
經過對電商店鋪斤價、商品數、月銷量等數據總體統計分析和數據挖掘,反映出碧根果電商店鋪經營策略特點,主要體現在以下幾點:
商品數和斤價表現出藍海紅海市場狀況。在數據總體統計分析中,經過斤價分區和商品數、月銷量關聯分析,發現普價區店鋪數和商品數非常多,雖然月銷量總體很高,但商品單件月銷量卻處于較低水平,反映出普價區呈現紅海特點,即該區競爭白熱化,是殘酷的“招招見紅”的紅海區域;優質價區店鋪數和商品數非常少,月銷量總體較高,商品單件月銷量是最高的區域,反映出優質價區呈現藍海特點,即該區競爭較少,是未被過度開發的“前景廣闊”的藍海區域;活動價區商品數較少,月銷量一般,商品單件月銷量較好,反映出活動價區呈現“低價大市場,提升知名度”的宣傳效果;高價區商品數少,月銷量一般,雖然商品單件月銷量表現一般,但是由于高價代表著高額利潤,反映出高價區是具有巨大潛力的“金牛”市場。
店鋪聚類反映出商品鋪貨狀況。在K-MEANS對店鋪聚類后,店鋪1-4類有明顯的競爭特色:店鋪1類主打普價區,感受到紅海競爭激烈的同時通過活動價區提升月銷量和宣傳;店鋪2類立足普價區,在紅海中努力經營,達到商品數和店鋪數高引起月銷量高的“以量換量”狀況;店鋪3類涉足活動價區、普價區、優質價區和高價區,經營全系列價區商品,有著商品全面性的獨特優勢,表現出商品單件月銷量有效性最高的狀況;店鋪4類主打高價區,同時在普價區、優質價區都有鋪貨,反映出走“中高端”路線的經營特色,但因為斤價高的因素,月銷量以及單件月銷量雖并不是很高,但可推測店鋪4類有較好的收入和利潤結構。
(二)電商店鋪經營建議
在對電商店鋪商品的斤價、商品數和月銷量分析基礎上,建議采用以下競爭策略:
尋找商品數和斤價的最佳定位。在市場競爭中,商品斤價和商品數是非常重要的經營項目,通過市場數據總體分析能夠識別出價格分布,加上商品數和月銷量,進一步區別競爭激烈的紅海區與未被發展的藍海區以及活動對經營管理的部分效果。此時,電商店鋪在商品斤價和商品數策略決策時,應該充分考慮這些因素,優先選擇“競爭少效益好”的良性市場機會,避免陷入“競爭多效益少”的惡性市場陷進。
在“碧根果”市場中,電商店鋪應該首先優質價區,并重點增加商品數,避免普價區的惡性競爭,相應減少商品數,同時結合活動價區的銷量提升和宣傳效果,適時開拓高價區,增長店鋪的經營利潤。通過這些競爭策略,能夠幫助電商店鋪明顯改善經營管理效果。
改善店鋪商品鋪貨策略。在商品鋪貨方面,市場數據能夠識別出不同鋪貨策略的經營效果,通過改善店鋪商品鋪貨策略,增加經營管理效果。在碧根果市場中,僅僅鋪貨普價區的鋪貨策略有明顯的經營效果不佳;以高價區為主,兼顧普價區和優質價區,該鋪貨策略使效益有所改善,但并沒有體現較強的優勢;主打普價區和涉足活動價區的鋪貨策略有明顯的經營效果,并體現一定的優勢;最佳方案是全系列鋪貨,數據反映以所有價區為鋪貨對象的經營店鋪在經營效果上最佳。
當然,在全系列鋪貨中,每個價區的鋪貨商品數應該根據該區的競爭狀況考慮,在優質價區重點鋪貨贏得市場占有率,普價區適量鋪貨贏得基本效益和成本,在活動價區少量鋪貨提升宣傳和銷量基礎,在高價區部分鋪貨贏得高額利潤和提升品牌。
參考文獻:
1.郭承龍.農村電子商務模式探析—基于淘寶村的調研[J].經濟體制改革,2015(5)
2.楊鵬.網絡論壇信息采集技術的研究與實現[D].昆明理工大學,2014
3.張玉峰,何超,王志芳,周磊.融合語義分類的企業競爭力影響因素分析研究[J].現代圖書情報技術,2012(9)
4.譚晉秀,何躍.基于k-means文本聚類的新浪微博個性化博文推薦研究[J].情報科學,2016(4)
5.劉萌,谷文林.大數據時代下電子商務的發展芻議[J].價格月刊,2016(4)
6.胡文俊,鄧虹.大數據時代對企業經營決策的影響分析[J].商業經濟研究,2016(7)