胡星辰,李波,吳萍
隨著我國經濟的進入發展的快車道,人們對生活質量的要求不斷提升,越來越多的群眾開始重視起對嬰幼兒的撫養問題,尤其是產品安全問題。在2008年震驚中外的三鹿奶粉事件之后,國產奶粉的質量問題被社會提上了熱點話題,也給國產奶粉帶來了信任危機。加之隨著互聯網經濟的發展,國外奶粉進入國人的視線,嬰幼兒奶粉的選擇面增加,我國奶粉行業的競爭愈發激烈。
當前很多學者對我國適齡生育父母嬰幼兒奶粉購買行為導向因素進行研究并得出不少消費者購買奶粉的影響因素。
劉華[1]通過對南京市消費者關于嬰幼兒奶粉消費者購買行為的影響的調查中,對消費者認知、風險感知和支付能力等因素對購買行為的影響進行研究。得到安全是消費者購買嬰幼兒奶粉時考慮的第一因素;而消費者認知程度越高、支付能力越強越傾向于購買價位更高的進口奶粉,說明國內奶粉依然由很長的路要走。不足之處是統計樣本較少只有167份,沒有進行抽樣調查也沒有系統的模型進行結果解釋缺乏說服力與比較。
于海龍[2]以北京市消費者為調查對象,運用統計描述法和Logit回歸模型,分析消費者對不同品牌嬰幼兒奶粉的選購行為及其影響因素。也同樣得到國外奶粉在中國的奶粉市場上占據明顯優勢,這是由于對國產奶粉質量不認同的原因;而消費者的風險感知、收入、子女數和性別是影響消費者選購奶粉的主要影響因素。不足之處是樣本具有顯著的地域特征,奶粉沒有分類處理,研究結果沒有普適性。
針對網上購物中“寶爸寶媽”們對嬰幼兒奶粉購買影響因素的影響,目前還沒有學者進行研究。本文以此為基礎,針對消費者在網上購買嬰幼兒奶粉的情況研究其背后考慮的購買因素,希望得到一個普適性的結論。
通過Python軟件對某電子商務平臺進行數據爬取,得到該平臺嬰幼兒奶粉的銷售情況導入EXCEL中,其中包括嬰幼兒奶粉的商品品牌、商品毛重、奶源產地、國產或進口、適用年齡、包裝單位、配方、分類、段位、團購價等指標。其中商品品牌、奶源產地、國產或進口、包裝單位、配方、分類等為非數據變量;商品毛重、段位和團購價等為數據變量。[3]
首先對數據進行預處理,由于我們選取了團購價與評價量作為單變量分布分析的指標,而每種奶粉在不同商家購買、團購價還要與商品毛重掛鉤。因此,我們還要求得每條購物信息之下的商品單位價格,設毛重為m,團購價為W,則單位價格w為:

在這里,我們選取毛重在(0.85- 1.15)kg之間的奶粉作為對象,統計單位毛重的價格即單價代表影響因素。
對于已知的n個數據點總可以唯一確定一條n-1次多項式曲線因為n個數據點都在曲線上,所以有


通過使用MATLAB對插值結果進行分析,線性插值的效果較為理想,如圖1所示。

圖1 商品毛重與評價量的線性插值圖
進一步通過MATLAB進行線性曲線擬合,效果如下圖2所示。

圖2 商品毛重與評價量的線性曲線擬合圖
線性擬合效果數據如下表1所示

表1 線性擬合效果數據表
我們能夠看到數據擬合的可決系數為0.4730,效果不是特別的理想,但是整體的發展規律與趨勢還是可以展示的。從圖1我們可以發現評價量處于較高位置水平的在區間[1,2]內,毛重超過或者低于該水平則評價量均不是很高。而從圖2可以判斷評價量最大值為1.5kg,也就是毛重為該水平的奶粉最受消費者歡迎。
3.1.1 結果分析
家長在購買奶粉過程首先考慮的肯定是質量保質期問題,他們會更多選擇剛生產的奶粉,而購買奶粉質量過重會出現奶粉開封時間過長導致的安全隱患,質量過小又會出現頻繁購買的麻煩,所以他們選擇重量適中的奶粉;而幾乎所有消費者都會有貪婪心理,在相同質量與價格下更傾向于毛重偏多的一方。
通過對數據初步整理,通過使用MATLAB對插值結果進行分析,線性插值的效果較為理想,如圖3所示。

圖3 團購價與評價量的線性插值圖
進一步我們通過MATLAB進行線性曲線擬合,效果如下圖4所示。

圖3 團購價與評價量的曲線擬合圖
線性擬合效果相關數據如下表3所示

表3 線性擬合效果數據表
從表3中可知線性曲線擬合的可決系數為0.7090,擬合效果較為理想;由圖3可知團購價在0-500元是大眾價格,是最大市場需求人群所能承受的價格區間,而100-400 元之間評價量最大,說明處于這個價位的奶粉最受市場歡迎。但是處于高價位 1000-2500 元即屬于奢侈品的奶粉也有少部分的市場需求量,卻微乎其微,這部分可能主要用于富人購買。總之,銷售商和生產商既要考慮普通大眾的價格承受能力,又要滿足富人對奶粉的高標準和低需求,不同價位的奶粉商品產品結構應該有所調整,不同價位的奶粉商品應該符合普通大眾和富人階層的人群比例。
3.2.1 結果分析
我國仍是處于發展水平,國民消費水平整體不是很高,人均收入水平任處于較低層次,所以在購買時候會首先考慮自身經濟承受能力,所以商家在生產奶粉定位價格的時候一定要考慮當前消費水平,以免出現供過于求,難以銷售。
將數據收集的EXCEL表轉化為奶粉數據.txt 文本,共有 846 條信息,在這846 條信息中由于奶粉的品牌、 場地和國產或進口等的不同,導致奶粉的評價量也不一樣。人為引入影響值αij代替文字語言,定義影響值:

其中,N是固定值846。
以該理論為基礎,將本文數據所有文字語言轉化為影響值,實現文字語言到數據的轉化。
①根據評價目的的確定評價指標體系,收集評價數據
根據文本挖掘處理的結果,得到846×11的純數字矩陣B。X1,X2,…Xn,分別表示商品品牌貢獻值、商品毛重、奶源產地貢獻值[5]、國產或進口貢獻值、適用年齡貢獻值、包裝單位貢獻值、配方貢獻值、分類貢獻值、段位貢獻值、團購價( n=10)的評價對象。矩陣如下:

②確定參考數據列
參考數據列應該是一個比較理想的比較標準,可以以各指標的最優值(或最劣值)構成參考數據列,也可以根據評價目的選擇其他參照值。記作
③對指標數據進行無量綱化

④逐個計算每個被評價對象指標序列(比較序列)與參考序列對應元素的絕對差值,即:

⑤確定

⑥計算關聯系數[6]
由⑤可計算每個比較序列與參考序列對應元素的關聯系數。
即

式中ρ分辨系數,在(0,1)內取值。若ρ越小,關聯系數間差異越大,區分能力越強。通常取ρ=0.5。
⑦計算關聯度
對各個評價對象分別計算其指標與參考序列對應元素的關聯系數的均值,以反映各評價對象與參考序列的關聯關系,并稱其為關聯度,記為:

通過MATLAB編程求解,可得到評價量與商品品牌、商品毛重、奶源產地、國產或進口、適用年齡、包裝單位、配方、分類、段位、團購價的關聯度數值,分別用人r1,r2...r10表示,如表4所示。

表4 各項因素關聯度表
進一步,我們用MATLAB得到各指標與評價量關聯程度的分布直方圖,如下圖4所示

圖4 指標與評價量的關聯程度直方圖
從圖中我們可以大體知道對評價量量影響大小的順序是:團購價>商品毛重>商品名稱>國產進口>段位>適用年齡>奶源產地>分類>包裝單位>配方。占據主要影響力的分別是團購價和商品毛重,這也說明我國消費者在購買奶粉過程首先考慮的是價格,這也符合大多數消費者心理,畢竟需要考慮自身經濟能力。這也提醒廠家在定位價格銷售時需要考慮大眾消費水平放在首位。
對于媽寶們來說,需要根據實際情況選擇合適的奶粉。每個孩子處在的不同的年齡段,需要有針對性的奶粉商品,不能夠隨大眾,各個年齡段都有著不同的最為適合的集中奶粉,應該考慮孩子自身的身體情況選擇奶粉的培養與原料。同時單位質量價格在100-500元/kg的奶粉最受歡迎,這既是考慮了性價比,又是考慮了不同階層群體的需要。其次,根據孩子在不同階段的需求及時改變不同階段的奶粉,并以單罐質量在1-2kg的奶粉為主,既可以保證奶粉不會浪費也可以保證減少購買次數節約時間。
