胡春華,趙 慧,童小芹,任 劍
(1.湖南工商大學大數據與互聯網創新研究院,湖南 長沙 410205;2.移動商務智能湖南省重點實驗室,湖南 長沙 410205;3.湖南省移動電子商務協同創新中心,湖南 長沙 410205)
電子商務與商務智能的快速發展使得消費者進入了一個物品繁多、信息過載的新時代,信息不對稱、選擇困難、時間成本差異等成為影響消費者消費行為的關鍵因素,推薦系統應運而生[1]。推薦系統是基于消費者以往瀏覽行為的數據,計算分析消費者的興趣,進而預測消費者喜好和購買意愿的復雜工具[2]。因此推薦系統可以改善消費者網購體驗,提高消費者黏性,從而提高下單轉化率和支付轉化率。
目前,國內外電子商務平臺使用不同推薦系統挖掘消費者興趣和偏好,緩解信息過載的問題。如淘寶Matrix推薦系統[3]構建了底紋推薦、首頁熱詞、下拉推薦、搜索發現等推薦平臺,京東Diviner推薦系統[4],Amazon的Instant推薦系統[5]等。由此可見,電子商務平臺中推薦系統的應用十分廣泛。雖然不同平臺間的推薦系統有一定區別,平臺也會根據不同的推薦任務和要求實時更新推薦系統,同一平臺的推薦算法也不盡相同。從消費者角度來說,消費者無需了解推薦系統的運作機理就可運用其在平臺上購物。推薦系統的差異性和網絡購買不存在直接關系,并不直接影響消費者在平臺的整體網購支出[6-7]。因此,本文暫不考慮平臺推薦系統的差異性影響。
Adomavicius等[8]研究了廣義的在線推薦對消費者購買意愿的影響,結果顯示不論是考慮偏好的推薦,還是有誤差的推薦,對消費者的購買意愿都有同樣的效果。即接受推薦系統在線評級和建議屬于使用了推薦系統,不再細分是否為定向推薦和非定向推薦。黃立威等[9]提出許多大型電子商務網站都應用了推薦系統。然而現有的電子商務網站中推薦系統多是面向個體,并不適用于向群體進行推薦。借鑒文獻[8-9]的研究,本文研究的是廣義的、實時更新的推薦系統,并不考慮群體差異的消費者個體網購支出的影響。
微軟研究報告指出,Amazon網站30%的頁面瀏覽量來自推薦[10]。Amazon關閉某一書目推薦后,將使該書目的銷售額下降40%[11]。推薦系統廣泛應用的同時也帶來了巨大的經濟效益;除消費者購買商品和服務等消費行為直接創造的經濟效益外,使用推薦系統的消費者還可以貢獻流量,Nazerzadeh等[12]和Davis[13]提出可以使用CPA(Cost per action)和CPL(Cost per lead)將流量轉化為經濟價值,豐富產品附加值;Digg使用了UserCF算法設計上線推薦系統后,該平臺消費者活躍度增加了40%,評論增加了11%,好友數增加了24%,證明推薦系統應用后能使智能商務網站具有更好的活躍度和實用性。
使用推薦系統對消費者網購有哪些方面的影響,影響是否顯著以及如何有效客觀地評估推薦系統對消費者網購的影響成為頗具挑戰的問題[14]。
從推薦系統對消費者影響因素不同的角度可以將已有研究分為以下三類:
第一類是通過社交信任影響消費者網購。Geng Bingrui等[15]和Guo Taolin等[16]認為社交互動與分享社交化鏈接能幫助消費者尋覓到感興趣的商品,鏈接越豐富,向消費者推薦效果越好。Bach等[17]認為消費者評論為消費者交互、消費者購買提供重要了手段。Xiao和Benbasat[18]研究了有偏見的個性化產品推薦代理,結果顯示93%的消費者會受推薦影響,對推薦的產品有極高的信任并購買該產品。Chen Yanhong等[19]拓展了沖動、推薦信任對消費者網購的影響。但研究背景限于微信平臺,沒有比較產品或服務類型。張哲宇等[20]認為消費者主動提供的消費評價可信度更高,也更具參考價值。郝玫和馬建峰[21]提出消費者評論的情感可信度指標,從而篩選高可信度的典型評論向消費者進行推薦。尹進等[22]認為不同親密度的朋友提供的推薦信息往往會對消費者有不同影響,越親密的關系在推薦過程中起到的作用越明顯。考慮消費者交互信任關系的推薦系統能提升消費者對非目標產品點擊率,降低消費者網購決策時間[23]。
第二類是通過提高消費者滿意度和忠誠度影響消費者網購。Baier和Stüber[24]和Lee和Kwon[25]研究表明推薦購買可以提高消費者對推薦產品的滿意度、購買意向,增強消費實際購買力,增加零售商的銷售額。Zhang等[26]研究表明推薦系統每降低1單位消費者篩選商品的時間成本,可提高9.4%的消費者忠誠度。有學者研究發現準確率高的推薦系統可能會導致商品服務范圍過小,降低消費者對推薦系統的好感度,應當綜合考慮覆蓋率、召回率等指標[27-29]。綜合考慮消費者社會關系及用戶影響力的社會模型,對提高召回率、滿意度有一定的優勢[30]。Dabholkar和Sheng[31]認為推薦能降低消費者的風險擔憂,消費者使用推薦會獲得更高的滿意度、忠誠度、更高的購買意向。
第三類是通過預測消費者偏好影響消費者網購。Liu Chienliang和Chen Yingchuan[32]提出基于隱變量模型的迭代因子分析方法為消費者提供實時動態推薦,結果表明更新速度快的推薦能夠更好地預測消費者偏好,增加購買行為。Sarwar等[33]認為消費者瀏覽到商品的概率和該商品在網站推薦列表的排序具有反向關系,消費者使用推薦系統更有可能增加計劃外消費。Zhang Qian等[34]提出了CIT(Consistent information transfer)模型,結果顯示推薦系統能夠預測消費者潛在消費和服務。Fleder和Hosanager[35]認為提高推薦系統多樣性有助于消費者增加購買行為。Schreiner等[36]從消費者性別角度研究得出女性更喜歡基于CF算法的推薦,男性傾向于參考最暢銷產品的推薦。考慮情境化消費者偏好的推薦可以更大程度的滿足群體消費者的個性化需求,促進消費者網購[37]。張立功等[38]認為網絡購物可能造成消費者偏好的不確定性,會使消費者承擔更多的購物風險,降低其購買意愿。朱志國等[39]指出消費者的移動性會改變其興趣點,考慮消費者社交范圍的推薦會提高推薦效果。
綜上所述,國內外關于推薦系統的效應研究大多圍繞推薦系統對智能商務平臺影響等方面,從消費者角度研究的文獻較少;現有對推薦系統影響消費者網購的文獻多為影響因素研究:推薦系統可以通過社交信任、預測消費者偏好、提高消費者忠誠度等來影響消費者網購,研究推薦系統對消費者影響效果評估的文獻較少;推薦系統的研究多集中在如何提高推薦系統的準確性,忽視了推薦系統的新穎性、多樣性、長尾效應、覆蓋率等評價推薦系統的經濟效益指標。現有對推薦系統影響消費者行為的研究還處于初級摸索階段。本小組設計實現了面向社交電商環境的TDA-RBM算法,研究了基于信任和不信任關系的實值受限玻爾茲曼機推薦,構造了信任-不信任監督機制,結果顯示考慮社交信任的推薦對消費網購的推薦效果更優[40]。因此本文在團隊成果基礎上,研究使用推薦系統對消費者網購支出的影響,評價推薦系統的經濟效益。
本文在消費函數的基礎上,主要從推薦系統影響消費者網購支出角度展開了研究,提出了待驗證的研究假說:使用推薦系統是否影響消費者在智能商務網站的購物支出。文章使用了消費者層面的微觀調查數據,借助相關理論使用傾向得分匹配法對研究假設進行實證分析,來改善消費者“自選擇”是否使用推薦系統產生的內生性。并且使用多種匹配方法、工具變量法進行穩健性檢驗,證明了使用推薦系統的消費者比不使用推薦系統的消費者有更高的網購支出。
本研究數據來源于消費者調查問卷,借助國內較大的“問卷星”平臺形成網絡鏈接及二維碼。問卷以國內經常網物的消費者作為研究對象,并分層次納入了不同地域(臺灣、澳門除外)消費者樣本。樣本設置了篩選原則,即消費者必須傾向于網購而不是國內實體店購買商品。
該問卷調查時間為2018年8月-2019年6月,共回收問卷4540份。其中調查方法1:在微信等社交平臺發布了電子問卷的網絡鏈接。根據該程序回收問卷數據共計1368份。調查方法2:通過問卷星的樣本服務發放問卷,根據該程序回收問卷數據共計3172份。對相關數據進行預處理,將邏輯不符、惡意填寫等不符要求的問卷數據作為無效問卷剔除,其中方法1剔除無效問卷325份,有效問卷為1043份;方法2剔除無效問卷1127份,有效問卷為2045份。共回收有效問卷數據3088份,回收率為68%。其中,男性占43.04%,女性占56.96%;年齡構成分布如下:23歲以下占23.51%,23-28歲占24.97%,28-33歲占23.09%,33-38歲占11.88%,38-43歲占7.55%,43歲以上占9%;受教育程度分布如下:初中及以下占2.4%,高中及專科占19.14%,大學占69.59%,研究生及以上占8.87%。
調查采用了結構化的問卷調查,問卷的核心內容包括(1)消費者概況,如年齡、性別、消費理念、所在區域、受教育程度等。(2)消費者收入概況,如主業是否具有穩定收入、月收入數值區間等。(3)消費者使用推薦系統的態度,如使用智能推薦系統的頻數、對推薦系統的了解程度、對推薦系統的接受程度等。(4)推薦系統的影響,消費者是否選擇使用推薦系統和使用推薦系統后消費者網購次數變化、網購總額的變化、技術影響消費的實現方式等。
本文使用SPSS25.0利用Cronbach’s Alpha值來計算信度,由表1可知,α值均大于0.6,說明問卷信度較好。
本文利用因子分析法測量結構效度。由表1可知,KMO值均大于0.6;巴特利特球型檢驗中顯著性水平均小于0.01,說明問卷,適合做因子分析。各主成分的平均方差提取值分別為73.801%、73.933%,說明本文的問卷結構效度較好。

表1 信度和效度分析
綜上,本文的信度和效度都符合數據分析的要求。
根據消費調查,本文將調查樣本按照Bejarano等[41]和Maghrabi等[42]提出的自選擇分類方法分為使用推薦系統和不使用推薦系統兩大類。調查結果顯示:在3088個消費者樣本中選擇推薦系統的消費者有1853個,占樣本總體60%,沒有選擇推薦系統的消費者有1235個,占樣本總體的40%。其中自選擇的含義為:是否使用推薦系統應用并不是隨機分配給消費者,而是消費者自己選擇使用推薦系統購買或自行搜索購買。本文的自變量T為一個二元變量,表示消費者是否選擇使用推薦系統。當其值為1時代表消費者選擇使用推薦系統購物,值為0時則代表選擇不使用推薦系統購物。本文最關注的因變量是消費者的網購消費能力,本文分析的因變量受諸多因素影響,如個人收入、所在城市(鄉村)整體消費水平、消費觀念、科技要素,審美變化等,因此在實證分析模型中還考慮了男女成員比例、教育程度、年齡、消費環境、消費經歷等消費者個人信息特征。表2衡量了使用推薦系統網購消費者和未使用推薦系統網購的消費者的基本特征以及兩者差異。可發現,使用推薦系統的消費者和未使用推薦系統的消費者收入上有一定的差異;同時使用推薦系統的消費者有更高的網購消費支出;不使用推薦系統網購的消費者有更高的平均年齡、更低的受教育程度(t檢驗均在1%水平顯著)。

表2 消費者描述性統計分析
由圖1可見,廣告信息過多、虛假的評論和銷售量是阻礙消費者使用推薦系統的兩大原因,因此推薦系統要著重改善垃圾廣告、虛假買家秀、刷單等問題。由圖2可見,節約時間、便于找到性價比更高的產品是各年齡段消費者選擇使用推薦系統的主要原因。綜合圖1和圖2,18歲以下消費更加輕率,可以增加好友推薦的商品供其選擇。18-43歲的消費者使用好友推薦較少,更注意隱私保護,因此推薦系統可以減少監聽套取隱私,降低消費者疑慮。28歲以上的消費者更注重購買產品的性價比,43歲以上的消費者更節省時間。因此,推薦系統更應提高推薦的精準性和有效性,方便消費者在短時間內找到其喜愛的、性價比高的產品,提高其購買力。

圖1 消費者不使用推薦原因

圖2 消費者使用推薦原因
對消費者接受推薦后更傾向于網購的產品進行描述性統計分析。結果表明:消費者使用推薦系統主要購買的產品是休閑零食和服裝鞋襪。
僅有8%的消費者傾向于使用推薦購買醫藥保健產品,消費者使用推薦系統購買醫藥保健、糧油副食類的意向與年齡成正比。33歲以下的女性消費者更傾向于使用推薦購買洗護彩妝產品。33-43歲的消費者更傾向于使用推薦購買家用電器產品。在43-48歲的消費者中,使用推薦系統購買數碼產品的占46%,購買辦公產品的消費者僅占4%。
一般來說,顧客忠誠度可用顧客滿意度、重復購買率以及好友推薦率來衡量。如圖4,大多數的消費者最關注店鋪中的其他商品,而不是在店鋪中重復購買同一商品和服務,因此推薦系統可多為消費者推薦同一店鋪中互補商品。

圖4 使用推薦系統對消費者忠誠度影響
其次,消費者關注和在乎好友推薦,并且在各年齡段影響力都比較大。28-43歲的消費者最喜歡將買過的產品向朋友推薦,推薦結果受社交影響。因此推薦技術應注重基于社交關系的推薦。
除此之外,使用推薦后,消費者會更傾向于選擇重復購買、關注買過的店鋪并將其作為首選店鋪,并且訪問的時間次數都有所增長。為了提高推薦效果,推薦系統應提高向該消費群體推薦店鋪的質量和聲譽。
綜上所述,推薦效果受社交關系、互補產品、店鋪聲譽等因素影響。
本文將消費者購買力這一定性指標量化為消費者的消費函數的一部分來反映消費者網購支出關系。消費函數中主觀因素和客觀因素都可以影響消費者購買力,其中主觀因素包括消費者的消費習慣、消費心理、社交影響等。客觀因素包括收入水平、行業規范、科技創新、推薦系統發展等。因此可以看出消費者是否使用推薦系統可能會對消費者的消費心理和消費行為產生影響。
消費函數為:C=α+βy。其中C代表消費支出,y代表消費者收入。α為消費者自發消費,即消費者結合自己的剛需決定消費的部分,可以理解為消費者為了生存所需要的固定消費。β為邊際消費傾向,是值在0到1之間的參數,而βy代表的是由收入變化引致的消費。
杜森貝里提出相對收入假說理論,該理論認為消費者會因為消費心理的變化改變自身消費行為。其中最具有代表性的是攀比效應和示范效應。而智能商務環境中的推薦系統的興起與發展剛好為消費者提供了消費環境與技術支撐。消費者可能會因此更快捷有效的發掘喜歡的商品、好友推薦的商品。名人使用的具有示范效應商品,可能會觸發計劃外消費或者超前消費。
杜森貝里提出棘輪理論來進行佐證,該理論認為消費者的消費行為是不可逆的。這種消費行為受許多因素影響,如個人消費習慣、好友間攀比示范、網站推薦等。消費者網購支出最高時期的消費行為對消費者之后的購買行為有重大影響。因此,消費者可能在使用推薦系統后出現提高網購支出以及網購次數的情況。
本文在消費函數中考慮推薦系統的技術效應,則:C=α+βy+λT,此時λ為邊際消費傾向,是值在0到1的參數,T代表一個二元變量,而λT代表的是由推薦系統引致的消費。
因此本文在上述理論基礎上,提出待驗證相關假設:智能商務環境中推薦系統對消費者網購支出是否具有積極正向的作用,即在相同的資源條件下,使用推薦系統的消費者是否比未使用推薦系統的消費者有更高的網購支出。
本文使用的方法為傾向得分匹配法(PSM),目的是將推薦系統獨立于其他影響消費者購買力的因素情況,調查推薦系統的使用對消費者網購支出效應及其穩健性。傾向得分匹配法是由Rosenbaum和Rubin[43]首次提出的,該方法可以將消費者多維信息特征降維成一個傾向得分因子,在得分基礎上將使用推薦系統的消費者和未使用推薦系統的消費者進行匹配,分析結果網購支出差異得出推薦系統對于消費者網購支出的凈效應。鑒于不同匹配方法各有優劣,通常采用多種匹配法進行匹配以保證穩健性。
傾向得分匹配法優點:第一、常用的描述性統計分析的方法會高估使用推薦系統對消費者網購支出的經濟效應。第二、傾向得分匹配法可以做到將多個變量降維為一維傾向得分。第三、Wooldridge[44]認為傾向得分匹配法只需要滿足條件獨立性假設和共同支撐兩個前提假設,受限較少,匹配完成度較好,樣本損失率低。第四、Glenn等[45]認為在線測試ABtest必須要求消費者從始至終只能選擇一種方案并產生淘汰機制,傾向得分匹配法能夠很好的保護樣本。
傾向得分匹配法的主要特征是創造隨機試驗條件進行樣本比較。但使用傾向得分匹配法的前提需要滿足兩個假設:
(1)條件獨立分布假設檢驗:我們假設存在一組不受推薦系統影響的可觀測的協變量X,且消費獨立于推薦系統的使用。在這個假設下,消費者是否使用推薦系統不是預先設定的,而是由消費者自行選擇的,結果呈隨機分布。在此基礎上比較相同條件稟賦的消費者在使用推薦系統和不使用推薦系統的情況下的網購消費支出差異。
(2)共同支撐假設:假設PSM的傾向得分(Propensity Score)是介于0到1的參數,即同樣具有X特征的消費者會具有使用推薦系統和不使用推薦系統的正向概率。該假設排除了傾向得分的長尾效應,提高了消費者匹配的精度和準度,但是會使消費者匹配樣本減少。Heckman等[46]提出非參數匹配方法必須是建立在共同支撐的條件下才是有意義且可討論的。因此我們很難避免用一定量的樣本損失來換取匹配質量的提高。
選用傾向得分匹配法原因:由于商業目標最本質的性質就是平均一個消費者能給經濟社會帶來的盈利。因此我們首先考慮分析同一消費者使用推薦系統前后網購支出,以探究推薦系統對經濟社會所貢獻的效益。這要求掌握該消費者使用推薦系統前后的數據,并且控制除消費者是否使用推薦系統外,其他可能影響消費者購買力的因素不變,而該條件控制很難保證準確實現。其次,不同的消費者在年齡、收入、消費觀念等條件方面有很大不同。單獨比較使用推薦系統的消費者與未使用推薦系統的消費者的網購支出是否存在差異,不能保證消費者網購支出提高與使用推薦系統有直接因果效應。所以借鑒Kahneman等[47]運用反事實的情況,即尋找與使用推薦系統的消費者個人基礎信息相似不使用推薦系統的消費者,然后將兩者的網購支出相比較。由于兩者的個人特征相似,所以兩者網購支出差異是使用推薦系統后消費者網購支出的直接技術效應。
本文借鑒了部分Caliendo和Kopeinig[48]傾向得分匹配法的步驟:在考慮變量的情況下,選擇使用probit或者logit模型分析估算傾向得分;根據得出的傾向得分將消費者進行匹配,執行匹配的方法具體有最近鄰匹配法(Nearest Neighbor Matching Mathod)、核匹配法(Kenel Matching Mathod)和半徑匹配法(Radius Matching Mathod)等;通過比較兩組消費者匹配前后的偏差變化率、Pseudo-R2值等來分析不同匹配方法質量的差異;采用“剪枝(Trimming)”理論來檢查假設條件引發消費者樣本的損失的情況。
傾向得分匹配法中匹配估算消費者是否使用推薦系統的決定方程:
PS(X)=Pr[T=1|X]=E[T|X]
(1)
X定義為影響消費者使用推薦系統的宏觀特征因素,PS定義為使用推薦系統消費者的概率,又稱為傾向得分。通常建立Probit模型,計算每一個消費者的傾向得分,然后將傾向得分作為消費者之間匹配的依據。
樣本整體的平均技術效應(ATE)為:
τi=PS·[E(Y1|T=1)-E(Y0|T=1)]+(1-PS)·[E(Y1|T=0)-E(Y0|T=0)]
(2)
PS表示消費者使用推薦系統(T=1)的概率;Y1是消費者使用推薦系統效應;Y0是消費者不使用技術的效應。方程(2)表示整個樣本的技術效應為消費者使用推薦系統和不使用推薦系統的加權平均效應。然而反事實情況E(Y1|T=0)和E(Y0|T=1)是不能直接得出的。在僅考慮使用推薦系統的消費者樣本的情況下,研究消費者樣本的平均技術效應(ATT),需要構造一個反事實E(Y0|T=1)。使用推薦系統的消費者樣本平均技術效應(ATT)可以表示為:
τATT=E(τ|T=1)=E(Y1|T=1)-E(Y0|T=1)
(3)
基于上述的討論,推薦系統對消費者的平均技術效應,即ATT的傾向得分匹配評估可以從兩組消費者的網購支出水平的平均差異得到,表示如下:
(4)
采用多種匹配方法可以在一定程度上提高穩健性,因此本文分別使用最近鄰匹配法、半徑匹配法和核匹配法進行匹配。
最近鄰匹配的規則為:
C(i|T=1)
(5)
其中i|T=1代表使用推薦系統的消費者,i|T=0代表未使用推薦系統的消費者,C(i|T=1)為與消費者i|T=1成功匹配的消費者i|T=0的集合,即傾向得分與消費者i|T=1最為近似的消費者集合。
半徑搜索的規則為:
C(i|T=1)
(6)
r 定義為匹配需要的半徑又被稱為卡尺或者卡鉗,上式為所有消費者滿足傾向得分與既定的消費者i的傾向得分差異小于等于r的集合。經過初步匹配,同時參考 Becker和Ichino[49]研究中ATT的計算方法得出公式:
(7)

(8)
與最近鄰匹配法、半徑匹配法原理不同,核匹配法引進了非參數估計概念。為了對消費者i|T=1進行高質量匹配,需要將既定PS值附近的未使用推薦系統網購的消費者加權運算,權重與消費者i|T=1和消費者i|T=0的PS值之差相關。
核匹配方法對應的ATT估算公式為:
(9)

本文實驗采用Stata14.0分析實驗數據,數據包含了消費者的基本信息、支出情況、對推薦系統的態度以及消費者在推薦系統使用前后消費支出變化。本文對相關數據進行預處理,有效數據3088份。
在簡單最小二乘法(OLS)回歸分析中只使用treat變量(OLS1)區分使用推薦系統的消費者和不使用推薦系統的消費者的情況下影響系數是顯著的。使用推薦系統的消費者比不使用推薦系統的消費者網購支出高26.6%,如表3所示。
考慮結果的可解釋性,OLS回歸采用對數線性模型,對因變量消費者網購支出取對數。為了提高精準性,在此基礎上加入了控制變量的模型(OLS2),仍然得出相同條件下,使用推薦系統的消費者比不使用推薦系統的消費者網購支出高16.7%,如表3所示。教育程度高低對網購支出有顯著作用,原因可能是教育程度越高的消費者對推薦系統更容易接受,故接受度也就比較高。

表3 兩組消費者OLS分析
Probit主要分析了各變量對消費者使用推薦系統的影響。研究中參與傾向得分估算的特征變量有性別、年齡、教育程度、所在地區等。從表4中可以看出消費者年齡增與使用推薦系統的概率呈反比,消費者的所在區域越接近城市,使用推薦系統的可能性越高。女性使用推薦系統的概率明顯高于男性。年輕人更易受到推薦系統的影響。

表4 不同匹配方法的Probit估算結果
通過對消費者特征變量進行傾向得分估算,可研究使用推薦系統的消費者和不使用推薦系統的消費者的得分平衡性是否滿足條件,在此基礎上使用合格的得分計算最終傾向得分。
ATT是指消費者使用推薦系統對消費者網購支出(對數形式)的平均效應,即使用推薦系統的消費者與不使用推薦系統的消費者在網購支出上的花費差異。從表5可以看出,不論哪一種匹配方法,結果都顯示使用推薦系統的消費者與不使用推薦系統的消費者有更高的消費,即推薦系統的技術效應是正向的。

表5 基于傾向得分匹配法的ATT值
但是不同的匹配方法的ATT結果略有不同:最鄰近匹配法ATT值為18.4%、卡尺0.001匹配法ATT值為14.7%、卡尺0.01匹配法ATT值為14.9%、卡尺0.1匹配法ATT值為14.7%、核匹配法ATT值為15.9%。匹配方法都滿足顯著性(在1%水平顯著)。
表6從三個衡量匹配質量的指標來計算不同匹配方法在匹配前后的數值變化,在匹配前所有消費者的平均標準偏差值為12.7,匹配后的平均偏差均出現了較大幅度的下降,其中最近鄰匹配法平均標準偏差值降為3.7,下降比例為70.9%。

表6 不同匹配方法的匹配質量
使用卡尺匹配方法后,匹配質量顯著提高。刻度卡鉗為0.1和0.01時,平均標準偏差值分別降2.1和2.2,下降比例分別83.5%和82.7%。所以卡尺匹配的過程能夠很好地平衡使用推薦系統的消費者和未使用推薦系統的消費者的個體特征。核匹配的質量介于最近鄰匹配法和卡尺匹配法之間,平均標準偏差值降為2.2,下降比例為82.7%。除此之外,Pseudo-R2匹配前值為0.019,匹配后各匹配方法下降比例均達到89.5%。核匹配法匹配后值非常小,說明匹配變量在使用推薦系統的消費者和不使用推薦系統的消費者之間沒有分布沒有系統差異。且匹配前t檢驗值為7.78,經不同方法匹配后,t檢驗值下降比例均達到43.4%。因此傾向得分匹配法將推薦系統從其他影響消費者的因素中獨立出來,證實了使用推薦系統對消費者網購支出有正向作用這一結果更有可信度。
圖5為匹配后消費者傾向得分密度分布圖,橫軸代表傾向得分數值,縱軸代表傾向得分概率密度分布。從圖可以發現,相對于匹配前概率密度分布,匹配后,使用推薦系統的消費者和未使用推薦系統的消費者的密度分布曲線均比未匹配的密度分布更加接近,表明匹配結果較好。處理前的數據,處理組呈現出尖峰分布,對照組呈現相對平峰分布,處理組和對照組之間差異較大,而經過不同方法的傾向得分匹配處理后的數據,處理組和對照組之間的差異性得到了較為明顯的調整,兩個組之間的密度分布更為接近,對于后續的分析意義更為嚴謹。

圖5 傾向得分密度分布圖
平衡性假設要求匹配后各變量在使用推薦系統的消費者組和不使用推薦系統的消費者組不存在顯著差異。匹配后標準偏差的絕對值越小,匹配效果越好。變量的標準化偏差(% bias)大都小于10%。偏差變化的百分比(%Reduct|bias|)反映的是PSM前后數據匹配程度的變化,表明平衡性提升的幅度。表7結果顯示除性別、教育程度外的其他變量在匹配前的t值都是顯著的,而匹配后均不顯著。樣本中特征變量經過傾向得分匹配后,標準偏差明顯減小,其中,年齡、地區等變量的標準化偏差經過匹配后下降幅度都達到80%以上,并且在幾乎所有稟賦

表7 傾向得分匹配法匹配前后平衡性分析
特征變量下,使用推薦系統和不使用推薦系統的差異不再顯著使用推薦和不使用推薦的稟賦特征差異基本得到了消除,表明平衡假設得到驗證,即使用推薦和不使用推薦之間消費支出差異的結論是可信的。
傾向得分匹配模型中分別使用了最近鄰匹配法、半徑匹配法和核匹配法來估算推薦系統的使用對消費者網購支出的影響。不同匹配方法的在趨勢和大方向上相類似,但結果有一點差異,如表8所示。最近鄰匹配法和核匹配法的損失情況較少,損失率僅為0.19%,其中最近鄰匹配法的設定是無替換最近鄰匹配。半徑匹配法的樣本損失率較高,損失率受卡鉗設置的影響,卡鉗數值越小范圍越受限,消費者樣本的損失率越高。由于共同支撐區域的差異可能會導致半徑匹配法估算結果相對于其他的匹配方法出現樣本代表性降低的情況。

表8 共同支撐導致的消費者樣本損失統計
為了驗證傾向得分匹配法的實證結果,本文選擇使用工具變量法進行穩健性檢驗,如表9所示。由于樣本中的消費者來自不同的省份和地區,考慮到不同省份城市規模、金融商業、文化底蘊等虛擬變量可能與未納入模型的遺漏變量存在相關性。該變量能影響消費者自主選擇是否使用推薦,又對消費者網購的行為有一定影響。如一、二線城市和三、四線城市會因為經濟發展水平高低、文化素養差異會自選擇是否使用推薦,同時導致消費者網購消費支出數值不平衡的相關情況,即內生性問題。為了消除內生性,我們用工具變量法來研究推薦系統對消費者網購支出的影響效應,引入省份虛擬變量作為城市-農村虛擬變量的工具變量。結果顯示使用推薦系統的消費者比不使用推薦系統的消費者網購支出高16.5%,低于回歸方程的結果26.6%、16.7%,因此能夠改善高估推薦技術的效應的弊端,與傾向得分匹配法結果相近,進一步檢驗了匹配結果的穩健性。

表9 工具變量法分析
推薦系統對消費者的消費方式與網購支出的影響是一個值得研究的問題。本文在消費函數理論背景下,構建了推薦系統對消費者網購支出影響研究框架,提出了待驗證假說,并使用傾向得分匹配法進行假說驗證。
本文調查了消費者層面的數據,分析了推薦系統對消費者網購支出的影響。推薦系統對消費者網購支出的影響是復雜的,一般認為推薦系統的進步會有較好的經濟價值。在消費者自行選擇是否使用推薦系統的情形下,消費者使用推薦系統的行為是由一系列以個人特征和消費習慣等變量決定的,所以我們使用了傾向得分匹配法來分析評估推薦系統對消費者網購支出的效應。并且本文在推薦系統效應的評估分析上使用了不同的傾向得分匹配方法來計算推薦系統對消費者購買力的經濟效應,具體匹配方法不同會產生不同的共同支撐區域,從而造成消費者樣本損失與匹配質量的差異,但樣本損失率均低于2.59%。其中,最近鄰居法與核匹配法中消費者樣本信息損失較少,匹配質量欠佳。卡尺匹配法會實現較高的匹配質量,代價是會損失較多的消費者樣本信息。
研究結果表明:使用推薦系統對增加消費者的網購支出具有穩健的正向作用。調查發現,OLS1和OLS2計算出使用推薦系統的消費者比不使用推薦系統的消費者人均網購支出高26.6%和16.7%,使用傾向得分匹配法對消費者匹配后得出結果僅為14.7%,該結果能改善描述性統計分析以及最小二乘法高估推薦效應的弊端。除此之外,本文使用工具變量法對傾向得分匹配法的結果進行進一步的穩健性檢驗,得出使用推薦系統的消費者比不使用推薦系統的消費者月人均網購支出高16.5%,與傾向得分匹配法結果基本相同。得出使用推薦系統對增加消費者的網購支出具有穩健的正向作用。
除此之外,推薦系統對消費者網購的影響還可以體現在對消費者網購產品和網購忠誠度方面:推薦系統可以著重向33歲以下的女性消費者推薦洗護彩妝產品、向23-33以及43-48的消費者推薦數碼產品、向33-43歲的消費者推薦家用電器、向33歲以上和28歲以下的消費者推薦醫療保健產品、向48歲以上的消費者推薦家居清潔產品;同時在主頁面向各年齡段消費者加大關于休閑零食和服裝鞋襪的推薦。
推薦技術應注重向28-43歲的消費者加大基于社交關系的推薦、向38歲以上的消費者推送重復購買商品鏈接和店鋪信息。商品的價格上升會導致消費者的流失,因此要合理控制價格的短期漲幅,增強消費消費者黏性,除此之外推薦系統要積極改善垃圾廣告、虛假買家秀、刷單、泄露隱私等問題,同時提高推薦系統的新穎性,有助于提高消費者的滿意度和忠誠度。將來可進一步細化分析定向和非定向推薦機制對消費者推薦的采納率影響,著重分析平臺間推薦系統差異對消費者網購支出的具體影響。