李明琨,葛藝博
(上海大學 管理學院,上海 200444)
隨著互聯網快速的發展,電子商務作為新型的商業運作渠道,逐漸顛覆傳統商業營銷模式。相較于商家占主導的傳統信息傳播形式,在虛擬的網絡購物平臺中消費者更傾向于利用以用戶生成內容(user generated contents)為核心的評價系統進行信息交換與口碑傳播。潛在消費者利用在線評論內容獲取產品信息[1],降低購買風險和不確定性[2]。商家依靠評論內容促進產品銷量[3],尤其是新上線產品的銷量[4],以此提升知名度和品牌效應。第三方平臺則根據用戶評價內容對店鋪進行流量管理。通過累積動態評分來判斷商家的受歡迎度,并給予優秀商家更多的流量[5]。這種評價規則無疑導致賣家優者更優,劣者更劣。評論內容不僅關乎到消費者的購買決策,更關乎到商家在平臺中的“存亡”。為了在激烈的市場競爭中不被淘汰,商家已不滿足消費者自發的分享購物經驗,而是通過推出“好評返現”、“好評返券”等新的好評獎勵機制,試圖刺激消費者的評論積極性,由此提高店鋪的動態評分。
從營銷的視角,商家可通過各種形式的獎勵策略激勵已有顧客將所購商品以口碑傳播的形式推薦給潛在顧客[6]。好評獎勵可為消費者帶來優惠,為商家帶來銷量,為第三方平臺帶來點擊量,因此,此類營銷方式一經推出便被廣泛使用。然而,消費者在獎勵刺激下給出的評論信息可能存有不實的狀況[7]。本應以“信任”為基礎發展起來的電商市場逐漸充斥了為“掙好評”而出的虛假信息,部分評論成為變了味的推銷。究其原因,有學者認為是消費者見小利而忘大義、助紂為虐導致的結果[8];也有學者將其歸結于商家的逐利性[9],并站在“商業賄賂”的角度闡述賣家好評獎勵行為對自身、消費者及市場造成的危害[10]。這些研究的一個基本假設前提是消費者及商家的完全經濟理性,即逐利。然而,獎勵對消費者撰寫評論有著更為復雜的影響[11]。消費者亦可能出于對商品不盡滿意后的損失厭惡及補償心理給好評拿獎勵,或是出于對平臺“差評騷擾”的擔憂而妥協[12]。另一方面,賄賂性好評的存在使得消費者重新審視在線評論的價值[13],越來越多消費者甚至忽略好評只關注差評,這又使得商家需斟酌使用其營銷手段。
對好評獎勵的研究可以從消費者的視角探討口碑傳播及消費者推薦意愿的影響因素。如張德鵬等[14]利用社會心理學,證明顧客參與對口碑推薦意愿有顯著的調節作用。戴國良[15]研究發現,滿減、特價、秒殺等不同促銷方式對消費者口碑傳播意愿有不同的作用。謝毅等[16]則認為消費者的口碑傳播意向會受品牌信任和品牌情感的共同影響。以商家好評獎勵行為為重點,可探討賣方的非倫理行為及其產生的影響。如黃蘇萍等[17]聚焦國內在線評論呈現極度正向偏移分布的偏差現象及形成機制,認為商家經濟獎勵是消費者正面評價的主要動機。同樣,沈超等[18]通過仿真實驗也論證了商家誘導行為會提高商品好評率,進而獲得競爭優勢。然而,王曉蓉等[19]研究發現獎勵披露會降低消費者對產品的信任度。李研等[20]基于心理抗拒理論,也證明了被迫好評會消極影響消費者的整體滿意度,并抑制其后續購買行為。
可見,在現實生活中,消費者的評論行為并不僅僅取決于對產品或服務本身的滿意度,而是根據整個交易過程中的感知收益和感知成本來權衡的。消費者的好評動機可能是因為擁有了較滿意的產品或服務,也可能是為了獲得“額外獎勵”所帶來的喜悅感[21],或是出于有限理性下的損失厭惡心理[22]。電商好評獎勵策略與消費者推薦行為之間可能存在動態博弈的過程。根據獎勵形式的不同,好評獎勵通常有現金獎勵和優惠券獎勵,好評獎勵的效果在一定程度上取決于獎勵的設計和獎勵的形式[23]。對于商家而言,為激勵消費者發表產品評論提供經濟回報,需要考慮財務成本和產出效益[24]。相較于現金獎勵,好評返券可以拉動回頭客創造一定比例的二次消費[25]。對于消費者而言,返現是其更加偏愛的方式[26],然而引發的賄賂性虛假評論的爭議亦更大,商家需考慮政府懲罰風險及爭議的負面影響。而返券要求消費者必須進行二次消費,通常還有使用的時間、場所以及購買產品類別等方面的限制,激勵效果有限。商家與消費者群體如何選擇策略獲得更大的收益,是一個群體不斷探索和演化調整的結果。因此,本文區分好評返現與好評返券策略,進行博弈的推演及比較分析。
通過總結以往文獻,消費者在線評論與商品本身的質量、消費者心理、回報收益均有一定的相關性。本文基于以往研究,綜合考慮產品質量、消費者心理預期以及獎勵報酬等參數,并增加平臺監控及政府懲罰機制,研究基于現金獎勵與優惠券獎勵兩種好評獎勵方式對消費者推薦意愿不同程度的影響,構建商家與消費者群體的演化博弈模型。分析商家與消費者在好評獎勵策略中的群體行為和發展趨勢,并通過對參數進行分析,找出在不同情境下影響商家與消費者行為的主要因素。
本文主要考慮電子商務環境下商家實施好評獎勵策略對消費者推薦意愿的決策影響,可以看作是雙方主體博弈的結果。因此,假設在線評論平臺上,商家為激勵消費者好評推薦而采取的策略集為{好評返現,好評返券},消費者可采取的決策包括“給予推薦性評語”和“不給予推薦性評語”,其策略集簡稱為{推薦,不推薦}。
假設市場中存在商家群體以p單位的價格出售質量為q(q
一次成功的交易完成后,消費者可以選擇是否進行推薦評價。假設消費者好評推薦策略能為商家帶來的總潛在效益值為 λ(λ>0)。在商家承諾好評返現的前提下,消費者好評推薦可獲得a單位的獎勵金。在現實中,消費者如果進行非誠信推薦,要承擔包括對低質量商品索賠的權益、推介的可信度、社會群體的受認可度等方面的信用代價,因此給予非誠信推薦者r1(r1>0)單位的信用懲罰。同時,商家疑似商業賄賂的行為將受到網絡平臺的監管和處罰,罰金為r2(r2≥0)。若滿意度較高的消費者不給予推薦,意味著放棄a單位獎勵金。而滿意度較低的體驗者不給予推薦,可以平衡較差的購物體驗所帶來的不滿意度,從而獲得f1(f1>0)單位的心理效益。商家因消費者不推薦行為損失f2(f2>0)單位的返現效益。
如果商家承諾好評贈送店鋪優惠券,實施好評推薦行為的消費者將獲得b單位的店鋪優惠券。由于優惠券的效益在實施二次購買行為時才會生效,為分析問題方便又不失合理性,本文假設消費者若想獲得優惠券收益,必須在首次消費的基礎上進行多消費,用 β(0≤β≤1)表示消費者二次消費的比率。現實生活中會存在一定比例滿意體驗者放棄二次購買機會,假設這將損失 γb單位的優惠效益,γ(0≤γ≤1)表示消費者用優惠券二次購買商品的成本損失系數,同樣會給予不誠信推薦者r1單位的信用懲罰。滿意度較低的體驗者不推薦行為可以平衡較差的購物體驗所帶來的不滿意度,從而獲得f1(f1>0)單位的心理效益。商家因消費者不給 予好評推薦需承擔的返券效益損失為f3(f3>0)。
假定消費者購買該產品后表現為滿意和不滿意兩種狀態的概率分別為 θ 和1 ?θ(0<θ<1)。消費者采取“推薦”策略的概率為x,采取“不推薦”策略的概率為 1 ?x,其中,0≤x≤1;商家采取“好評返現”策略的概率為y,采取“好評返券”策略的概率為1 ?y,其中,0≤y≤1。根據以上假設,構建商家與消費者博弈行為的收益矩陣,如圖1所示。

圖1 商家與消費者好評獎勵博弈收益矩陣Fig.1 Payoff matrix of business and consumers on rewards for favorable reviews
圖中,Πc,Πb分別代表消費者與商家的收益函數,不同策略行為中,消費者收益函數表達式分別為

如果消費者選擇推薦策略,那么收益函數是Πc1和 Πc2。 式 (1)和 (2)之間的差異在于返券策略下要獲得推薦收益需要在首次購買的基礎上多消費。在不推薦策略下,消費者的損失收益值是Πc3和 Πc4唯一的區別。同樣,在不同獎勵策略下,商家收益函數表達式分別為

考慮到現實情況,商家給予現金獎勵時容易被監管部門檢測到商業賄賂性行為并受到相應的懲罰。因此,Πb1與 Πb2之間除了基礎收益不同外,懲罰成本也是一項差異。
在電子商務平臺中由于雙方信息不對稱,商家與消費者之間的行為決策很難實現完全理性。消費者個體行為的差異將導致在策略選擇過程中存在部分消費者不選擇完全理性博弈的均衡策略,而是通過不斷地學習、模仿、試錯等動態調整過程作出決策,最終達到一個穩定的均衡結果。商家也會根據好評獎勵策略帶來的總收益和總風險大小不斷地調整策略,采取對自身最有利的行動,這與演化博弈思想一致。因此,基于復制動態的演化博弈分析方法,由圖1可知,參與博弈的消費者選擇“推薦”策略和“不推薦”策略的期望收益Uc1,Uc2,以及消費者平均期望收益Uc分別如下所示:


同理,參與博弈的商家選擇“好評返現”策略和“好評返券”策略的期望收益Ub1,Ub2,以及商家的平均期望收益Ub分別如下所示:

假設種群中使用某一策略的個體在種群中所占比例的增長速度是該策略的相對適應性,適應度高的策略會在種群中發展。令F(x)表示消費者群體中選擇“推薦”策略的復制子動態,即采用“推薦”策略的比例隨時間的變化率。為便于公式書寫,令 φ =(1+θγ)b+βp(θα1+θα2?α2),運用非對稱復制動態演化方式,得到x的復制動態方程分別為

同理,用F(y)表示商家群體選擇“好評返現”策略的復制子動態,運用非對稱復制動態演化方式,得到y的復制動態方程分別為

式(15)和式(16)表明,僅當x=0,1或時,消費者選擇“推薦”策略的概率是局部穩定的。僅當y=0,1或x?=時,商家選擇“好評返現”策略的概率是局部穩定的。因此,進一步 整 理 得 到 系 統 有E1(0,0),E2(0,1),E3(1,0),E4(1,1),E5(x?,y?) 5個局部均衡點。
本文在Friedman[27]提出的雅克比矩陣判斷均衡點穩健性的基礎上得到,復制動態方程可以用公式來表示。分別對x,y求偏導得到雅克比矩陣表達式為

各均衡解對應的雅克比矩陣J及其行列式Det和跡Tr如表1所示。

表1 各均衡解所對應的雅克比矩陣表達式及行列式和跡Tab.1 Jacoby matrix expressions and determinants and traces of each equilibrium solution
在本博弈中,A=f2?f3;B=f2?f3+b?a+(θ?1)r2?β(p?q);C=(1?θ)(r1+f1)?φ;D=(1+θ)a?φ。
以往很多研究都指出,與優惠券相比,現金獎勵更能激起消費者的推薦意愿[28]。如果商家采取返現獎勵策略所需承擔的成本及損失低于返券獎勵策略,即當參數滿足條件:

這 時 系 統 中 存 在4個 均 衡 點E1(0,0),E2(0,1),E3(1,0),E4(1,1)。 并且A<0,B>0,C<0,D>0。將均衡條件代入表1中,E4(1,1)是該條件下的演化穩定策略,如圖2所示。商家普遍趨向于“返現”策略,消費者則在現金的誘導下均實施“推薦”行為。

圖2 A <0,B>0,C <0,D>0時均衡解的復制相位圖Fig. 2 Phase diagram of the equilibrium solution when A<0 , B>0,C<0,D>0
然而對于商家來說,實施現金獎勵通常比實施優惠券獎勵所承擔的運營風險更高[29],即當參數滿足條件:

系 統 中 存 在E1(0,0),E2(0,1),E3(1,0),E4(1,1),E5(x?,y?)5 個均衡點。在這種條件下,B