劉夢茹,陳瑞義
(南京郵電大學管理學院,江蘇 南京 210003)
隨著互聯網的發展,電子商務成長迅速。互聯網的虛擬特性使電商平臺和消費者之間出現信息不對稱,進而導致售賣假貨、惡意競爭、產品質量低下等問題頻繁出現[1]。究其原因是商家追逐利益和電商平臺自身監管責任意識的缺失[2],由于電商平臺缺乏對商家的嚴格約束,部分商家為了追逐短期利益而出售低質量產品,使得越來越多的消費者對電商平臺的產品質量提出質疑,網絡信任危機由此產生。因此,網絡信任危機成為影響電子商務持續高效發展的主要問題,電商平臺作為電子商務的主要媒介,其監管職責不容忽視[3]。
近年來,如何破解電商平臺的信用監管困境成為廣大學者研究的熱點。從監管必要性來看,趙宏霞等[4]指出電商平臺內商家存在通過刷好評來提升商家店鋪評分的現象,造成商家之間惡意競爭,嚴重破壞信用評價系統;郭延祿等[5]指出由于電商平臺監管體系不夠完善,平臺內產品質量參差不齊、消費者維權難等問題不斷涌現。從監管缺失的原因來看,汪旭暉等[6]通過研究發現電商平臺監管不到位與自身的管理模式和商業模式有關;謝康等[7]指出監管成本過重將造成電商平臺監管責任意識的缺失。從解決措施來看,劉偉等[8]考察了固定和動態懲罰機制下的平臺監管策略,并指出動態懲罰機制能使雙方策略演化至穩定狀態且平臺選擇“自律”行為策略與懲罰上限呈正相關;汪旭暉等[2]通過構建動態懲罰和激勵機制下電商平臺和商家的博弈模型,進一步指出動態懲罰和激勵機制相結合易達到電商平臺信用監管的動態平衡。從研究方法來看,博弈模型是多數學者研究電子商務領域常用到的方法。王曉燕[9]運用進化博弈模型分析網絡信用問題,認為第三方評價能夠正面促進電商平臺的監管。楊豐梅等[10]基于博弈論,探究了C2B2C電商信用監管機制,其中C2B2C是指顧客通過企業電子商務平臺,實現顧客與企業之間、顧客與顧客之間信息交流的模式。汪旭暉等[2]基于政府治理視角下,采用動態演化博弈方法探究電商平臺的信用監管機制。毛文娟等[11]基于激勵視角下,構建“消費者—商家—平臺”三方演化博弈模型,探究平臺社會責任治理問題。
綜上所述,盡管有學者對獎勵和懲罰機制下電商平臺信用監管的成效進行了研究,但缺乏不同獎勵和懲罰機制組合下對電商平臺和商家影響的深入探討。并且,多數學者是基于獎勵和懲罰為靜態的假設,使用演化博弈模型對電商平臺信用監管問題開展的研究。鑒于此,本文采用演化博弈方法,以有限理性為分析框架[12],構建電商平臺和商家的博弈模型,深入分析靜態獎勵靜態懲罰、動態獎勵靜態懲罰、靜態獎勵動態懲罰及動態獎勵動態懲罰四種獎懲機制下雙方的策略選擇。
3.1.1 基本假設與模型構建


電商平臺與商家的收益矩陣如表1所示。

表1 商家和電商平臺收益矩陣Tab.1 Merchant and e-commerce platform revenue matrix

由公式(4)可知,商家選擇誠信經營策略時群體概率的增長率dx/dt與誠信和失信經營收益的差額R1-R2、電商平臺獎勵金額A和懲罰金額F呈正相關,與誠信與失信經營成本的差額C1-C2呈負相關。由公式(5)可知,電商平臺選擇積極監管策略時群體的增長率dy/dt與獎勵金額A呈負相關,與懲罰金額F呈正相關。
3.1.2 穩定性分析
由復制動態方程組可得到系統的五個均衡點:(0,0)、

電商平臺在積極監管策略下,若使其獎懲機制發揮作用,需滿足商家誠信經營獲得的收益高于商家失信經營獲得的收益,即A+R1-C1>-F+R2-C2。在滿足以上條件時進行穩定性分析,各均衡點穩定性分析結果如表2所示。

表2 靜態獎勵靜態懲罰機制下系統均衡點的穩定性分析結果Tab.2 Stability analysis results of system equilibrium points under static reward and static penalty mechanisms
分析表2可知,均衡點(0,0)、(0,1)、(1,0)、(1,1) 都不具有穩定性,是該博弈系統的鞍點。是該博弈系統的一個穩定均衡點,但并不具有漸進穩定性,電商平臺和商家的策略演化軌跡圍繞形成閉環曲線。因此,在靜態獎勵靜態懲罰機制下,電商平臺和商家之間不存在演化穩定策略。
為探究有效的獎懲措施,假設電商平臺獎勵力度與商家誠信經營的選擇相關,即電商平臺給誠信經營商家的獎勵為,A表示獎勵上限值,懲罰值仍為常量F。對應的復制動態方程組:

復制動態方程組可得到系統的五個均衡點(0,0)、(0,1)、
由公式(7)可知,商家選擇誠信經營策略時群體概率的增長率dx/dt與誠信和失信經營收益的差額R1-R2、電商平臺獎勵金額A(x)和懲罰金額F呈正相關,與誠信和失信經營成本的差額C1-C2呈負相關。電商平臺選擇積極監管策略時群體的增長率dy/dt與獎勵金額A(x)呈負相關,與懲罰金額F呈正相關。
電商平臺在積極監管策略下,要想讓其獎懲機制發揮作用,需滿足商家誠信經營獲得的收益高于商家失信經營獲得的收益,即xA+R1-C1>-F+R2-C2。在滿足以上條件時進行穩定性分析,各均衡點的穩定性分析結果如表3所示。

表3 動態獎勵靜態懲罰機制下系統均衡點的穩定性分析結果Tab.3 Stability analysis results of system equilibrium points under dynamic reward and static penalty mechanisms
由表3分析可知,均衡點(0,0)、(0,1)、(1,0)、(1,1) 都不具有穩定性,是該博弈系統的鞍點。同理,電商平臺和商家的策略演化軌跡圍繞(x2*,y2*)形成閉環曲線,(x2*,y2*)并不是演化的穩定策略(ESS)。因此,在動態獎勵靜態懲罰機制下,電商平臺和商家之間同樣不存在演化穩定策略。
假設電商平臺的懲罰力度與商家選擇誠信經營策略相關,即電商平臺對于失信經營商家實施的懲罰為F表示懲罰上限值,獎勵值仍設為常量A。復制動態方程組如下:

由復制動態方程組可得到系統的五個均衡點(0,0)、(0,1)、由公式(8)可知,商家選擇誠信經營策略時群體概率的增長率dx/dt與誠信和失信經營收益的差額R1-R2、電商平臺獎勵金額A和懲罰金額F(x)呈正相關,與誠信與失信經營成本的差額C1-C2呈負相關。由公式(5)可知,電商平臺選擇積極監管策略時群體的增長率dy/dt與獎勵金額A呈負相關,與懲罰金額F(x)呈正相關。
同理,在滿足前提條件A+R1-C1>-(1 -x)F+R2-C2的情況下進行穩定性分析,各均衡點的穩定性分析結果如表4所示。

表4 靜態獎勵動態懲罰機制下系統均衡點的穩定性分析結果Tab.4 Stability analysis results of system equilibrium points under static reward and dynamic penalty mechanisms
分析表4可知,均衡點(0,0)、(0,1)、(1,0)、(1,1) 都不具有穩定性,是該博弈系統的鞍點。是該博弈系統的一個穩定的焦點,電商平臺和商家的系統演化過程是一個漸進穩定的焦點,因此商家選擇誠信經營的概率為,電商平臺選擇積極監管的概率為。
假設電商平臺對商家的獎勵和懲罰都與商家選擇的經營策略有關,即電商平臺給誠信經營商家的獎勵為A(x)=x·A,A表示獎勵上限值;電商平臺對失信經營商家的懲罰為F(x)=(1 -x)·F,F表示懲罰上限值。復制動態方程組如下:

由表5分析可知,均衡點(0,0)、(0,1)、(1,0)、(1,1) 都不具有穩定性,是該博弈系統的鞍點。(,)是該博弈系統的一個穩定的焦點,電商平臺和商家的系統演化過程是一個漸進穩定的焦點,因此商家選擇誠信經營的概率為,電商平臺選擇積極監管的概率為。

表5 動態獎勵動態懲罰機制下系統均衡點的穩定性分析結果Tab.5 Stability analysis results of system equilibrium points under dynamic reward and dynamic penalty mechanisms
為了更加直觀清晰地了解經營成本、經營收益、電商平臺的獎懲對商家經營策略行為選擇的影響及其演化趨勢,采用MATLAB軟件對上述因素進行數值仿真分析,考慮實際情況及等式平衡原則[13],數值仿真分析的默認取值A=20、F=40、C1=20、C2=10、R1=20和R2=30。設置x、y的初始值為0.1,各主體演化路徑如圖1所示。

圖1 不同獎懲機制下電商平臺和商家的演化路徑Fig.1 The evolutionary path of e-commerce platforms and businesses under different reward and penalty mechanisms
由圖1(a)和圖1(b)可知,靜態獎勵靜態懲罰機制和動態獎勵靜態懲罰機制下,演化博弈過程是一個分別圍繞穩定中心點進行周期運動的閉環曲線,沒有穩定點。在兩種激勵機制下,電商平臺積極監管和商家誠信經營呈現周期性的行為,都無法使系統達到穩定狀態。
由圖1(c)和圖1(d)可知,靜態獎勵動態懲罰和動態獎勵動態懲罰機制下,電商平臺和商家的博弈系統演化路徑呈螺旋收斂趨勢,分別穩定于,并且在動態獎勵動態懲罰機制下,電商平臺積極監管和商家誠信經營的概率更高。因此,以動態獎勵動態懲罰機制為例,進一步探究誠信與失信經營成本差額、誠信與失信經營收益差額、獎勵和懲罰力度對雙方策略選擇的影響。
由圖2(a)可知,商家選擇誠信經營的概率與商家采取誠信經營和采取失信經營策略成本的差額C1-C2呈負相關,意味著當誠信經營需要花費的成本越高,商家選擇誠信經營的概率就越低。由圖2(b)可知,電商平臺隨商家采取誠信經營與商家采取失信經營策略的成本差額越高,其積極監管的概率就越高,也就意味當商家誠信經營所需花費的成本較高時,其選擇誠信經營的概率就越低,此時電商平臺會加大監管力度,當兩種經營策略成本之差為20時,電商平臺積極監管的概率y為1。

圖2 誠信與失信經營成本差額對商家誠信經營和電商平臺積極監管概率的影響Fig.2 The impact of the cost difference between honest and dishonest operation on the probability of businesses' honest operation and positive supervision of e-commerce platforms
由圖3(a)可知,商家選擇誠信經營的概率與商家采取誠信經營和采取失信經營策略的收益差額R1-R2呈正相關,意味著當誠信經營給商家帶來的收益較高時,商家選擇誠信經營的概率就越高。由圖3(b)可知,電商平臺積極監管概率隨著商家誠信與失信經營帶來的收益差額R1-R2的增加而減小,也就意味著當誠信經營給商家帶來的收益越高時,此時電商平臺會降低監管力度,當商家采取誠信經營和采取失信經營策略的收益差額R1-R2為10時,電商平臺積極監管的概率y為0。

圖3 誠信與失信經營收益差額對商家誠信經營和電商平臺積極監管概率的影響Fig.3 The impact of the income difference between honest and dishonest operation on the probability of businesses' honest operation and positive supervision of e-commerce platforms
由圖4(a)和圖4(b)可知,在其他參數保持不變的條件下,隨著電商平臺獎勵力度A的增加,x和y都減小,x變化幅度較小,y變化幅度較大。適當的獎勵在初期會對商家有一定的激勵效果,而隨著獎勵力度A越大,電商平臺積極監管成本越高,電商平臺積極監管的概率y就會降低,此時商家存在機會主義行為,其誠信經營的概率x也會降低。適當的獎勵能夠促進商家誠信經營,當獎勵額度過高時,反而無法達到較好的效果。


圖4 獎勵力度對商家誠信經營和電商平臺積極監管概率的影響Fig.4 The impact of reward strength on the probability of businesses' honest operation and positive supervision of e-commerce platforms
由圖5(a)和圖5(b)可知,在其他參數保持不變的條件下,隨著電商平臺懲罰力度F的增加,x增加,y減小,x變化幅度較小,y變化幅度較大。較高的懲罰具有一定的震懾作用,一方面有利于提升商家誠信經營概率x和產品質量,吸引更多消費者,另一方面在一定程度上可以使電商平臺減少其監督工作量,降低其監管成本。

圖5 懲罰力度對商家誠信經營和電商平臺積極監管概率的影響Fig.5 The impact of penalty intensity on the probability of businesses' honest operation and positive supervision of e-commerce platforms
本文利用演化博弈理論構建獎懲機制下電商平臺和商家的博弈模型,通過數值計算和仿真分析可知,動態獎懲機制更利于電商平臺平穩發展。(1)與靜態獎懲策略相比,商家行為更容易受電商平臺動態獎懲策略選擇的影響;(2)電商平臺采取動態獎懲策略對商家進行監管時,更容易激勵商家選擇“誠信經營”策略;(3)電商平臺在采取動態獎懲政策引導和激勵商家誠信經營時,應制定合理的獎懲措施,加大對失信經營商家的懲罰力度和誠信經營商家的獎勵補貼,推進電商市場監管的動態平衡,從而促進平臺經濟健康穩定發展。