吳 斌,程 晶,宋 琰
(南京工業大學 經濟與管理學院,江蘇 南京 211816)
大數據時代,由于數據獲取的便捷性,電商平臺為了追求利潤最大化,利用大數據“殺熟”現象頻繁發生。大數據“殺熟”,指的是賣方利用老客戶對產品的信任,利用已形成的購買習慣等要素,對老顧客悄然抬高產品的售價或保持高價,借此謀取巨大利益。電子商務研究中心主任曹磊認為,理論上商家和電商平臺都有權對同一件商品進行不同的定價,而不是全部統一定價。商家可以在不損害消費者利益的前提下,實行溢價的經營策略。但在消費者不知情的情況下,并不在其列,否則會產生不利的消費者反應。“殺熟”行為對商家而言,短期內可增加收益,但是暴露之后會失去具有品牌忠誠度的老用戶。這種行為在侵犯消費者利益的同時,會擾亂市場秩序,使得線上消費“物美價廉”形象面臨崩塌,極有可能造成價格欺詐。“殺熟”現象的發生引發消費者對“大數據經濟”的猜忌,線上經營缺乏基本的治理,監督者力不從心是造成這一現象的重要因素。
目前關于“殺熟”現象的學術研究還未有定論,多集中于新聞報道。但有關價格歧視、價格欺詐的研究成果較多,從研究內容上來看,大部分文獻比較關注價格歧視對企業經營、政府監管的影響以及如何改善該狀況。在企業經營方面,Kao等[1]認為創新水平由外部創新者決定的情況下,價格歧視會抑制企業創新,降低社會福利。張凱等[2]應用雙寡頭兩期動態博弈模型,引入用戶滿意度,研究雙邊平臺在統一定價和歧視定價以及不同戰略情形下的最優定價問題,發現歧視定價策略有助于企業提高利潤但不利于提升用戶效用和社會福利。有學者針對價格歧視現象提出改善措施,李聰等[3]將買家在線購買歷史聚合為買家信譽度,提出了一種面向C2C電子商務的差異化折扣模型,使得C2C賣家根據買家的信譽度實施更精準的一對一營銷。Steppe[4]分析了一般數據保護條例(GDPR)與在線價格歧視之間的聯系,結果發現賦予人們在歧視定價方面的權利和義務,糾正造成價格歧視的相關決策以及數據,有利于保護個人數據,改善價格歧視狀況。黃建華[5]用三方演化模型,研究渠道商價格欺詐農戶問題,指出政府監管力度與參與者規模有關,合理適度的監管有助于維護市場秩序。Danias等[6]研究非對稱關稅作為一個監管機構監管企業的價格歧視行為,結果表明利用該監管機構,控制市場價格,可以增加消費者福利。在關于價格歧視的博弈問題上,演化博弈中的有限理性假設使得研究更具有現實意義,然而上述文獻的博弈決策函數是建立在期望效用理論的基礎上,與現實有限理性假設相悖。
為了更好的研究人們的決策行為,Kahneman和Tversky[7]從認知心理學的角度提出了較期望理論更加貼近現實人決策的前景理論。在監管方面的研究上,前景理論和演化博弈綜合應用在不同的行業中。雷勛平等[8]以前景價值函數表示演化博弈的收益函數,構建食品行業的收益前景值矩陣。Chen等[9]將前景理論嵌入演化博弈框架中,對駕駛員和行人的決策行為進行建模,研究行人穿越馬路的安全問題。趙澤斌等[10]運用前景理論和演化動態博弈研究重大基礎設施工程的風險管理行為。為了進一步完善人們的決策行為,Kahneman和Tversky[11]首次使用“心理賬戶”概念研究人們的決策行為。后續,Richard Thaler[12]正式提出“Psychic Accounting(心理賬戶)”概念,意圖解釋真實的決策行為。心理賬戶應用到不同領域的行為分析中,Liu等[13]將消費者心理賬戶與銷售模式聯系在一起,研究企業的銷售模式對混合促銷的影響。李愛梅等[14]通過實證研究探討了心理賬戶的認知標簽與情緒標簽對消費決策行為的影響。陳林等[15]將心理賬戶理論應用到交通出行的行為選擇中。文獻[16]將前景理論和心理賬戶結合應用在投資分析中,文獻[17]結合演化博弈模型將其應用到煤礦安全群體的行為研究中。
綜上所述,現有研究主要存在以下問題:目前結合前景理論和心理賬戶并通過演化博弈研究電商平臺管理的文獻較少;在運用博弈分析解決問題時,多數利用期望效用理論,忽視博弈參與方的價值感知和心理賬戶,這可能使得研究結果偏離實際;在參與者的行為選擇上,現有研究未深入分析參與者選擇“冒險行為”的原因。鑒于此,文章綜合考慮電商平臺和政府部門行為選擇的影響因素,將心理賬戶及前景價值感知函數同演化博弈相結合,構建收益感知矩陣,并基于該矩陣對電商平臺和政府部門行為決策進行演化博弈分析,探究抑制電商平臺“殺熟”定價,政府部門不履行監管責任的條件,最后通過數值仿真進一步驗證影響決策行為的參考因素,結果更加貼近現實,更具有借鑒意義。
電商平臺為了增加附加收益,在產品的定價方面可能有投機行為,此時產生的附加收益稱為灰色超額利潤。本文討論的是電商平臺針對老顧客進行“殺熟”定價的行為。這一行為會影響商家誠信,損害消費者利益,造成價格欺詐,因此相關政府部門有責任對電商平臺“殺熟”定價采取措施,進行監管。
在不考慮外部環境及其他市場主體影響的情況下,假設只存在電商平臺“殺熟”定價這一類經營狀況。本文通過演化博弈模型模擬電商平臺和政府部門之間的博弈情境,由于博弈本身存在風險決策行為,因此本文做出如下假設:
假設1博弈主體為電商平臺和政府部門這兩類群體,且均為有限理性,滿足前景理論以及心理賬戶所構建的價值函數,結合前景理論和心理賬戶的價值函數可以表示為:

其中V(x)表示效價賬戶即得到回報的判斷價值函數,Z(x)表示成本賬戶即付出成本的判斷價值函數,U0表示效價參照點,U1表示成本參照點。λ表示對效價損失規避的敏感度,x表示價值變量,β、θ表示效價相對收益——損失的風險偏好系數,φ、σ表示成本相對損失——收益的風險偏好系數,δ表示對成本損失規避的敏感度。相關的決策函數為:

其中π(ε)表示決策權重函數,它代表決策者對事件發生概率的主觀判斷或對策略選擇的傾向程度,是一種概率評價性的單調增函數,且π(0)=0,π(1)=1。r表示決策影響系數,r越大,表明決策權重函數越彎曲,個體對客觀概率的辨別率越小。
假設2電商平臺和政府部門的博弈行為只包含兩種策略的有限集合,其中電商平臺根據自身的經營策略可以針對老顧客采取(“不殺熟”,“殺熟”)策略;政府部門作為對電商平臺行為的重要監督者,其實際選擇可以是(監管,不監管);本文將消費者群體作為第三方舉報團體,消費者只有在政府部門不履行監管責任,電商平臺進行“殺熟”定價時進行舉報。
假設3考慮到電商平臺“殺熟”定價帶來的損失,博弈雙方都要承擔一定的安全風險,如消費者舉報后帶來的輿論風險、信息泄露風險等。博弈雙方只有在同時滿足“不殺熟”和履行監管責任時,才能確保整體達到安全狀態。在博弈的過程中,雙方承擔的風險系數是會變化的,且風險會進行傳遞,風險傳遞系數不為0。
假設4在政府部門選擇監管,電商平臺選擇“不殺熟”時,此時的風險最低。為了方便研究,假設此時雙方承擔的事故風險成本為0。政府部門進行監管時,若電商平臺“殺熟”定價,政府部門就會發現電商平臺的“殺熟”行為,并給予一定的罰款。
(1)電商平臺的參數設定
CP1表示電商平臺不進行“殺熟”的勞動成本,如電商平臺在正常經營過程中對人員、平臺管理付出的人力、物力等;CP2表示電商平臺不進行“殺熟”的努力成本,如電商平臺因提升正常收益,對產品服務標準化規范、平臺經營進行監督造成的時間精力耗費等;CP3表示電商平臺違反誠信道德,“殺熟”后需要承擔的心理成本,如違背誠信經營原則的情感以及因精神壓力未完成當前決策任務需要支付和承擔的成本;LP1表示電商平臺被消費者舉報所承擔的損失;SP1表示電商平臺正常經營得到的收益;SP2表示電商平臺因“殺熟”定價得到的灰色超額收益;L表示電商平臺進行“殺熟”定價時,承擔的風險成本,如電商平臺形象受損造成的聲譽損失以及對消費信任度造成的破壞性后果等;h表示風險傳遞系數,因為在博弈過程中,雙方承擔風險的比例是變動的,因此取值可能大于1,也可能小于1。但在本文中,為了體現“殺熟”造成的嚴重后果,認為政府部門和電商平臺對于“殺熟”行為造成的損失應承擔平等重要的責任,所以設置h=1,則政府部門承擔的風險成本為hL;P0表示發生經營事故的風險概率;q1表示電商平臺不進行“殺熟”定價,政府部門不履行監管職責時需要承擔的風險系數;q2表示電商平臺進行“殺熟”定價,政府部門履行監管職責時需要承擔的風險系數;W0表示電商平臺因“殺熟”定價行為遭受政府部門的罰款;α表示消費者舉報的概率。
(2)政府部門的參數設定
CG1表示政府部門履行監管職責時需要付出的勞動成本,如政府部門對電商平臺監督、管理付出的人力、物力等;CG2表示政府部門履行監管職責時需要付出的努力成本,如政府部門對電商平臺監督、管理造成的時間精力耗費等;CG3表示政府部門不履行監管職責時需要承擔的心理成本,如不履行職責的情感以及因此造成的工作效率低下、資源的流失等;LG1表示政府部門不履行監管職責時被舉報產生的損失,如輿論風波對政府部門的聲譽損失等;LG2表示政府部門不實施監管被舉報所承擔的額外損失,如受到行政處罰等;SG1表示政府部門得到的正常收益,如獲得的行政費用、投資收益等;SG2表示政府部門不履行監管職責時,從電商平臺處收取的賄賂好處;q3表示政府部門的監管結果與自身提成有關的提成系數;PG表示政府部門從電商平臺處得到好處的概率。
將博弈雙方的行為成本細化為電商平臺“不殺熟”和政府部門履行監管責任時付出的勞動成本、努力成本,因此得到的行為效價為雙方群體的正常收益。行為風險為電商平臺和政府部門違反法規承擔的心理成本以及罰款、被舉報的損失,在這種情況下,相應的效價仍然存在。結合上述四點假設和模型參數的設定,構建電商平臺、政府部門的傳統博弈矩陣,如表1所示。

表1 傳統博弈矩陣
通過上述傳統博弈矩陣,將效價賬戶函數V(x)和成本賬戶函數Z(x)分別代入博弈矩陣中,構建基于前景理論-心理賬戶的演化博弈矩陣,如表2所示,其中SP1、SP2、SG1、SG2屬于效價賬戶V(x),CP1、CP2、CP3、LP1、CG1、CG2、CG3、LG1、LG2、L、W0屬于成本賬戶Z(x)。

表2 基于前景理論-心理賬戶的博弈矩陣
假設電商平臺采取“不殺熟”定價行為的概率為x、政府部門采取監管措施的概率為y。基于表2,求得電商平臺“不殺熟”和“殺熟”的價值感知UPY和UPN以及平均價值感知UP:

同理,得到政府部門采取監管措施和不采取監管措施的價值感知UGY和UGN以及平均價值感知UG為:

根據非對稱復制動態演化方式,得到電商平臺的復制動態方程為:

其中A表示政府部門監管時,電商平臺選擇策略的價值函數。B表示政府部門不監管時,電商平臺選擇策略的價值函數。
同理可得政府部門的復制動態方程為:

其中C表示電商平臺“不殺熟”時,政府部門選擇策略的價值函數。D表示電商平臺“殺熟”時,政府部門選擇策略的價值函數。
建立政府部門與電商平臺的復制動態方程,聯立得到由政府部門與電商平臺構成的二維動力系統G為

由于線上消費的隱秘性、不可預測性,若電商平臺為了追求更大的利益進行“殺熟”定價,消費者意識到被“殺熟”后,心理上承受的損失遠遠大于金錢上的損失。為了提高客戶對線上消費的忠誠度,促進平臺的穩定發展,電商平臺和政府部門都應該履行責任,盡量減少“殺熟”定價行為的發生概率。由動態方程組求出的平衡點不一定是系統的演化均衡策略(ESS),根據Friedman[18]提出的Jacobian矩陣局部穩定性可得:

其中:a11=(1-2x)[π(y)A+π(1-y)B],a12=(1-x)D],det J=(1-2x)[π(y)A+π(1-y)B]
當矩陣滿足:det J>0,tr J<0時,局部均衡點將成為演化均衡點(ESS)。通過計算可以得到四個均衡點處a11、a12、a21、a22的取值,如表3所示。
因此,當

這6個條件同時滿足時,系統收斂于(1,1),即(“不殺熟”,監管)策略集,即滿足A>B,C>D時系統達到最優狀態。

表3 均衡點穩定性分析
在點(x0,y0)處,具有常規的雅克比矩陣判斷法失效,所以借鑒文獻[17]采用微分分析法進行判斷,分別求x,y的偏導數,得:

約束條件(15)表明無論政府部門實施監管或不監管策略,電商平臺的“殺熟”行為效價感知均大于“不殺熟”行為效價感知,電商平臺的“不殺熟”行為成本感知均小于“殺熟”行為成本感知;無論電商平臺采取“殺熟”或“不殺熟”策略,政府部門的監管行為效價感知均大于不監管行為效價感知,監管行為成本感知均小于不監管行為成本感知,即當電商平臺采取“不殺熟”策略和政府部門履行監管職責時,價值感知收益均同時大于對立行為的價值感知收益,此時系統能達到最優狀態。
然而,電商平臺和政府部門都是有限理性的,在現實生活中存在僥幸心理,這會導致其在決策的過程中不能做出準確的判斷,從而阻礙系統達到最優狀態。這些阻礙因素在進行“不殺熟”策略,履行監管職責時,會出現行為成本較高、效價較低、心理期望值較高以及風險偏好不同等一系列問題,以下具體分析這些問題產生的原因。
(1)電商平臺運營成本,政府部門進行監管時行為成本較高,與之對應的行為效價較低。對于電商平臺來說,平臺運營需要擴大開源,即提高平臺知名度,吸引消費者,在開源的同時也需要在成本與費用方面進行合理控制。電商平臺的運營成本包括硬運營成本、軟運營成本、人員成本、貨品成本等。電商平臺的效價包含著對利益的感知,然而隨著競爭平臺的不斷發展,很難出現“一家獨大”的現象,利益方面的競爭更加激烈。常規經營策略的效價不能保障,可能會造成電商平臺采取一些非常規措施提高平臺的收益。
對于政府部門來說,監管的行政成本、運作成本偏高。政府部門對工資的感知度較低,監管機構缺乏有效的績效評估機制,政府部門工作質量的不合理支出,工作質量與其收入并不具有明顯的關系,績效評估機制并未對政府部門起到激勵作用。這一系列弊端增大了政府部門對電商平臺運營的監管難度,監管策略的實施對監管機構的靈活性和創新性提出了挑戰,監管人員難以做到全方位、不間斷的監控,往往是待事物發展出現問題后,法律再跟進。
(2)電商平臺、政府部門心理期望值高,希望以較少的付出獲得較高的回報。在效價和成本賬戶中存在不同的參照點(U0,U1),高的心理期望值,易出現高效價參照點,低成本參照點[19]。當效價參照點較高時,主體會對效價差感知強烈,從而加大其對某種行為的選擇傾向,即效價參照點較高時反而不利于電商平臺選擇“不殺熟”策略。對于成本賬戶來說,發生事故概率的存在使得正常經營成本大于“殺熟”定價經營成本,所以電商平臺更傾向于選擇“殺熟”定價策略。當成本參照點較低時,則主體對成本差感知強烈,從而減少了對“不殺熟”策略的選擇。
(3)在風險決策過程中,損失規避對心理賬戶影響非常大。在面臨損失時,人們是風險偏好的,而在面臨獲得時,人們是風險規避的[20]。電商平臺面對“殺熟”和“不殺熟”行為效價選擇時,因效價代表“獲得”感知,所以表現為風險規避,此時β、θ較小,λ較大,選擇傾向不明顯。但是在面對成本選擇時,因成本代表“失去”感知,所以表現為風險追求,φ、σ較大,δ較小。在選擇“不殺熟”策略時,往往伴隨著確定性的付出CP1、CP2,但面對“殺熟”定價策略,僅有一定的概率發生被舉報以及懲罰等事故,所以其選擇“殺熟”定價策略的概率較大。同理,對于政府部門來說,面對履行監管責任和不履行監管責任的效價和成本選擇時,也會出現風險規避與風險追求兩種現象,且風險追求較為明顯。這是因為在選擇履行責任進行監管時,往往伴隨著確定性的付出CG1、CG2,但不履行責任,不進行監管時僅有一定的概率發生事故,所以其選擇不履行監管的概率較大。
本文采用Matlab軟件模擬電商平臺與政府部門之間的演化狀態,可以更加直觀的分析不同參考因素對電商平臺,政府部門行為選擇的影響,設置的初始參數值如下:
CP1=1.5;CP2=1.5;CP3=1;LP1=3;SP1=3;
SP2=4;CG1=1.5;CG2=1.5;CG3=1;LG1=3;
LG2=1;SG1=3;SG2=1;PG=0.5;L=100;
h=1;P0=0.03;q1=0.4;q2=0.6;β=0.88;
λ=2;φ=0.98;σ=0.98;δ=2;r=0.75
根據Van[21]的參數設定,風險偏好系數β、θ設為0.88,φ、σ設為0.98,風險規避度λ、δ設為2;發生經營事故的風險概率P0根據海因理希理論1∶300原則[22],設為0.03,決策影響系數r設為0.75[23],其余初始值的設置則是為了保證行為選擇概率能夠保持相對穩定所進行的隨機賦值,這利于改變其中任何一個參數,能有效觀察行為選擇概率的變化。
根據上述模型和參數設定,結果分析如下:
(1)改變消費者不同的舉報值α,觀察其對電商平臺、政府部門的群體行為選擇變化。

圖1 舉報值對電商平臺、政府部門的影響
如圖1所示,改變舉報值α,使其從0到1逐漸增加。圖1中實線表示α對電商平臺x值的影響,虛線代表對政府部門y值的影響,從圖中可以看出,隨著α的增加,x,y均收斂于1,并且α的增加能使其更快的收斂于1。因此,提高消費者的舉報概率能影響電商平臺、政府部門的行為,促使電商平臺向“不殺熟”策略、政府部門向履行監管行為方向演化。
(2)改變參照點U0、U1的值,觀察其對電商平臺,政府部門的群體行為選擇變化。
如圖2所示,改變參照點U0和U1,從-1到1逐漸增加,U1從0到1逐漸增加。圖2中實線表示U0對電商平臺x值的影響,虛線代表對政府部門y值的影響,點劃線表示U1對電商平臺x值的影響,點線代表對政府部門y值的影響。從圖2中可以看出,隨著U0的減少,U1的增加,電商平臺和政府部門迅速收斂于1,說明增加成本參照點和降低效價參照點能快速降低“殺熟”和不監管行為的發生。

圖2 U0、U1 對電商平臺、政府部門的影響
(3)電商平臺進行“殺熟”定價被發現后,改變政府部門對其處罰的程度W0以及增加政府部門監管結果與績效掛鉤的提成系數q3,研究電商平臺,政府部門的群體行為選擇變化。
如圖3所示,改變處罰值W0和政府部門的提成系數q3,W0從0到10逐漸增加,q3從0到1逐漸增加。圖3中實線表示W0對電商平臺值的影響,虛線代表對政府部門y值的影響,點劃線表示q3對電商平臺x值的影響,點線代表對政府部門y值的影響。從圖3中可以看出,隨著W0和q3的增加,電商平臺向“不殺熟”策略轉變,政府部門向監管行為轉變,說明增加對電商平臺的罰款力度能促進其向“不殺熟”策略演化,提高政府部門的提成系數可以有效的激勵政府部門向履行監管職責演化。

圖3 W0 和q3 對電商平臺、政府部門的影響
通過對電商平臺和政府部門演化模型的仿真分析,發現消費者的舉報概率、參照點的改變、政府部門的處罰力度以及政府監管群體的提成系數均對參與方的行為策略有一定的影響。對于電商平臺,提高影響“不殺熟”定價策略價值收益感知的參數值、降低影響“殺熟”定價策略的價值收益感知參數值,均能促進其向“不殺熟”行為演化。同理,對于政府部門,提高利于監管行為的價值收益感知的參數值,降低影響不監管行為的價值收益感知參數值,可以促進政府部門采取監管行為。
本文根據電商平臺“殺熟”現狀,將前景理論和心理賬戶引入演化博弈理論中,探討電商平臺與政府部門在“殺熟”監管行為上的博弈問題,分析了影響參與方決策行為的因素,并通過數值仿真技術進行驗證,最終獲得了以下重要的結論:
(1)消費者的舉報行為對電商平臺選擇“不殺熟”、政府部門選擇監管策略很重要。在平臺監管過程中,消費者需要提高對公民價值、權利和能力的認識。政府部門需要引導鼓勵消費者參與平臺的監管,拓寬消費者賦權渠道,將消費者從受眾轉變為參與者、監督者。
(2)本研究揭示了參照點對參與方決策行為的影響。提高影響“殺熟”行為、不監管行為的成本參照點,降低影響“不殺熟”行為,監管行為的效價參照點,可以抑制電商平臺“殺熟”定價行為,加強政府部門監管力度。
(3)提高政府部門群體的提成系數,可以促進政府部門采取“監管”策略。對政府監管群體采取合理的激勵措施,有助于提高監管水平,降低“殺熟”現象造成的聲譽損失,提高公民對其工作能力的信任度。
(4)加大對電商平臺的處罰力度,可以有效抑制電商平臺“殺熟”策略。電商平臺要想獲得長期利益,應該意識到消費者既是收益的來源也是監督者。電商平臺需要承擔自身在市場中的社會責任,保護消費者權益,遵循市場規則的嚴謹性,形成正確的成本與收益價值的感知,從根本上杜絕“殺熟”現象的發生。
本文深入分析了電商平臺與政府部門之間的“殺熟”博弈,在研究的過程中通過分析影響行為決策的參考因素,認為在后續工作中可以進一步探討消費者、電商平臺、政府部門之間的三方博弈問題。對消費者進行賦權,探討消費者如何參與平臺監管以及如何影響博弈的演化穩定策略。