李佩蕓, 郭思培, 張 鑫
(華中師范大學數學與統計學學院, 武漢 430072)
隨著互聯網的產生及發展,淘寶、美團、餓了么等一些電子商務交易平臺逐漸占據大多數人的日常生活,食品行業開展電子商務交易是大勢所趨.近年來,國內不少企業積極投身于食品行業交易電子化的發展中,特別在新冠肺炎疫情期間,根據中國飯店協會和餓了么聯合發布的《2020-2021年中國外賣行業發展研究報告》顯示,食品電商外賣行業的中國品牌迅速崛起,人們對這行業的需求量日漸增大,同時食品電商的發展也為疫情防控貢獻了一份力量.但食品電商行業也出現了一些問題,比如食品的安全質量、平臺和政府監管效率低下、消費者投訴等問題.據統計,2017年至2020年上半年,全國各級人民法院一審新收網絡購物合同糾紛案件共計4.9萬件,其中,食品類糾紛在網絡購物合同糾紛案件中占比接近半數,為45.65%.這些問題的存在影響了消費者的食品安全信心,也影響了食品行業的健康發展.國家和政府部門更加重視食品安全工作,黨的十九大報告明確提出“實施食品安全戰略,讓人民吃得放心”;習近平總書記強調,要把食品安全作為一項重大的政治任務來抓,堅持人民至上、生命至上,把保護人民生命安全擺在首位,要求提高食品藥品等關系人民健康產品和服務的安全保障水平.食品電商行業的有序健康發展成為當今研究的熱點問題.
目前國內外關于食品電子商務發展的研究逐漸增多,主要集中在食品電子商務平臺的構建、發展現狀以及安全監管方面的研究.一些學者基于復雜網絡檢測算法[1]、協同過濾推薦算法[2]等研究如何構建食品電商平臺.隨著我國食品電商平臺技術迅速發展,有學者通過大數據分析食品電子商務面臨的困境及成因,提出食品電子商務交易的合理方案[3].但由于平臺作為市場中有限理性的經濟主體[4],為了追求利益的最大化,在食品安全監管上會存在一定的監管漏洞,所以許多學者基于演化博弈理論來研究電商平臺如何參與食品安全監管.而演化博弈理論是隨著1973年Maynard和Price[5]提出的演化穩定均衡點的概念而產生的,可以用來分析博弈主體的平衡點及其穩定性.如文獻[6]從食品供應鏈的發展模式來研究平臺與食品制造商的演化博弈策略均衡;文獻[7]采用演化博弈論方法構建政府和食品企業的博弈模型,對食品安全生產中相關者的策略選擇進行分析;文獻[8]通過構建平臺、商家、消費者三方博弈模型與數值仿真結合來揭示不同監管制度對策略選擇的影響.與此同時,隨著當今社會新媒體的迅速崛起,信息共享和信息傳遞的速度加快,新媒體可以及時對信息進行反饋與揭露,在食品安全監管和平臺監管問題上發揮著重要的作用.因此,有學者將新媒體作為第三方監管來研究,主要探究政府監管機構與食品企業[9]、食品供應鏈中的食品供應商和零售商[10]、電商平臺和入駐商戶[11]以及政府監管部門、食品生產企業和消費者三方[12]這些不同參與方的策略行為選擇受到新媒體報道真實性準確率和影響力兩大因素的影響.除此之外,還有部分學者致力于將演化博弈模型結合機制設計來研究如何提高食品電商平臺的監管質量.如文獻[13]通過結合消費者反饋機制的三方演化博弈模型,探討如何提高食品電商平臺的信息監管質量;文獻[14]結合政府懲罰機制分析平臺與外賣商家的演化動態的行為監管;文獻[15]通過建立平臺和政府的信息共享機制,研究平臺不同監管力度下政府和商家策略的動態變化規律,充分發揮平臺監管的作用;文獻[16]引進靜態和三種動態獎懲機制來分析演化博弈均衡;文獻[17]主要探究固定懲罰機制和動態懲罰機制下策略的演化均衡.
以上文獻鮮有學者結合新媒體參與的角度,分析食品電商行業平臺的動態獎懲機制.因此本文基于食品供應商和電商平臺有限理性的特性,運用演化博弈方法研究在新媒體參與下引入平臺的四種靜動態獎懲機制如何影響供應商的決策選擇,并且通過運用Matlab工具對引入四種不同獎懲機制下平臺和供應商的演化策略進行數值模擬仿真分析,對這四種不同獎懲機制的監管效率進行了比較,再進一步分析在靜態獎懲機制下引入新媒體參與監督的演化穩定結果,從而得到平臺更好的監管機制設計,對平臺如何促進食品產業的健康有序發展提出了有效建議.
由于網絡具有虛擬性和隱蔽性,信息不對稱存在于電子商務平臺進行交易食品時,供應商提供的食品的安全品質和真實信用狀況難以判斷.但是在優勝劣汰的市場中,平臺電商和供應商在一些機制設計的引導下會采取適應性的學習行為,符合有限理性的群體行為特征.因此,本文基于演化博弈的方法分析在平臺的靜態獎懲機制下,電商平臺和供應商之間的利益沖突和最優選擇,提出以下假設.
1) 電子商務食品質量安全博弈過程的主要參與方為食品供應商和電子商務交易平臺,假設博弈雙方都是有限理性的.食品供應商有兩種策略為:提供合格食品和提供不合格食品兩種策略.而供應商提供不合格食品的行為將會影響食品流通市場中人民的健康安全和市場秩序.電子商務平臺對食品供應商行使監管的職責,也有兩種策略為:嚴格監管和寬松監管.
2) 假設食品供應商選擇提供合格食品的概率為x(0≤x≤1),則提供不合格食品的概率為1-x;假設食品電商平臺選擇嚴格監管的概率為y(0≤y≤1),則選擇寬松監管的概率為1-y.
3) 假設食品供應商通過電商平臺銷售食品獲得的收益為H1,食品供應商提供合格食品時需要消耗的成本為C1,但是由于利益的驅使,供應商為了獲得額外收入ΔH會選擇提供不合格食品;假設食品電商平臺參與監管的收益為L1,電商平臺嚴格監管時由于大量的人力以及物力技術資源需要消耗的成本為C2,食品電商平臺選擇寬松監管時會節約監管成本,因此C2=0.
4) 假設提供不合格食品供應商的投機行為被平臺嚴格監管發現時,將會面臨被平臺記錄誠信檔案,平臺可能會通過對信譽差或者無證經營的供應商適當提高準入金或者下次不予準入等措施來處罰供應商的違法行為,此時供應商受到平臺的處罰為F(F>0),其中F作為平臺嚴格監管獎勵給予平臺;假設供應商提供合格食品,在平臺的嚴格監管下,平臺會給予供應商一定的優惠補貼T(0 5) 假設供應商的機會主義行為損害了消費者的利益,消費者會選擇向平臺投訴,但是如果消費者的舉報行為得不到監管平臺的反饋,則消費者會選擇通過新媒體對食品質量問題進行曝光,從而維護自身的權益.假設新媒體的影響力為α(α>1),由于新媒體的報道有時會因消費者的舉報信息有誤或者為了吸引自身流量關注度出現報道失真現象,因此假設新媒體報道信息的準確率為β(0≤β≤1),假設新媒體報道會造成食品供應商經營利潤的有形損失以及造成食品供應商名譽、口碑的無形損失為v1,造成平臺的口碑損失為v2. 6)假設供應商提供合格食品,而新媒體報道失真,此時供應商受到媒體報道失真的影響造成的損失為(1-β)αv1,同時,平臺也會受不實信息影響而使得消費者降低消費意愿,此時造成的損失為(1-β)αv2.當供應商提供不合格食品,新媒體正確報道時,供應商受到的損失為βαv1,平臺的損失為βαv2. 根據上述假設,可以得到表1的得益矩陣情況. 復制動態方程[4]一般是用來反映參與人學習速度和方向的,主要取決于博弈參與方之間策略占比概率和該策略得益與博弈參與方的平均得益之差.博弈參與方采取不同博弈策略時收益有所不同,收益低的參與方會在博弈過程中不斷調整自身策略,學習并模仿收益高的參與方,這是復制動態方程的核心思想,反映系統向著穩定狀態演化的動態收斂過程.基于此構建食品供應商與電商平臺之間的復制動態方程. Qm1=(H1-C1+T-(1-β)αv1)·y+ (H1-C1-(1-β)αv1)·(1-y), (1) Qm2=(H1+ΔH-C1-F-βαv1)·y+ (H1+ΔH-C1-βαv1)·(1-y), (2) (3) x(1-x)[(T+F)·y-ΔH-(1-2β)αv1]. (4) 對F(x)關于x求導,則 命題1表明隨著電商平臺嚴格監管概率的提高,食品供應商的演化穩定策略將由提供不合格食品轉變為提供合格食品.反之亦成立. Qn1=(L1-C2-T-(1-β)αv2)·x+ (L1-C2+F-βαv2)·(1-x), (5) Qn2=[L1-(1-β)αv2]·x+(L1-βαv2)· (1-x), (6) (7) y(1-y)[(-T-F)·x-C2+F]. (8) 對F(y)關于y求導,則 命題2表明隨著供應商提供合格食品概率的降低,電商平臺的演化穩定策略將由寬松監管轉變為嚴格監管.反之亦成立. 演化博弈分析的目的是以有限理性為框架,研究博弈雙方在經過不斷學習適應,追求利益最大化的過程中形成的動態平衡,并且系統的穩定策略受博弈初始狀態和演化路徑的影響. 借助Jacobian矩陣分析參數約束條件對系統局部均衡點的穩定性的影響,Jacobian矩陣如下: (9) 表2 均衡點穩定性分析 根據以上分析,得到下面命題3. 由于在靜態獎懲機制下,信息不對稱導致供應商的機會主義行為使得雙方行為沒有達到有效的監管狀態.因此,為了使得結果更加符合實際情況,本文將從食品供應商的合法經營行為進行不同程度獎勵,設置了線性動態獎勵機制.假設電商平臺采取“嚴格監管”策略時對合法經營的供應商的獎勵T和供應商采取“提供合格食品”策略的概率成正比,則獎勵由固定的常數T變為線性函數g(x)=xT,其中,T為供應商獲得的最高程度的獎勵金額.此時得到供應商和平臺的復制動態方程分別為 ΔH-(1-2β)αv1], (10) (11) Jacobian矩陣如下: (12) 根據Jacobian矩陣對系統局部均衡點穩定性的影響,接下來將5個均衡點分別代入Jacobian矩陣,表3為演化博弈系統的均衡點穩定性分析. 表3 均衡點穩定性分析 根據以上分析,得到下面命題4. 命題4在平臺動態獎勵和靜態懲罰機制下,該系統的演化博弈模型有4個鞍點和1個不穩定點,其中,不穩定點為 E′(x*,y*)= 這表明系統的演化過程沒有穩定均衡的狀態. 從上述靜態獎懲機制、動態獎勵機制和靜態懲罰機制角度來求解模型的穩定性可知,在上述兩種機制下系統無法達到穩定均衡.為了使得結果能夠趨向穩定均衡,將引入線性動態懲罰機制,對食品供應商的違法經營行為的不同程度的結果進行不同程度處罰,設置了線性動態懲罰機制.假設電商平臺采取“嚴格監管”策略時對違法經營的供應商的懲罰F和供應商采取“提供不合格食品”策略的概率成正比,則懲罰由固定的常數F變為線性函數f(x)=(1-x)F,其中F為供應商受到的最高程度的懲罰金額.此時得到供應商和平臺的復制動態方程分別為 x(1-x)[(T+(1-x)F)·y-ΔH-(1-2β)αv1], (13) y(1-y)[(-T-(1-x)F)·x-C2+(1-x)F]. (14) Jacobian矩陣如下: (15) 根據Jacobian矩陣對系統局部均衡點的穩定性的影響,接下來將5個均衡點分別代入Jacobian矩陣,表4為演化博弈系統的均衡點穩定性分析. 表4 均衡點穩定性分析 根據以上分析,得到下面命題5. 命題5在平臺動態懲罰和靜態獎勵機制下,該系統的演化博弈模型有4個鞍點和1個焦點,其中,穩定點為 這表明系統具有穩定性. 由上述從靜態獎懲機制、動態獎勵機制和靜態懲罰機制以及動態懲罰機制和靜態獎勵機制角度來求解模型的穩定性,可知只有在動態懲罰機制和靜態獎勵機制下系統可以達到穩定均衡,從而實現有效監管.現將線性動態獎勵機制和動態懲罰機制結合.假設獎勵T和懲罰F與供應商采取“提供合格食品”策略的概率有關,將線性函數g(x)=xT,f(x)=(1-x)F代入上述式(4)和(8),基于動態獎勵機制與動態懲罰機制下食品供應商和平臺的演化博弈的復制動態方程分別為 x(1-x)[(xT+(1-x)F)·y-ΔH-(1-2β)αv1], (16) y(1-y)[(-xT-(1-x)F)·x-C2+(1-x)F]. (17) Jacobian矩陣如下: (18) 根據Jacobian矩陣對系統局部均衡點的穩定性的影響,接下來將5個均衡點分別代入Jacobian矩陣,得到如表4一樣的演化博弈系統的均衡點穩定性分析結果. 根據以上分析,得到下面命題6. 表5 仿真參數賦值 1) 圖1是雙方混合策略時整個系統的演化博弈曲線,分別在不同初始比例(x0,y0)=(0.5,0.5)、(x0,y0)=(0.2,0.8)和(x0,y0)=(0.8,0.2)時,靜態獎懲機制下該系統的演化博弈軌跡是一個圍繞穩定中心點進行周期運動無限循環的閉圓環,沒有穩定均衡點,這表明食品供應商和電商平臺的演化過程呈現周期性. 圖1 混合策略的演化結果 2) 圖2是不同初始比例下供應商和平臺分別采取“提供合格食品”策略和“嚴格監管”策略的演化博弈曲線,圖2a為固定平臺采取“嚴格監管”策略的初始概率為y0=0.5,供應商采取“提供合格食品”策略的初始概率分別為x0=0.2,0.8時的演化博弈曲線.圖2b為固定供應商采取“提供合格食品”策略的初始概率為x0=0.5,平臺采取“嚴格監管”策略的初始概率分別為y0=0.2,0.8時的演化博弈曲線. a. y0=0.5 x0=0.2,0.8 b. x0=0.5 y0=0.2,0.8 從仿真結果看,在給定供應商采取“提供合格食品”策略和電商平臺采取“嚴格監管”策略的初始概率情況下,對于x0和y0的不同初始值,供應商采取“提供合格食品”策略和電商平臺采取“嚴格監管”策略的概率隨時間呈現上下波動狀態,系統不會穩定到中心點 (x*,y*),不存在演化穩定策略.從波動幅度來看,x0和y0的初始值不同,博弈演化過程曲線的波動存在顯著差異.圖2a中固定y0,x0=0.8時的波動幅度大于x0=0.2的波動幅度.圖2b中固定x0,y0=0.8的波動幅度大于y0=0.2的波動幅度,即供應商和平臺概率x0和y0越大波動越大.以上結果表明,在電商平臺采取“嚴格監管”策略,對供應商采取“提供合格食品”策略的獎懲為靜止固定時,供應商和電商兩個群體的博弈過程不能達到穩定的均衡狀態,兩個群體的行為呈現周期上下震蕩模式,沒有固定穩定的策略.并且供應商采取“提供合格食品”策略和電商平臺采取“嚴格監管”策略的初始概率越大,波動的幅度越大,越難趨向于穩定. 1)圖3是供應商采取“提供合格食品”策略的初始概率為x0=0.5和平臺采取“嚴格監管”策略的初始概率為y0=0.5時的演化博弈曲線.由圖3a可知,在動態獎勵機制和靜態懲罰機制下,供應商和電商平臺兩個主體的演化軌跡的演化過程是一個圍繞起點的封閉軌道循環,沒有收斂點,因此食品供應商與電商平臺的演化過程沒有穩定均衡點,無法實現有效監管.由圖3b可知,在動態懲罰機制和靜態獎勵機制下,供應商和電商平臺兩個主體的演化軌跡呈螺旋收斂的態勢,并最終收斂于一點,因此食品供應商與電商平臺的演化過程有穩定均衡點,食品供應商的違法行為可以得到有效監管.由圖3c可知,在動態懲罰機制和動態獎勵機制下,供應商和電商平臺兩個主體的演化軌跡也是呈螺旋收斂的狀態,并最終收斂于一點,因此食品供應商與電商平臺的演化過程也有穩定均衡點. 圖3 混合策略的演化結果 2) 圖4是在初始概率為(x0,y0)=(0.5,0.5)時,兩種不同機制下供應商和平臺分別采取“提供合格食品”策略和“嚴格監管”策略的演化博弈曲線. 圖4 不同機制的演化結果 從圖4a、圖4b可知,在動態獎勵機制和靜態懲罰機制下,供應商和平臺分別采取“提供合格食品”策略和電商平臺采取“嚴格監管”策略的概率隨時間呈現上下震蕩狀態,系統不存在演化穩定策略.從波動幅度來看,系統在動態獎勵機制與靜態懲罰機制下,比靜態獎懲機制下的上下波動幅度更大.以上結果表明,將靜態獎懲機制變為動態獎勵機制和靜態懲罰機制時,供應商和電商兩個群體的博弈過程依舊不能達到穩定的均衡狀態,兩個群體的行為呈現周期上下震蕩模式,沒有固定穩定的策略. 由圖4c、圖4d可知,對比靜態獎勵和靜態懲罰機制,在動態懲罰機制和靜態獎勵機制下,食品供應商和平臺的策略選擇概率隨時間最終會逐漸收斂趨于穩定.因此,平臺合適的懲罰機制可以發揮監管供應商行為的作用,將供應商的信用納入征信系統進行等級劃分,實行有針對性地分級管理懲罰,促進平臺的嚴格監管的效率,從而規范食品供應商的違法行為. 由圖4e、圖4f可知,對比動態懲罰機制和靜態獎勵機制,食品供應商和平臺分別采取“提供合格食品”策略和“嚴格監管”策略的概率都是經歷過短暫上下波動以后逐漸收斂趨于穩定,雖然兩個機制下系統都經歷過短暫的上下波動后趨于穩定,但動態獎勵和動態懲罰機制下供應商和平臺收斂概率更高,因此動態獎勵和動態懲罰機制效果更好. 3) 圖5a和圖5b是在初始概率為(x0,y0)=(0.5,0.5)時,四種不同機制下供應商和平臺分別采取“提供合格食品”策略和“嚴格監管”策略的演化博弈曲線.由仿真結果可知,在這四種機制下,系統在動態獎勵靜態懲罰機制下,上下波動的振幅最大,最不容易穩定;在動態獎勵和動態懲罰機制下供應商和平臺收斂概率更高,這表明平臺對供應商的動態獎懲機制對群體最終的收斂狀態效果最好. 圖5 不同機制的演化結果 為了更進一步探究在靜態獎懲機制下新媒體的影響力α、新媒體報道信息的準確率β對供應商和平臺最終演化路徑穩定性的影響,可以保持在其他參數不變的情況下,改變α、β這兩種參數變量,仿真如下. 1) 新媒體的影響力α對穩定性的影響 圖6a、圖6b分別為新媒體不同影響力下電子商務交易市場中供應商和平臺的演化博弈曲線.當新媒體的影響力逐漸增大時,供應商和平臺分別選擇“提供合格食品”策略和“嚴格監管”策略的概率震蕩幅度都在增加;對于供應商,隨著新媒體報道對供應商造成的損失增大,供應商會因不敢承擔風險而放棄賺取額外利潤,從而最終收斂穩定到概率x=1;對于平臺,由于新媒體介入監管,平臺會選擇“搭便車”,從而選擇“寬松監管”,最終收斂穩定到概率y=0,即此時穩定策略為(提供合格食品,寬松監管).這表明新媒體的影響力增大對供應商和平臺群體最終的收斂狀態分別呈正向和反向關系,新媒體的影響力適當增大可以促進供應商規制行為和節約平臺的監管成本. 2) 新媒體報道信息的準確率β對穩定性的影響 圖7a、圖7b分別為新媒體不同報道準確率下電子商務交易市場中供應商和平臺的演化博弈曲線.隨著新媒體報道準確率的增加,供應商和平臺分別選擇“提供合格食品”策略和“嚴格監管”策略的概率震蕩幅度都在增加;對于供應商,即使沒有穩定到x=1,但是向上波動明顯比初始概率x0=0.5增加了;對于平臺,隨著新媒體報道準確率的增加,平臺選擇“嚴格監管”策略的概率降低.這表明新媒體的報道對供應商的違法行為進行了規制,產生比較強的威懾作用,從而推動食品供應商主動重視食品安全問題,從而平臺會適當降低監管力度,節約監管成本,但是此時供應商和平臺都沒有達到穩定狀態. 圖7 新媒體準確率β與x、y的時間關系 本文以演化博弈和機制設計為研究方法,探究在新媒體環境下引入不同靜動態獎懲機制的演化穩定性,從仿真結果表明,平臺的靜態獎懲機制與動態獎勵和靜態懲罰機制下供應商和平臺的演化博弈呈周期性上下波動變化,不能達到穩定均衡狀態; 在平臺的動態懲罰和靜態獎勵機制與動態獎勵和動態懲罰機制下供應商與平臺的演化博弈呈螺旋收斂,可以達到穩定狀態,并且動態獎勵和動態懲罰機制效果更明顯,因此設置合理的動態懲罰和動態獎勵機制可有效控制供應商的違法行為,促進食品電商行業的可持續發展.新媒體的參與監督對靜態獎懲機制下供應商和平臺的策略行為造成了不同的影響,一定程度上高效地促進了食品電商行業的有序發展.由于食品安全問題的隱蔽性,平臺不能完全發現供應商的違法行為,并且平臺作為一個有限理性經濟體,為了實現自己利益最大化也會存在自身監管效率的局限性.本文對影響食品供應商和平臺的行為因素未能全部納入進行研究,未來可繼續從政府獎懲機制和消費者監督機制的角度完善該模型,使其更符合實際情況.1.2 供應商的復制動態方程





1.3 平臺的復制動態方程





1.4 演化博弈系統穩定性分析




2 動態獎懲機制下食品供應商與電商平臺的演化博弈模型
2.1 動態獎勵機制和靜態懲罰機制




2.2 動態懲罰機制和靜態獎勵機制


2.3 動態獎勵機制和動態懲罰機制

3 數值仿真分析
3.1 靜態獎懲機制




3.2 對三種不同的動態獎懲機制仿真




3.3 新媒體不同參數對靜態獎懲機制穩定性的影響

4 結論