李春發(fā),曹穎穎,王 聰,郝琳娜
(1.天津理工大學管理學院,天津 300384;2.聊城大學商學院,山東 聊城 252000)
隨著AI、AR和大數據等技術迅速發(fā)展,直播電商打破銷售渠道時空、信息等限制[1],減少產品流通環(huán)節(jié),滿足了消費者社交性[2]、互動性需求和尋求高效選品途經的需要,成為推動品牌消費增長的重要商業(yè)模式[3]和互聯(lián)網經濟領域新的增長點。艾瑞咨詢數據指出,2019年直播電商整體成交額達4 512.9億元,同比增長200.4%,占網購整體規(guī)模的4.5%[4]。然而,直播電商模式火爆發(fā)展同時,因其參與主體多、入住門檻低及網絡交易的虛擬性與數據缺失性等[5],電商假貨問題層出不窮[6],部分爆款單品缺乏基本的質量保障[7],直播平臺對供應商、主播行為策略難以規(guī)制的問題尤為突出。為此,政府頻頻出臺相關政策加強指導與監(jiān)管,規(guī)范平臺運行[8-9],如中國廣告協(xié)會于2020年7月發(fā)布《網絡直播營銷行為規(guī)范》,對直播電商中的供應商、直播平臺、主播的行為作全面定義規(guī)范。直播電商行業(yè)規(guī)范是保證直播電商行業(yè)持續(xù)發(fā)展的重要基礎[10-13],探究直播平臺規(guī)制參與主體行為策略,并提出規(guī)范供應商及主播行為的具體措施,對引導直播電商市場健康規(guī)范化發(fā)展和助力直播經濟高質量發(fā)展具有重要的現實意義。
供應商的供品策略、直播平臺的規(guī)制方式、主播的行為規(guī)范對直播電商三方收益產生重要影響,相關問題受到各方關注與重視[14],許多學者對網絡直播電商方面的研究主要是以監(jiān)管策略和治理對策為切入點,闡述直播平臺規(guī)制策略的必要性[15-19]。從利益相關者的視角,李亞兵等[20]結合博弈演化探討了多方參與下網絡直播治理的內在機理,并提出相應的網絡治理策略;從政府監(jiān)管的視角,彭曉薇[21]提出了當前政府對網絡直播的監(jiān)管體系和具體措施;從直播平臺的視角,薛鵬等[22]研究了主播侵權下直播平臺需要承擔的責任及其監(jiān)管責任如何體現。直播平臺與主播之間關系的研究主要關注直播負面問題、行業(yè)信用和行業(yè)競爭等,李婧祎等[23]研究了當前網絡直播行業(yè)存在的問題并探究原因,最后提出相應的對策建議。鄭森圭等[24]認為導致直播平臺盈利能力不足的兩個原因分別為簽約主播比例與直播平臺基礎規(guī)模不匹配,以及直播平臺簽約策略不恰當。近年來,學者們開始運用博弈論探討電商參與主體內在的影響機理。張麗等[25]基于博弈論將消費者投訴引入電商平臺信用監(jiān)管機制,構建了信息不對稱下以電商平臺、商家和消費者為主體的三方演化博弈模型,分析了各主體博弈策略選擇與行為演化的影響因素及趨于穩(wěn)定狀態(tài)的條件,并進行演化仿真分析和數值模擬。楊豐梅等[26]構建C2B2C電商信用監(jiān)管模式下的演化博弈模型與定價交易模型,對電商和消費者雙方的長期交易策略進行了分析。徐鯤等[27]運用演化博弈理論對電商雙邊市場供應鏈融資合作機制進行分析,并結合收益分配模型計算得到收益分配系數的最優(yōu)解。Aringhieri等[28]通過混合博弈和代理仿真分析電子商務中的在線信譽體系,建立模型,探究買賣雙方不同的行為對電商政策的影響。
目前研究主要聚焦于直播電商行業(yè)規(guī)范必要性的理論分析,對供應商、直播平臺及主播三方主體間行為策略關系鮮有量化描述,本文以供應商、直播平臺和主播為研究對象,鑒于供應商供品策略、直播平臺規(guī)制方式以及主播行為抉擇涉及諸多利益主體,從有限理性的角度出發(fā),抽象出供應商、直播平臺以及主播之間進行策略選擇的影響因素,構建演化博弈分析模型,并采用agent仿真,側重分析不同的策略對三方收益的影響,從而提出規(guī)范供應商及約束主播行為的具體措施。
考慮由分別負責產品供應、服務和推薦的供應商、直播平臺(簡稱平臺)和主播組成的直播電商系統(tǒng)。在該系統(tǒng)中,供應商通過向主播進行商業(yè)投放、提供貨源等獲利;主播通過向消費者推薦產品獲利,存在將仿品作為正品進行虛假宣傳等違規(guī)行為;平臺通過按場次及時間向供應商收取服務費、提供運營規(guī)范和業(yè)務檢查等獲利。作為產品和服務質量責任承擔者,平臺接受政府和社會監(jiān)督,對供應商、主播行為采取積極規(guī)制或者消極規(guī)制。供應商、平臺和主播之間存在行為策略演化博弈關系(見圖1)。

圖1 供應商、直播平臺和主播行為策略演化關系
設供應商正、仿產品支付成本分別為C1和C2;主播銷售守規(guī),供應商選用正品、仿品的基本收益分別為R1和R2;主播違規(guī),供應商選用正品、仿品的基本收益為R3和R4。平臺積極規(guī)制對選用仿品供應商、違規(guī)主播的懲罰和約束分別為F和M(γ為懲罰系數,δ為約束系數)。平臺消極規(guī)制對選用正品供應商、守規(guī)主播的支持和補貼分別為H和L(β為支持系數,α為補貼力度)。平臺積極規(guī)制成本為C3,直播平臺積極、消極規(guī)制的基本收益分別為U1、U2。供應商選用仿品,主播守規(guī)/違規(guī)使平臺效益增加/減少W1/W2。違規(guī)收益指主播違規(guī)獲得的超額收益,設主播違規(guī)獲得的超額收益為ηQ1、ηQ2,Q1、Q2為供應商選用正品、仿品時主播的基本收益,η為違規(guī)收益因子。主播守規(guī)、違規(guī)的收益和損失分別為V1和V2。平臺消極監(jiān)管將導致平臺市場產品質量混亂,消費者對平臺的選擇意愿降低,平臺和主播利益損失分別為K1、K2。電商直播中消費者的感知服務質量和感知價值對購買意愿有正向影響[29]。主播推薦仿品時,消費者的感知服務質量和感知價值較低,從而降低購買意愿,主播收益損失為E。供應商、平臺和主播博弈收益矩陣如表1所示。

表1 供應商、平臺、主播三方博弈收益矩陣



從而可建立供應商、平臺和主播演化博弈模型(1)。
(1)
按照Friedman提出的方法,微分方程系統(tǒng)的演化穩(wěn)定策略(ESS)可由該系統(tǒng)的Jacobian矩陣局部穩(wěn)定性分析得到。由式(1)知,系統(tǒng)Jacobian矩陣[30]為
在式(1)中,令F(x)=F(y)=F(z)=0,知E1(0,0,0),E2(0,0,1),E3(0,1,0),E4(0,1,1),E5(1,0,0),E6(1,0,1),E7(1,1,0),E8(1,1,1)為局部均衡點。Jacobian矩陣的所有特征值都為非正時的均衡點為系統(tǒng)的演化穩(wěn)定點;所有特征值的符號確定且均為正值時,該均衡點為非穩(wěn)定點。
均衡點為E1(0,0,0)時,有
類似地,將8個均衡點分別代入Jacobian矩陣,各均衡點對應Jacobian矩陣的特征值如表2所示。

表2 Jacobian矩陣的特征值
假設R1-R2+βH-C1+C2>0,V1+V2-ηQ1-δM+αL>0,U1-U2-C3-K1>0。說明主播守規(guī),供應商選用仿品總收益較正品小,平臺消極規(guī)制總收益較積極規(guī)制小;平臺積極規(guī)制,主播守規(guī)總收益較違規(guī)大。由于模型中參數的復雜性,本文分3種情形對演化博弈穩(wěn)定策略進行討論。
情形1:當U1-C3+δM-γF-K1 圖2 情形1的復制動態(tài)相位圖 情形2:當U1-C3+δM-γF-K1>U2,R3+γF+βH-C1 圖3 情形2的復制動態(tài)相位圖 情形3:當R3+βH-C1>R4-C2且V1+αL+E>ηQ2-V2時,說明當平臺積極規(guī)制且主播違規(guī)時,供應商選用正品總收益較仿品大,當平臺消極規(guī)制時,主播守規(guī)總收益較違規(guī)大,由表3知,均衡點E8(1,1,1)對應Jacobian矩陣特征值均為負值,故E8(1,1,1)為均衡點,{正品,積極規(guī)制,守規(guī)}為演化穩(wěn)定策略,演化博弈模型的相位圖如圖4所示。 圖4 情形3的復制動態(tài)相位圖 表3 局部均衡點穩(wěn)定性分析 以阿里巴巴為例利用多主體建模仿真(mABM)技術,模擬直播電商不同情形下穩(wěn)定性策略變動,分析驗證演化均衡穩(wěn)定性結論。即通過對模型參數進行取值,模擬“供應商-直播平臺-主播”之間演化博弈的變動趨勢,揭示各主體決策規(guī)律。在Netlogo仿真平臺中,供應商、直播平臺和主播分為3類Agent,分別設置初始數量300個,設定黃色、灰色曲線分別為供應商選擇“正品”和“仿品”策略的概率變化曲線,紅色、黑色曲線分別為直播平臺選擇“積極規(guī)制”和“消極規(guī)制”策略的概率變化曲線,橙色、藍色曲線分別為主播選擇“守規(guī)”和“違規(guī)”策略的概率變化曲線。 在仿真過程中,合理設置仿真模型的參數取值是有效仿真的關鍵。根據Liu[31],汪旭暉等[32],參數取值設置主要有兩方面依據:1)文獻與實際調研。參照楊豐梅等[26]的參數設置,設定選用仿品供應商懲罰分別為β=0.4,H=10,違規(guī)主播的約束分別為δ=0.3,M=4;選用正品供應商的支持分別為γ=0.3,F=10,守規(guī)主播的補貼分別為α=0.2,L=4。在對阿里巴巴進行實際調研,發(fā)現實地調研結果與《阿里巴巴國際站處罰扣分說明》、《阿里巴巴國際站虛假交易違規(guī)處罰規(guī)則》和現有相關文獻參數設置基本吻合。本文根據以上數據來源對模型參數進行取值,具體如表4~6所示。2)等式平衡原則。本文對以下3種不同情形進行模擬分析。 表4 支付矩陣參數值 情形1:當U1-C3+δM-γF-K1 設置初始x=0.41,y=0.53,z=0.34和x=0.57,y=0.53,z=0.52,運行結果如圖5、6所示。 圖5 初始x=0.41,y=0.53,z=0.34演化博弈仿真結果 圖6 初始x=0.57,y=0.53,z=0.52演化博弈仿真結果 由圖5、6可知,博弈穩(wěn)定策略為E1(0,0,0)和E8(1,1,1),即{仿品,消極規(guī)制,違規(guī)}和{正品,積極規(guī)制,守規(guī)}。三者最終演化結果取決于三者最初狀態(tài),當直播平臺消極規(guī)制時,主播守規(guī)獲得補貼αL較違規(guī)獲得收益ηQ1-V2小,主播傾向選擇“違規(guī)”策略;當直播平臺消極規(guī)制且主播違規(guī)時,供應商選用仿品總收益較正品大,供應商選擇“仿品”策略。當供應商選用正品時,平臺積極規(guī)制收益U1-C3較消極規(guī)制收益U2大,直播平臺傾向于選擇“積極規(guī)制”策略,當供應商選用正品且平臺積極規(guī)制時,主播守規(guī)獲得補貼和形象增加αL+V1較違規(guī)利益加成ηQ1-δM-V2大,主播選擇“守規(guī)”策略。{仿品,消極規(guī)制,違規(guī)}和{正品,積極規(guī)制,守規(guī)}為演化穩(wěn)定策略,驗證了情形1理論分析結論的有效性。 情形2:當U1-C3+δM-γF-K1>U2,R3+γF+βH-C1 表5 支付矩陣參數值 設置初始x=0.28,y=0.66,z=0.59和x=0.46,y=0.65,z=0.68,運行結果如圖7、8所示。 圖7 初始x=0.28,y=0.66,z=0.59演化博弈仿真結果 圖8 初始x=0.46,y=0.65,z=0.68演化博弈仿真結果 由圖7、8可知,博弈穩(wěn)定策略為E3(0,1,0)和E8(1,1,1)。博弈出現兩種漸進穩(wěn)定策略:{仿品,積極規(guī)制,違規(guī)}和{正品,積極規(guī)制,守規(guī)}。三者最終演化結果取決于三者最初狀態(tài),當供應商選用仿品時,主播若選擇“違規(guī)”策略,可滿足供應商銷量需求,此時供應商選用仿品、平臺積極規(guī)制和主播違規(guī)屬于穩(wěn)定策略。當供應商試圖選用仿品時,主播若選擇“守規(guī)”策略,無法滿足供應商銷量需求,且平臺選擇“積極規(guī)制”策略,供應商只能轉而選擇“正品”策略。{仿品,積極規(guī)制,違規(guī)}和{正品,積極規(guī)制,守規(guī)}為演化穩(wěn)定策略,驗證了情形2理論分析結論的有效性。 情形3:當R3+βH-C1>R4-C2,且V1+αL+E>ηQ2-V2時,設支付矩陣各參數如表6所示。 表6 支付矩陣參數值 設置初始x=0.56,y=0.65,z=0.55,運行結果如圖9所示。由圖9可知,博弈穩(wěn)定策略為E8(1,1,1)。博弈出現一種漸進穩(wěn)定策略:{正品,積極規(guī)制,守規(guī)}。隨著主播違規(guī)收益因子η降低,當供應商選用正品且平臺積極規(guī)制時,主播違規(guī)獲得額外收益不足以抵消違規(guī)造成的利益損失,主播將選擇“守規(guī)”策略。{正品,積極規(guī)制,守規(guī)}為演化穩(wěn)定策略,演化博弈仿真結果驗證了情形3理論分析結論的有效性。 圖9 初始x=0.56,y=0.65,z=0.55演化博弈仿真結果 由于直播電商系統(tǒng)供應商、直播平臺和主播三方博弈的策略演化復雜性,利用Python軟件分析參數變化對策略演化穩(wěn)定性的影響,其中包括分析懲罰系數γ、約束系數δ、支持系數β、補貼系數α和違規(guī)收益因子η對直播電商系統(tǒng)演化過程的影響。假設初始供應商、直播平臺和主播選擇不同策略的概率均為0.5,取R1=7,R2=13,R3=14,R4=17,C1=4,C2=3,C3=3,V1=4,V2=5,Q1=14,Q2=12,U1=19,U2=13,W1=3,W2=3,K1=1,K2=2,E=1,L=9,H=9,F=10,M=10。γ,δ,β,α和η分別取0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0。 懲罰系數取不同值時,演化博弈仿真結果如圖10所示。在不同懲罰系數下,直播電商系統(tǒng)三方博弈演化軌跡如圖10a所示。當直播平臺對供應商懲罰力度較小時,供應商選用仿品,主播考慮違規(guī)風險選擇守規(guī),直播平臺選擇消極規(guī)制。隨著懲罰系數增加,供應商策略選擇向正品方向演化,主播策略選擇向違規(guī)方向演化,直播平臺選擇積極規(guī)制策略,并最終達到穩(wěn)定狀態(tài)。 供應商策略選擇隨時間變化的演化軌跡如圖10b所示。當懲罰系數過小時,供應商考慮成本及懲罰,選用仿品策略。懲罰系數適度增加時,供應商剛開始處于觀望狀態(tài),隨著時間增加,供應商感知正品的益處,逐漸向正品方向演化。當懲罰系數較大時,供應商選用正品,并最終達到穩(wěn)定狀態(tài)。 圖10 懲罰系數γ的參數分析 直播平臺策略選擇隨時間變化的演化軌跡如圖10c所示。當平臺對供應商選用仿品懲罰力度較小時,直播平臺向消極規(guī)制方向演化,且隨著懲罰系數增大其演化速率越來越小,直到最終達到穩(wěn)定狀態(tài)。當懲罰系數過大時,直播平臺的策略選擇不穩(wěn)定,無法達到穩(wěn)定狀態(tài)。 主播策略選擇隨時間變化的演化軌跡如圖10d所示。當平臺對供應商選用仿品懲罰力度較小時,供應商選用仿品時主播違規(guī)風險較大,考慮到違規(guī)風險,主播選擇守規(guī)。當懲罰系數過大時,主播策略選擇不穩(wěn)定,無法達到穩(wěn)定狀態(tài)。 約束系數取不同值時,演化博弈仿真結果如圖11所示。在不同約束系數下,直播電商系統(tǒng)三方博弈演化軌跡如圖11a所示。當直播平臺對主播約束力度過小時,主播選擇違規(guī),此時供應商考慮主播違規(guī)風險后選擇提供正品,直播平臺選擇積極規(guī)制。隨著約束系數增加,考慮到違規(guī)成本,主播向守規(guī)方向演化,供應商向仿品方向演化,且趨向穩(wěn)定的速度隨約束系數增加而變快,直播平臺向消極規(guī)制方向演化,逐漸趨于穩(wěn)定狀態(tài)。 圖11 約束系數δ的參數分析 供應商策略選擇隨時間變化的演化軌跡如圖11b所示。當直播平臺對主播約束力度過小時,供應商考慮選用仿品,主播違規(guī)風險較大,選擇正品策略。當約束系數適度增加時,供應商剛開始處于觀望狀態(tài),但主播守規(guī)無法滿足供應商利益需求,供應商開始向仿品方向演化。當約束系數較大時,供應商選用仿品,并逐漸趨于穩(wěn)定狀態(tài)。 直播平臺策略選擇隨時間變化的演化軌跡如圖11c所示。當直播平臺對主播約束力度較小時,平臺向積極規(guī)制方向演化,且隨著約束系數增大其演化速率越來越快,最終達到穩(wěn)定。當約束系數達到合適范圍后,直播平臺向消極規(guī)制方向演化,演化速度隨約束系數增加而加快,最終趨于穩(wěn)定。 主播策略選擇隨時間變化的演化軌跡如圖11d所示。當約束系數較小時,主播考慮違規(guī)成本較低,選擇違規(guī)行為。約束系數適度增加時,主播剛開始處于觀望狀態(tài),隨著時間增加,主播感知到違規(guī)成本過高,向守規(guī)方向演化。當約束系數較大時,主播選擇守規(guī)行為。 直播平臺對供應商支持系數取不同值時,演化博弈仿真結果如圖12所示。在不同支持系數下,直播電商系統(tǒng)三方博弈演化軌跡如圖12a所示。平臺為鼓勵供應商選用正品,對選用正品供應商給予支持。當支持系數較小時,供應商選用仿品,主播考慮違規(guī)風險后選擇守規(guī),直播平臺選擇消極規(guī)制策略。當支持系數適中,供應商感知正品的益處,向正品方向演化,主播向違規(guī)方向演化,最終達到穩(wěn)定。當支持系數較大時,供應商選用正品,主播和直播平臺演化過程不穩(wěn)定,直播電商系統(tǒng)三方博弈無法達到穩(wěn)定狀態(tài)。 供應商策略選擇隨時間變化的演化軌跡如圖12b所示。當直播平臺對供應商選用正品支持力度過小時,供應商選用正品成本較仿品大。當支持系數適中時,供應商一開始處于考察狀態(tài),隨著時間變化,供應商認識到正品的益處,向正品方向演化,且演化速度與支持系數正相關,直到達到穩(wěn)定。當支持系數較大時,供應商選用正品。平臺高支持系數可有效激勵供應商選用正品。 圖12 支持系數β的參數分析 直播平臺策略選擇隨時間變化的演化軌跡如圖12c所示。當直播平臺對供應商選用正品支持力度較低時,直播平臺向消極規(guī)制方向演化,其支持系數越大演化速率越快,最終達到穩(wěn)定。當支持系數較大時,直播平臺由于支出過大,策略選擇不穩(wěn)定,無法達到穩(wěn)定狀態(tài)。 主播策略選擇隨時間變化的演化軌跡如圖12d所示。當支持系數較小時,供應商選用仿品,主播考慮到違規(guī)風險問題,選擇守規(guī)。當支持系數過大時,主播守規(guī)收益無法滿足利益需求,但存在違規(guī)風險過大問題,其策略選擇無法達到穩(wěn)定狀態(tài)。因此,只有當直播平臺對供應商支持力度調控在合適范圍內,才能調動主播守規(guī)的積極性。 不同補貼系數取值下,演化博弈仿真結果如圖13所示。在不同補貼系數下,直播電商系統(tǒng)三方博弈演化軌跡如圖13a所示。直播平臺為吸引主播守規(guī),遵守平臺規(guī)則,對守規(guī)主播進行補貼,且平臺補貼系數對主播決策影響顯著。若直播平臺不提供補貼,主播守規(guī)收益無法滿足利益需求,則主播選擇違規(guī)行為,供應商選用仿品。當補貼系數適中時,主播向守規(guī)方向演化,供應商策略選擇向正品方向演化,且趨向穩(wěn)定的速度隨補貼系數增加而變快,直至達到最終穩(wěn)定。當平臺補貼系數過大時,供應商策略選擇向正品方向演化,直播平臺選擇積極規(guī)制策略。 供應商策略選擇隨時間變化的演化軌跡如圖13b所示。當直播平臺對守規(guī)主播補貼力度過小時,主播選擇違規(guī)策略,供應商為增大收益選用仿品,經過考察這種狀態(tài)發(fā)生變化,供應商根據主播選擇相應策略。當補貼系數較高時,供應商策略選擇向正品方向演化,且演化速率隨著補貼系數增大而變快,最終達到穩(wěn)定狀態(tài)。因此,直播平臺高補貼系數可有效激勵供應商選用正品。 直播平臺策略選擇隨時間變化的演化軌跡如圖13c所示。當直播平臺對主播守規(guī)補貼力度較低時,直播平臺向消極規(guī)制方向演化,其補貼系數越大演化速率越快,最終達到穩(wěn)定。當補貼系數過大時,直播平臺由于支出過大,將選擇積極規(guī)制策略。因此,平臺對主播補貼力度需保持在較高水平上,方可推動直播系統(tǒng)正常發(fā)展。 主播策略選擇隨時間變化的演化軌跡如圖13d所示。主播策略選擇將隨著平臺補貼系數變化而產生不同行為選擇,當補貼系數過低時,主播選擇違規(guī)行為增加額外收益。當補貼系數較高時,主播守規(guī)獲取補貼足以滿足利益需求,開始向守規(guī)方向演化,且演化速率隨補貼系數增大而變快,最終達到穩(wěn)定狀態(tài)。因此,直播平臺高補貼系數可有效激勵主播遵守平臺規(guī)則,選擇守規(guī)行為。 圖13 補貼系數α的參數分析 違規(guī)收益因子取不同值時,演化博弈的仿真結果如圖14所示。在不同違規(guī)收益因子下,直播電商系統(tǒng)三方博弈演化軌跡如圖14a所示。當供應商選用仿品時,給違規(guī)主播帶來額外收益,違規(guī)收益因子對主播策略決策影響顯著。當違規(guī)收益因子較小時,主播違規(guī)獲取額外收益不足以吸引主播違反平臺規(guī)則,主播選擇守規(guī)行為,供應商選用正品,直播平臺選擇積極規(guī)制策略。當違規(guī)收益因子較大時,主播向違規(guī)方向演化,供應商選用仿品,平臺選擇消極規(guī)制策略,最終三方演化博弈系統(tǒng)達到穩(wěn)定。 供應商策略選擇隨時間變化的演化軌跡如圖14b所示。當違規(guī)收益因子較小時,主播由于收支不平衡選擇守規(guī)行為,供應商選用正品。當違規(guī)收益因子較大時,主播試圖選擇違規(guī)獲取額外收益,此時供應商策略選擇向仿品方向演化,其演化速度隨著違規(guī)收益因子的增大而變快,最終達到穩(wěn)定狀態(tài)。 直播平臺策略選擇隨時間變化的演化軌跡如圖14c所示。當主播違規(guī)收益因子較小時,直播平臺獲取收益較高,選擇積極規(guī)制策略。當主播違規(guī)收益因子較大時,直播平臺總收益逐漸降低,開始向消極規(guī)制方向演化,且其演化速度隨著違規(guī)收益因子增大而變快,最終達到穩(wěn)定狀態(tài)。 主播策略選擇隨時間變化的演化軌跡如圖14d所示。當違規(guī)收益因子較小時,主播獲得違規(guī)收益較小,選擇守規(guī)行為。當違規(guī)收益因子適度增加時,主播剛開始處于觀望狀態(tài),隨著時間增加,主播感知違規(guī)益處,向違規(guī)方向演化。當違規(guī)收益因子較大時,主播選擇違規(guī)策略,且演化速率隨違規(guī)收益因子增大而變快,最終達到穩(wěn)定狀態(tài)。 圖14 違規(guī)收益因子η的參數分析 本文針對直播電商平臺規(guī)制問題,從有限理性的角度出發(fā),構建直播電商系統(tǒng)中供應商、直播平臺和主播三方演化博弈模型,分析三方主體行為策略演化路徑及其聯(lián)動作用規(guī)律,得出的具體結論和建議如下: 1)考慮利益需求與風險程度,保持適當的懲罰與約束力度,有助于提高供應商和主播規(guī)范行為的積極性。當直播平臺對供應商、主播的懲罰與約束力度較大時,供應商策略行為向正品方向演化,但主播無法滿足利益需求,選擇違規(guī)行為;當懲罰與約束力度較小時,主播主播選擇違規(guī)行為,供應商考慮主播違規(guī)風險選用正品策略。因此,直播平臺應積極與政府監(jiān)管部門配合,加強部門、平臺聯(lián)動,對供應商出售仿品行為形成強大的震懾作用;同時加強對主播的道德教育,提高主播守規(guī)守紀意識,加強直播自律。 2)平臺較高補貼或支持雖鼓勵供應商和主播規(guī)范行為,但過高的補貼和支持將增加平臺負擔,使平臺演化無法到達穩(wěn)定。研究表明,當直播平臺對供應商支持系數適中,或給予守規(guī)主播補貼力度較大時,主播選擇守規(guī)策略,供應商選用正品。因此,平臺要控制補貼和支持力度,加大直播風紀的宣傳力度,提高主播及供應商對直播風氣的認知水平,從而推動直播電商運營秩序的發(fā)展。 3)違規(guī)收益因子是影響主播和供應商策略選擇的重要因素。研究表明,當違規(guī)收益因子較大時,主播選擇違規(guī)策略,供應商選用仿品。反之當違規(guī)收益因子較小時,主播將選擇守規(guī)行為,供應商選用正品策略,此時直播電商機制達到最優(yōu),從而推動直播電商發(fā)展。 本文的局限性在于模型分析結果是基于研究假設得出的,而假設中涉及參數是對現實的抽象,理想狀態(tài)下認為主播是否選擇違規(guī)完全取決于自身意愿與供應商策略選擇,未過多考慮其他因素,因此存在考慮因素不充分的缺陷;另一方面,未考慮消費者心理因素對整個直播電商的演化的影響,今后研究可將消費者作為博弈方之一,構建四方博弈體系。



2.2 直播電商系統(tǒng)演化的mABM仿真分析








3 參數分析
3.1 懲罰系數γ對三方演化博弈行為的影響

3.2 約束系數δ對三方演化博弈行為的影響

3.3 支持系數β對三方演化博弈行為的影響

3.4 補貼系數α對三方演化博弈行為的影響

3.5 違規(guī)收益因子η對三方演化博弈行為的影響

4 結論與展望