潘 定,謝 菡
(暨南大學 管理學院,廣東 廣州 510632)
近期,某旅游網站被推上了大數據“殺熟”的風口浪尖,某消費者稱同一時間預訂同一酒店的同一房型,作為白金會員的他卻比朋友的價格高出80元。雖然該旅游網站否認“殺熟”,但是大數據“殺熟”的確是目前很多電商平臺存在的問題。不同于傳統經濟中的“殺熟”,大數據“殺熟”是指電商企業依據對顧客購買歷史數據的收集、分析與挖掘,利用忠誠客戶的路徑依賴和信息不對稱,就同一商品或服務向其收取更高價格[1]。電商定價本因由市場決定,市場配置資源是通過價格進行的,這是市場經濟的內在要求,因此不需要政府干預[2]。但數字經濟下,由于數據的采集、分析、加工日趨成熟與普遍,用戶畫像更加清晰,消費者剩余被完全剝奪。互聯網下的信息不對稱讓大數據“殺熟”更加隱蔽,消費者很難察覺,隱私泄露的可能性和維權的難度增大。對電商企業而言,當“殺熟”獲得可觀利潤時,企業就不會技術創新,致使運作效率低下,同類競爭者和供應鏈企業之間的價格競爭惡化,產生負的市場外部性。對于市場而言,掌握大數據的電商企業可以輕易地形成合謀,從而壟斷市場并賺取超額利潤,導致市場失靈并嚴重威脅市場經濟的健康發展[3]。因此當市場不能優化資源配置并出現市場失靈時,就需要政府宏觀調控進行干預,從根本上遏制企業的歧視定價行為[4]。
現有文獻對于企業歧視定價的研究主要立足于企業和消費者兩個主體,但只有引入政府監管才能真正解決市場失靈的問題。數字經濟下,我國政府存在傳統監管和大數據監管兩種模式。本文從政府和電商企業兩個主體出發,但復雜的個體決策往往會受到決策信息的有限性、收益成本、以往經驗等因素的影響[5]。政府若采取大數據監管,企業畏懼其監管成功率高而選擇正常定價,而政府為降低監管成本會隨之轉變為傳統的事后監管。一旦政府采取傳統監管,其低成功率會誘發企業采取“殺熟”定價的機會主義行為。因為政府的監管策略與企業的“殺熟”策略會相互影響,這是一個長期的策略選擇過程,是一個有限理性下的博弈過程。決策是基于有限理性假設而非完全理性,本研究不適用于傳統的博弈理論。演化博弈理論假設參與者具有有限理性,并提供了一種在演化語境中進行多重均衡選擇的方法,在研究中更能貼近現實情況,在多種決策趨勢分析中得到應用[6],因此本文采用演化博弈來研究政府和企業的博弈。
出現大數據“殺熟”的根本原因是鑒于計算機和通信技術的發展[7],企業使用客戶的購買歷史數據來區分老顧客和新客戶的價格,爭取更多的消費者剩余,即一種基于行為的定價方式(BBP)[8]。早在2002 年,亞馬遜就被曝出同一件商品,會員的購買價格會高于非會員的購買價格[9]。通過研究國內近5 000 個購物平臺的瀏覽記錄,發現大部分網站采取價格歧視策略,一些消費者購買與其他人完全相同的產品卻支付雙倍價格[10]。
大數據“殺熟”問題一直是近幾年國內外研究的焦點。國外對于大數據“殺熟”的研究主要立足于競爭企業之間、供應鏈企業之間以及企業和消費者之間的博弈。歧視定價不僅會導致企業制定不同的價格策略,也會影響企業產品質量的差異化選擇[11]。與統一定價情形相比,基于購買歷史的價格歧視抑制了企業的技術創新,降低了運營效率[12],導致企業之間的價格競爭加劇[11],并減少消費者剩余[13]。企業可以根據消費者的先前購買行為調整其價格[14],消費者可以通過選擇匿名方式來避免被確定為老客戶,但可能需要付出代價,增加匿名成本雖可以使消費者受益,但達到一定程度之后效果會逆轉[15]。國外高度重視并采取法律措施來遏制這種歧視定價行為,因此這種歧視定價在國外主流電子商務中一直發展很慢[16]。國內對此研究主要以定性分析為主。從消費者權益保護的角度分析,以傾斜保護原則規范經營者的損害賠償責任是解決問題的必經之路[3],綜合發揮市場和政府的作用可以改善大數據“殺熟”的市場處境[1]。
對于電商企業的違法行為,政府干預監管的確可以有效解決問題。面對電商虛假評論行為,政府通過重點懲治虛假評論,規范網絡口碑發布行為,可以提高網絡口碑的真實率[17]。政府和企業的協同共治可以有效消除誘發商家刷單的社會因素[18]。政府監管部門降低打擊造假行為成本及提升相應的獎勵收益能更加有效地抑制電商造假行為[19]。商戶與消費者的信息不對稱性還導致電商失信問題日益突出,通過提高信用保證金、增強信用監管力度、增加偽裝成本可以有效避免失信行為[20]。網購環境中存在著較傳統市場環境下,更為嚴重的食品安全信息不對稱問題。面對產品質量問題,政府監管成本、懲罰額度、第三方檢測成本是影響產品質量博弈均衡的重要因素[21],而新媒體報道的影響力和真實性兩大因素也有重要作用[22]。對于歧視定價問題,政府也一直強迫企業向客戶披露基于行為的定價措施[23]。2019 年開始實施的《電子商務法》明確規定,電子商務經營者應當同時向該消費者提供不針對其個人特征的選項,力圖避免大數據“殺熟”行為。
國內外對于政府監管的研究以是否監管為主[24],對于采取何種監管策略的定量研究較少。但根據我國目前的環境狀況,政府部門對企業進行監管已勢在必行,因此監管策略的焦點從是否需要監管,轉變為如何進行監管[25]。目前我國政府監管方式有傳統監管和大數據監管兩種。傳統監管是一種“出現問題—解決問題”的事后被動監管,大數據監管是可以事前預測、事中跟蹤、事后控制的主動監管模式。傳統監管是在新公共管理(NPM)背景下依據行業特征,以市場為導向,強調強有力的組織領導和明確的績效激勵的監管方式[26]。這是一種側重于以政府為中心的監管1.0 形態,其技術支撐則是以政府網站、管理信息系統為代表的初期電子政務[27]。大數據監管是在數字化治理方式(DEG)下,以物聯網、大數據為技術特征,對市場行為監管由人工到智能、事后到事前、現場到遠程、滯后到實時、粗放到精準、分散到共享、常規到高效等實現集成化監管革新[28]。大數據監管有效解決了信息不對稱問題,從事后監管變為事前預測、制度設計與預防治理,提高了監管效率。但是傳統的監管并不是一文不值[26],政府監管模式改革的特點是組合不是替代,基于多種因素將不同監管方式組合成多維監管模式[29]。多維監管模式比單維的更具有靈活性[30],兩種監管模型可以互補,創造新的混合監管形式。目前我國是兩種監管模式并行,因此政府應該綜合考慮監管成本和收益,選擇最合適的監管策略。
綜上所述,國內外對大數據“殺熟”的研究主要立足于消費者、企業兩個主體,涉及政府如何對電商企業“殺熟”定價監管的問題,卻很少有學者探討。同時國內對于政府的博弈決策主要集中在政府是否監管,對于監管策略的選擇研究較少。大數據監管和傳統監管的監管效果和成本有較大差異,因此選擇何種監管方法也是本文重點研究的問題。隨著社會媒體的發展,消費者參與到政府監管中也越來越普遍,但消費者在大數據“殺熟”監管中究竟起何作用有待研究。故本文基于大數據“殺熟”現象,構建政府和電商企業的演化博弈模型,并根據演化博弈的進化穩定策略來分析政府與電商企業的動態策略選擇和博弈結果的影響機理。
本文模型中兩個博弈方為政府監管部門和電商企業,兩者均為有限理性的主體。根據演化博弈理論,反復在兩個群體中抽取一個成員配對進入策略選擇,政府的行為集合是(大數據監管,傳統監管),電商企業的行為合集是(不“殺熟”,大數據“殺熟”)。具體的基本假設如下。
假設1:電商企業用大數據“殺熟”的比例是x(0≤x≤1),電商企業不進行大數據“殺熟”,常規定價的比例為1-x;政府大數據監管比例為y(0≤y≤1),傳統監管的比例為1-y。博弈雙方都是有限理性。企業的目標是追求企業自身利益的最大化;政府作為國家的權力機構考慮的是社會發展的公平穩定和可持續性,代表整個社會的利益。
假設2:電商企業不采取“殺熟”定價銷售時的成本為C1,包括產品的生產成本、物流運輸費用等,同時其收益為R1。電商企業大數據“殺熟”時,其成本C1會因為利用大數據而降低至αC1(0<α<1),實現精準營銷、精準物流;還包括企業利用老用戶的歷史購買記錄、交易數據作為銷售定價的媒介,對老用戶進行個性化定價的成本C2,此時企業收益的為R2,且R2>R1。
假設3:政府選擇大數據監管,大數據的邊際成本趨近于0,基本成本包括實施成本和運行維護成本兩個主要部分共計為CB。實施成本主要包括數據搜集采集、數據清洗與數據加工費用、專業技術人員費用、軟硬件購置費用,等等;運行維護成本包括運行費用、管理費用和維護費用等。政府選擇傳統監管主要是線下的走訪、調查,所需人力和物力等成本為CT。政府監管查出電商企業存在大數據“殺熟”行為時,電商企業受到的處罰是F1,包括沒收收入、貨幣處罰等;還有經濟損失F2,包括顧客流失、銷量下降、品牌信譽度下降、消費者索賠、產品召回等。此時政府可以獲得相關收益F1,包括物質獎勵等。
假設4:政府采取傳統監管是指事件發生后,消費者維權或者媒體曝光后政府派人跟蹤調查,此時消費者維權或者媒體曝光的概率為λ。政府傳統監管時,對“殺熟”企業監管的成功概率為γ,采取大數據監管時成功的概率為β,并且線上利用大數據監管效果肯定好于傳統的線下調查走訪,因此0≤γ<β≤1。
從表1 可以得到,政府和企業的策略集合可以分為(大數據監管,“殺熟”)、(大數據監管,不“殺熟”)、(傳統監管,“殺熟”)、(傳統監管,不“殺熟”)。不同策略集合的群體收益變化決定整個系統是否達到納什均衡。

表1 政府和企業的行為選擇及收益矩陣
1.演化過程的均衡點。根據表1 的收益矩陣,政府選擇大數據監管和傳統監管時的期望收益UG1,UG2和群體平均收益UG分別為:

根據Malthusdian 動態方程[21],政府的復制動態方程為:

同理,電商企業“殺熟”定價和不“殺熟”定價的期望收益為:

電商企業的復制動態方程為:

根據Malthusdian 方程,可以知道政府大數據監管和企業“殺熟”的復制動態方程組形成一個二維動力系統。為便于分析系統的均衡性及穩定性,令,系統的均衡點為:(0,0)、(0,1)、(1,0)、(1,1)、(A,B)。
2.穩定均衡點及穩定性分析。復制動態方程求出的均衡點不一定是系統的演化穩定策略(ESS),根據Friedman 提出的研究方法,其均衡點的穩定性可由該系統雅可比矩陣的局部穩定性分析得到[31]。下面研究這些均衡點的局部穩定性,該動態系統的Jacobian 矩陣為:

矩陣中的n11、n12、n21、n22分別為:

如果同時滿足以下兩個條件,則復制動態方程的均衡點就是演化穩定策略(ESS)[21]。
trJ=n11+n22<0(跡條件);
根據5 個局部均衡點處的具體取值變化,我們可以看出,在局部均衡點(A,B)處矩陣的跡為0,不滿足演化穩定策略的條件,所以此均衡點不是ESS。其他四個局部均衡點處具體取值(如表2 所示)。
通過MATLAB 對演化博弈模型進行仿真,可以更加直觀地分析在不同參數變化時政府和企業系統的演化過程,以及演化穩定策略。

圖1 穩定點(0,0)演化仿真結果

圖2 穩定點(0,1)演化仿真結果

圖3 穩定點(1,0)演化仿真結果

圖4 穩定點(1,1)演化仿真結果
在信息不對稱及有限理性的條件下,將演化博弈運用到企業大數據“殺熟”定價中,建立了政府與電商企業的演化博弈模型,通過求得各自的復制動態方程和進化穩定策略,分析了影響政府和企業策略選擇的影響因素,并運用MATLAB 仿真模擬進行分析結果的驗證。研究結果表明:
1.政府監管成本、處罰力度、“殺熟”凈收益、監管成功率以及第三方監管概率是影響雙方博弈系統的關鍵因素。企業策略受到大數據“殺熟”凈收益ε、大數據監管成功率β 和傳統監管的期望成功率λγ 三者之間大小的影響。當β 和λγ 均高于ε 時,可以從根本上解決“殺熟”的機會主義行為[25]。兩種監管策略的期望成本和期望監管收益是影響政府策略選擇的關鍵因素,當兩種監管成本比值大于傳統監管概率λ 時,政府會選擇大數據監管策略。若監管成本和監管成功率得不到保障,系統則會陷入“大數據監管—不‘殺熟’—傳統監管—不‘殺熟’—大數據監管”的循環怪圈,因此“殺熟”定價行為得不到根本性解決。
2.政府與電商企業的策略選擇是一個動態的博弈過程,從系統演化中可以看出具有明顯的路徑依賴特征。政府在企業所得收益損失率大于任何一種監管成功率時,改傳統監管為大數據監管策略,或提高查處大數據“殺熟”行為的懲罰力度來強力規制企業的違規行為,通過改變收益損失率來影響企業的理性決策,使其策略朝著有利于政府大數據監管和促進企業合理定價的方向發展。總之,政府若能在這一時期審時度勢、分階段實施不同措施,就可以有效遏制企業的“殺熟”行為。
根據上述研究結論,提出如下建議:
第一,優化傳統監管模式,實現與第三方協同監管,提高傳統監管效率。線下也要積極進行群眾調查,了解消費者一些購買數據,從中鎖定存在“殺熟”可能的電商平臺進行重點監管。建立大數據“殺熟”名單,并對記錄在案的企業進行定期查訪。同時,政府應該加大隱私保護和維權意識的宣傳力度,培養消費者有害信息識別、有效信息解決問題的能力,養成良好的網絡消費習慣。積極鼓勵消費者利用法律手段,積極維護自身合法權益,并簡化消費者維權舉報流程,提高維權和辦事效率,多種渠道開通監管維權平臺。
第二,加強數據信息系統建設,提高大數據監管成功率。政府部門要加大數據安全管理裝備的投入,配置檢測設備,建立價格檢測機制。一方面,政府可以利用收集到的大數據信息對產品、服務建立基準價格體系,給消費者購買時基本的價格參考。另一方面,開展價格監測監控,充分發揮大數據的預測功能,通過對現有價格數據的分析,形成對未來價格波動趨勢的預測。政府還可以利用區塊鏈技術將用戶信息儲存在分布式數據庫中,憑借其去中心化、去信任、不可更改、匿名性等特點,有效解決數據泄露濫用、低存儲效率和高成本等問題。
第三,建立有效的信息共享途徑,實現數據主導下的公共服務價值共創,降低大數據監管成本。信息共享機制分為橫向和縱向兩種共享途徑[32]。橫向是指各個地方政府監管部門之間的信息共享,建立企業定價數據監控管理的溝通渠道。各地方政府監管部門可以第一時間共享價格波動數據、監管歷史數據和監管經驗方法,可以有效的解決監管部門之間信息不對稱問題。縱向是指自上而下的,從監管部門到電商企業再到公眾的信息共享途徑。對于民眾而言,關注政府提供的監管服務,更加關注政府監管的進度。大數據技術不但為民眾對政府監管過程的參與和了解提供可能,而且提高了政府的公信力。