章 超 徐名海
(南京郵電大學通信與信息工程學院 江蘇 南京 210003)
近年來,隨著我國市場化程度越來越高,同行企業間為爭奪市場、擴大占有率采取各種營銷策略。作為一種傳統的市場營銷策略,價格競爭策略在現代市場競爭中具有重要的作用。網絡化博弈是一種研究市場價格競爭策略的重要方式,其在博弈理論中引入網絡拓撲的概念。網絡化博弈在社會網絡、生物網絡、信息網絡與交易網絡中都具有廣泛的應用,從一個團隊成員間的競爭合作博弈關系到國內運營商市場中電信、移動和聯通三大品牌的博弈,汽車市場各品牌的價格競爭,甚至國家與國家間的博弈交涉,不同規模的網絡都可以借助博弈論進行分析。
經典博弈論是用數學方法研究主體在特定環境和一定規則下如何選擇策略和行動方案,如:Li等[1]運用納什均衡理論研究高頻通信系統中的信道分集問題;Zhang等[2]使用博弈論框架設計用于抑制主瓣中的欺騙性干擾的最佳發射極極化;Ding等[3]將博弈論方法應用于分析和調節復雜網絡中節點的行為;Jing等[4]以伯特蘭模型為基礎,探討港口物流企業間的價格競爭;Fu等[5]采用價格戰博弈模型分析中國電信企業如何獲得競爭優勢等。但是經典博弈論存在三種缺陷:假設缺陷、方法缺陷和實證缺陷[6]。其中:假設缺陷[7]是指經典博弈論假設博弈參與個體是完全理性的,可以獲得完全的信息,參與人還可以通過精確計算推理得到最優策略,然而現實中的參與人只具有有限理性;方法缺陷[8]是指經典博弈論關注如何求出博弈的均衡解,但不能解釋博弈的參與者是如何達到均衡的,這就忽略了博弈的過程;實證缺陷是指經典博弈論基于理想的假設和精確的數學推導,現實中的實驗卻發現博弈并非按照人們預期方向發展[9]。
演化博弈論[10]是結合博弈論和動態演化過程分析發展起來的一種理論,研究有限理性個體在一個動態過程中如何隨時間演化在重復博弈中自適應地學習,選擇最優策略以最大化自身利益的問題。網絡化博弈主要在演化博弈理論中引入網絡拓撲的概念,其研究途徑可以歸結為兩方面:(1)從個體出發,研究群體層面的策略選擇機制;(2)從群體需求出發,研究個體層面的干預調控機制[11]。為了剖析個體層次的行為規則與群體層次的涌現行為之間的復雜關系,國內外許多學者做了深入研究。Nowak等[11]首先將空間結構引入囚徒困境,研究二維方格子上的重復囚徒困境博弈;Szabo等[12-13]則在方格格子上的簡化囚徒困境基礎上,使用蒙特卡羅仿真和動態聚類技術研究穩態下合作者的密度;Vukov等[14]研究平均度為4的兩種正則格子上的囚徒困境,發現收益和噪聲(溫度)對維持合作具有影響,當改變噪聲水平和(或)最高收益時,系統表現出從合作者和叛逃者的混合狀態到僅叛逃者活著的吸收狀態的二階相變;Wang等[15]考慮到個體的決策過程與記憶經驗密切相關,提出一種基于記憶的雪堆博弈模型;Hauert等[16]研究隨機正則小世界網絡上的囚徒困境博弈行為,研究發現拓撲隨機化有利于合作的涌現,與方格格子相比,合作者更容易在隨機網絡上結成大的合作簇,促進合作行為在隨機網絡上的涌現;Santos等[17-19]研究無標度網絡上的兩人兩策略博弈行為,通過與全耦合網絡和隨機網絡上的兩人兩策略博弈行為比較發現,不論是囚徒困境博弈,還是雪堆博弈或者獵鹿博弈,BA無標度網絡都能極大地促進合作行為的涌現;翟丹妮等[20]通過構建移動通信產業產學研合作網絡,建立網絡演化博弈模型;徐建中等[21]研究無標度網絡上的企業低碳創新合作行為的網絡演化機理;張宏娟等[22]基于復雜網絡演化博弈對傳統產業集群低碳演化模型進行了研究。總體而言,目前絕大多數網絡化博弈研究主要存在四個問題:(1)網絡拓撲局限于規則網絡(方格格子、Kagome格子和四點派系正則格子等)、小世界網絡或者無標度網絡;(2)缺少考慮博弈個體之間的競爭激烈程度的不同,博弈個體之間的差異化會導致競爭強弱不同;(3)博弈模型缺乏實際性,如博弈模型中沒有考慮環境背景等在實際社會中會對博弈參與者決策帶來重要影響的因素;(4)網絡化博弈建模方式欠佳,網絡化博弈是一種自下而上的科學范式,它通過對個體的行為規則、個體之間的交互方式和結構進行建模,對動態變化的復雜系統適宜采用基于Agent的建模方式。
本文針對上述問題,選取南京地區汽車品牌市場為應用場景,提出一種基于Agent的網絡化博弈建模方式,構建符合現實的復雜網絡拓撲結構,在網絡拓撲中引入“強競爭”和“弱競爭”的概念,建立博弈模型。
考慮到汽車品牌市場的復雜性,本文以南京地區汽車品牌市場為應用場景,車型只選擇中大型車,并基于價格設定汽車品牌為四檔,分別記為超豪華系列(如賓利)、一線豪華系列(如寶馬5系)、二線豪華系列(如凱迪拉克CT6)和普通高端系列(如大眾帕薩特)。
實際經濟活動中,許多因素都會影響到汽車品牌間的價格競爭。如消費者生活地區的經濟水平、地理位置、政策形勢等環境背景因素,消費者品牌忠誠度因素,汽車品牌的合謀、車型屬于家用車還是商務車、汽車品牌的宣傳力度、售后服務和科研投入等汽車品牌本身因素。
應用場景如圖1所示,每個小車代表一種汽車品牌,汽車品牌分為四檔,消費者地區以南京為例。

圖1 應用場景
本文研究南京汽車市場的網絡化博弈建模,需要構建網絡拓撲結構,針對汽車品牌之間的競爭關系鏈路建模,并結合影響汽車品牌價格競爭因素建立博弈模型。考慮到影響汽車品牌價格競爭的因素較多,為簡化分析,在后續的網絡化博弈模型中,假設南京地區消費者用戶均為價格敏感用戶,汽車品牌本身因素只考慮汽車品牌的合謀,環境背景因素不予考慮。
網絡化博弈理論首先由Nowak等提出,網絡結構、博弈模型和策略更新規則是網絡化博弈的三個要素[23]。
圖論是一種有效的構建網絡的方式,根據圖論構建網絡G=(V,E),其中:V表示網絡中節點的集合;E表示所有邊的集合。因此,本文基于南京地區汽車品牌的銷售情況,構建汽車品牌間的價格競爭網絡。具體來說,V為汽車品牌的集合,eij∈E表示品牌i和品牌j之間存在競爭關系。用鄰接矩陣A=[aij]來描述汽車品牌間的價格競爭網絡,aij表示品牌j對品牌i的競爭程度(aij不一定等于aji),其中aij用式(1)來表示。
(1)
網絡結構如圖2所示,其中每個節點代表一種汽車品牌,不同的灰度表示汽車品牌所屬的檔次不同,節點間的邊粗細表示競爭關系的強弱aij。

圖2 網絡結構
關于汽車品牌競爭關系的強弱,考慮到不同檔品牌面向消費者用戶不同,產品差異化程度不同,不能片面地用銷量來分析,本節從同檔次不同品牌間的競爭和不同檔次不同品牌間的競爭兩個方面分析。
(1)同檔次不同品牌。同檔次不同品牌間的競爭強弱是不同的,在60個汽車品牌近10個月南京市銷量(數據來源:e易車、車主之家)的基礎上運用Pearson系數來劃分競爭強弱關系,計算式表示為:
(2)

(2)不同檔次不同品牌。不同檔次不同品牌間的競爭強弱也是不同的,以兩檔品牌平均價格差為基礎,劃分到不同的競爭段,得出不同檔次品牌間的競爭關系。競爭關系的權值如表1所示。

表1 競爭關系
2.3.1模型基本假設
假設1:假設有限理性。有限理性意味著各博弈方在策略選擇的過程中,并不是一開始就能找到最優策略,而是通過在博弈中不斷學習、更新進而找到較優策略。
假設2:假設主體在選擇博弈對手進行博弈時,將博弈范圍r限定在鄰域內,博弈半徑r=1。實際網絡中各品牌由于成本等條件限制,無法與網絡中其余所有品牌進行比較,因此假設博弈半徑r=1更符合實際情況。
假設3:假設所有品牌只有不降價和降價兩種策略,并采用同一策略更新規則。汽車品牌降價可以看成汽車品牌不合謀,而汽車品牌不降低價格可以看作汽車品牌合謀(合謀:企業協調相互競爭關系以使利潤最大化)。
假設4:假設市場上有兩個差異化品牌i和j,品牌的差異程度可以用交叉價格彈性Eji來衡量[24]。Eji表示品牌j價格變化對品牌i需求量變化的影響,Eji的計算式為:
(3)
式中:Qi、Qj為品牌i、j的市場需求量;Pi、Pj分別是品牌i、j的價格。為便于分析,本文構造品牌i和j的需求函數:
Qi=Qi(Pi,Pj)=a-aijPi+Pj
(4)
Qj=Qj(Pi,Pj)=a-ajiPj+Pi
(5)
式中:aij為品牌j對品牌i的競爭強弱程度;市場需求總量a為常數。假定品牌i、j的邊際成本為MCi=MCj=c(a>c),則品牌i、j利潤為:
πi=(Pi-MCi)Qi=(Pi-c)(a-aijPi+Pj)
(6)
πj=(Pj-MCj)Qj=(Pj-c)(a-ajiPj+Pi)
(7)
假設5:假設品牌i、j合謀時產生的附加收益Lij(MCi+MCj)。Lij指利益分配系數,表示品牌i分配利益占i、j合謀產生附加利益的比,同理Lji指品牌j分配利益占i、j合謀產生附加利益的比。
假設6:假設品牌i、j合謀時,一方背叛合謀會受到懲罰δi=δ(MCi+MCj)以及收益ηi=η(MCi+MCj),其中:δ、η分別記作違約懲罰系數和背叛收益系數。當品牌i、j不合謀時,不存在違約懲罰和背叛收益,即δi=0、ηi=0。
2.3.2支付矩陣及收益函數


表2 收益矩陣

(8)
Ti=(Pi-MCi)Qi-δi+ηi=
(Pi-c)(a-aijPi+Pj)-(δ-η)2c
(9)
Si=(Pi-MCi)Qi-ηi+δi=
(Pi-c)(a-aijPi+Pj)+(δ-η)2c
(10)
Ri=(Pi-MCi)Qi+Lij(MCi+MCj)=
(Pi-c)(a-aijPi+Pj)+Lij2c
(11)
假設在博弈初始階段只有汽車品牌i和汽車品牌j,品牌i選擇不降價(合謀)的概率為x,選擇降價(不合謀)的概率為1-x,品牌j選擇不降價的概率為y,選擇降價的概率為1-y。x和y是時間t的函數,根據收益矩陣可知:
品牌i采取合謀(不降價)時的收益為:
Uij1=yRi+(1-y)Si=y[(Pi-MCi)Qi+Lij(MCi+
MCj)]+(1-y)[(Pi-MCi)Qi-ηi+δi]=
(Pi-c)(a-aijPi+Pj)+yLij2c-
(1-y)(η-δ)2c
(12)
品牌i采取不合謀(降價)時的收益為:
Uij2=yTi+(1-y)Pi=y[(Pi-MCi)Qi-δi+ηi]+
(1-y)(Pi-MCi)Qi=
(Pi-c)(a-aijPi+Pj)-(δ-η)2c
(13)
則品牌i以x概率不降價,1-x概率降價的平均收益為:
Uij=xUij1+(1-x)Uij2=(Pi-c)(a-aijPi+Pj)+
xyLij2c+(η-δ)2c(xy+1-2x)
(14)
同理品牌j以y概率不降價、以1-y概率降價時的平均收益為:
Uji=yUji1+(1-y)Uji2=(Pj-c)(a-ajiPj+Pi)+
xyLji2c+(η-δ)2c(xy+1-2y)
(15)
通過上述收益函數,可得到復制動態方程[25]:
x(1-x)[yLij2c-(2-y)(η-δ)2c]
(16)
y(1-y)[xLji2c-(2-x)(η-δ)2c]
(17)
將式(16)和式(17)聯立,可以得到汽車品牌i、j的復雜動力系統為:
(18)
令F(x)=F(y)=0,可以得到局部穩定點為E1(0,0)、E2(0,1)、E3(1,0)、E4(1,1)。
2.3.3策略更新規則
大多數學者在分析復雜網絡中個體的博弈行為時指出,在網絡演化的過程中,節點的效用和收益是非常重要的指標。因此,本文研究汽車品牌在復雜網絡中的個體行為時,仍將節點的收益作為重要的衡量指標。
網絡中任意汽車品牌節點的策略更新規則:
(1)每一時刻汽車品牌個體與其所有鄰居節點進行博弈,每次博弈作為一個博弈周期;一次博弈完成后,計算當期收益Ui(t)。
(19)
式中:Uij為節點i和節點j博弈后所獲得的當期收益;θi為節點i的鄰居節點,θi數值的大小等于節點i的度ki。
(2)費米規則。在每一輪博弈中,節點i以當期收益Ui(t)為基準,隨機選擇一個鄰居j進行收益的比較;下一輪中i采取j本輪策略的概率根據統計物理中的費米函數計算[14]:
(20)
式中:si(t)、sj(t)分別表示i、j本輪采取的策略;κ指環境的噪聲因素,反映了節點在策略更新時的不確定性;當κ→0時,意味著策略的更新是確定性的,節點i的非理性選擇趨近于0,相反,當κ→∞時,意味著節點處于噪聲環境中,無法做出理性決策,只能隨機更新自己的策略。
本文的實驗目的是對所構建的網絡化博弈模型進行驗證和分析,可以分為以下兩點:(1)分析模型的精度,并與其他方法進行對比,驗證網絡化博弈模型的可行性和優越性;(2)對影響模型的部分因素進行數值分析。
網絡化博弈是一種自下而上的科學范式,它對個體的行為規則、個體之間的交互方式和結構進行建模。因此本文采用基于Agent建模方法ABM(Agent Based Modeling),并將NetLogo作為實驗平臺。
本文首先對南京地區汽車品牌市場的價格競爭進行抽象,構建網絡拓撲結構。通過數據調研搜集,可以獲得以上模型的數據,為便于分析,參數設定如表3所示。
3.2.1模型精度分析
為驗證基于Agent的網絡化博弈模型與現實汽車品牌價格競爭的符合程度并計算誤差,本文以奧迪A6L為例,統計了其在近十個月份的實測市場價格,并與基于Agent的網絡化博弈模型的仿真結果進行對比,結果如圖3所示。

圖3 1月至10月網絡化博弈仿真價格與實測價格對比
可以看出,基于Agent的網絡化博弈模型在1月至10月仿真價格與實測價格非常相似。為更直觀地表示相似情況,用范數平均相對誤差NMRE公式(式(21)),求出基于Agent的網絡化博弈模型仿真價格與實測價格的NMRE為2.11%。
(21)

為體現基于Agent網絡化博弈模型相比于其他方法的優越性,本文與改進前的規則網絡(方格子網絡)博弈以及不考慮競爭強弱的網絡化博弈進行對比。仿真價格與實測市場價格的范數平均相對誤差如表4所示。

表4 多種模型仿真價格與實測價格相對誤差對比
除此之外,基于Agent網絡化博弈相對于改進前的兩種博弈更貼近現實市場。
圖4(a)、(b)和(c)分別是三種模型仿真價格演化曲線與實際價格演化曲線的對比,圖4(d)是前三幅圖的匯總,包含4種模型價格演化曲線的對比。

(a) (b)
綜上所述,本文提出的基于Agent的網絡化博弈模型誤差小,更貼合于實際汽車品牌市場的價格競爭,具有有效性、高精度性。
3.2.2影響因素數值分析
數值分析如圖5所示。

(a)參與意愿x、y同時變化的演化結果 (b)參與意愿x變化的演化結果
(1)初始意愿對演化關系的影響。圖5(a)是在其他參數不變的情況下(控制變量法,下同),品牌i、j參與合謀的初始意愿變化對演化關系的影響,違約懲罰力度δ=3,背叛收益系數η=5,其中:橫坐標t指博弈次數;縱坐標p指品牌參與合謀的意愿的概率。假設品牌i、j的參與合謀的初始意愿相同,即x=y,由圖5(a)可知,當初始意愿x、y大于零時,x、y均收斂于1,最終平衡點趨向于(1,1)。當初始意愿x、y都等于零時,x、y均收斂于0,最終平衡點趨向于(0,0)。初始意愿x、y越大,收斂速度越快;初始意愿x、y相等時,品牌i收斂速度大于品牌j的收斂速度。圖5(b)是在其他參數不變的情況下,品牌i參與合謀的初始意愿變化對品牌j參與合謀策略的影響。由圖5(b)可知,初始意愿x、y均大于零,收斂于1,最終趨向于平衡點(1,1)。初始意愿x的增大,會加快y的收斂速度。這說明品牌i參與合謀的初始意愿越高,越會促進品牌j參與合謀。圖5(c)是在其他參數不變的情況下,品牌j參與合謀的初始意愿變化對品牌i參與合謀策略的影響。
(2)違約懲罰力度對演化關系的影響。圖5(d)、(e)是在其他參數不變的情況下,違約懲罰力度δ變化對品牌i、j參與合謀策略演化的影響,初始意愿x=y=0.5,背叛收益系數η恒為5。可以看出違約懲罰力度δ的臨界值在3~4之間。當δ小于該臨界值時,x、y收斂于0,最終平衡點趨向于(0,0),此時δ的增加使x、y的收斂速度減慢,δ相同時利益分配系數大的品牌收斂速度小于利益分配系數小的品牌。當δ大于臨界值時,x、y收斂于1,最終平衡點趨向于(1,1),此時δ的增加使x、y的收斂速度加快,δ相同時利益分配系數大的品牌收斂速度大于利益分配系數小的品牌。這是因為當δ小于臨界值時,違約懲罰力度小于背叛收益,品牌不合謀可以獲得更多的收益,說明了增大違約懲罰力度δ可以促進品牌的合作合謀。
(3)利益分配系數對演化關系的影響。圖5(f)是在其他參數不變的情況下,利益分配系數變化對品牌i、j參與合謀策略演化的影響,初始意愿x=y=0.5,違約懲罰力度δ=3,背叛收益系數η=5。可以看出利益分配系數越大,對應x或y收斂速度越快,最終趨于平衡于(1,1)。這說明利益分配系數大的品牌傾向于合謀,通過合謀獲得更大的收益。
綜上所述,汽車品牌間的價格競爭對違約懲罰力度δ最為敏感,對利益分配系數Lij和參與合謀初始意愿x、y敏感次之。增大違約懲罰力度δ可以有效促進品牌間的合作合謀行為,實現利益更大化;利益分配系數和參與合謀初始意愿越高,汽車品牌越傾向于參與合謀。
本文提出一種基于Agent的網絡化博弈建模方式。在建模過程中,以南京地區汽車品牌間價格競爭現象為應用場景,將汽車品牌看作Agent個體。接著基于現實網絡復雜結構特征,引入“強競爭”、“弱競爭”概念,并結合地區經濟水平背景因素,運用演化博弈理論研究有限理性下汽車品牌價格競爭行為。最后,以NetLogo軟件進行仿真實驗,與汽車品牌市場實測價格數據和傳統網絡化博弈模型對比,驗證了本文提出模型的有效性和高精度,并通過MATLAB軟件對影響價格競爭的部分因素進行數值分析。分析結果表明,違約懲罰力度δ對汽車品牌間的價格競爭影響最為顯著,利益分配系數Lij和參與合謀初始意愿次之。這些分析結論對指導汽車品牌間價格競爭的競合關系具有一定的理論和實踐價值。
本文存在一定的局限性,例如,選取汽車品牌數目有限,會使網絡中汽車節點中心性與現實存在偏差,從而導致網絡拓撲結構偏差較大。除此之外,本文對汽車品牌競爭關系強弱的劃分較粗糙,這會造成網絡拓撲結構的偏差。消費者生活地區地理位置、政策形勢等環境背景因素,消費者品牌忠誠度因素,汽車品牌的宣傳力度、售后服務和科研投入等汽車品牌本身因素等均會對價格競爭帶來影響,致使博弈模型不同。這些不足有待今后研究改進。