不完全信息四人幫模型的建設工程競標合作均衡分析＊

2015-07-02 08:08:38李海霞王祖和修瑛昌王根霞

經濟數學 2015年3期

關鍵詞：戰略

李海霞，王祖和，修瑛昌，王根霞

（山東科技大學經濟管理學院，山東，青島 266590）

1 引言

博弈論作為數學研究領域的一個分支，主要應用于分析競爭形勢，競爭結果往往不僅是個人選擇和機會的結果，還依賴于其他參與者的決策．因此競爭結果是由所有參與者的行為決定的，每個競爭參與者都試圖得到其他參與者選擇信息，再做出自己的最佳策略．建設工程投標報價決策中，投標者競爭的關鍵是智勝對手，引入博弈論的精髓在于博弈中的一個理智決策者必須以考慮其他參與者的反應為基礎來確定自身最理智的投標報價方案．因此博弈論適用于研究投標報價決策問題．

研究結果表明［1］，在完全信息條件下，只要是有限次的博弈重復，不論重復的次數是多少，都能出現唯一的子博弈精煉納什均衡，即所有參與者在每次博弈中都選擇靜態策略（假設存在唯一靜態博弈的精煉納什均衡），也即參與人在有限次重復博弈條件下不會選擇合作．但在實際投標活動中經常存在投標者之間相互串標，導致投標價大幅提高或者出現競爭者以低于其成本中標的結果．可見應用完全信息條件下靜態博弈來研究投標者的報價決策有一定的局限性，不完全符合實際狀況．

基于博弈論的投標報價模型的基本假設是所有投標者的決策都是針對競爭對手決策行為直接反映并且所有投標者的決策都是其最優報價決策［2］．在求解最優報價過程中，通常對成本分布函數的分布做種種假設［3］，在實際中要想獲取競爭對手的成本分布函數非常困難．因此通過基于博弈論的投標報價策略來預測競爭對手的報價決策困難很大．鑒于此，通過基于博弈論原理來研究投標過程中競爭對手之間的合作均衡規律．

2 競標博弈模型的構建

2．1 精煉貝葉斯納什均衡

博弈論中先行動者為了不讓后行動者利用其行為結果，在行動之前都會設法傳遞對自己最有利的信息，避免將對自己不利的信息傳遞出去．因此投標者之間的競爭決策是信息不完全的動態博弈過程．研究結果已經證明“四人幫”聲譽模型（Kreps，Mailgram，Robbers and Wilson Reputation model，1982，簡稱KMRW）可以有效的解決信息不完全條件下的重復博弈問題［4－5］，可以利用信息不完全有限次重復博弈的“四人幫”聲譽模型來研究建設工程投標報價中投標者之間是如何建立競爭與合作的均衡關系．

若設定投標者1具有大于0的概率q是不理智的，即在競標報價過程中會出現不論對方報價如何決策，投標者1都有可能出現不理智的任何報價策略；投標者2對投標者1的這一不理智概率q是已知的，已知的方法是通過使用貝葉斯法則觀察投標者1的行為中獲取的．在一般的“四人幫”模型中，對所有參與者的屬性的推斷均體現在他的信譽之中［6］．舉例而言，如果在向銀行貸款的過程中一個企業向來有按時還貸的良好信譽，當在建立企業與銀行之間的信貸博弈模型并考慮劃分企業的屬性時，銀行對該企業向來能做到按時還款這種屬性賦予一個正的條件概率．

精煉貝葉斯均衡是一個先驗戰略組合m＊（t）＝（m1＊（t1），．．．，mn＊（tn））和一個貝葉斯后驗概率組合q＝（q1，…，qn）的組合，需要滿足以下條件：

1）對于每一個參與者i，在所有的信息集A里邊，∈argmax

2．2 模型的基本假設

1）假設投標者有理智和非理智兩種屬性，每個投標者在投標前均清楚自己的屬性，而不清楚對手的屬性，但嚴格意義上來講這種信息不完全條件實際上是相仿的信息不完全條件，所以投標者會對對手可能的屬性有一個主觀判斷．

2）在投標中，投標者與招標人之間不存在約束力關系，即各自獨立作出各方的決策．

3）投標者的總利潤是所有時段博弈利潤貼現后的現值之和．

4）業主沒有對于哪一個投標者有特殊偏愛，即所有投標者面臨的風險是等量的．

5）本文中假設的中標方式是最低價中標方式．

2．3 模型的博弈要素分析

1）參與人

目前雙人博弈已經具備了比較成熟的理論和算法，而對于參與者人數n＞2的多人博弈而言，計算量遠遠高于雙人博弈，求解過程更為困難．鑒于此，為計算簡便本文將實際問題中的大于三人的博弈轉化為雙人博弈來處理，也即將所研究的一個投標者定義為博弈者1，然后利用Friedman投標報價模型中的平均對手法則將其余n－1個投標者進行虛擬等值定義為博弈者2．

2）投標策略及利潤函數

為了減少計算量，設定投標者的投標策略集合為高投標價或低投標價，投標者在兩種策略下的利潤組合如表1所示．

表1 投標者競標利潤組合表

3 競標博弈模型精煉貝葉斯納什均衡的求解

3．1 投標者之一為完全理智的情形

1）兩投標者競標的博弈順序

首先假設投標者1有具有非理智屬性的條件概率為q，對應的理智屬性條件概率為1－q．為計算簡單，假設投標者2是完全理智的．理智屬性的投標者1（以下簡稱Z1）可以任意選擇“高投標價”或“低投標價”．在對模型進行分析時，假設非理智屬性投標者1（以下簡稱FZ1）只有一種戰略：勢不兩立戰略．這種假設下一旦他偏離了“勢不兩立”戰略，就立即暴露出他是理智的．有了這個假設，就可以集中精力對理智屬性投標者2（以下簡稱Z2）的戰略選擇進行分析．對于FZ1，他的戰略是：開始選擇“高投標價”，此后在y時段選擇Z2在y－1時段的選擇（即選擇Z2上次的投標策略）．

在上述假設條件下，“四人幫”聲譽模型下兩投標者競標有如下的博弈順序：

①投標者1知道自己的屬性，投標者2只知道投標者1屬于理智和非理智屬性的概率．

②得到第一時段博弈結果之后，進入第二時段博弈；得到第二時段博弈結果之后，進入第三時段博弈．如此重復博弈Y次．

③所有時段博弈的利潤的現值之和作為兩個投標者在博弈中的總利潤（本文假設現值系數θ＝1）．

完全信息條件下重復博弈中兩個投標者的屬性都是“理智的”，每個投標者在開始時段博弈中的選擇都是合作的“高投標價”行為．此時意味著2個投標者都有著合作的信譽，他們都采取一種 “勢不兩立”戰略：選擇合作一直到競爭對手在y時段選擇“低投標價”（對抗）為止，然后從y＋1時段開始一直到Y都選擇“低投標價”（對抗）．勢不兩立戰略代表著一種“對對手的背信棄義行為絕不原諒”的原則．隨著對手的第一次選擇“低投標價”的背叛使得這種合作的信譽終止．但是在“四人幫”模型中，投標者1因“理智”屬性的概率是1－q，就存在概率非理智概率q去采取“勢不兩立”戰略，即開始選擇“高投標價”（合作），以后己方采取的方案就是對方上次所選擇的方案．這樣合作的可能就出現在重復博弈中．至少在開始的第一時段投標者1的合作信譽可以通過條件概率q表現出來，因為條件概率為q的非理智屬性投標者1開始的選擇高投標價體現了合作愿望．

2）博弈重復兩次的情形

用L代表“低投標價”，即L可以表示對抗的行為；用H代表“高投標價”，即H表示合作行為．現在從最后一個時段（y＝2）開始逆向倒退進行討論．在最后博弈時段，因為L嚴優于H，所以Z2和Z1都會選擇L報價．而這時FZ1的選擇依賴于Z2在第一時段的選擇，不妨設選R（R可以是L或H）．退到第一時段，根據假設，因為FZ1采取“勢不兩立”戰略，所以FZ1開始應選擇H（“高投標價”）；Z1必然選擇他的嚴格占優戰略L，而且他這時的選擇不會影響Z2在第二時段的選擇．這樣，討論的中心問題就集中到Z2在第一時段的選擇R到底是L還是H上．因為他的選擇直接影響到FZ1在第二時段的選擇．兩時段博弈進行情況如表2所示．對于第1時段博弈收益結果可以由圖1所示的擴展式中表述．

表2 博弈重復2次報價組合（Y＝2）

圖1 階段博弈收益擴展式

如果Z2選擇R＝H，也就是選擇合作行為，這時他的期望利潤為

由于Z2在第一時段選擇了H，因而在第二時段中，FZ1和Z1以及Z2的選擇依次是H、L、L．因此，在第二時段中，Z2的期望利潤為

這樣，由于前面設定θ＝1，兩時段博弈Z2總的期望利潤就是

類似地，如果Z2在第1時段選擇R＝L，也就是選擇對抗行為，這時他的期望利潤為

這樣，Z2在兩時段博弈的總期望利潤就是

因此，當不等式

Z2在重復博弈的開始時段（第一時段）將會選擇R＝H．這表明，如果非理智屬性的投標者1的條件概率q≥G2LL－G2LH／G2HH－G2LH，Z2將會在第一時段博弈選擇H，也就是選擇合作行為．這也即說明，Z2選擇合作時段的數量只與條件概率q有關．

在前文的討論中，只對投標者1的屬性進行了兩種假設，投標者2只有一種屬性，屬于單邊非對稱信息假設．這樣建立的合作均衡不屬于精煉貝葉斯納什均衡．這是因為，如果Z2在y＝Y－1時段不選擇H，到了最后時段（y＝Y），FZ1跟著也不會選擇H．這樣，y＝Y－2與y＝Y－1組成的兩時段博弈，Z2在y＝Y－2時段也不會選擇H．依次類推，沒有任何一個時段上理智的Z2選擇H，Z1也不會選擇嚴劣戰略H．唯一的精煉貝葉斯納什均衡是時段博弈納什均衡（L，L），即（低投標價，低投標價）重復Y－1次，這與在完全信息情況基本一樣，區別只有Z1在第1時段選擇了H．即信息完全和單邊非對稱信息不完全的有限次重復博弈條件下兩投標者之間的競標出現合作行為的概率為0．

3．2 兩投標者都具有大于零的概率是非理智的情形

前面討論的投標者1具有非理智概率q而投標者2完全理智的情形，本節討論投標者1和投標者2均具有非理智概率q的情形，即本節討論非理智投標者2的期望利潤．根據參考文獻［7］，在兩投標者信息不完全有限次重復博弈中，非理智屬性投標者選擇的戰略為“勢不兩立”戰略改換為“苛刻戰略”，但最后產生的均衡是一樣的．為了論證方便，也將非理智投標者選擇的戰略由“勢不兩立”戰略改換為“苛刻戰略”，即“開始第一時段選擇H（合作），合作直到對手選擇L（對抗），然后一直以牙還牙選擇L．”

所以如果對手是FZ1，FZ2的期望利潤是G2HH×Y，兩方均不會做出背叛選擇（因為非理智屬性投標者選擇“苛刻戰略”，在y＝1時段，只會選擇H）．即一直處于合作狀態．

如果對手Z1在y＝1時段選擇L，FZ2在y＝1時段選擇H，從y＝2時段開始，兩個投標者都將選擇L，直到最后一個時段（y＝Y）．這是一個均衡：從y＝2時段開始，FZ2選擇L是根據“苛刻戰略”報復Z1；Z1的最優選擇總是嚴優戰略L．這種情況下FZ2的期望利潤是：

考慮到投標者1屬于兩種屬性的條件概率分別為q與1－q，這樣FZ2從這一戰略得到的期望利潤應為：

考慮投標者2，如果他在第一時段（y＝1）上選擇L，會暴露他是理智屬性．這時投標者2的期望利潤為：

比較式（8）與式（9）的結果，對于投標者2，第二戰略優于第一戰略的條件為：

這個不等式結果表明，只要Y大于式（10）右邊取整后的Y＊，則可以說明從一開始就選擇L（對抗）不是投標者2的最優戰略．由上式可以看出，q越小，Y＊取值越大．也就是說，對手理智的概率與選擇合作的可能性具有正相關性．不論q多么小，總存在一個Y＊，使得對所有的Y＞Y＊，投標者2在y＝1時段選擇L不是最優戰略，最優戰略為選擇高報價（合作戰略）．根據對稱性原理，類似的結論對投標者1也成立．這個結果表明，對于非理智投標者，即便存在微小的非理智概率，如果跟對手達到足夠多的重復博弈次數Y，合作成為最優戰略．

4 結論

應用信息不完全條件下有限次重復博弈的“四人幫”聲譽模型原理，建立建設工程投標報價中兩投標者進行競標的重復博弈模型，并求解及分析報價模型的精煉貝葉斯納什均衡，得到如下結論．

1）信息完全有限次重復博弈條件下兩投標者之間的競標出現合作行為的概率為0，而信息不完全有限次重復博弈條件下兩投標者之間的競標存在合作的均衡規律．

2）兩投標者在有限次重復博弈競標中，如果每一個投標者都具有非理智的概率q＞0，不論q多小，只要進行了足夠多的博弈重復次數，就會出現合作均衡的局面，并且對抗非合作時段的總數與博弈重復的次數無關，而只與這種非理智的概率有關．

3）對于一方投標者，競爭對手的理智概率決定了選擇與其合作的可能性．不理智的概率越小，合作的時段越會提前．

［1］熊炳忠，馬柏林．基于貝葉斯MCMC算法的美式期權定價［J］．經濟數學，2013，30（2）：55－54．

［2］左西子，趙人可，彭朝暉，等．具有不完全信息的內部交易動態博弈［J］．經濟數學，2014，31（2）：49－54．

［3］孫修勇．合作博弈視角分析社會財富分配［J］．經濟數學，2013，30（3）：75－80．

［4］焦銀禾．建設工程招投標及博弈論應用［M］．北京：中國鐵道出版社，2009：147－182．

［5］李光久．博弈論基礎教程［M］．北京：化學工業出版社，2004：168－191．

［6］喻剛．建筑工程項目投標報價決策研究［D］．天津：天津大學管理學院，2008．

［7］蒲永健．應用博弈論［M］．重慶：重慶大學出版社，2014．