摘要:上市公司信用一直以來都是倍受人們關注的問題。文章運用不完全信息動態博弈的方法對上市公司信用問題進行分析。建立并求解一個KMRW聲譽模型,得出以下結論:在滿足一定的約束條件下且博弈重復的次數足夠長,對于高信息成本投資者,其與上市公司博弈的結果收斂于不合作;而對于低信息成本投資者,上市公司選擇遵守承諾,投資者繼續投資,是一個“精煉貝葉斯均衡”。
關鍵詞:上市公司信用;博弈分析;精煉貝葉斯均衡
一、 引言
文章應用改進的聲譽模型分析我國上市公司的信用問題,從中找出我國上市公司信用問題的制度因素,并給出政策建議,以期對我國的證券市場信用建設有一定啟示作用。
二、 模型的建立及求解
在完全信息情況下,不論博弈重復多少次次,只要重復的次數是有限的,唯一的子博弈精煉納什均衡是每個參與人在每次博弈中選擇靜態均衡戰略,即有限次重復博弈不可能導致參與人的合作行為。但阿克斯羅德(Axelord,1981)的實驗結果表明,即使在有限次重復博弈中,合作行為也會出現。克瑞普斯、米爾格羅姆、羅伯茨和威爾遜(Kreps,Milgrom,Roberts Wilsom,1982)的聲譽模型的出現解開了這個悖論。他們通過將不完全信息引入重復博弈證明參與人對其他參與人支付函數或戰略空間的不完全信息對均衡結果有重要影響,只要博弈次數足夠長,合作行為在有限次博弈中會出現。
1. 模型假定。模型假定在一個充分競爭的環境下,進行博弈的兩個參與人分別是上市公司和投資者。根據分析問題的需要,結合實際,首先假定上市公司只有理性一種類型,并假定其可選擇任意戰略。而投資者由于信息成本的不同可分為高信息成本投資者和低信息成本投資者,高信息成本的投資者難以獲得有效信息從而無法對對手進行標示,實際上面臨的是對手不確定的一次性博弈,根據不確定性最小化假定,高信息成本投資者為了使自己對未來事件的結果有最大可能準確的預測或控制,因而不能進入重復博弈,所以固守納什均衡策略,這里將其定義為“囚徒”型投資者;低信息成本的投資者可以獲得有效信息對對手進行標示,因而有條件進入重復博弈模式。同時我們引入時間成本,時間成本的存在使得投資者改變自己的行為模式是需要成本的,這樣設定的理由是改變行為模式需要付出作決策的時間成本。這里把時間成本低的低信息成本投資者定義為理性投資者,而把時間成本高的低信息成本投資者定義為非理性投資者,概率分別為(1-p)和p。這里有必要說明的是“理性投資者”和“非理性投資者”只是分別對兩種不同類型投資者行為方式的概括。對于非理性投資者,“冷酷戰略”是能滿足其不確定性最小化要求的策略。
如果投資者選擇合作(投資),上市公司將能夠在證券市場上融資,進而擴大生產和提高企業競爭力,因此其收益為正;若投資者拒絕合作(不投資),上市公司將無法獲得發展所需要的資金,將出現投資不足的現象,因此其收益為負。對于投資者,當上市公司守信時,作為股東的投資者能夠分享公司成長所帶來的收益,因此其收益為正;當上市公司不守信時,投資者的利益將受到種種非法的侵害,因此其收益為負。另外,由于守信企業要付出守信成本,因此在給定投資者不投資的情況下,守信企業的損失要大于不守信企業。階段博弈的支付矩陣如表1。
2. 模型推導。Ⅰ首先討論“囚徒”型投資者的策略。由于“囚徒”型投資者不能標示對手,假定時間成本因素只允許囚徒有限次改變行為模式,比如說,只允許改變一次,“囚徒”型投資者的策略實際上只有{始終合作}或{始終不合作},而采用這種單一策略的優點是不需要付出信息和決策成本。如果采用{始終合作},則不能排除這種可能性即存在上市公司標示出“囚徒”型投資者后,采用機會主義的不合作策略以對“囚徒”型投資者進行掠奪。這不滿足不確定性最小化的要求。因此{始終不合作}是其惟一的均衡策略。而這個策略的結果是,其與上市公司的博弈收斂于雙方都拒絕合作。(這與博弈論中的囚徒博弈分析一樣)。
Ⅱ再來看低信息成本投資者。其與上市公司博弈的順序如下:

(1)自然首先選擇投資者的類型;投資者知道自己的類型,上市公司只知道投資者屬于理性的概率是(1-p),非理性的概率是p。
(2)投資者和上市公司進行第一階段博弈。
(3)觀測到第一階段的博弈結果后,進行第二階段博弈;觀測到第二階段博弈結果后,進行第三階段博弈;如此等等。
(4)理性投資者和上市公司的支付時是階段博弈的支付的貼現之和(這里假定貼現因子e=1)。
現在首先討論博弈只重復兩次(T=2)的情況。為了敘述方便,用C代表非合作行為,D代表合作行為。同在完全信息情況下一樣,在最后階段(t=2),理性投資者和上市公司都將選擇C,非理性投資者的選擇依賴于上市公司在第一階段的選擇。在第一階段,非理性投資者選擇D(根據假定);理性投資者的最優選擇仍然是C,因為它的選擇不會影響上市公司在第二階段的選擇。因此,只考慮上市公司在第一階段的選擇(X),它的選擇將影響非理性投資者在第二階段的選擇,如表2所示。
如果選擇X=D,上市公司的期望支付時:
[(5*p)+(1-p)*-6]+[8*p+(1-p)*-3]=22p-9
如果選擇X=C,上市公司的期望支付是:
[(8*p)+(1-p)*-3]+[-3]=11p-6
其中等式左邊第一項是第一階段的期望支付,第二項是第二階段的支付。
因此,如果下列條件滿足,上市公司將選擇X=D
22p-9≥11p-6即p≥3/11
就是說,如果投資者屬于非理性的概率不小于3/11,上市公司將在第一階段選擇守信(合作)。現在假定p≥3/11。
現在考慮博弈重復三次(T=3)的情況。給定p≥3/11,如果理性投資者和上市公司在第一階段都選擇D(合作),那么,第二、三階段的均衡路徑與表2相同(其中X=D),總的路徑如表3所示,接下來將證明表3時均衡的充分條件。
首先考慮理性投資者在第一階段的戰略。與博弈只重復兩次不同,當博弈重復三次時,C不是理性投資者在第一階段的最優選擇,這是因為,盡管選擇C在第一階段可能得到8單位的最大支付(如果上市公司選擇D),但暴露出他是理性的,上市公司在第二階段就不會選擇D,理性投資者在第二階段的最大支付是0;但如果選擇D,不暴露自己是理性的,理性投資者可能在第一階段得到5,第二階段得到8。由此可見理性投資者的最優化選擇事D(沒有興趣偏離表2的戰略)。
現在考慮上市公司的戰略。上市公司有三種戰略,分別為(D,D,C)、(C,C,C)和(C,D,C)。給定理性投資者在第一階段選擇D(第二、三階段選擇C),上市公司選擇(D,D,C)的期望支付為:
5+[5p+(1-p)*-6]+[8p+(1-p)*-3]=22p-4

如果上市公司選擇(C,C,C),博弈路徑如表4所示,期望支付是:
8+[-3]+[-3]=2
因此,(D,D,C)優于(C,C,C),如果:

22p-4≥2即p≥3/11
因為我們假定p≥3/11,上述條件是滿足的。
如果上市公司選擇(C,D,C),博弈路徑如表5所示,期望支付是:
5+[-6]+[8p+(1-p)*-3]=11p-4
因此,(D,D,C)優于(C,D,C),如果:
22p-4≥11p-4即p≥0
因為p≥3/11,上述條件是滿足的。
3. 模型結論。上述分析表明,對于“囚徒”型的投資者,只要有機會主義的存在,他就不能用{始終合作}策略“免費搭車”;其每一次博弈都和其他博弈相互獨立,因而與靜態博弈沒有差別,不合作是惟一的均衡策略。

對于低信息成本的投資者,只要投資者非理性的概率p≥3/11,表3所示的戰略組合就是一個精煉貝葉斯均衡。進而可以證明,如果p≥3/11,下列戰略組合構成一個精煉貝葉斯均衡:理性投資者在t=1至t=T-2階段一直選擇合作,然后在t=T-1階段和t=T階段選擇不合作。容易看出,只要T>3,非合作階段的總數量等于2,與T無關。這里引出KMRW定理:在T階段重復博弈中,如果參與的雙方都存在P≥0的概率是非理性的,且T足夠大,那么存在一個T0≤T,使得下列戰略構成一個精煉的貝葉斯均衡:所有理性參與者在t≤T0階段選擇合作,t≥T0階段選擇不合作;且非合作階段的數量(T-T0)只與P有關,而與T無關。
從模型中看,低信息成本投資者與上市公司在一定條件下存在合作階段,也存在非合作階段。
三、 對我國上市公司信用缺失的解釋
由以上的博弈分析模型可以看出,公司不守信可能會獲得短期的利益,但如果想要獲得長期穩定的發展,則一定恪守信用。可為什么目前我國的上市公司卻普遍為追求短期利益而失信呢?這主要是我國的股票市場由于制度上所存在的缺陷,往往難以達到KMRW聲譽模型中所要求的相關條件,使得上市公司只顧一次博弈的利益所得,從而導致上市公司出現信用缺失的問題。具體問題體現在以下方面。

1. KMRW模型的一個直觀解釋是為了獲得長期合作收益,每一個博弈的參與者都想樹立一個合作形象(使對方認為自己是喜歡合作的),即使他在本性上并不是合作型的。因此長期合作的收益大于短視行為的收益是參與者選擇合作的基礎。在模型中,當支付矩陣中企業不守信一次所得大于8時,模型將無法在三次博弈中達到合作均衡,不守信的一次所得越大,合作的均衡結果越是難以得到。由于我國股市建立之初就有為國有企業融資解困的目的,一大批經營困難的企業包裝上市獲取了大量的制度租金,上市后借著所謂的資本運做手段,內幕人員中飽私囊,大肆侵吞上市公司和中小股東的利益。投機占據市場主導,踏踏實實做主業的企業反而受到市場的冷遇。在這種情況下博弈的支付發生了改變,企業一次性博弈的收益過大,上市公司短視行為的利益大于長期合作的收益。
2. 在模型的設定之初我們假定貼現因子e=1,貼現因子越趨近于0,合作的均衡越難以實現,這就要求博弈的參與人要有足夠的耐心。而目前我國上市企業主要是國有企業。盡管國家股的代理者,如各級國有資產管理機構,在上市公司中行使所有者職權,但由于多級代理關系的存在而導致“所有者缺位”。國家股缺位的后果是在公司治理結構中監督的缺失。經營者往往缺乏足夠的耐心,他不會真正關心其長遠利益,而只會追求短期利益最大化,而這又是以長期利益的損失為代價的。譬如,公司領導層只關心其在任期內帳面利潤的優異,而不顧及長遠發展,殊不知,這種短期業績往往是以犧牲長足發展為代價的。這最終導致不合作行為的出現。
3. 在整個模型的分析中,我們可以看到,在低信息成本的投資者存在的情況下,以合作為均衡策略的情況就會出現;而只要有高信息成本的投資者,以不合作為均衡策略的情況就會存在,也就是說,信息的完全程度和對稱程度越高,合作的可能性就越大,反之亦然。由于經濟轉軌時期我國的立法及執法體系還不健全,上市企業及個人制造虛假信息幾乎不受成本的約束,虛假信息的普遍存在進一步加劇了證券市場中的信息不對稱程度,使投資主體面臨超常的道德風險問題。如1997年~1998年,注冊會計師行業在執行證券業務中,接踵發生瓊民源、紅光、東鍋三大案件;2001年上半年,我國就有一百多家會計事務所共四百多名注冊會計師參與制造虛假信息,這些都造成我國證券市場嚴重的信息制約。
四、 結論及政策建議
本文在KMRW模型的基礎上,根據理性人追求多階段總效用最大化和不確定性最小化的假定,并引入時間和信息成本,認為對于高信息成本的投資者來說,不合作是其與上市公司博弈的均衡惟一結果;而對于低信息成本的投資者,只要滿足條件,上市公司選擇遵守信用,投資者繼續投資,是一個“精煉貝葉斯均衡”。
1. 建立和完善法律法規。雖然目前我國已經相繼出臺了一些對上市公司失信行為的懲罰措施,但是違規的懲罰手段多為“譴責”等行政手段,法治手段不強,市場的約束力偏弱,使得上市公司違規幾乎不存在成本或成本很小,企業違規的收益遠遠高于成本。要建立一個良好的市場信用體系,關鍵是要建立一套使守信者得到利益,失信者必然付出代價的制約機制。從目前成熟和規范的時常經濟國家來看,它們都建立一整套完善的維護失信懲罰機制的法律法規。因此,必須盡快建立一套完整的法規,加大執法力度,提高上市公司的違約成本,降低上市公司一次性博弈(違規行為)所得,實現長期合作的收益大于短視行為所得。
2. 產權制度改革。產權的確定性和穩定性對于重復博弈的實現是至關重要的。如果產權不明晰,就無以真正關心其長足發展,表現為上市公司管理層缺乏耐心(即貼現因子e趨近于0)。在上市公司中占大部分的國有企業里,一般是一股獨大,而這獨大之股往往又是國家股、法人股,產權不明晰,經理人難以得到有效的監督和約束。而要改變這一局面,必須明晰產權,適度分散股權,增加管理層持股以及引入戰略投資者,使公司更關注長遠發展,有激勵自覺重視信用。
3. 完善信息披露制度,增加信用市場的透明度。完善的信息披露能夠減少證券市場的信息不對稱,增加信用市場的透明度,這是建立信用市場公平、公正、公開競爭的關鍵,并且可以有效防止逆向選擇和道德風險。然而,由于市場對上市公司披露信息的反映,上市公司將傾向于披露有利的信息,不愿披露利差的信息,以穩定投資者對公司的信心。這些現象會導致上市公司會計信息披露失真。因此,監管層必須明確規定上市公司信息披露的義務以及信息披露的內容、準則。加強對企業會計信息的檢查,完善《會計法》。為我國上市公司信用的健康發展創造一個良好的信息條件。
參考文獻:
1. Fudenberg D and J.Tirole.Game Theo- ry.Cambridge.Mass:MIT Press,1991.
2. Harsanyi,J. Game with randomly disturbed payoffs-A rationale for mixed-strategy equilibr- ium points.InternationaI Journal of Game Theory,1973,(2):1-23.
3. 張維迎.博弈論與信息經濟學.上海:上海三聯書店、上海人民出版社,1996.
4. 于立,于左,丁寧.信用、信息與規制——失信守信的經濟學分析.中國工業經濟,2002.
5. 中國證監會.關于加強社會公眾股東權益保護的若干規定.
6. 蔣海.不對稱信息、不完全契約與中國的信用制度建設.財經研究,2002,(2):48-51.
7. 張維迎.企業理論與中國企業改革.北京:北京大學出版社,1999.
作者簡介:譚小芳,大連海事大學交通運輸管理學院講師,經濟學博士。
收稿日期:2009-12-22。