劉任重
(1.哈爾濱商業大學金融學院,黑龍江哈爾濱150028;2.華東政法大學法學博士后流動站,上海201620)
近幾年來,我國食品安全事件頻頻發生,從山西杏花村的假酒到阜陽劣質奶粉,從三鹿事件到雙匯的瘦肉精,一直到現在沸沸揚揚的塑化劑事件。這些事件的發生不僅對公眾的身體健康造成了巨大的傷害,更對國家的安全和社會的穩定帶來了消極影響。根據制度經濟學的觀點,安全作為一種純公共物品應該由政府提供[1]。因此,中國食品安全事件屢禁不止的根本原因在于政府的監管方面存在著巨大問題。本文將從規制經濟學的視角緊緊圍繞這一問題展開探討,這對于分析和解決中國當前存在的食品安全問題具有一定的理論意義和現實意義。
曹婧等(2010)以危害食品安全行為的懲罰性賠償制度為例,得出了懲罰力度與強度對違法行為具有顯著影響的結論[2]。王兆華等(2004)對美國、歐盟和日本等國在食品安全立法、監管體系、管理方式以及轉基因食品安全管理等方面的情況進行了分析與述評,為完善我國食品安全監管體系提供了參考和借鑒[3]。Arrow(1996)認為,食品安全管制是彌補市場失靈的必須手段,是否應進行食品安全管制以及食品安全管制政策的選擇應基于成本 -收益法對管制效益評價的結果[4]。Henson和Caswell(1999)從博弈與均衡角度分析,認為食品安全管制政策的選擇是國內外消費者、農場主、食品制造商、食品零售商、政府、納稅人等利益集團博弈的結果[5]。Loader和 Hobbs(1999)認為:盡管消費者非常在意食品的安全性,但保障食品安全的職責應該由政府承擔[6]。分析已有的文獻,多數都是從單一角度,諸如懲罰、立法、管制與被管制等各方面針對所研究的問題進行討論的。應該說,食品安全的管制問題是一個涉及諸多博弈方,同時又受到懲罰、獎勵等眾多變量影響的動態博弈過程。因此,本研究采用重復博弈的方法,通過構建政府-企業、企業-企業的博弈模型,引入懲罰、獎勵和社會公眾滿意度作為變量創建政府監管的創新模式,實現食品企業選擇生產安全食品的最優博弈策略。
首先,將政府和食品生產企業設定為博弈參與方,政府監管行為的作為和不作為,食品企業生產安全食品和非安全食品行為作為博弈雙方的可選擇策略,單純考慮經濟效用的情況下,可構建如表1所示的博弈支付矩陣。

表1 政府與企業間的靜態博弈支付矩陣
其中,c表示政府進行監管所耗費的成本(包括檢查、信息收集和處理等費用);r表示食品企業選擇生產安全食品策略所獲得的收益;R表示食品企業選擇生產非安全食品策略所獲得的短期收益;F表示食品企業從事非安全食品生產,被政府查出并予以處罰所繳納的罰金。
現在假設政府選擇監管的概率為p,則其選擇不作為的概率為(1-p);食品企業選擇生產安全食品的概率為q,則其選擇生產非安全食品的概率為(1-q)。由此可計算政府進行監管所獲效用的期望收益為:

同理,食品企業生產安全食品所獲效用的期望收益為:

在長期均衡條件下,根據完全信息靜態均衡博弈混合策略的求解方法可得:政府對食品企業進行監管的概率,食品企業選擇生產安全食品的概率分析p和q的解同政府處罰力度F的關系,根據可以得出:政府選擇監管的概率同政府的處罰力度F呈負相關關系,食品企業選擇生產安全食品的概率同政府的處罰力度F呈正相關關系,這一點同現實情況相符。然而,在考察政府的期望收益函數時會發現,其代表的含義是當食品企業選擇生產安全食品策略的概率q增加的時候,政府的期望收益會變小。如果將政府視作理性經濟人,其出于對自身經濟效用最大化的追求(F全部歸其所有),就會想方設法阻止q的增加,甚至會讓q減少,也就是說政府不愿看到食品企業選擇生產安全食品的策略,從而追求獲得更多的F。這一結論從經濟學的角度出發是有其合理性的,但是卻有悖常理。在此,我們增加政府監管行為社會效益的考量指標。我們引入“公眾對于政府和企業行為的滿意度”對政府監管策略的社會效益進行量化,并將這一變量添加到支付矩陣中。如果公眾獲悉食品企業從事非安全食品的生產并且政府監管采取不作為策略的時候,則公眾更可能產生“政府玩忽職守導致食品企業肆意違法”的心理,則政府蒙受了-s的公眾滿意度損失,新的支付矩陣如表2所示。

表2 引入公眾滿意度的政府與企業間的靜態博弈支付矩陣
根據上述矩陣,重新求解政府和企業的期望效用函數為:

從激勵相容的角度分析,政府在對生產非安全食品的企業進行懲罰的同時,還可以在一定程度上對生產安全食品(信譽好、質量高)的企業進行一定的獎勵,包括官方渠道的免費宣傳,政府設立專項獎勵基金獎勵生產安全食品的誠信企業,針對原材糧價格上漲導致生產成本增加的補貼等等,由此所耗費的成本我們設定為w。由于企業只能通過采取檢查措施才能知道哪些食品企業從事安全食品的生產,因此,獎勵只能發生在政府監管、企業生產安全食品的策略選擇中,則可重新構建矩陣,見表3。

表3 引入獎勵的政府與企業間的靜態博弈支付矩陣
根據矩陣3,再次對政府和企業的期望效用進行求解:

上述分析是在參與方進行一次博弈的基礎上展開的。如果考慮到政府的獎勵政策能夠影響食品企業的長期行為,即生產安全食品能夠為企業獲得更多的獎勵,從而獲得更多的收益,進而政府能夠在將來獲得更多的稅收并足以彌補政府支付獎勵的情況下,那么獎勵這一變量的影響是積極還是消極的呢?
從成本角度分析,一個食品企業之所以生產非安全食品是因為能夠獲得更多的收益。在市場競爭中,相對于生產安全食品的企業,其原材料成本更低,生產環節所耗費的成本更少,從而在同等價格條件下,其獲得的利潤更多;或相同利潤條件下,其價格更低,競爭力更強。所以,我們可以假設在一定區域內只存在兩個(產品、規模、產能等方面)完全相同的食品企業,考察他們之間的博弈關系,見表4:

表4 兩企業間的靜態博弈支付矩陣
兩個食品企業A和B都存在兩種策略選擇,即生產安全食品和非安全食品,所以此支付矩陣存在四組策略。第一組策略:兩個企業都選擇生產安全食品策略,其所獲得的總收益均為TR。第二組策略:A生產安全食品,B生產非安全食品,其所獲得的收益分別為(TR-σ,TR+σ)。在此種情況下,由于相同價格條件下,B生產非安全食品所耗費的成本更低,并且其產品同A生產的安全食品一樣混跡于同一市場銷售,在無有效監管條件下,其所獲得的收益超過正常收益TR的部分為σ,而A因價格高于B使得收益減少,因此損失的收益為-σ。同理可得第三組策略為A生產非安全食品,B生產安全食品,其所獲得的收益分別為(TR+σ,TR-σ)。第四組策略為 A、B都選擇生產非安全食品策略所獲得的收益為TR'。顯然在同一區域內,兩個企業都生產非安全食品,最終這一市場要么萎靡,民眾不敢購買這種食品;要么這一市場被外來或進口食品占領,如三鹿事件之后的中國奶粉市場。所以有 TR'<TR。因此有:TR-σ<TR'<TR<TR+σ。這是一個與“囚徒困境”非常相似的結果,即A和B都擔心獲得TR-σ的收益而選擇生產“非安全食品,非安全食品”,則此靜態博弈支付矩陣的純納什均衡解為(TR',TR')。
上述結論是在一次博弈條件下得出的,現在將這一支付矩陣納入到無限期重復博弈中考察每一組解的總效用。將四組策略的總效用分別用分別表示A、B兩企業始終選擇生產安全食品和始終選擇生產非安全食品所獲得的效用表示A企業在第一期中選擇生產安全食品策略,但是在第二期中由于B企業始終選擇生產非安全食品策略而改變自己原來的策略,進而選擇生產非安全食品策略并一直持續下去所獲得的效用;恰恰相反。設折現因子為i,則A、B企業在這四組策略中所獲得的總效用分別為根據前述TR-σ<TR'<TR<TR+σ,顯然在無限期重復博弈解中,兩企業所獲的效用最大,也無需政府監管,是我們最希望得到的均衡解,因此無需討論。表示兩個企業選擇的策略恰恰相反,我們以為例作為一種情況討論。對于,即使A企業在第一期中選擇生產安全食品的策略,卻由于B企業選擇生產非安全食品而使自己的收益變少,即ΩA1-,因此,在第二期博弈中轉而選擇生產非安全食品策略,但是其收益和ΩB2相比,仍然少獲得2σ(ΩB2-ΩA2)。因此,在這里我們可以引入前文中增加的變量——政府獎勵w,如果政府給予生產安全食品企業的獎勵w>2σ,則對于食品企業A,無論B選擇什么樣的生產策略,A都會選擇生產安全食品。那么,在這一重復博弈過程中,企業B通過觀察,發現自身選擇生產非安全食品策略會獲得比A更少的收益,同時,如果再加上政府的嚴格監管,自身還要冒著被政府處罰F的罰金,其理性的收益最大化選擇必然是選擇生產安全食品策略。對于,因在如果存在政府給予生產安全食品企業的獎勵w>2σ,此時,無論是企業A還是B,都不必擔心對方選擇生產非安全食品策略而使自身的收益變小。因而,雙方都會選擇生產安全食品策略。所以,在引入獎勵w>2σ的情況下,第四種策略組合不會發生,也無需討論。這樣,從長期來講,因為引入政府獎勵,將使食品企業最終(無論是第一期還是后期)都會選擇生產安全食品策略。這也使得前文中提到的“政府獎勵越多,企業生產安全食品的概率越小”的悖論得到了解決。應該說,政府的獎勵或補貼是一筆不小的開支。然而從時間維度講,這筆開支卻可以從兩個方面支出,首先是針對生產非安全食品企業的罰金中支出。當罰款效應逐漸從博弈支付矩陣中發生作用的時候,即企業選擇生產非安全食品策略的收益在減少的情況下改變自身的生產策略,這部分開支就可以轉而從食品企業全都選擇生產安全食品策略從而使自身收益和社會效益都達到最大化的情況下,從未來更多的稅收中支出。
通過構建政府與企業間的靜態博弈支付矩陣,驗證了罰金和公眾滿意度的引入,可以提高食品企業選擇生產安全食品策略的概率。也有效的解釋了政府過于追求經濟效益最大化而忽略社會效益最大化導致食品安全事件出現在一國經濟高速增長時期的現象。通過構建企業間的靜態博弈支付矩陣,并將其納入到無限期博弈中考察,通過引入獎勵變量,打破了食品企業選擇生產非安全食品的“囚徒困境”,驗證了獎勵的引入可以有效的引導食品企業選擇生產安全食品的策略。正如前文分析,食品安全規制是一個涉及政府、企業、公眾等多方之間進行博弈的動態過程,而其中起主導作用的應該是政府,因此,代表政府行使監管職能的食品安全監管機構應該因勢利導,綜合考量懲罰、獎勵等措施的搭配使用,在充分考慮公眾滿意度的前提下,切實履行監管職能,構建科學合理的規制食品安全的監管框架和模式。
[1]張維迎.法律制度的信譽基礎[J].經濟研究,2002,(1):2-3.
[2]曹婧,孫紹榮.懲罰性賠償制度的博弈模型分析[J].經濟體制改革,2010(4):164-166.
[3]王召華,雷家骕.主要發達國家食品安全監管體系研究[J].中國軟科學,2004,(7):19-24.
[4]Arrow K.Benefits-cost Analysis in Environmental Health and Safety Regulation:A Statement of Principles[M].Washington D.C.:The AEI Press,1996,23-27.
[5]Henson S,Caswell J.Food Safety Regulation:an Overview of ContemporaryIssues[J].FoodPolicy,1999(24):589-603.
[6]Loader R,Hobbs E.Stragetic Responses to Food Safety Legislation[J].Food Policy,1999(24),685-706.