糧食主產區動態補償機制的演化博弈分析

2014-11-28 08:18:14焦晉鵬

江西社會科學 2014年11期

■焦晉鵬

糧食安全是關系國民經濟發展和全面建成小康社會的重大問題，糧食主產區的發展是維護國家糧食安全，促進區域協調發展，帶動農民增收致富的重要保障。但是，由于糧食生產具有明顯的正外部性，糧食主銷區和全體社會成員從中獲益但并未支付相應成本，糧食主產區和農民因糧食生產損失了一部分發展權益但并未獲得有效補償，在一定程度上弱化了農戶種糧的積極性和糧食主產區的均衡發展。隨著國家城鎮化建設進程的逐步推進，大量的農村勞動力轉移到非農產業或進城務工，使得糧食的剛性需求結構發生較大變化，主銷區糧食需求量逐漸增加。同時，受自然環境改變、城鎮化建設征地、耕地過度利用等因素的影響，適宜種糧的農地正在逐漸流失。隨著國內CPI 指數，與農業生產直接相關的農藥、化肥、種子、農機具等物品價格大幅上漲，農民種糧的積極性嚴重受挫。因此，建立合理有效的糧食主產區動態補償機制已成為當前保障國家糧食安全、促進農村與城市和諧發展的重點。國家在取消農業稅的基礎上，針對糧食主產區先后出臺了一系列的糧食補償政策，取得了較好的效果，但隨著經濟發展環境的不斷變化，傳統的糧食主產區補償機制發揮的作用逐漸受到限制，建立更為完善的糧食補償機制勢在必行。

因此，本文嘗試運用演化博弈理論分別分析糧食主產區在傳統的糧食補償機制及動態補償機制兩種不同的補償機制下，糧食主產區的地方政府與種糧農戶之間的演化穩定策略，試圖揭示糧食主產區補償機制改進的演化規律及其演化穩定策略，在此基礎上研究糧食主產區的動態糧食補償機制。

一、演化博弈模型的指標設定和前提假設

(一)指標設定

設定C1表示糧食主產區地方政府在傳統補償機制下對農戶進行補償時支付的補償成本;C2表示糧食主產區地方政府采用動態補償機制下對農戶進行補償時支付的補償成本(C2＞C1);N1表示在傳統補償機制下農戶決定種糧而獲得的總收益;N2表示農戶放棄種糧而去務工所獲得的收益;D 表示糧食主產區地方政府采用動態補償機制后給予種糧農戶的增加補償;R 表示糧食主產區政府采用動態補償機制時獲取的來自糧食主銷區的利益補償;S 表示糧食主產區地方政府改進補償機制帶動農戶種糧積極性，提高糧食產量對保障國家糧食安全所產生的社會正效益，是中央對于糧食主產區地方政府的獎勵性財政補貼;P 表示農戶因種糧收益未達到期望而選擇務工造成糧食增量下降，影響國家糧食安全所產生的社會負效益，是中央對于糧食主產區地方政府改進糧食補償機制實施無效后的利益補償削減，屬于政策性懲罰。

(二)研究假設

第一，假設糧食主產區糧食補償行為中存在兩類行為主體:糧食主產區地方政府與農戶，構成博弈方組合I=｛1，2｝，其中參與人1 為政府，參與人2 為農戶，兩類行為主體都是完全理性的，即均以自己期望效用最大化為前提做出決策。

第二，假設在糧食主產區糧食補償行為活動中的兩類主體都存在兩種行為策略，即糧食主產區地方政府的策略集為G1=｛改進，不改進｝，改進是指糧食主產區地方政府為促進糧食產業的發展采取動態補償機制，從而獲取中央財政及糧食主銷區的利益補償，提高糧食補償的水平，使種糧農戶獲得的直接補償高于從事其他經營活動的收益，不改進則表示糧食主產區地方政府依然采用現有的補償機制。農戶的策略集為G2=｛種糧，務工｝，一般來說，在傳統補償機制下，農戶會根據家庭實際狀況及從事種糧以外其他經營活動的收益來選擇自身的策略行為，這里用務工代表農戶其他策略行為集合。

二、糧食主產區地方政府與種糧農戶之間靜態博弈分析

在不考慮雙方行動順序情況下，糧食主產區地方政府與農戶的博弈結果矩陣如下:

圖1 糧食主產區地方政府與農戶完全信息靜態博弈矩陣

根據博弈模型前提假設，對靜態博弈條件下博弈雙方收益情況進行分析。

1.當N1＞N2時，農戶在考慮家庭因素和收益的相對優勢的情況下，將會選擇種糧，糧食主產區地方政府不改進糧食補償機制的支付成本為C1，改進糧食補償機制的支付成本為R+S-C2，而C2＞C1，若來自糧食主銷區及中央財政的利益補償(R+S)不能彌補改進糧食補償機制的增加支出，則政府的最優策略為不改進;若R+S＞ C2-C1，則政府的最優策略為改進。

2.當N1+D ＜N2時，農戶在考慮自身收益的情況下，會選擇務工，若糧食主產區地方政府不改進補償機制，其支付成本為C1，若采取改進糧食補償機制的行為，則其支付成本為C2+P-R，當R-P＞ C2-C1時，政府的最優策略為改進，若R 不能彌補改進補償機制所增加支付成本及因改進效果不佳造成的中央財政懲罰性利益補償削減，政府最優策略為不改進。

因此，糧食主產區地方政府采取改進的糧食補償機制獲得利益補償能否有效彌補因改進補償機制而產生額外補償支付是政府選擇改進與否的關鍵因素，當R+S＜C2-C1時，糧食主產區地方政府明顯會采取保守策略，農戶則會根據其所獲得的收益而選擇自身的行為。當N1＞N2時，均衡策略為(不改進，種糧)，此時糧食補償機制的改進對農戶的影響不起決定性作用，農戶的理性選擇是種糧;當N1＜N2時，均衡策略是(不改進，務工)，這種情況下，糧食主產區地方政府和農戶的選擇對自身有利，但是從長期來看對國家糧食安全會產生不利的影響。如果R+S＞C2-C1，糧食主產區則會選擇改進糧食補償機制，若N1＞N2，或N1+D＞ N2，此時存在純均衡策略(改進，種糧)，若改進后農戶獲得種糧補償依然小于務工所獲得的收益，即N1+D ＜N2，則不存在純策略納什均衡。

在以上研究的基礎上，可以看出存在一個混合策略納什均衡，建立2×2 雙矩陣博弈模型，假設參與人1 即糧食主產區地方政府改進糧食補償機制的概率為x(0≤x≤1)，不改進的概率為1-x;參與人2 即農戶選擇種糧的概率為y(0≤y≤1)，農戶選擇務工的概率為1-y，則此時的博弈模型可以表示為以下:

圖2 混合策略下糧食主產區地方政府與農戶靜態博弈模型

因此，糧食主產區地方政府的期望支付成本為

對于糧食主產區地方政府來說，其支付成本相對較少，并能產生良好社會效益的條件是支付成本期望函數一階導數等于0，即

因此，政府最優改進概率為

而糧食主產區農戶的期望收益為

對于糧食主產區農戶來說，其獲得最大收益的條件是收益期望函數一階導數等于0，即

因此，農戶獲得最大收益的概率為

糧食主產區地方政府與種糧農戶的混合策略納什均衡為(y'，x')。對于糧食主產區地方政府來說當糧食主產區農戶種糧的概率y＞y'時，政府的最優選擇為改進;當農戶種糧的概率y=y'時，政府則以y'=(C2+P-C1-R)/(S+P)的概率改進糧食補償機制，而當y ＜y'時，政府的最優選擇是維持現狀，不采用改進的糧食補償機制。對于糧食主產區農戶來說，當地方政府改進糧食補償機制的概率x＞x'時，農戶的最優選擇是種糧;當x=x'時，農戶則以x'=(N2-N1)/D 概率選擇種糧;當x ＜x'時，農戶則選擇務工。可見，在靜態博弈條件下，因受政府補償成本、農戶自身收益和外部利益補償等因素的影響，均衡結果并不唯一，因此需要引入演化博弈模型進行更為深入的分析。

三、糧食主產區地方政府與種糧農戶之間演化博弈分析

在靜態條件下，政府和農戶之間由于信息的對稱性和雙方的有限理性，可以通過納什均衡 [(C2+P-C1-R)/(S+P)，(N2-N1)/D]中變量的變化不斷調整自身的應對策略，但是，在糧食主產區糧食補償的實際推行過程中，博弈雙方信息是非對稱的，各糧食主產區地方政府及農戶的行為受諸多因素的影響，不可能實現完全的有限理性，在諸多影響因素的引導下，雙方進行著不斷的重復博弈，同時，在雙方博弈的過程中，還會產生一定的學習強化效應，因此，靜態條件下的均衡不能有效體現博弈雙方的演化路徑，不能充分描述現實情況下具有動態意義的糧食主產區地方政府和農戶的有限理性行為，需要借助演化博弈分析的方法對該活動進行進一步的探討。

在靜態博弈分析的基礎上，運用演化博弈的復制動態模型來進行分析，通過糧食主產區地方政府占優策略的實施來影響農戶的選擇，使其路徑向既定的方向演化發展，更為準確地反映現實中糧食主產區博弈雙方的決策行為。

基于靜態博弈分析的前提假設，建立兩總體2×2行演化博弈模型。通過對多總體演化博弈特點的分析可以發現，該演化博弈的演化穩定策略與漸進穩定狀態具有等價性，且應為純策略納什均衡。假設糧食主產區地方政府群體中選擇改進糧食利益補償機制的比例為x(0≤x≤1)，糧食主產區農戶群體中選擇種糧的比例為y(0≤y≤1)。在糧食主產區地方政府與農戶博弈的過程中，雙方決策的適應性如果比群體的平均適應性高，則該決策會成為主導發展方向。因此，該博弈下的復制子動態方程組為:

根據演化博弈理論，上述系統演化路徑與均衡可從兩個角度進行分析。

1.基于糧食主產區地方政府的演化路徑分析，該情況下可從兩個方面進行討論:(1)當y=(C2+P-C1-P)/(S+P)時=0，對于所有的x 概率的糧食主產區地方政府的決策選擇都是穩定的，具體來說，當糧食主產區農戶選擇種糧決策的比例為(C2+P-C1-R)/(S+P)時，糧食主產區地方政府采取改進與不改進糧食補償機制的決策支付給種糧農戶補償成本是相等的，兩種行為策略是無差異的。(2)當y≠(C2+P-C1-R)/(S+P)時，x=0 與x=1 時，均可得到=0，因此x 取這兩個值時是糧食主產區地方政府決策選擇的兩個穩定狀態均衡點。

此時，對y 的取值情況進行分析，如果y＞(C2+PC1-R)/(S+P)，則＞0，在此情況下，糧食主產區地方政府選擇改進的決策投入的成本會小于群體的平均水平，因而在x=0 的穩定狀態下，若在國家發展規劃的引導下，國內13 個糧食主產區的地方政府群體中若有采取改進糧食補償機制的決策，并產生較好的經濟和社會效益，則為采取相應決策的其他糧食主產區地方政府將進行效仿，相繼采取改進的決策，即x=1 是復制動態下的一個演化穩定策略，也是糧食主產區地方政府的最優選擇;如果y ＜(C2+P-C1-R)/(S+P)，則＜0，在此情況下，糧食主產區地方政府選擇改進的決策所投入的成本大于群體的平均成本，因而在x=1 的穩定狀態下，若國內13 個糧食主產區中的某一個采取改進決策的糧食主產區地方政府因投入的補償成本過高放棄推行改進后的糧食補償機制，并獲得國家批準，那么存在相同情況的其他糧食主產區也會相繼采取相同的決策，即x=0 也是復制動態下的一個演化穩定策略，但從維護國家糧食安全的角度來看，該決策行為屬于保守策略，在一定程度上延緩了國家糧食安全戰略的實施。

因此，y=(C2+P-C1-R)/(S+P)是x=0 和x=1兩類演化策略的分界點，糧食主產區地方政府糧食補償的成本、采用動態補償機制時獲取的來自糧食主銷區的=0，對處于y 值概率的農戶選擇種糧與務工的決策都利益補償、中央對于改進的獎勵性財政補貼和政策性的懲罰對糧食主產區地方政府改進糧食補償機制的決策具有一定的影響。中央和糧食主銷區對于實施改進糧食補償機制的糧食主產區地方政府的利益補償越大，采取改進補償機制的糧食主產區地方政府投入的補償成本相對越低，則改進決策對于糧食主產區地方政府的導向性越大，反之，若外部的利益補償不能彌補改進后的額外補償支付成本，那么糧食主產區地方政府將趨向于采取保守策略，繼續運行傳統的補償機制。

2.基于糧食主產區農戶的演化路徑分析，該情況下同樣可從兩個方面進行討論:(1)當x=(N2-N1)/D 時，是穩定的。具體來說，當糧食主產區地方政府采取改進糧食補償機制的比例為 (N2-N1)/D 時，選擇種糧與務工的決策農戶數量是隨機的。(2)當x≠(N2-N1)/D 時，y=0 與y=1均可得到=0，因此y=0 與y=1 是農戶選擇的穩定狀態。此時，對x 的取值進行分析，若x＞(N2-N1)/D，則·y＞0，糧食主產區農戶選擇種糧的收益與群體收益的平均水平相比較，會高于群體收益的平均水平，y=1 是復制動態下的一個穩定演化策略，也是在國家倡導保障糧食安全、提高糧食主產區種糧農戶收益的最優策略，具體來說，當國內主要糧食主產區地方政府采取改進糧食補償機制的比例超過 (N2-N1)/D 時，農戶因看到改進后的糧食補償機制能夠帶來更大的收益，逐漸趨向選擇種糧的決策，并且不會因一部分農戶依然選擇務工而改變自身最優決策的選擇。若x ＜(N2-N1)/D，則＜0，在此種情況下，糧食主產區農戶選擇種糧的收益與群體受益的平均水平相比較，會低于群體收益的平均水平，y=0 是復制動態下的一個穩定演化策略，具體來說，當糧食主產區地方政府采取改進的比例低于(N2-N1)/D 時，農戶會因種糧收益低于務工收益，而趨向于選擇務工。

所以，兩類演化穩定策略y=0 與y=1 的分界點是x=(N-N1)/D，糧食主產區農戶種糧的收益與務工相比越高，農戶種糧的意愿越大，糧食主產區地方政府在采取改進決策所支付的補償成本相對越低，并能更好地貫徹國家保障糧食安全的戰略規劃。

基于上述糧食主產區地方政府和農戶復制動態方程的分析，博弈雙方的演化復制動態關系演化路徑圖如圖3 所示。

圖3 糧食主產區地方政府與農戶演化博弈分析路徑圖

從圖3 可以看出，博弈雙方動態演化最終趨向于哪種均衡取決于博弈初始時模型中變量的取值。如果變量初始取值落在G1和G4區域內，則通過動態演化博弈最終的穩定狀態為(不改進，務工);如果變量的初始取值在G2和G3區域內，則通過演化博弈最終將穩定于(改進，種糧)的狀態。顯然，從保障國家糧食安全的角度來看，第二種演化方向為理想狀態，即糧食主產區地方政府采取改進糧食補償機制決策，農戶則選擇種糧，獲得新補償機制下的增加補償收益，進而實現糧食主產區地方政府、種糧農戶、國家三者之間策略選擇的最優化，兼顧整體效益與各方利益的最大化。但是，在現實情況下，由于博弈雙方信息的不對稱性，糧食主產農戶的行為決策可能并不以政府是否改進補償機制實現利益補償的增加作為關鍵性影響因素，農戶在選擇種糧與務工時具有一定的隨機性，在決策時，如果農戶尚未獲得改進補償機制增加的利益補償或認為期望中的種糧收益沒有務工收益高時，農戶會趨向于選擇務工來保障期望收益的可增長性，而糧食主產區地方政府因采用改進補償機制未達到國家要求的狀態，在下一年的糧食補償中將受到中央的政策性懲罰，需通過增加地方財政支出彌補糧食補償標準提高產生的增加成本，這種結果對于糧食主產區地方政府來說明顯不利，因此政府將趨于放棄改進的糧食補償機制，重新實行傳統的補償機制。

四、結論及建議

在糧食主產區糧食補償實施的過程中，由于農戶在信息的獲取中處于劣勢地位，其在未能直接感受種糧補償的顯性增長的情況下，會衡量種糧與其他行為決策的當時收益水平，選擇獲取收益高的經營方式，而在國內糧食主產區現階段執行的補償標準下，種糧的收益明顯低于同等條件下種植經濟作物或發展果蔬的收益，也低于務工的收益，這使得種糧農戶群體的總體數量呈現遞減的趨勢，從保障國家糧食安全的角度來看，這種情況將會影響國家糧食供銷和儲備的長期穩定。因此，為保障國家糧食安全，實現糧食主產區糧食產量增加與種糧農戶收益同步提高，國家和糧食主產區地方政府必須采取有效的措施促進改進的糧食補償機制，即動態補償機制的有效實施。

糧食主產區動態補償機制與傳統補償機制相比，不僅將糧食補償各相關主體納入到機制中，而且進一步明確了補償資金的構成及針對農戶的補償方式，如圖4 所示:

圖4 糧食主產區動態補償機制

可見，糧食主產區動態補償機制的有效落實和運行能夠更好地促進糧食主產區經濟的發展，提高種糧農戶的直接收益。因此，為促進糧食主產區動態補償機制的實施，需從五個方面進行保障。

(一)完善糧食動態補償機制的立法

我國當前推行的糧食補償政策缺少清晰穩定的法律保障，使得國家針對糧食主產區農戶實行的糧食最低收購價，直接收入補貼等政策呈現出臨時性和階段性特征，政策效果難以保證。因此，國家應借鑒美國，法國等發達國家糧食補償的成功經驗，用法律形式將糧食主產區的糧食動態補償政策固定下來，形成促進糧食動態補償政策運行的長效機制。

(二)簡化補貼種類

糧食主產區地方政府可根據實際情況將現有的四種補貼融合為一體，即將針對種糧農戶實行的農民直接補貼、良種補貼、農機具購置補貼和農資綜合補貼融為一體，建立糧食直接補償基金。在綜合考慮農戶糧食產量、當期CPI 指數水平、種糧成本變動水平等因素的基礎上實行動態補償，直接針對種糧農戶，補償條目簡單清晰，方便糧食產區基層組織操作，便于農戶理解并做出行為反饋。

(三)提高補償標準，明確補償依據

為提高糧食主產區農戶選擇種糧行為的比例，對種糧農戶的利益補償標準應能保證農戶種糧的收益不低于從事經濟作物種植或務工所獲取的收益，若種糧補償低于其他經濟行為的收益，農戶會做出不種糧，改種經濟作物或果蔬的理性選擇。因此，糧食補償的標準必須經過科學的核定，具有吸引力，補償的依據也需做出相應的調整，實行以糧食出售量為依據的方式，由財政和糧食儲備部門聯合印制糧食收購統一票據，憑票據結算，補貼到人。

(四)提高對糧食主產區的財政補貼及政策支持力度

國家農業部應充分考慮國內13 個糧食主產區的具體情況，根據各糧食主產區商品糧產出數量及地區經濟發展的狀況分配農業項目資金，加大對糧食主產區農業板塊的支持力度，鼓勵實施大型商品糧基地建設、優質糧食產業工程、農業綜合開發等項目，劃撥專項資金用于糧食主產區中低產田改造、優良品種繁育和農技推廣，對糧食總產量超過“千億斤”的糧食主產省給予特別獎勵性資金支持。

(五)完善糧食主銷區對糧食主產區的反哺機制

糧食主銷區對于主產區的利益補償可通過開辟新的稅賦科目，按照糧食調入數量確定補償的標準，并將該部分利益補償資金轉入到糧食主產區直補基金池中。此外，糧食主銷區可通過與主產區進行對口援建改進主產區糧食生產的基礎建設水平，實現糧食調入的轉移補償，促進糧食主產區的經濟發展

[1]賈貴浩.提高主產區糧食生產能力面臨的問題與對策[J].宏觀經濟研究，2011，(3).

[2]賈貴浩.城鎮化背景下糧食主產區利益動態補償問題研究[J].宏觀經濟研究，2013，(12).

[3]蔣和平，吳楨培.建立糧食主銷區對主產區轉移支付的政策建議[J].中國發展觀察，2009，(12).

[4]王冀寧，陳銘，陳庭強.中國金融市場監管行為的演化博弈研究[J].北京理工大學學報(社會科學版)，2013，(5).

[5]黃凱南.演化博弈與演化經濟學[J].經濟研究，2009，(2).

[6]Drew Fudenberg，Jean Tirole.博弈論，黃濤等譯[M].北京：中國人民大學出版社，2010.