周玉龍 孫久文
解決不平衡與不充分問題已經成為我國經濟社會發展的首要任務,其中脫貧攻堅問題得到了各界的高度重視。我國 1986年開始實施以國貧縣為重點的有組織、有計劃、大規模扶貧開發戰略,目標是發展生產、消除貧困。扶貧開發政策實施以來,我國的貧困狀況得到顯著改善,農村貧困人口由 1978年的 2.5億人②按1978年年人均收入100元的絕對貧困線計。減少到 2016年的3046萬人③引自《2017年國民經濟和社會發展統計公報》,按照每人每年2300元(2010年不變價)的農村扶貧標準計算。,但排除經濟發展等空間中性的因素,基于地區的扶貧開發政策對農民增收起到的作用尚未可知。因此,必須對過去 30年的扶貧開發政策進行科學系統的評估,才能為新時代打贏脫貧攻堅戰提供合理的理論指導。
認定政策貢獻最直接和常用的方法有兩種,一是縱向比較貧困地區扶貧開發政策實施前后的貧困水平,二是橫向比較受政策扶持與否的區縣的發展水平。但是這種單重差分能夠識別扶貧開發政策效果的前提是其他因素不會影響貧困水平,或能夠充分控制這些因素。值得指出的是,影響貧困狀況的因素比較復雜,例如與扶貧開發戰略實施同期的改革開放帶來的高速經濟增長對減貧的效果十分顯著(Ravillion和 Chen,2007;汪三貴,2008),導致經濟增長效應和政策效應難以分辨,這些因素在國貧縣和非國貧縣間往往存在系統差別。因此,以上簡單的縱向或橫向比較難以準確識別扶貧開發的政策貢獻。
解決以上問題的有效方法是隨機控制實驗方法。因此,本文關注國貧縣調整的準自然實驗,利用雙重差分以及合成控制法減弱國貧縣選擇的內生性以及其他不可觀測變量的干擾,能夠更嚴格地評估政策效果。另外,本文使用 1990—2010年的縣域面板數據,有助于控制不隨時間改變的區縣因素對評估的影響;更重要的是本文的數據在時間維度上覆蓋了扶貧開發政策實施的大部分時間周期,有助于識別政策的長期效果。再者,本文研究以國貧縣為瞄準對象的一攬子扶貧開發政策的有效性,避免了不同類別政策效果的混淆問題,同時也更有助于從整體上探討以國貧縣為政策目標這種制度安排的實施效果,為更加精準的扶貧制度改革提供理論基礎。最后,本文對造成扶貧開發“政策陷阱”的政府“亂作為”機制進行了實證檢驗,能夠提供一定的政策啟示。
本文的研究結果表明,扶貧開發政策能夠有效促進國貧縣的經濟發展,同時短期會顯著提高被扶持地區的農民收入約 10%~17%,但長期來看,十年之后政策的增收效應逐漸減弱,甚至可能阻礙農民增收。說明過去的扶貧開發政策在長期存在“政策陷阱”效應。本文進一步將以上結論的原因分為地方政府的“不作為”和“亂作為”機制。實證分析表明,“亂作為”機制是以上“政策陷阱”的主要原因,即地方政府能夠有效利用扶貧開發資源發展第二產業,從而促進當地的經濟增長,但這對其他有利于提高農民收入產業的發展造成擠出效應,從而阻礙農民脫貧增收。另外,本文利用多種穩健性檢驗方法驗證了以上結論。
研究某項政策對發展的影響評估是經濟學領域的經典主題(Khandker等,2010),本文關注的“基于地區”(place-based)的區域開發政策在世界各地都有大量案例,其有效性評價也獲得了持久的關注(Ravallion,2007;Glaeser和 Gottlieb,2008;Neumark和Simpson,2014)。
歐美發達地區的開發政策起步較早,例如美國的田納西流域管理局(TVA)計劃、阿巴拉契亞區域委員會(ARC)計劃和授權特區(EZ)計劃以及歐洲的基金等,大量文獻也使用隨機控制實驗的方法對各項政策進行了短期和長期效應的評估,但多數案例中,不管是不同政策還是同一政策的不同研究往往沒有一致的結論。Kline和Moretti(2014)評估了TVA實施100年的成效,他們認為TVA能夠通過基礎設施改善和集聚經濟影響經濟發展,其中前者的效果尤其明顯,但后者的收益則可能被其他地區的損失抵消。Isserman和 Rephann(1995)研究了ARC實施 26年的影響,他們發現1969—1991年間,與控制組相比,阿巴拉契亞地區的收入增長快 48%,人口增長快5%,人均收入增長快 17%,但作者同時謹慎地認為,由于自選擇內生性的存在,處理組的高增長并不一定歸因于ARC的項目。關于 EZ計劃效果的結論更為復雜。Hanson(2009)發現該計劃并沒有有效改善就業和貧困發生率,但顯著提高了房產價值(Krupka和Noonan,2009)。Reynolds和Rohlin(2015)在研究EZ計劃的分配效應時發現低收入者的生活水平并沒有得到有效改善,反而讓遷移進來的高收入者受益更多。Busso等(2013)的結論則相反,他們認為,計劃提高了被扶持地區的就業和工資,而相應的人口和生活成本并沒有上升。Neumark和Simpson (2014)對世界各國類似政策的研究的綜述中并沒有發現企業特區政策能夠影響就業和總體福利的證據,對更細致的政策分配效應研究仍然十分必要。
具體到中國,我國的扶貧開發政策研究文獻也較為豐富。Park等(2002)的研究表明扶貧開發政策使得國貧縣農村居民收入在 1985—1992年比非國貧縣增長快2.28%,1992—1995年則快 0.91%。劉朝明和張銜(1999)、毛捷等(2012)、Meng(2013)以及王藝明和劉志紅(2016)關注了 1994—2000年中國第一個全國性扶貧計劃——“八七扶貧攻堅計劃”——的影響,他們的研究都認為該計劃短期內顯著提高了農民收入,但長期的扶貧效果并不顯著。Park和 Wang(2010)以及張彬斌(2013)探討了2001年以來新時期扶貧開發的政策效果,前者發現新時期農村扶貧開發的成效并不顯著,僅在政策實施第八年到第九年才有3%左右的增收效應,而后者利用了村級的住戶調查數據,發現政策為富裕家庭帶來的收益更多,但對貧困戶增收效果并不顯著。從另一個角度看,由于數據可得性和其發揮的重要作用,另有一些研究對我國扶貧資金的績效進行了評估。總體而言,扶貧資金對減貧的作用較為顯著( 昉蔡 等,2001;劉冬梅,2001),但細分的財政發展資金、扶貧貼息貸款和“以工代賑”資金等不同類型的扶貧資金效果各異,研究結論并不一致(陳凡和楊越,2003;曹洪民等,2003;朱乾宇,2003)。
可見,開發政策評價是一個受到廣泛關注的話題,大量研究也在這個方向做了努力,已有對發達國家開發政策的研究不僅關注了政策對區域總體發展的短期影響,同時還研究了長期效應,而對我國的扶貧開發效果評價卻多數集中在 10年以內的短期視野中,這無疑忽視了政策能否能夠培育扶持地區內生減貧動力的重要問題。另外,很多研究發現扶貧開發政策的長期效果不甚理想,這背后的機制也亟需進一步研究。
因此,本文利用上世紀 90年代到本世紀頭 10年的縣域面板數據,借助國貧縣名單的調整,通過雙重差分以及合成控制法模擬自然實驗,構建國貧縣發展的反事實情況,通過與實際情況比較來更嚴格地評估扶貧開發政策的短期和長期效果并深入研究扶貧開發政策效應背后的原因機制。
從1986年我國認定的第一批258個到最近2011年認定的592個國貧縣①到1988年各省同時認定了370個省級貧困縣,但認定標準并不透明,同時扶貧工作主要由地方政府負責,力度較小(Park等,2002),因此不作為本文的主要研究對象。,國貧縣名單在這期間進行了數次調整。其中 1986年的認定標準為 1985年人均純收入低于150元,但革命老區和少數民族自治縣的標準擴大到200元,對中國革命做出重要貢獻的老革命根據地和內蒙、新疆和青海的一部分有特殊困難的少數民族自治縣的標準提高到300元。1993年認定的國貧縣標準為各縣1990年農民人均純收入低于300元。在1986年確定的國貧縣中,83個貧困縣農民人均純收入低于150元,82個縣在150~200元之間,93個縣在200~300元之間。只有三分之一的縣符合150元的最低標準,表明貧困縣的選擇標準是一種“軟約束”,國貧縣可能是自然稟賦條件最差的地區,但也可能存在大量“例外情況”②參考報道《17縣騙資金:貧困縣如何扶貧?》,http://view.news.qq.com/original/intouchtoday/n2658.html。,這也成為之后國貧縣制度最嚴重的問題之一(李飛,2014)。這種情況的存在提高了國貧縣選擇的隨機性,從而有利于改善本文的因果識別效果。
《中國農村扶貧開發綱要(2001—2010年)》進行的國貧縣調整主要包括四個方面。(1)全國貧困縣總數保持不變,依然為592個;(2)除河北和海南以外東部沿海地區的省市,包括遼寧、山東、浙江、福建、廣東的貧困縣由各省自行扶持,退出國家扶持貧困縣名單,騰出 33個貧困縣的名額;(3)將西藏整體作為一個扶貧單位,單獨列入計劃,其原有的 5個貧困縣名額相應讓出;(4)其他省貧困縣具體的調整方案是:各省重點縣數量的確定采用“631”指數法,即各省貧困人口占全國的比重占 60%的權重(其中絕對貧困人口與低收入人口各占 80%和 20%比例),農民人均純收入較低的縣數所占全國比例占 30%比重(人均純收入一般地區以 1300元為標準,老區、少數民族和邊疆地區人均純收入標準提高到1500元)、人均GDP低的縣數(低于2700元)占全國比例和人均財政收入低的縣數占全國的比例(低于120元)合占10%的權重;各省根據指數法確定的重點縣數量在省內確定具體的縣,報國務院扶貧開發領導小組審核、備案。
盡管不同扶貧開發時期的政策細節有所差異,但總體而言,作為扶貧開發“主戰場”的國貧縣會排他性地享受一系列扶貧開發資金扶持、信貸優惠、財稅優惠和經濟開發優惠等政策。
一方面,在扶貧資金方面,八七扶貧攻堅時期的相關規定要求,“國家各項扶貧資金必須全部用于國家重點扶持的貧困縣”,2001—2010年的中央財政扶貧資金中“以工代賑資金和新增財政扶貧資金全部用于國定貧困縣”,發展資金則重點用于國定貧困縣。在2011—2020年間,“中央財政專項扶貧資金主要投向國家確定的連片特困地區和扶貧開發工作重點縣、貧困村,其中新增部分主要用于連片特困地區”①詳見1996年公布的《中共中央、國務院關于盡快解決農村貧困人口溫飽問題的決定》、1997年公布實施的《國家扶貧資金管理辦法》、2000年公布的《財政扶貧資金管理辦法(試行)(財農字[2000]18號)》以及2011年公布的《財政扶貧資金管理辦法(財農[2011]412號)》。。可見,2010年之前國家的扶貧開發主要瞄準國貧縣,但之后的扶貧瞄準對象更加泛化,因此本文主要關注2010年之前的國貧縣發展情況。
根據1986—2010年的數據測算,國貧縣每年縣均可以獲得扶貧資金投入3500萬元,占同期縣均財政收入的 9.97%。歷年的具體情況可見圖1,可以發現國貧縣扶貧資金的投入總量和縣均扶貧投入在不斷增加,到2010年已經超過500億,盡管扶貧資金占地方財政收入的比重呈下降趨勢,但其比重最高超過了35%,最低仍然在5%左右。這充分表明了國貧縣獲得資金支持力度之大。
另一方面,在非資金的扶貧項目和政策優惠方面,東西協作和定點幫扶多以國貧縣集中的地區或國貧縣為對象,各種勞動力培訓轉移項目主要在國貧縣實施,信貸扶貧資金支持的農業產業化項目也集中在國貧縣。貧困地區的義務教育工程、“一費制”改革、兩免一補和高招加分等教育政策往往從重點縣開始實施,國貧縣的農業稅也先于其他縣免除。另外,還有其他一些產業和稅收等優惠政策專門針對國貧縣實施。
可見,在現有制度安排下,被認定成為國貧縣便意味著本地能夠從中央獲得大量額外的財政轉移支付和政策優惠。國貧縣的認定調整和其享受資金及政策優惠的排他性為本文模擬自然實驗的情境提供了條件:首先,本文可以通過某個區縣是否被列入國貧縣來區別某個區縣是否受到了扶貧開發政策的處理,即可以定義列入國貧縣的區縣為處理組,其他為控制組;其次,國貧縣名單的調整提供了構建反事實情況的必要條件;最后,未嚴格按照貧困狀況進行的名單調整使得列入國貧縣名單的很可能并非最貧困的區縣,提高了處理組的變異程度和處理分配的隨機性,有利于精準識別因果效應。
由于除了扶貧開發政策之外,區縣特定的因素(如地理位置、資源稟賦等)以及發展政策等隨時間可變的可見或不可見因素同時會影響農民收入,普通的最小二乘法并不能保證控制所有相關因素,會導致遺漏變量偏差。雙重差分(DID)可以緩解這種問題,其主要邏輯是做組內處理前后和組間同期的兩次差分,前者可以消除組內個體隨時間固定因素的干擾,后者可以排除經濟總體沖擊的干擾,這樣在自然實驗的基礎上,就可以估計處理的因果效應。
在滿足隨機分配和平行趨勢的前提下,可以通過方程(1)實現本文的DID估計:
其中,Y為農民人均純收入,Controls為其他控制變量,ε為回歸殘差。對受到政策扶持的區縣來說povertycountyc=1,反之為0;如果政策實施的時間為t,則在t年之前的aftert=0,之后的為1。下標c指代區縣,t為時間。
具體到本文的研究中,我國的農村扶貧開發具有連續性,為了避免只有一輪扶貧開發被列為國貧縣的樣本的干擾,本文將1993年和2001年兩輪國貧縣認定中都被列入國貧縣名單的區縣作為處理組,一直未被列入國貧縣名單的作為控制組,排除只有一輪被認定為國貧縣的樣本的影響,并將1993年作為接受處理時間,1990—1992年作為處理前時期,1993年之后作為處理后時期。
另外,2001年的國貧縣調整中部分區縣不再作為國貧縣接受政策扶持,而又有部分區縣進入了國貧縣名單,但這些樣本數量較少,利用DID方法無法保證研究信度。本文利用合成控制法(Abadie和Gardeazabal,2003)有效利用這部分變異。該方法的基本思路是:雖然難以尋找和處理組完全類似的對照組,但是通過將所有非國貧縣按照相關變量構造一個與處理組最接近的對照組作為處理組的反事實樣本,然后將其與國貧縣進行比較就可以得出扶貧開發政策的因果效應。
具體來看,合成控制法最重要的是要求利用控制組的個體構建一個合理的“合成”處理組,即構建一個對控制組進行加權平均之后與處理組相關特征最一致的個體。其中計算權重的方法是選取相關影響結果的處理前或非時變變量,讓這些變量的加權平均與各自對應處理組的變量差別最小,亦即求解以下最優化問題:
其中ωk為第k個控制組個體的權重,Xi為用于合成的第i個變量,K為控制組。
其統計推斷信息可以利用置換法獲得。
具體到本文的情境,本文利用2001年的國貧縣調整變動,主要是因為2011年之前,扶貧開發政策施行的主戰場一直為國貧縣,而之后則開始向國貧縣以外延伸,同時1993年的相關數據缺失嚴重。具體來看,本文比較新被列入國貧縣名單的區縣與利用非國貧縣合成的虛擬國貧縣的農民增收情況,從而得到扶貧開發政策的因果效應。
由于大部分時期內國貧縣都是我國扶貧開發政策的主戰場,因此本文主要利用上世紀90年代以來的縣級面板數據,具體年限為1990—2010年。被基于數據可得性的考量,本文選擇覆蓋東中西三大板塊、少數民族縣、山區縣、革命老區縣以及邊境縣等特殊區域的河北、內蒙古、江西、貴州和甘肅五省數據作為基礎數據,包括472個縣級行政區,其中有170個國貧縣。數據來源為相應年份的《中國縣域統計年鑒》《中國農村貧困監測報告》以及各省統計年鑒等。
農村扶貧開發的根本目標是提高貧困人口收入水平,因此在考慮數據可得性的前提下,本文選取區縣農民人均年純收入(farmerincome)作為因變量,取對數值進行回歸。根據國貧縣評選的標準,控制變量主要選取了以滯后一期的人均 GDP(pergdp)、人均財政收入(perfiscalin)、第二產業增加值占 GDP比重(structure)變量,在合成和匹配時還加入了是否是少數民族縣(peoplecounty)、山區縣(mountcounty)和革命老區縣(revocounty)等表征政策、自然稟賦和地理條件的變量。在合成控制法的推斷中,根據盡量擬合處理前處理組和合成組的原則,本文還加入了1990年、1995年和2000年的農民人均年純收入變量,所有價格變量都利用各省農村消費者價格指數調整為 1990年不變價格。
各變量的描述性統計如表1所示。從發展的平均水平看,21世紀前后10年我國的農民收入、人均GDP、人均財政收入和工業化水平都有了大幅提高,但國貧縣與非國貧縣的差距并沒有有效縮小,而從工業化水平的角度看,國貧縣2010年的工業化水平相較于1990年提高了80%,遠高于非國貧縣的50%的工業化水平增幅。另外,值得注意的是,到 2010年,國貧縣的人均 GDP和財政收入指標極值已經接近甚至超過了非國貧縣,這表明有的國貧縣發展已經接近甚至超過了普通區縣,但整體發展差距巨大①參考媒體報道“有多少百強縣仍是國家級貧困縣?”,http://society.people.com.cn/GB/15731868.html。。

表1 變量描述性統計表
首先,本文使用雙重差分方法對扶貧開發政策的短期效應,也就是列入國貧縣對農民10年內的增收效應進行了檢驗,由于國貧縣認定會考慮區縣的人均GDP和財政情況,另外考慮產業結構對農民收入有直接影響,因此回歸控制了相關變量。結果如表2所示,第(1)~(7)列分別為以1990年為基期,1993年之后不同年份作為處理后時期的回歸結果。
雙重差分項中2000年之前年份的系數基本顯著為正,且系數的絕對值在逐漸提高。這說明隨著時間推移,扶貧開發政策的增收效果逐漸顯現,平均而言,排除經濟增長因素后,列入國貧縣第二年可以使農民增收超過10個百分點,之后的效果逐漸提高至第七年的約17個百分點。本文認為這種效果的由小變大原因是多種扶貧開發政策生效有一定的時滯性。例如以工代賑政策中國家安排以工代賑投入建設農村小型基礎設施工程,貧困農民參加以工代賑工程建設,獲得勞務報酬,直接增加收入,但項目的實施需要進行各種行政手續,農民收入的取得也往往在項目完成之后。另外,其他教育培訓和開發類項目同樣需要一定的時間才能提高農民收入,從而造成政策效果的滯后效應。
另外,1995年作為處理后時期的結果不顯著,可能存在異常值或周期性因素的干擾,在穩健性檢驗中本文將進一步排除這種干擾。2000年作為處理后時期的結果則并不顯著。政策實施到2000年時效果不再顯著,初步表明扶貧開發政策長期效果可能并不理想。

表2 短期農民增收效應的雙重差分結果
控制變量中,人均GDP和人均財政收入的系數皆顯著為正,表明總體經濟發展水平以及地方政府財力對農民收入提高有顯著的促進作用。工業化水平變量的系數顯著為負,本文認為,相較于農業和服務業企業,由于工業企業往往是資本密集型的非“利貧性”企業,因此工業化的提高會導致非“利貧性”增長,從而對農民收入造成負面影響。這種機制將在后文進行更細致的檢驗。
為了檢驗長期效果,本文進一步以1990年為扶貧開發政策實施前時期,2000之后的不同年份作為處理后時期分別進行檢驗,結果如表3所示。

表3 長期農民增收效應的雙重差分結果
2000—2005年之間的雙重差分系數皆不再顯著且轉為負值,說明被扶持的第八年之后,扶貧開發政策對農民收入的促進作用已經不再顯著,可以認為這段時期我國農村地區脫貧的主要動力來自于涵蓋所有地區的經濟增長,而非瞄準國貧縣的政策干預。這與 Park和 Wang(2010)以及張彬斌(2013)等人對 2001—2010年新時期農村扶貧開發的研究結論一致。2005年之后,雙重差分系數開始變為顯著為負,表明扶貧開發政策反而降低了農民收入約6~8個百分點,瞄準國貧縣的扶貧開發出現了“政策陷阱”效應。
另外,控制變量中,人均 GDP和財政收入變量系數皆顯著為正,表明當地經濟發展的總體水平與農民收入水平可以同步提高。以第二產業增加值比重衡量的產業結構系數顯著為負,表明在其他條件不變的情況下,工業發展的確與農民增收的目標存在一定的矛盾性。
為了更充分地利用樣本信息同時降低可能的異常值影響,本文以江西、貴州和甘肅三省①內蒙古 2001年沒有加入新國貧縣,而河北只有一個國貧縣調整且數據缺失較為嚴重,因此未考察這兩個省的情況。各自新被列入國貧縣名單的區縣取平均形成三個各省國貧縣的處理組,利用各省的非國貧縣合成為對照組。江西的吉安縣、樂安縣和萬安縣,貴州的道真縣、江口縣、錦屏縣和思南縣以及甘肅②合作市也是2001年新國貧縣,但其在1996年才成立,數據不足,因此未考慮。的合水縣、兩當縣、麥積區、寧縣、夏河縣和鎮原縣在2001年被新列入國貧縣名單,因此本文首先分別將三省這些區縣的各總量指標取均值,形成每省一個的三個“平均國貧縣”作為處理組,接著進一步將其他對應各省未列入新一輪國貧縣名單的區縣作為對照組進行合成控制。通過求解公式(3)的最優化問題,可以獲得對照組各區縣的比重ωk,具體的結果如表4所示。

表4 合成國貧縣的區縣及其權重
其中合成指標包括是否是少數民族縣、山區縣或革命老區縣的虛擬變量、人均GDP、人均財政收入以及 1990年、1995年和 2000年的農民收入以進行充分擬合,各省合成國貧縣與實際國貧縣和非國貧縣的各指標比較如表5所示。可以看出實際國貧縣與非國貧縣的各指標差別明顯,但合成國貧縣與實際國貧縣的對應特征(尤其是各處理前時期的農民收入)十分接近,可見將合成國貧縣當作國貧縣的反事實(counterfac tual)情況是合理的。

表5 參加合成變量的擬合與對比
圖2為實際國貧縣與合成國貧縣平均農民年純收入的對比,其中(a)~(c)分別為江西、貴州和甘肅的情況,可見三省中新列入國貧縣的區縣并沒有顯示出顯著的農民增收效應,甚至在江西和貴州的新國貧縣農民收入增長開始慢于非國貧縣,這與之前的扶貧開發可能造成“政策陷阱”,即阻礙農民增收的結論保持了一致。江西的非國貧縣都昌縣在合成國貧縣時被賦予了最大的權重,意味著其與國貧縣特征最為接近,因此本文選其進行合成控制作為安慰劑檢驗①即將實際未受處理的樣本假設為處理組進行合成控制,檢驗政策效應是否來自于樣本共同的非政策因素。,結果如圖(d)所示,與圖(a)~(c)相比,圖中在 2001年前后實際農民收入始終與擬合農民收入保持了高度一致性,并沒有出現合成樣本高于實際樣本的偏離。這說明合成控制法很好的擬合了其收入走勢,證明了國貧縣效應不會提高反而會降低農民收入的結論并非其他共同偶然因素造成的,這進一步論證了本文的結論。
造成扶貧開發“政策陷阱”的原因較為復雜,但根據地方政府對政策資源的利用情況,總體可以將其分為兩種機制②感謝審稿人提出的扶貧開發政策可能直接影響脫貧的機制,但由于本文關注的是瞄準國貧縣的扶貧開發政策,研究期間相關的政策和資源主要用于支持通過區域開發而帶動居民脫貧的項目,并非通過直接轉移支付降低貧困,因此可以忽略這種機制的干擾。。
一種是國貧縣政府未能有效利用政策資源的“不作為”機制。具體來看,首先,國貧縣一般是經濟社會發展較為落后的地區,其制度環境也往往不盡完善,因此政策實行過程中的資源漏出以及精英俘獲問題會嚴重降低扶貧的精準性(周玉龍和孫久文,2017;汪三貴等,2004),從而造成資源浪費;其次,我國的國貧縣認定周期約為十年,缺乏動態識別和退出機制,因此入選國貧縣名單意味著當地可以享受數年的扶貧開發政策扶持,而且發展越落后越有利于繼續爭取下一周期的扶持,導致從政府到貧困人口都沒有足夠的激勵爭取“脫貧摘帽”,由此形成對政策和資金“等靠要”的路徑依賴(匡遠配和汪三貴,2012);最后一個必然存在的原因是扶貧開發至今已經取得了顯著成就,大量貧困人口已經擺脫貧困,剩余的扶貧對象往往脫貧難度最大,這不可避免的導致扶貧政策邊際效應遞減。以上的“不作為”機制可能解釋國貧縣短期增收效果明顯,而長期增收效應消失的現象卻無法解釋扶貧開發政策對農民收入的負面作用。
因此,本文考察另一種解釋,由于扶貧開發重要的目標是發展生產,從而帶動人口脫貧,但這種機制生效的前提是國貧縣能夠實現“利貧性”增長,也就是降低貧困的增長。如果地方政府有效利用了政策資源,但將其投入到了非“利貧性”產業中,從而對“利貧性”的產業造成了擠出,那么便會造成加劇貧困的增長模式,產生“政策陷阱”。在我國的分權式政治激勵體制下,地方政府往往更重視GDP增長,而忽略農民的收入提高及其自我創收能力的培養(周黎安,2004),使得扶貧開發資源可能被挪用于發展見效快的以第二產業為代表的資本密集型產業(劉瑞明和趙仁杰,2015),忽視對貧困人口人力資本積累以及軟環境建設的投資,無法培養農民自身的創收能力。同時,長期來看,如果扶貧開發的政策資源如果被大量投入到資本密集型產業發展中,甚至形成路徑依賴,就可能會對能夠有效提高貧困人口報酬的勞動力密集型產業造成擠出,此時盡管地方 GDP會有增長,但這種資本密集型產業導向的外部扶持反而可能降低農民收入。
對此,本文對以上兩種機制的相對重要性進行檢驗。如果“不作為”機制成立,那么國貧縣的總體經濟發展水平不會受到政策的顯著影響。基于這種推論,本文以調整到 1990年不變價格的實際GDP和人均實際GDP為結果變量,分別做扶貧開發政策的雙重差分檢驗,結果分別如表6和表7所示。

表6 實際GDP增長效應的雙重差分結果

表7 人均實際GDP增長效應的雙重差分結果
兩種檢驗的結果相似,多數年份的雙重差分系數結果皆顯著為正,不管是從短期還是長期看,扶貧開發政策都能夠有效促進國貧縣的經濟增長,且隨著時間推移這種增長效應越來越強。基于國貧縣的扶貧開發政策的實施有益于當地經濟總體增長,且在短期內農民收入增長和總體經濟增長能夠同步實現,但長期則削弱了政策對農民增收的效果。這表明國貧縣政府能夠充分利用扶貧開發資源,相對于“不作為”機制,“亂作為”機制可能是扶貧開發“政策陷阱”更重要的原因。
基于以上結果,本文進一步對扶貧開發政策是否導致國貧縣產業結構變遷進行檢驗以考察“亂作為”機制的存在性。表3中產業結構系數顯著為負的結果已經表明,相對于第一、三產業,資本密集型的第二產業不利于農民收入的提高。因此,本文以第二產業增加值占 GDP比重作為因變量進行雙重差分檢驗,驗證相對于非工業,非“利貧性”的第二產業是否的確發展更快,結果如表8所示。

表8 產業結構效應的雙重差分結果
可以看出,多數年份雙重差分項的系數為正,且在 2004年之后系數多顯著為正。說明扶貧開發政策在短期內并未改變國貧縣的產業結構,但長期促進了國貧縣第二產業的發展,第一產業和第三產業發展卻相對滯后,進一步驗證了長期中國貧縣將扶貧開發資源更多地投向了資本密集型產業的發展而不利于農民增收這一“亂作為”機制。
以上DID方法的應用是在自然實驗的情境之上的,即需要滿足隨機性和同質性假設條件(陳林和伍海軍,2015),換句話說,在運用DID方法之前,需要檢驗處理組和控制組在政策實施前的結果變量變化是否有相同的趨勢。
因此,本文對進行 DID檢驗的結果變量進行了平行趨勢檢驗,結果如圖3所示。從圖(a)~(d)中可以看出,在“八七”計劃開始之前,國貧縣和非國貧縣的農民收入、GDP、人均GDP和產業結構演化趨勢較為相似,因此可以認為利用雙重差分能夠有效識別政策效果。以上的實證研究結果較為可靠。
為了保證結論的穩健性,本文進一步試圖糾正可能存在的樣本選擇偏誤。Baum-Snow等(2017)、Duranton和Turner(2012)和Faber(2014)在糾正交通基礎設施建設的自選擇性時將歷史鐵路線路和地理因素等當作工具變量,但是合理的工具變量往往很難獲得。還有的研究利用了斷點回歸(RD)方法估計局部處理效應來降低處理的自選擇效應(毛捷等,2012;Meng,2013),但 RD方法的假設前提是在斷點附近的處理狀態無法通過控制相關變量進行人為干預,而國貧縣的資格恰恰可以通過數據操縱等手段來獲得,現實中這種現象也極有可能存在(匡遠配和汪三貴,2012)。
幸運的是,如果這種選擇偏誤是基于可觀測的變量,例如區縣發展水平和要素稟賦等因素,那么本文就可以通過傾向得分值匹配(PSM)方法重新調整處理組和控制組,獲得盡可能隨機分配的樣本。
PSM 方法要求首先估算出每個區縣的傾向得分 P(X)(即其他特征變量 X給定的情況下,被認定為國貧縣的概率),然后根據這個概率尋找最接近的處理組和控制組對進行匹配,將匹配后的控制組作為處理組的反事實情況。在匹配樣本滿足條件獨立分布和共同支撐的假設下,扶貧開發對發展的因果效應即匹配對在共同支撐域的結果變量差的均值,如式(4)所示。
如上所述,PSM 方法需要滿足一個重要的假設條件,即決定處理分布的變量都是可觀測而且可得的變量,而在國貧縣的確定過程中,正如之前指出的,盡管一些原則性的規則是確定且透明的,但其中仍然有很多模糊性的因素,利用PSM需要克服遺漏變量的困難,如果不可觀測的其他因素影響國貧縣的認定,匹配結果就不能滿足處理外生的獨立性假設,則PSM的結果就是有偏的。
對此,在本研究的背景下,本文引入結合以上兩種方法優點的雙重差分傾向得分值匹配(PSMDID)估計(Heckman等,1997),以便充分利用數據的面板特性來克服自選擇和遺漏變量的內生性問題。PSMDID的估計量可以用式(5)獲得:
PSMDID估計量的主要優點在于其在樣本的雙重差分基礎上進行匹配(Fan,2010),從而能有效利用面板數據結構,排除非時變和共同因素的干擾,同時有效解決樣本自選擇引起的內生性問題。
使用PSMDID方法要求通過共同支撐和平衡性檢驗,圖4中(a)和(b)分別展示了兩個檢驗的結果。
圖中(a)圖為是否列入國貧縣名單的傾向得分值,縱軸為樣本數,國貧縣的得分值平均高于非國貧縣,但大量樣本處在二者的共同得分區間,因此保證了足夠的共同支撐樣本數。(b)圖為匹配前后控制變量的平衡性檢驗,可見除 revocounty變量外,其他變量的國貧縣和非國貧縣偏差顯著降低,可以認為匹配過程通過了平衡性檢驗。
表9展示了PSMDID的結果,與以上DID的結果保持了一定的一致性。列入國貧縣在3年至5年的短期內增收效果顯著,但2000年及之后這種國貧縣的農民收入增長反而開始落后于非國貧縣,意味著某個國貧縣如果未被列入國貧縣名單,農民收入增長的速度可能更高,扶貧開發政策的干預反而干擾了增長本身的脫貧效應。這進一步印證了之前表明的與國貧縣聯系的扶貧開發政策可能使其陷入“政策陷阱”的結論。

表9 農民增收效應的PSMDID結果
為了消除周期波動的干擾,本文取1998年、2005年及其前后一年的對應變量取平均值,作為處理后時期分別利用 DID和 PSMDID方法進行檢驗。結果如表10所示,其中雙重差分項的系數符號和顯著性與未取平均值時保持了一致。到1998年,列入國貧縣能夠顯著提高農民收入,但到 2005年,這種效應已經消失甚至開始阻礙農民增收,進一步證實了結論的穩健性。

表10 消除波動的檢驗結果

續表10
本文利用 DID 和合成控制法,使用河北、內蒙古、江西、貴州和甘肅五省 1990—2010年的縣域數據考察了國貧縣受到的扶貧開發政策扶持在短期和長期內是否有利于農民增收的問題。本研究發現,扶貧開發政策短期會顯著提高被扶持的農民收入約10%~17%,但長期來看,十年之后這種增收效應會逐漸減弱,甚至開始阻礙農民增收約 6%~8%,說明扶貧開發政策在長期存在“政策陷阱”效應。進一步的機制分析表明,地方政府能夠有效利用扶貧開發資源促進當地的經濟增長,但國貧縣第二產業的發展速度比其他產業更快,可能對其他有利于提高農民收入產業的發展造成擠出效應,從而阻礙農民脫貧增收。
本文的研究結論主要有三點政策啟示。首先,要嚴格監管扶貧開發資源的使用用途,建立科學的評價制度以避免資源分配者的“亂作為”行為,防止其被用于發展不利于貧困人口收入增加的項目。其次,要合理調整國貧縣的政績激勵,進一步降低經濟增長目標的考察權重,鼓勵發展最有助于農民增收的勞動力密集型產業。最后,當前國貧縣認定的十年周期是扶貧開發政策陷阱的重要原因,盡管根據中央部署,2020年國貧縣將全部“脫帽”,國貧縣的調整問題將不復存在,但新的扶貧戰略也要重視瞄準對象的動態退出和進入機制設計,提高扶貧開發資源的利用效率。