□ 湯明磊 趙 巖
政府績效評估是發達國家在改革公共管理過程中逐漸形成和發展起來的,其發軔于20世紀初美國紐約市的績效評估實踐活動,勃興于20世紀80年代的“新公共管理”運動,目前廣泛地存在于各國政府管理的各個層面。
中國地方政府自20世紀90年代引入績效評估實踐以來,已經進行了積極的探索與創造,并形成了各具特色的績效評估模式,較為典型的有青島的目標責任制、廈門的公共部門建設、杭州的公民評議和蘭州的第三方評估等。*藍志勇、胡稅根:《中國政府績效評估:理論與實踐》,《政治學研究》,2008年第3期。然而,由于制度環境、組織結構等多種因素的影響,中國地方政府在推進績效管理工作的多個環節中均出現了偏離預期效果,甚至內生出無形控制力量的負面現象,導致績效的功能異化。面對政府績效評估異化現象,關鍵問題是對異化的種類進行歸納,并找出績效評估背離正態功能的深層次原因,本文試圖對中國地方政府在績效評估過程中的異化現象進行探討,并對其內在邏輯與“中國”誘因做初步回答。
現實的政府在運轉過程中會出現一些“偏離”制度和法律規定的行為和狀態,任何政府的實踐活動均會與其預期產生一定程度的偏差,然而偏差并不等于異化,如何界定“異化”,是對績效評估異化現象分類前的一個必要補充。
1.績效評估定位是否準確
明確績效評估的定位有助于明確績效評估的邊界,第一個需要明確的是績效評估究竟更多服務于“外部責任”還是“內部控制”?政府組織績效評估雖然服務于多重目標,但可以劃分為“外部責任”和“內部控制”兩種基本類型。彼得·德魯克認為,一個組織的績效是由外部決定的,在其內部則更多地體現為費用。發達國家的政府績效評估偏重于外部問責和服務,具有自下而上的雙向性特征;而中國政府績效評估則更多著眼于內部控制和監督,具有自上而下的單向性特征。
第二個需要明確的是績效評估究竟更多側重于管理提升的措施還是效績預防的手段?績效評估作為目標管理的一種手段,其目標應與組織的目標保持一致,然而,隨著組織層級鏈的傳遞,處于底層的地方政府往往容易專注于活動的過程導向,而忽視活動的結果導向,使得效率、質量對組織的貢獻程度退居次要地位,在評估過程中處于被動地位。
2.績效評估內容是否科學
政府部門角色的合理定位,是科學組織績效評估的前提。績效評估的內容應根據政府部門的職能確定,越位基礎上的績效評估是評估異化的重要表現。當前,由于中國政治經濟社會仍處于較為劇烈的轉型期,政府職能在某些方面的界定仍處于莫衷一是的狀態,在目標責任制、效能監察等管理機制中,組織績效評估都是圍繞“中心工作”展開,而不少地方政府和部門所確定的“中心工作”,并不一定屬于或完全屬于政府的職能范疇,如果將這些工作置于績效評估體系的重要地位,則內容的科學性就成為異化與否的重要標準。
根據績效評估異化界定原則,可以將中國地方政府績效評估的異化現象分為四類。
1.偏離性異化
偏離性異化指的是組織或個人在進行績效評估時過分追求過渡性的“非使命指標”,導致結果指標向過程指標轉化,使得與最初績效目標產生嚴重偏離的現象。非使命目標在很大程度上是改革者為應對有效治理地方事務的壓力性政治需求而采取的權宜之計,屬于暫時性和過程性指標,過分追求易導致本末倒置,侵蝕地方政府治理根基。*JieGao,Hitting the Target But Missing the Point: The Rise of Non-Mission-Based Targets in Performance Measurement of Chinese Local Governments,Administration & Society,42( 1S) ,2010,p.56-76.
在中國,偏離性異化集中體現在政府績效評估體系中對諸如信訪、招商引資、計劃生育、農作物推廣等任務指標的嚴格制定上。如招商引資目標考核的任務被下發到各級地方政府,甚至某些國家級新區功能區區域外行使社會管理職能的下轄街道也被賦予剛性考核義務*如天津濱海新區在2013年9月26日撤銷塘沽、漢沽、大港三個城區工委、管委會建制后,仍賦予轄下27個街鎮招商引資指標任務。,凡完不成招商指標的部門和官員都將面臨著通報批評、扣發補貼、離崗、引咎辭職的處理。然而,招商引資僅僅是完成經濟增長的結果指標下的過程指標,當面臨巨大的招商壓力時,政府部門很難成為“公正仲裁者”或良好市場秩序的締造者。
2.對沖性異化
對沖性異化指的是由于評估指標設置的綜合性,導致評估結果被沖淡甚至失靈的現象。近年來,地方政府的指標體系隨著績效評估的廣泛應用而日益完善,考核形式也逐步增多,兩者都在一定程度上加劇了被評估主體的“應試疲勞”;尤其是經濟發展、節能減排、安全生產、農業補助、環境保護、科技創新等諸多方面都被逐步納入考核體系,過于分散的指標任務分散了政府部門的精力,且不同指標任務之間也會存在不同程度的沖突,考核指標不斷完善的同時也削弱了考核指標的指向性;最后的評分階段,分數配比往往又使用簡單加權平均的通用計算方式,而不是對指標體系進行層次和權重的分配,最終導致考核指標失靈,無法通過指標考核改善治理質量。
對沖性異化的另一個突出表現是同時專注于過程性指標與結果性指標,導致結果性指標在加權中被沖淡。新公共管理理論認為,“最核心的觀點是為結果而管理,而不是努力去完成那些被期望做的事;最重要的結果之一則是使‘顧客’滿意”*Bardach , Eugenel Getting Agencies to Work Together :The Practice and Theory of Managerial Craftsmanship. Washington D. C. : Brookings Institution Press ,1998.。然而,中國地方政府績效評估指標體系中,領導重視程度、組織的保障、組織的活動、服務對象滿意度,在評估結果中各占四分之一左右的比重,導致真正需要被重視的服務對象滿意度比重在聚合異化中被沖淡。這不僅使得參與者積極性受挫,也并未帶來公共服務質量的明顯提升,政府績效評估效果和作用式微已影響到績效評估活動的公信力及可持續性。
3.驅逐性異化
驅逐性異化指的是由于績效評估中量化指標的可計量性,導致被評估主體對可計量指標的過度關注,從而忽略其他不可計量性工作,出現可計量任務“驅逐”不可計量任務的現象。*Wilson,J.Q. What Governmental Agencies Do and Why They Do It? New York: Basic Books, 1989.績效指標具有價值倡導與行為指南功能,盡管客觀可計量指標是對評估工作內容的抽象概括,并不能包含工作的全部方面,因為,政府部門的產出往往包含很多無形的公共服務,與企業管理不同,有些公共服務很難用客觀指標加以衡量。如果被評估者專注于量化指標數據的營造,易導致量化指標出現機械性膠化,對實際工作產生消極影響。
舉例來說,地方政府績效評估中長期以招商引資和GDP作為核心指標,以此決定對地方執政者人事升遷考核的重要依據,而往往不會采用一些不易量化的指標對執政者進行考核,如居民幸福感等;公安部門績效評估的核心指標是破案率,而往往忽略居民的安全感;稅收部門績效評估的核心指標是收款數,而往往忽略服務質量、民主作風等。長此以往,數字驅動下的績效評估容易誘發被考評主體的“迎合性執行”和“偽造性執行”。如果將治愈數作為醫療部門績效評估的核心指標,醫生會傾向于接待病情較輕且容易治愈的病人,而對病情較重且難以治愈的病人避而遠之;同樣,如果將破案率作為公安機關績效評估的核心指標,辦案人員可能會選擇性地降低犯罪的標準或者專注于尋找甚至“創造”案件。因此,在評估主體信息不對稱的情況下,理性的被評估者就要想法設法隱瞞真實信息,或者創造出迎合標準的數據,通過多種手段保證評估結果好于實際狀況,這些都會為部門運行的實際績效帶來危害。
4.溢出性異化
溢出性異化指的是績效評估在實施的過程中,功能出現異化,從而由“評價方法”擴散為“執政工具”的現象。盡管我國各級地方政府的績效評估也取得了一定的成效,但客觀地說,以“考核”為目的的評估更多地是把績效評估作為了“評比評優”的工具,從而更多地把注意力集中在最終的名次上,而不是思考如何通過評估發現問題、解決問題。
溢出性異化的另一個突出表現是領導者不自覺地將績效評估當作控制和駕馭下屬的策略性工具,甚至作為收縮權力的“指揮棒”,如果下屬有違背上級的意愿和行為,上級領導可以通過專項評估設置、公眾評議尋托、察訪核驗突擊等手段對下屬進行脅迫性控制,使得績效評估在此過程中由技術手段擴散為政治手段。
績效評估作為新管理主義倡導下的現代公共行政語言,其制度本身就具有價值取向上的主客觀分歧,這樣的分歧來源于評估主客體在不同視角下對組織績效的界定,如果過度傾向于其中一種方向,易導致績效評估異化,從而使評估結果不能客觀、真實地反映政府部門的運行績效。兩者的比較詳見表1。

表1 績效異化兩種方向的比較
如果將被評估主體視為一個封閉的系統,假設任務是重復的、產出以某種方式消失、標準質量的資源可以永久獲得,則評估主體會不自覺地開始專注組織的技術層面,致力于技術功能的有效運行,被突出觀察的是組織的生產技術,即包含了序列的匹配和依賴,在流水生產線上以恒定的速率生產單一產品的能力,此時效率成為組織績效評估的核心指標。
在封閉系統視角下,組織的效率問題得以凸顯,而組織的公平層面相應被評估者淡化。評估者往往只分析組織的經濟因素,而過少考慮組織的政治因素,特別是公共績效評估充分利用了技術的特點,但它簡單地套用了物質生產中產品質量定級的標準,無法反映人類追求公平正義的價值。伴隨著各種管理技術手段的采用,如質量管理、目標管理和成本收益分析等等,政策制定者和執行者往往傾向于依賴工具和技術手段的問題解決方案,這至少帶來了三個沒有預期的結果:(1)數理統計法在組織績效中的廣泛應用,量化思維逐漸形成;(2)集中化政策的廣泛制定,組織趨同化與企業化現象嚴重;(3)人文與價值關懷的式微,社會人情的冷漠。這最終會導致管理權力的集中和依賴更多技術手段,由此導致了組織績效評估異化的封閉性方向。
如果將評估對象視為一個開放的系統,組織將不是獨立的實體,而是與周圍環境循環作用、相互反饋的一個部門,評估主體會不自覺地開始專注組織的協調層面,致力于協調技術次組織及其產品使用者,被突出觀察的是組織的協調技術,即對于時空上散亂分布的多個客戶,依據客戶自身的反饋對多種技術進行個性化的選取、組合與排序的能力,此時滿意成為組織績效評估的核心指標。
在開放系統視角下,組織的公平問題得以凸顯,而組織的技術層面相應遭遇淡化。評估者往往專注于組織的政治維度,而相應地忽略了組織的經濟維度。公眾對政府公共服務的需求、質量評估、態度和滿意度等成為組織管理者競相追逐的目標,以此為基礎開展的政府績效評估往往會墜入“民眾迎合主義”的風險,公眾的監督者和生產者角色被片面強調,而消費者角色則被忽略。同樣地,這些觀念也會帶來負面的溢出結果:(1)參與泛化導致組織效率的低下;(2)民眾迎合主義導致組織的任務失去長期規劃;(3)公眾評議可能會被利用成為政治斗爭的工具。由此導致了管理權力的過度分散以及組織績效評估的異化走向。
績效評估工作是一個系統的過程,做好績效評估工作,需要績效指標的科學設計、考評結果的合理利用、考核方式的多樣組合以及評估主體的多元配比共同發揮作用,任何一方面出現問題都可能導致績效評估實際效果弱化,甚至異化。在對績效評估異化影響因素的劃分中,能動程度和匹配程度是其中極具代表性的兩類。能動程度是指被考評單位對績效評估工作的認知情況,包括對同一績效考評指標的執行時間長短和是否主動地接受績效考評兩方面;匹配程度是指績效評估工作與被考評單位日常工作及利益的契合程度,包括績效考核指標是否與地方各部門利益匹配、績效目標與結果運用是否與街頭官僚利益匹配兩層次。
能動程度是影響績效評估工作異化的重要因素,能動程度越高說明對績效評估的認知越深刻、越科學,績效評估越不容易異化;反之則說明對績效評估的認知越教條被動。作為主觀認知上的變量,能動程度的高低取決于被評估主體對績效指標、考評結果以及考評方式等多個方面的認知,詳見表2。

表2 能動程度影響維度匯總表
由政府發動、政府實施的績效評估實際上是一種內部控制型的評估,具有單向性的特點*周志忍:《我國政府評估需要思考的幾個問題》,《行政管理改革》,2011年第4期。,表現為上級政府或主管部門對下級政府或主管部門進行自上而下的評估;績效評估體系也往往由處于行政序列高端的部門設計完成,缺乏社會和下級部門對體系設計的參與。內部控制型組織把績效評估當成控制約束下級的工具,而非承擔社會責任的載體。內部控制型績效評估能動程度低,可能導致評估異化。
評估主體可以由各級政府部門、專家學者、獨立的社會團體、普通公眾等聯合組成,甚至是“績效考評委員會”*王建名:《中國地方政府機構績效考評目標模式研究》,《管理世界》,2005年第10期。,因評估主體的價值取向不盡相同*包國憲、冉敏:《政府績效評價中不同主體的價值取向》,《甘肅社會科學》,2007年第1期。,評估主體多元且比例合理有助于提高被評估主體的能動程度。采用政府封閉的績效評估,缺乏其他主體的參與,或者激進的民眾評議,片面強調民眾參與數量及迎合民眾意見,一定程度上會忽視評估的科學客觀性*倪星、李佳源:《政府績效的公眾主觀評價模式:有效,抑或無效?——關于公眾主觀評價效度爭議的述評》,《中國人民大學學報》,2010年第4期;毛壽龍、陳小華:《政府績效評估中公眾參與的限度及超越》,《理論探討》,2011年第1期。。
績效評估的內容和指標也是影響績效評估的重要因素。指標的不切實際會誘發個別地方政府為了追求指標的達成而對市場和社會進行控制,從而導致職能越位;指標體系貪大求全和朝令夕改也容易導致異化,龐大且定量化的指標體系、頻繁修改的指標內容,容易降低指標的敏感度,也會給實際工作人員增加執行難度*倪星、余凱:《試論中國績效評估制度的創新》,《政治學研究》,2004年第3期。。包含目標責任意涵的績效評估易導致地方政府鑒于壓力和時限進行虛假行為,也可能催生成本的集中化浪費;而包含突擊檢查意涵的績效評估,則會給地方帶來一個新的檢查,而不是一個過程管理的評估。
匹配程度反映的是客觀上的指標,包括績效考核指標與地方實際利益匹配程度、績效考評指標實現難度與街頭官僚利益獲得難度兩方面的匹配程度。匹配程度越高說明績效評估工作與地方實際情況越契合,在推進過程中不會出現異常;反之績效評估工作則會帶來被考核單位的選擇性執行和虛假化執行等情況。
績效考核指標的科學性不僅僅包括指標本身是否能夠達到績效目的,也包括績效指標是否符合地方實際利益以及績效指標實現難度是否適中等因素。地方實際利益包括地方經濟發展情況和地方各政府部門的利益關系。如果在一個以重工業為基礎的城市實行綠色GDP為核心指標的績效考評指標,會催生各地方政府機構在目標責任制的要求和績效評估結果的激勵下做出瞞報謊報、偽造數據的行為。績效指標與地方實際匹配程度越低,越容易導致異化。
績效評估結果運用的目的在于通過激勵懲罰機制提高政府效能,然而當績效評估的效績獎勵占基層公務員收入的比例過高時,基層公務員則可能為了績效獎勵過分追求指標的達成,從而忽視指標的內涵。事實上,一味追求量化的績效措施也會妨礙公共服務的質量,并且削弱對街頭官僚的問責制,導致績效問責的“可計量的任務驅逐不可計量的任務”、“選擇性執行”和“績效悖論”。*顏海娜、聶勇浩:《基層公務員績效問責的困境——基于“街頭官僚”理論的分析》,《中國行政管理》,2013年第8期。績效目標和結果運用與街頭官僚利益匹配程度越低,越容易導致異化。
影響績效評估異化的兩個因素,按照高低程度兩兩組合形成四種組合,每一種組合對應著不同的異化方向,參見表3。

表3 匹配程度與能動程度的集中異化
表3表明,能動程度高、匹配程度高時,一般不會帶來異化。能動程度低、匹配程度高時,盡管績效評估實施起來難度很低,也不會得到各方的反對,最后也能順利執行;但是由于被評估主體對績效評估的認知不足,推行評估的自主意愿不強,導致績效評估的效果變弱,績效評估的質量降低,對沖性異化和溢出性異化都屬于這種情形。能動程度高、匹配程度低時,盡管被評估主體對績效管理認識深刻,績效評估的目的是為了提高政府效能、擴大評估主體、優化評估指標、強調過程管理,但是在具體執行時易遭遇較多阻礙,會出現指標設計虛假化、指標獲得艱難化、考評結果緊張化等情況,偏離性異化、驅逐性異化屬于這種情形。能動程度低、匹配程度低時,績效評估基本上就流于形式了。
中國的績效評估是在一種“壓力型體制”和“干部崗位目標管理責任制”下形成的,這種評估更容易形成上級對下級的考核,尤其是上級政府掌握著下級政府的資源時,績效評估異化的可能性將大大提高。一任政府官員可能會為了追求短期效果而對城市規劃、投資領域進行調整,在傳統的政績觀里取得一定的成績、得到領導的賞識是中國地方官員晉升的主要途徑。壓力型體制下的目標責任制加上傳統的政績觀使得地方政府在推進績效評估的過程中,往往形成上級對下級的單向度考核,缺少社會公眾參與,更容易出現溢出性異化。
中國的績效評估帶有運動式治理的特點,并且呈現出較強的根據地決策經驗擴散的色彩。一旦績效管理提出,它的生命力和滲透力都會達到頂峰,在各個領域、各個部門都要進行績效管理,一個新指標和新方法提出,各個領域都在學習,這既與中國開展績效管理時間較短有關,也帶有政策擴散的色彩。運動式治理導致績效評估異化的主要原因是政策擴散過程中出現的不適應問題。廣東的經驗適應廣東,但不一定適合北京,然而中國的績效評估有革命經驗擴散的色彩,一套指標在各地流轉,實際上中國的經濟具有明顯的跨越式斷層發展的特點,東中西部差異明顯,同樣強調同一指標的含義,甚至用同一“科學標準”來設計績效考核指標是導致異化的重要因素,在落后地區強調發達地區的績效考核指標只會帶來弄虛作假和選擇性執行。
新公共管理運動倡導績效問責,希望通過績效評估來實現對政府效能的提升,提高政府工作效率,改變政府形象,把政府當成是一個生產公共服務的企業,強調提高政府的生產率。新公共管理強調測量,追求績效量化模式管理。
然而政府的職能除了提高效率之外,更要求注重公平和社會正義。從目前實行績效管理的各省市試點來看,政府都在強調行政效率的提高和行政態度的改變,各部門都在強調高效的部門運營與企業化管理;然而這些都是提高政府能力的經濟維度,并沒有過多涉及政治維度的再分配。中國地方政府在績效評估中熱衷于以技術手段設計和開發政府績效評估指標體系,以技術理性代替政治理性探討政府績效管理機制,沉湎于對技術的精細化追求*陳天祥:《政府績效管理研究:回歸政治與技術雙重理性本義》,《浙江大學學報(人文社會科學版)》,2011年第4期。;出現以民為本價值缺失、經濟價值泛化等扭曲現象*廖曉明、孫莉:《論我國地方政府績效評估中的價值取向》,《中國行政管理》,2010年第4期。,政府績效的提高,行政效率的提升,包括經濟建設的擴張,在不能更好地用于再分配以減緩階層固化、縮小貧富差距的情況下,績效評估就沒有了存在的意義。片面強調政府的企業化管理,強調政府行為的營利性,而忽視政府行為的公平性,績效評估的目的必然會受到詬病。
中國地方政府績效評估異化導致公共資源的不合理配置,影響經濟社會持續健康發展。過度偏向“效率”和“滿意”中的一方都不適宜中國的實際,如何才能跳出“效率”和“滿意”的兩難境地,提高地方政府績效評估的有效性,需要在戰略管理與政策設計上做方向性的調整與轉變。
“一種有效的管理工具”是很多學者對政府績效評估性質的基本概括。這種“管理工具”的認識主要源自企業績效管理理論的觀點,進而衍生出“管理評估”范式,該范式的主要特點表現在以“所有者”和“經營者”的身份,專注于對組織建設能力的評估,而忽略了對組織維持能力的評估。隨著資本市場的發展和股份制的不斷完善,所有權與經營權進一步分離,“治理評估”范式逐步顯現發展,該范式的主要特點主要表現在以經營者的身份,專注于對組織維持能力而非建設能力的評估,雖然二者的評估對象是一致的,均為組織的整體績效,但它們所持的立場和評估的動機卻有著實質上的區別。
中國地方政府因為受到傳統行政文化、現行行政體制等諸多因素的影響,對政府績效評估較大程度仍停留在“管理評估”范式上,仍多以地區生產總值等經濟性指標為地區績效評估的重要標準,專注于地區的經濟建設能力,而忽略了地區的維持能力與可持續能力。今后在地方政府績效評估指標體系確立的過程中,可以在延續對地方政府經濟建設能力評估的基礎上,適當地加入一些對地方政府治理能力的評估指標,如政府負債、地區就業率、地區間泰爾指數、地區復合治理能力等,這些指標的加入在強化政府治理能力的同時,也減少了評估過程中的偏離性異化。
中國的績效評估帶有運動式治理的特點,一旦某一方法或指標被提出,在各個層級、各個領域、各個部門都要接受相同的考核,分數配比往往使用簡單加權平均的通用計算方式,而不對指標體系進行層次和權重的分配,這也在一定程度上導致了績效評估過程中驅逐性異化和對沖性異化的出現。現實的情況是,由于各個層級的政府職能差異性的存在,政府組織整體績效評估結果的有效性往往被“統一標準”中的經濟性導向和平均化導向所沖淡,最終導致考核指標失靈,無法通過指標考核改善治理質量。
今后地方政府績效評估指標體系確立的過程中,可以針對政府績效評估中的經濟性導向和平均化導向,設立多層次的指標考核體系,這里的“多層次標準”主要表現在兩個方面:第一是指標內容上的層次性,即對考核指標做基礎性、重點性和發展性的分類,如基礎性指標包括社會保障、社會就業、基礎教育、市政交通、環境保護等,重點性指標包括經濟建設、社會福利、高等教育等,發展性指標包括文化創意、科技創新等,每類指標依次被賦予相應的權重;第二是考核對象上的層次性,即對考核對象做層級上的區分,各級地方政府應依據職能劃分的不同確立不同的指標考核體系,以便更有效地考察地方政府的實際運行情況。
中國地方政府長期以來實行在以政府內部為主體的績效評估過程,一定程度上造成了政府體系之外的其他主體的監督缺位,如權力機關、政黨組織、社會公眾、媒體、第三方評估等。隨著這些主體的社會主體意識不斷增強,政府部門應有意識地建立復合評估主體系統,根據地方政府實際情況,強化權力機關在政府績效評估中的作用,發揮其他政黨組織的建議和監督作用,進一步完善公民參與機制,建立健全專家評估機制,有效利用媒體與社會組織的監督作用,賦予每一主體適當的權重,可以有效地減少驅逐性異化現象。
綜上而言,政府能力是個體能力與機制能力的總和,為了提高政府績效,發揮績效評估的重要作用,我們應該尋求新的導向,倡導地方政府的“治理”能力,分層次地鋪開績效評估指標體系,建立績效復合評估主體系統,以期兼顧中國的具體實際,考慮到上下級的關系,考慮到決策和執行的協調等諸多問題,這亟需學者們努力。□