阿儒涵 李曉軒
1 中國科學院科技戰(zhàn)略咨詢研究院 北京 100190 2 中國科學院大學 公共政策與管理學院 北京 100049
2018年中共中央、國務院提出“全面實施預算績效管理”要求以來,科技預算績效評價與其他領(lǐng)域預算績效評價一樣,正在越來越大的范圍內(nèi)開展起來,其對科技事業(yè)的影響日漸增強。預算績效評價與預算績效管理一樣是具有中國特色的新概念,應該以怎樣的理論來解析預算績效評價的內(nèi)涵,從而更好地指導實踐?黨的二十大報告提出“提升科技投入效能”的新要求后,在科技預算績效評價實踐中應如何體現(xiàn)?面對這些理論與實踐問題,文章在總結(jié)科技預算績效評價現(xiàn)有實踐,并借鑒已有理論的基礎(chǔ)上,提出了科技預算績效評價的 3E 理論,希望以該理論揭示科技預算績效評價的完整內(nèi)涵,以及科技預算績效評價進一步改革的方向。
20世紀60年代,為有效控制政府財政支出、節(jié)約成本,應對日益加劇的財政危機,以美國為代表的西方國家在政府績效審計中構(gòu)建了評價指標體系,經(jīng)濟性(economy)、效率(efficiency)、效果(effectiveness)等概念成為績效審計指標體系的重要內(nèi)容,被稱為“3E 指標”。不同國家在績效審計中的側(cè)重點不同。例如,瑞典側(cè)重效果,稱為“效果審計”(effectiveness audit);澳大利亞側(cè)重效率,稱為“效率審計”(efficiency audit);英國側(cè)重經(jīng)濟性(economy)則稱為“貨幣價值”(value for money)。此后,政府績效審計的3E指標被應用到更廣泛的評價領(lǐng)域,也增加了一些新的“E”指標,如公平性(equity)等。
20世紀80年代,在政府績效審計的 3E 指標基礎(chǔ)上,英國學者 Peter Checkland[1]提出了以面向公共部門和非營利組織為主的 3E 評價模型。該模型認為,對公共部門和非營利組織的全面評價需要著重回答 3 個問題:組織是否形成了既定產(chǎn)出(efficacy 問題);形成產(chǎn)出的過程中是否浪費了資源(efficiency 問題);產(chǎn)出是否有效(effectiveness 問題)。Checkland 的 3E 評價模型試圖運用系統(tǒng)論的思想來解決包含大量社會、政治及人為因素的組織評價問題[2],彌補了傳統(tǒng)利潤最大化評價模型無法將多維度復雜因素納入評價過程的缺點。另外,此前關(guān)于 3E 評價模型中的“E”概念是存在多種理解的,Checkland 在其 3E 評價模型中給出了既相互關(guān)聯(lián)又有區(qū)分度的界定。
Checkland 的 3E 評價模型被廣泛應用于各類公共事務的評價之中。例如,1998年,美國國立衛(wèi)生研究院(NIH)應用該模型開展了健康服務質(zhì)量的評價[3];2017年,美國聯(lián)邦政府應用該模型開展了針對 50 個州州立交通系統(tǒng)績效的評價[4];近年來,該模型還被廣泛應用于氣候變化倡議的提案評價[5]。我國對 Checkland 的 3E 評價模型應用也較為廣泛。例如,有學者在構(gòu)建科研機構(gòu)評價指標體系、人才培養(yǎng)績效評價管理模型研究中采用了該模型[6]。
預算績效評價作為一個具有中國特色的新概念,迫切需要形成自身的理論基礎(chǔ)。筆者研究認為,Checkland 提出的 3E 評價模型非常適合科技預算績效評價,值得借鑒。由此,文章以 Checkland 的 3E 評價模型為基礎(chǔ),結(jié)合我國已有實踐,提出了我國科技預算績效評價的 3E 理論(圖1)。①科技預算績效評價的3E理論內(nèi)涵包括 3個維度。基于科技視角的產(chǎn)出與管理行為(efficacy)維度;基于預算投入視角的資金投入效率(efficiency)維度;基于滿足經(jīng)濟社會需求視角的產(chǎn)出有效性(effectiveness)維度。②科技預算績效評價的3E 理論中 3個維度呈現(xiàn)逐層包含的關(guān)系。效率包含產(chǎn)出和管理行為維度,效率高要以產(chǎn)出和管理行為合理、合適為前提;效果包含產(chǎn)出與管理行為維度和效率維度,效果好要以這 2 個維度評價優(yōu)異為前提。③科技預算績效評價3E理論對 Checkland的3E 評價模型的擴展。主要體現(xiàn)在擴展了產(chǎn)出與管理行為維度的內(nèi)涵,使其既包含原有的產(chǎn)出內(nèi)涵,也包含目標設(shè)定、過程管理等管理行為。

圖1 科技預算績效評價的3E理論Figure 1 3E theory of S&T budgeting performance evaluation
在我國預算績效評價實踐中,關(guān)于“績效”自身的內(nèi)涵一直不明確、不規(guī)范。用到的概念較多,如效果、效益、效率、效能、結(jié)果、產(chǎn)出、影響、行為等。按照科技預算績效評價的 3E 理論,“產(chǎn)出”“結(jié)果”“行為”可歸為產(chǎn)出與管理行為(efficacy)維度;“效率”可歸為資金投入效率,即效率(efficiency)維度;“效果”“效益”“效能”“影響”可歸為效果(effectiveness)維度。
我國科技預算績效評價存在效率評價缺位和效果評價乏力問題。將我國現(xiàn)有科技預算績效評價實踐與以上科技預算績效評價的 3E 理論進行對比,可以得出應用 3E 理論的第 1 個重要結(jié)論,即:我國現(xiàn)有科技預算績效評價實踐主要集中于產(chǎn)出與管理行為(efficacy)評價,效率(efficiency)評價缺位,效果(effectiveness)評價乏力(圖2)。按照 2020年財政部出臺的《項目支出績效評價管理辦法》文件,現(xiàn)階段科技預算績效評價模型主要包括決策情況、資金管理和使用情況、實現(xiàn)的產(chǎn)出情況及取得的效益情況四大環(huán)節(jié)。前 3 個環(huán)節(jié)無疑屬于 3E 理論的產(chǎn)出與管理行為(efficacy)范疇;第 4 個環(huán)節(jié)在實際開展的科技預算績效評價中,也主要是從科技本身的視角來評價。因此,雖然第 4 環(huán)節(jié)理論上更加偏向于 3E 理論的效果(effectiveness)范疇,但在目前的實際評價中,仍然屬于產(chǎn)出與管理行為(efficacy)評價。

圖2 現(xiàn)階段我國科技預算績效評價模型與3E理論的對比Figure 2 Comparison between China’s nowadays model and 3E theory in S&T budgeting performance evaluation
提升科技投入效能需要開啟全面的科技預算績效評價。按照黨的二十大報告“提升科技投入效能,深化財政科技經(jīng)費分配使用機制改革,激發(fā)創(chuàng)新活力”的新要求,科技預算績效評價顯然不能僅僅停留在產(chǎn)出與管理行為(efficacy)評價一個維度上,還應大力加強效率(efficiency)評價和效果(effectiveness)評價,否則難以實現(xiàn)科技投入產(chǎn)出效能的提升。由此,筆者認為,落實黨的二十大報告“提升科技投入效能”的新要求,應該以科技預算績效評價3E理論為基礎(chǔ),重點增強效率評價和效果評價,開啟新階段全面的科技預算績效評價。
針對性開展“一改二增三強化”的3E評價工作。就如何開啟新階段全面的以 3E 理論為基礎(chǔ)的科技預算績效評價,文章提出以“一改二增三強化”為抓手針對性開展 3E 評價工作。改進和完善現(xiàn)有產(chǎn)出與管理行為(efficacy)評價,特別需要關(guān)注新增財政管理角度的評價與原有科技管理角度的評價之間的協(xié)調(diào)問題。增加效率(efficiency)評價,重在加快啟動效率評價方法探索與試點。強化效果(effectiveness)評價,重在系統(tǒng)建立效果評價方法體系。
2000年,我國啟動財政支出績效評價試點。2018年,《中共中央 國務院關(guān)于全面實施預算績效管理的意見》出臺。2020年,財政部《項目支出績效評價管理辦法》出臺,明確提出以“決策情況”“資金管理和使用情況”“實現(xiàn)的產(chǎn)出情況”“取得的效益情況”等為項目支出績效評價的主要內(nèi)容,項目層面的預算績效評價不斷規(guī)范。同時,部門與機構(gòu)整體預算績效評價也在積極推進。總體來說,一方面,經(jīng)過 20 余年實踐,預算績效評價基本實現(xiàn)了全覆蓋,“花錢問效”觀念日益深入人心,預算績效評價的效果初步顯現(xiàn)[7]。另一方面,從科技預算績效評價3E理論角度來看,目前以項目為主的預算績效評價主要涉及產(chǎn)出與管理行為(efficacy)評價,較少涉及效率(efficiency)評價和效果(effectiveness)評價;產(chǎn)出與管理行為(efficacy)評價也還存在較多要解決的問題,如評價方法、中介支撐機構(gòu)作用、結(jié)果應用等。這些問題共識性比較強,研究也比較多[8,9]。
本研究重點關(guān)注財政管理角度的科技預算績效評價與原有科技管理角度的科技評價之間的關(guān)系問題。該問題目前較少被關(guān)注,但其緊迫性日漸增加。科技管理角度的評價,即一般意義上的科技評價,起步早、涉及面廣。1985年,我國科技體制改革引入項目制后,以國家自然科學基金、“863”項目等的設(shè)立為代表,科技項目評價與科技計劃評價迅速廣泛開展起來。20世紀80年代中期以后,以中國科學院研究所評價為代表的科研機構(gòu)評價也逐步開展起來,并到 20世紀90年代初形成周期性的評價制度。近 10年來,基于科技管理角度的“三評”改革是當前的一項重點改革任務,主要包括“減量”“破‘唯’”兩大方面。“減量”就是減少評價的數(shù)量或頻次,“破‘唯’”即破“四唯”。目前“減量”改革取得了初步效果[10]。財政管理角度的科技預算績效評價從公共預算管理的需要出發(fā),評價預算資金效果的達成情況,既評“錢”又評“事”,目前處于增量發(fā)展之中。
目前,隨著財政管理角度的科技預算績效評價逐步實現(xiàn)全覆蓋,財政管理角度與科技管理角度這 2 個基本上相互獨立的管理角度的評價關(guān)系應如何協(xié)調(diào),已提上議事日程,旨在避免已經(jīng)顯現(xiàn)的管理工作上的重復、導向上的多頭導向及增加科技人員和科研單位負擔等問題。例如,某研究所短期內(nèi)分別接受了來自上級主管機關(guān)的周期性評價、來自科學技術(shù)部的中央級科研事業(yè)單位績效評價及來自財政部的整體支出預算績效評價。顯然,財政管理角度與科技管理角度的評價最大的重復在于兩邊都要評“事”。尤其是財政管理角度的預算績效評價目前仍以產(chǎn)出與管理行為評價為主,而較少涉及效率和效果評價,也就是說仍然以評“事”為主。因此,兩套系統(tǒng)重復評價的問題就更加凸顯。
未來協(xié)調(diào)的重點在于做好兩套評價體系的協(xié)調(diào),避免重復評“事”,有 2 種做好協(xié)調(diào)的路徑。①國務院關(guān)于全面加強基礎(chǔ)科學研究的若干意見. (2018-01-19)[2023-01-17]. http://www.gov.cn/gongbao/content/2018/content_5266238.htm.整合評價體系。目前,兩套評價出發(fā)點不同,財政管理角度的評價難以完全取代科技管理角度的評價。例如,大量的科技人才評價、期刊論文評價、科技獎遴選等是科技管理評價中有特色的評價。②在科技管理角度評價基礎(chǔ)上開展財政管理角度的評價。充分利用已有科技評價的數(shù)據(jù)、信息與結(jié)果,開展財政管理角度的評價,避免重復。從目前實際情況看,第 2 條路徑更具可行性。
從科技預算績效評價 3E 理論角度來看,到目前為止,效率評價很少開展,主要有 2 個方面原因:①關(guān)注度低。改革開放之初,我國科技投入的主要矛盾是投入不足、科技水平與國際先進水平差距巨大。改革開放 40 多年來,我國在科技投入管理上表現(xiàn)為投入驅(qū)動發(fā)展模式,即政府重視增加投入并將項目競爭作為分配資源的重要方式,但較少關(guān)注科技投入的效率。②評價難度大。由于科研具有科學研究靈感瞬間性、方式隨意性、路徑不確定性等①的特點,對科研要允許失敗,越是原創(chuàng)性大的研究失敗的可能性越大;科研產(chǎn)出難以量化;與企業(yè)開展成本收益分析的邏輯不同,政府科技投入一般不產(chǎn)生利潤,不能簡單套用經(jīng)濟學方法進行成本收益分析。
盡管評價難度大,但是科技投入效率確實是現(xiàn)實中的一個真問題,絕非偽問題。同樣的投入金額,投入的對象不同、投入方式不同、管理機制不同,其效率會存在差別。國際上開展過應用成本收益分析法對科技投入效率進行定量評價的有益探索。以下舉 2 個案例。
(1)大科學裝置的成本收益分析。2020年,英國科學與技術(shù)設(shè)施理事會(STFC)在對歐洲南方天文臺項目(ESO)開展績效評價的過程中,進行了大科學裝置的成本收益分析[11]。成本收益分析法的核心在于將成本和收益貨幣化,進而在比較成本、收益的基礎(chǔ)上,做出投入效率的判斷。大科學裝置項目的成本易于計算,即投入的資金總量;但科技投入的收益包括多方面的內(nèi)容,不易計算,如人才培養(yǎng)、科學外交、社會收益、其他價值轉(zhuǎn)化等收益很難完全量化。STFC 的解決方案是將可貨幣化的收益作為項目投入的最低收益,計算收益成本比的最小值。具體做法上,2020年 STFC 資助 ESO 的成本包括:① 對 ESO 項目的一次性資助年均分攤額,2 270 萬英鎊/年;② 一次性現(xiàn)金資助(服務入會費)的年均分攤額,974 萬英鎊/年;③ 當年項目資助額,216 萬英鎊/年。可量化的收益包括:① 英國供應商年度收益,1 160 萬英鎊;② 通過 ESO 產(chǎn)生的出版物的知識價值,1 920 萬英鎊;③ 授予英國學者使用望遠鏡的貨幣時間價值,1 460 萬英鎊。從成本收益分析結(jié)果來看,2020年度 ESO 項目的投資成本為 3 460 萬英鎊,預計的最低收益為 4 540 萬英鎊,收益成本比約為 1.3,即 STFC 對 ESO 的投入是有效率的。
(2)應用技術(shù)項目的成本收益分析。2017年,澳大利亞聯(lián)邦科學與工業(yè)研究組織(CSIRO)借鑒成本收益分析法,對所資助的直噴碳發(fā)動機技術(shù)(DICE)項目開展了應用技術(shù)項目投入的成本收益的預測分析,其分析的難點同樣在于收益的量化。CSIRO 采用計算替代技術(shù)收益的方式來預測 DICE 項目的收益區(qū)間。具體做法上,DICE 項目的成本包括:① CSIRO 資助總額 1 100 萬美元;② 合作伙伴資助 1 800 萬美元;③ 預計研發(fā) DICE 技術(shù)大約需要 30年時間,預估 2020—2050年 DICE 技術(shù)的研發(fā)成本為 6 180 萬美元。收益部分將循環(huán)燃氣(combined cycle gas turbine)技術(shù)和褐煤(brown coal)技術(shù)作為 DICE 的可替代技術(shù)進行分析:① 替代褐煤的最大收益值為 5.33 億美元,最小收益值為 1.25 億美元;② 替代循環(huán)燃氣技術(shù)的最大收益為 2.02 億美元,最小收益為 ?4.77 億美元。因此,研發(fā) DICE 技術(shù)替代褐煤技術(shù)的收益成本比為 1.38—5.87,替代循環(huán)燃氣的收益成本比為 ?5.25—2.22。由此可見,相對于替代褐煤技術(shù),DICE 替代循環(huán)燃氣技術(shù)的收益并不確定。
當前,國內(nèi)外形勢發(fā)生重大變化,財政科技投入難以保持此前的高速增長模式,面對極為繁重的科技創(chuàng)新任務,政府必然要關(guān)注科技投入效率,關(guān)注財政政策效能以及支出結(jié)構(gòu)等[12]。事實上,黨的二十大已經(jīng)明確提出了“提升科技投入效能”的要求。為此,我國也需要盡快開展效率評價方法的研究與試點,先易后難。例如,可以考慮先選擇大科學裝置和應用技術(shù)的投入效率評價作為研究與試點對象。在條件成熟時,將效率評價作為制度化的評價內(nèi)容納入科技預算績效評價之中。
從科技預算績效評價 3E 理論角度來看,我國一直重視效果評價,但是沒有實際做到。例如,在現(xiàn)有科技預算績效評價中,效益是評價的四大環(huán)節(jié)之一,但卻是基于科技視角的評價多,而基于滿足經(jīng)濟社會需求視角的評價少,且主要評的是產(chǎn)出而不是效果。從 1985年開始,科技體制改革試圖解決的科技與經(jīng)濟“兩張皮”的問題,但仍未解決好,科技投入的效果還未得到充分發(fā)揮。
影響我國科技投入效果的原因很多,其中一個比較重要的原因在于科技管理的碎片化,部門本位主義色彩較重,沒有形成“整體性政府”[13]。因此,解決科技投入效果的問題需要從科技治理的整體角度多方發(fā)力,當然也包括從效果評價角度發(fā)力。通過效果評價,著重解決評價中“產(chǎn)出眾多而貢獻稀少”等問題。文章認為可以從 3 個方面借鑒相關(guān)國外經(jīng)驗,著手做好科技投入的效果評價。
(1)通過效果評價,優(yōu)先保證戰(zhàn)略目標的達成。美國曾采用“項目評級工具”(PART)對聯(lián)邦資助項目進行綜合打分評價,但發(fā)現(xiàn)這種評價方法容易陷入細節(jié)而忽視科技戰(zhàn)略性目標達成。為此,美國聯(lián)邦政府在 2008年出臺《政府績效與結(jié)果法案修正案》(GPRAMA),重點在于確立了以“預算所要達成效果”為核心的績效評價體系,即以戰(zhàn)略目標為牽引,構(gòu)建從宏觀到微觀的績效目標體系:采用自下而上的評價方式,以微觀層面資助項目的產(chǎn)出為證據(jù),逐級向上,最后重點評價宏觀戰(zhàn)略目標也就是效果的達成情況。在 GPRAMA 的新體系下,更容易保障戰(zhàn)略目標的達成。
(2)以效果評價為基礎(chǔ)確保對重大研究任務的長期持續(xù)性的資助。美國國立衛(wèi)生研究院在癌癥、艾滋病、阿爾茨海默病等重大研究上的成功突破與進展,正是因為有這種以效果評價為基礎(chǔ)的長期持續(xù)性的資助保障為前提[14]。科學研究具有不確定性,效果評價允許子目標中有滯后者。但要對滯后的研究深入分析原因和需求,在保證總體效果前提下,對于難度大的研究給予耐心和包容,寬譜帶布局,多路徑攻關(guān)。
(3)多角度探索效果評價的制度與方法。2008年金融危機后,美國推出了一項名為 STAR METRICS的項目,即“美國再投資中的科學與技術(shù)測度研究在創(chuàng)新、競爭力以及科學上的影響”[15]。該項目旨在開發(fā)一個基于實證的框架來測度政府科研投資的效果并向公眾展示。2014年,英國提出對大學科研進行評價的“研究卓越框架”(REF),在原有評價中增加了科研對經(jīng)濟社會影響力的評價。在整個評價體系中,影響力評價權(quán)重達到 25%。為做好 REF 評價工作,還專門開發(fā)了不同類型學科科研成果影響力的特征與例證作為指南[16]。
黨的二十大報告提出“提升科技投入效能,深化財政科技經(jīng)費分配使用機制改革,激發(fā)創(chuàng)新活力”,標志著我國財政科技投入的主要矛盾已由“投入不足”轉(zhuǎn)化為“提升效能”。預算績效評價作為提升科技投入效能的重要工具,亟待從現(xiàn)階段“評產(chǎn)出、算得分”向“評效果、重效率、促效能”的方向發(fā)展。為此,文章從科技預算績效評價的內(nèi)涵解析入手進行了深入研究,形成 4 點結(jié)論。
(1)文章以 Checkland 的 3E 評價模型為基礎(chǔ),結(jié)合我國科技預算績效評價現(xiàn)有實踐,提出了科技預算績效評價 3E 理論。該理論包括基于科技視角的產(chǎn)出與管理行為(efficacy)評價,基于資金視角的效率(efficiency)評價,基于滿足經(jīng)濟社會需求視角的效果(effectiveness)評價共 3 個方面,且呈現(xiàn)逐層包含的關(guān)系。
(2)按照科技預算績效評價 3E 理論,我國目前開展的科技預算績效評價主要停留在產(chǎn)出與管理行為(efficacy)評價的單一維度上,效率(efficiency)評價缺位,效果(effectiveness)評價乏力。
(3)按照科技預算績效評價的 3E 理論及落實黨的二十大報告“提升科技投入效能”的新要求,可以把開啟全面的以 3E 理論為基礎(chǔ)的科技預算績效評價作為下一階段改革的方向,完善產(chǎn)出與管理行為(efficacy)評價,補強效率(efficiency)評價和效果(effectiveness)評價。
(4)在產(chǎn)出與管理行為(efficacy)評價維度上關(guān)注新增財政管理角度的評價與原有科技管理角度的評價之間的協(xié)調(diào)問題;在效率(efficiency)評價維度上,加快啟動效率評價方法探索與試點;在效果(effectiveness)評價維度上系統(tǒng)建立效果評價方法體系。
廣義來講,以上 4 個結(jié)論共同構(gòu)成科技預算績效評價的 3E 理論。第 1 個結(jié)論位階最高,類似數(shù)學上的公理;后 3 個結(jié)論是第 1 個結(jié)論的應用而得到的結(jié)論,類似數(shù)學上的推論。希望科技預算績效評價的 3E 理論在實踐中得到檢驗和發(fā)展,為“提升科技投入效能”作出一份貢獻。