晉興雨, 張英姿, 于麗英
(1. 上海大學管理學院, 上海200444; 2. 上海大學人事處, 上海200444)
我國高等教育發展已由規模擴張、數量供給為主步入了以提高質量和發展水平為主的內涵式建設新階段. 提升優質高等教育資源的供給水平, 已成為高等教育資源配置的核心內容.國務院印發的“關于統籌推進世界一流大學和一流學科建設總體方案”, 要求建立健全績效評價機制, 積極采用第三方評價, 提高科學性和公信度. 因此, 在一流大學建設背景下, 強化高等教育管理績效思維和績效方法, 測評和提升高校自身的績效, 開展評價研究, 充分激發高校內生動力和發展活力, 具有重要的理論和現實意義[1].
近年來, 國內外學者對高校的績效評價, 按照研究對象分類, 主要集中在兩個方面.
一是以高校作為研究對象, 針對不同高校、不同省份、不同區域, 甚至不同國家的高等教育績效進行評價. Johnes[2]通過分析100 多家英國高等教育機構的教學與科研績效水平, 發現其具有很高的技術績效和規??冃? 不同類型大學之間的相對績效差異并不明顯. Kempkes等[3]使用數據包絡分析(data envelopment analysis, DEA)和隨機前沿分析兩種方法, 研究了1998—2003 年72 所德國公立大學的績效, 發現東德的大學在全要素生產效率上的表現優于西德, 但西德的相對效率結果仍處于領先地位. 李群霞等[4]研究了全國各地區理工農醫類高校的科研績效, 認為西部地區的科研投入很好地發揮了作用, 建議向西部地區和欠發達地區政策傾斜并進一步加大科研規模. 劉天佐等[5]研究了湖南省27 所公立本科院校的科研績效, 發現不同層級的高??蒲锌冃c其科研實力呈正相關趨勢. 鄧云濤等[6]選取了9 所教育部直屬理工類高校進行比較研究, 發現高校教育資源利用效率存在的主要問題是規模有效性較差. 高校規模收益是一個動態的波動過程, 物力和財力資源是導致DEA 方法無效的主要原因. 張友棠等[7]基于大學的功能, 使用DEA 方法構建了績效評價體系, 設計了預算績效撥款模式.
二是以學院作為研究對象, 聚焦于科研績效評價. Kounetas 等[8]利用DEA 方法評估了一所希臘大學學術機構的研究績效, 發現基礎設施、人員年齡和部門人事政策等“環境因素”具有重要作用. Joanna[9]使用兩階段半參數DEA 方法評價了歐洲和美國公立學校過去10 年的技術效率, 發現就平均而言, 歷史越悠久的歐洲大學效率越高, 并且政府資金似乎發揮了負面作用, 但是對于美國高校而言, 以上結論尚不明確. 陳俊生等[10]以南京師范大學和南通大學的15 個人文社會科學類學院為評價對象, 發現科研技術績效與管理績效之間的線性關系并不明顯.
總結上述高??冃гu價研究成果, 有以下4 個特點: 一是在研究對象上, 通常是以高?;驅W院作為研究對象分析地區間、高校間的績效差異, 而較少關注單個高校自身的績效水平; 二是在研究內容上, 通常側重于研究高校的科研績效水平, 而較少從高校職能和實際出發評價其教學與科研績效; 三是在研究方法上, 更多地是基于傳統DEA 方法和SBM 模型, 但當多個決策單元同時處于生產前沿面上時, 無法進一步比較其效率值的大小; 四是在評價指標上, 通常是將某年的學生數、科研成果等截面數據進行績效評價, 較少利用面板數據研究高??冃У膭討B演化. 因此, 本工作選擇從高校人才培養和科學研究整體角度出發, 建立教學與科研投入產出指標體系, 基于Super-SBM 模型開展實證研究, 分析了S 大學的教學與科研綜合績效水平,并利用Malmquist 指數研究了其綜合績效的演化趨勢, 探索提高高校自身教學與科研綜合績效的途徑.
高校不直接創造物質財富, 投入和產出難以用價格衡量. 但是高校不斷探求新知識, 履行社會責任, 培養具有創新精神和能力的人才, 因此難以用傳統的分析方法來估計其生產函數. 為了評價多投入、多產出組織的效率, Charnes 等[11]提出了DEA 方法, 來評價各個決策單元(decision making units, DMU)的相對有效性. 對高校綜合績效的評價, 可以將高校視為由各學院組成的多投入、多產出系統. 各學院不但擁有同類資源投入, 如師資隊伍、人員經費等,還有共同的成果產出, 如教學業績、科研成果等, 具有同類性. 也就是說, 把各學院看作決策單元, 從投入資源和產出成果的邏輯關系入手, 每個決策單元呈現性質相同的輸入和輸出, 其績效可以通過一定時間內所消耗的投入資源和產出成果來衡量. 因此高校綜合績效的評價適合運用DEA 方法.
經典的DEA 方法有CCR 模型和BCC 模型兩種. 從數理角度上看, 二者的不同之處在于BCC 模型在CCR 模型的基礎上增加了一個凸性約束條件以區分規模收益. DEA 方法及其改進模型是從徑向(投入和產出同比例變化)和角度(投入或產出角度)兩個方面來衡量決策單元的相對效率, 主要存在以下兩方面問題: 一是模型未將投入產出的松弛效應計入效率,造成計算效率結果偏高; 二是模型只能區分決策單元的有效與無效, 對于同為有效的決策單元無法進一步比較效率. Tone[12]提出了一種基于松弛變量的非徑向且非角度的DEA 方法——Super-SBM 模型. 該模型是在SBM 模型的基礎上改進, 具體的評價思想原理如下: 在進行績效評價時, 對于績效評價無效的決策單元(即績效值θ <1), 其生產前沿面保持不變,Super-SBM 模型的績效值與SBM 模型相同; 對于績效評價有效的決策單元(即績效值θ = 1),Super-SBM 模型會重新績效評價, 將生產前沿面向后移動, 得到最終績效值大于SBM 模型的績效值, 實現對同為有效決策單元的進一步評價.
規模報酬可變假設下的Super-SBM 模型的分式規劃為

式中: x0=(xi0)和y0=(yr0)分別表示第i0個決策單元投入資源向量和產出成果向量;x 和分別表示將(x0,y0)排除在(x,y)之外的投入與產出矩陣;分別為投入和產出松弛變量, 分別表征第j 個決策單元投入冗余和產出不足; λj表示第j 個決策單元的權重系數; 模型中的下標“0”表示被評價決策單元對應的投入產出; 目標函數θ 是關于松弛變量s+和s-嚴格遞減的, 并且θ >0. 對于某個決策單元, 當θ ≥1 時說明績效評價有效; 當θ <1 時說明決策單元無效, 需要改進投入或產出.
Malmquist 指數, 即全要素生產率指數, 運用距離函數(distance function)來定義, 是衡量單位生產活動在一定時間內總投入與總產量生產效率的指標. 從t 時期到t+1 時期的Malmquist 指數可以用兩個時期的效率變化幾何平均來定義:

Malmquist 指數可以進行不同形式的分解. Ray 等[13]提出了Malmquist 指數分解的模型,將Malmquist 指數分解為純技術效率變化指數(pure technical efficiency change, PTE)、技術進步指數(technological change, TC)和規模效率變化指數(scale efficiency change, SE), 即

式中, 下角標c 表示規模報酬不變(constant returns to scale), v 表示規模報酬可變(variable returns to scale), 因此表示在規模報酬不變情況下的距離函數, Dtv(xt0,yt0)表示在規模報酬可變情況下的距離函數. Lovell[14]從理論角度對Malmquist 指數模型進行了研究, 進一步肯定了這一模型的正確性.
本工作采用Super-SBM 模型下的Malmquist 指數研究了高校教學與科研綜合績效動態演化情況, 其中構成Malmquist 指數的4 個不同時期的距離函數Dt(xt0,yt0), Dt(xt+10,yt+10),Dt+1(xt0,yt0)和Dt+1(xt+10,yt+10)可以利用跨時期的Super-SBM 模型求出.
S 大學早在2007 年就開始進行校院兩級管理體制機制改革, 其核心部分是構建以校內各學院為單位的校院兩級績效撥款機制, 將學院目標任務與其人員和經費資源配置相關聯, 致力于優化校內資源配置, 提升內部治理能力. 本工作選擇S 大學19 個學院作為教學和科研綜合績效評價的決策單元, 考察其學校內部運行績效, 其中DMU1~DMU11 代表11 個文科類學院, DMU12~DMU19 代表8 個理工類學院.
由于成果產出相對于資源投入具有滯后性, 因此對教學與科研投入產出綜合績效評價的研究需要考慮時滯期問題.胡振華等[15]對投入產出滯后期模型進行了回歸分析,發現當科研人員和科研經費投入轉化為產出的滯后期選定為3 年時, 均通過假設檢驗. 朱平芳等[16]通過研究專利產出和研發支出之間的關系, 發現科技活動的內部支出與專利產出的滯后機制表現出一個2~6 年的滯后結構, 專利產生之前第4 年的科技活動經費內部支出對專利產生的貢獻最大. 吳玉鳴等[17]通過對研究性大學研發投入與首都區域專利產出進行了動態計量經濟實證研究, 發現首都地區研發投入在影響專利產出過程中存在2 年的滯后效應. 基于現有研究成果和相關領域專家意見, 并結合S 大學投入產出的現狀, 本工作將科研成果產出時滯期確定為3 年.此外, 人才培養產出指標多采用當年度的課堂教學、課外實踐等環節的數據, 故沒有考慮時滯期.
高校是一個多變量投入、多變量產出的復雜系統, 績效評價的科學性和研究結論的合理性取決于能否建立合適的評價指標體系. 投入產出評價指標需要滿足以下兩點要求.
一是需要體現高校建設導向. 2017 年, 教育部、財政部、國家發展改革委聯合發布的《統籌推進世界一流大學和一流學科建設實施辦法(暫行)》明確規定, 一流大學遴選評價標準是綜合性的, 涵蓋高水平學科、人才培養、科學研究、師資隊伍建設等多個評價維度.
二是指標選取突出關鍵因素, 數量不宜過多. 由于Super-SBM 模型對于決策單元和投入產出指標的數量比較敏感, 指標數量過多會導致決策單元的有效性系數增大, 甚至普遍接近于1, 通常要求決策單元的個數不小于投入與產出指標個數之和的2 倍[18].
本工作從資源投入、學科發展水平和師資隊伍結構角度選取指標, 衡量S 大學各學院的投入情況; 相應地, 從人才培養和學術性角度選取指標, 衡量S 大學各學院的績效產出.
2.2.1 投入指標選取
(1) 資源投入.
人力資源具有能動性, 是所有資源中唯一具有創新功能的因素, 而師資隊伍是高校所有人力資源中的關鍵. 財力資源是高校存在和發展的基礎, 其中人員經費投入一般占財力資源的大部分, 發揮直接激勵作用. 因此, 本工作選擇各學院的“師資隊伍規?!?X1)和“人員經費核撥量”(X2)作為資源投入指標. 具體地, 以S 大學每個學院的師資隊伍規模表征學院占用的人力資源量, 以人員經費核撥量代表S 大學對各學院的財力資源投入.
(2) 學科發展水平.
學科發展水平是高校發展水平的標志之一, 直接影響到各學院建設經費的投入支持力度.因此, 本工作選取“重點建設學科數”(X3)表征S 大學各學院的學科發展水平. 具體地, 各學院重點建設學科數的計算按照學科點水平劃分, 其中碩士學位授權點、博士學位授權點、市重點建設高原學科、市重點建設高峰學科以及國家重點建設學科分別賦值1, 3, 5, 10 和20, 然后求和.
(3) 師資隊伍結構特征.
師資隊伍結構對于高校的資源使用效率有著重要影響, 是決定績效產出的重要因素. 因此, 選取“教授占比”(X4)作為投入指標, 反映各學院師資隊伍結構特征. 具體地, S 大學各學院教授占比為各學院的教授數除以相應的師資隊伍規模.
2.2.2 產出指標選取
(1) 人才培養.
本科生教育和研究生教育同屬我國高等教育的組成部分. 因此, 本工作選取“本科生教學業績”(Y1)和“研究生培養業績”(Y2)分別反映S 大學各個學院本科生培養和研究生培養績效.本科生教學業績測度不局限于課堂教學, 還包括實踐環節貢獻和課外培養環節貢獻, 旨在涵蓋人才培養全過程, 全面評價本科教學成果. 另外, 本科生教學業績還體現了學科差異, 如考慮到了藝術類與體育類授課的特殊性, 將其權重系數賦值高于其他課程. 研究生培養業績指標則重點體現學科特性, 評價指標由研究生數量、研究生課堂教學和研究生質量貢獻組成.
(2) 學術性.
科研能力作為高校學術性的重要體現, 已經成為衡量高校綜合實力的關鍵指標之一. 因此, 本工作選取“科學研究成果”表征S 大學各學院的科研能力和學術性. S 大學科學研究成果指標不但包括科研項目、論文論著、科研獎勵和重大學術活動成果, 還涉及知識產權轉化貢獻和作品展覽等文化傳承貢獻.
綜上所述, 本工作建立了高校綜合績效評價投入產出指標體系, 如表1 所示. 指標選取和數據來源盡可能體現高校的主要職能和任務, 既聚焦人才培養過程又注重科學研究成果, 以有效測度高校反映教學和科研活動的綜合績效.

表1 高校綜合績效評價投入產出指標體系Table 1 Input-output index of comprehensive performance evaluation in universities
3.1.1 2015 年教學與科研綜合績效評價
為了分析S 大學教學與科研綜合績效水平, 將各學院2015 年的投入產出量代入Super-SBM 模型, 使用DEA-SOLVER Pro 5.0 軟件, 測算了S 大學19 個學院的綜合績效, 計算結果如表2 所示.
由表2 可以看出, Super-SBM 模型可以在SBM 模型的基礎上進一步評價. 對于SBM 模型績效評價無效的學院, Super-SBM 模型的績效值與SBM 模型相等, 而對于SBM 模型績效評價有效決策的學院, Super-SBM 模型的績效值可以進一步細分.
整體上看, S 大學各學院的績效水平較高. 19 個學院的教學與科研綜合績效最高值為1.468 3, 最低值為0.534 2, 平均值為1.041 6, 中位值為1.036 4, 均方差為0.250 4. DMU1,DMU2, DMU3, DMU4, DMU12, DMU5, DMU13, DMU6, DMU14, DMU7, DMU8, DMU15,DMU16, DMU9, DMU10 共15 個學院(按照綜合績效值大小排序, 下同)的教學與科研綜合績效值大于1, 實現了DEA 有效, 占比79%. 純技術效率有效(大于1)并且規模效率大于0.95 的學院有DMU5, DMU13, DMU6, DMU7, DMU8, DMU15, DMU16, DMU9, DMU10 共9 個學院, 表明其2015 年的教學與科研活動資源投入和成果產出配置得當, 師資隊伍規模、人員經費、學科和師資隊伍結構性作用都得到充分發揮, 相對于資源投入取得了較理想的產出水平.若需進一步提高這些學院的成果產出水平, 則需要同時或單個追加師資和人員經費, 提升學科水平, 優化師資隊伍職稱結構. 由此可見, S 大學教學與科研綜合績效水平整體較高, 但學校在體制機制創新、績效管理、投入產出優化等方面仍有一定的改進空間.

表2 2015 年S 大學19 個學院投入產出綜合績效評價結果Table 2 Comprehensive performance evaluation results of 19 colleges of S University in 2015
3.1.2 歷年教學科研綜合績效評價靜態分析
為了進一步研究不同學科類型的學院投入產出綜合績效水平的差異, 將各學院2012—2015 年的投入產出量代入Super-SBM 模型, 使用DEA-SOLVER Pro 5.0 軟件, 測算了S 大學19 個學院的綜合績效, 結果如表3 所示.
分析2012—2015 年的總體教學與科研綜合績效發現, 每年的平均績效水平均大于1, 這說明S 大學教學與科研總體績效水平較高. 進一步分析不同學科類別學院的綜合績效后發現, 文科類學院除了2013 年的教學與科研綜合績效均值小于1(0.983 3)外, 其他年份均大于1, 而理工類學院2012 與2013 年的教學與科研綜合績效均值大于1, 2014 與2015 年的綜合績效均值卻小于1, 說明文科類學院基本保持了較高的績效產出水平, 理工類學院存在一定的改進空間.
分析不同學院的績效水平發現, 文科類學院的綜合績效均值為1.056 6, 略高于理工類學院的1.002 8, 但不同學科類型的學院綜合績效總體水平差別不大, 具體如下.
(1) 人文類和理工類學院中綜合績效均值前兩名的學院均為規模較大的學院, 說明學院教學科研綜合績效存在規模經濟, 即學院規模是影響教學科研綜合績效的一個因素. 在文科類學院中, DMU1 的歷年均值為1.478 1, 具有最高的教學與科研綜合績效值, 以較低學科水平和師資隊伍結構投入獲得較高的教學與科研績效產出. 在理工類學院中, DMU12 的歷年均值為1.231 8, 具有最高的教學與科研綜合績效值, 以最大師資隊伍規模和人員經費撥款以及最多的重點建設學科投入, 產出最大的學生培養和科學研究成果, 實現了高投入、高產出.

表3 2012—2015 年S 大學19 個學院投入產出靜態綜合績效評價結果Table 3 Static comprehensive performance evaluation results of 19 colleges of S University from 2012 to 2015
(2) 分析2012—2015 這4 年的均值分布情況, 發現11 個文科類學院中有6 個學院的教學與科研綜合績效大于1, 而8 個理工類學院中有4 個學院的教學與科研綜合績效大于1, 文科類和理工類學院的教學與科研綜合績效水平相對均衡地分布.
Super-SBM 模型作為相對績效評價方法, 不能縱向對比決策單元的綜合績效水平. 因此,本工作還使用了Malmquist 指數考察S 大學教學與科研綜合績效的動態演化.
3.2.1 綜合績效評價全要素生產率總體特征分析
根據Malmquist 指數模型及其分解公式, 可以計算出2012—2015 年S 大學全要素生產率及其分解指數值(見表4), 并得到如下幾種結果.

表4 S 大學19 個學院的平均Malmquist 指數Table 4 Average Malmquist Index of 19 colleges of S University
(1) 指數均值. 從Malmquist 指數的演化趨勢看, 2012—2015 年S 大學的教學科研綜合績效值緩慢下降. Malmquist指數平均值為0.982 2, 年均降低1.78%. 然而進一步分析發現, 每年度的Malmquist 指數卻升降不一: 2012—2013 年度的Malmquist 指數大于1 (1.134 2), 增長13.42%, 其后兩個年度分別增長-10.64%和-8.13%. 究其原因, 2012—2015 年處于一流大學建設方案實施前夕, 學校內部治理結構和治理體系還處于完善階段, 學校正在謀劃學科結構調整, 更新學科布局、研究領域和激勵措施尚未形成支撐學校發展的主要力量.
(2) 增長結構. Malmquist 指數的增長主要依靠純技術效率發揮積極作用. 2012—2015 年的4 年間, Malmquist 指數的分解指數變化分化明顯, 其中純技術效率變化增長2.57%, 技術進步變化基本持平, 規模效率變化下降1.59%. 這說明S 大學自2012 年開始的強化考核發揮了積極作用, 但仍需進一步強化學院內部資源整合, 提升規模效益.
3.2.2 綜合績效評價全要素生產率分學院演化趨勢分析
本工作選取2012 年和2015 年兩個截面數據, 研究各學院綜合績效評價全要素生產率及其分解指標的演化, 結果如表5 所示.

表5 2012—2015 年S 大學19 個學院Malmquist 指數Table 5 Malmquist Index of 19 colleges of S University from 2012 to 2015
研究發現, Malmquist 指數大于1 的學院有5 個, 漲幅在8.81%~29.2%之間, 說明這5 個學院的生產率處于上升趨勢, 其中DMU11, DMU7 和DMU9 得益于純技術效率的快速提升而增長最快. 值得指出的是, 雖然這3 個學院的教學與科研綜合績效水平不高, 但是相對于其他學院增長較快, 未來將會有更大的提升空間. 例如, DMU11 作為S 大學藝術學科的代表, 對接地方社會發展需要和學校錯位發展戰略, 積極爭取學科建設資源, 同時加強崗位管理, 明確崗位職責和績效考核, 學院內部管理能力明顯增強, 初步實現了人才集聚, 提升了學院績效產出.與之相對應, Malmquist 指數小于1 的學院有14 個, 說明大部分學院的生產率需要提升, 其中DMU19, DMU17 和DMU18 的Malmquist 指數因純技術效率降低而下降明顯, 因此這3 個學院應該借鑒管理經驗, 改進工作方法, 提升績效.
本工作以S 大學19 個專業學院作為研究對象, 選取資源投入、學科發展水平和師資隊伍結構特征作為投入指標, 人才培養和學術性作為產出指標, 建立了教學與科研投入產出綜合績效評價指標體系; 基于采用非定向Super-SBM 模型和Malmquist 指數設計了教學與科研投入產出綜合績效評價方法, 深入分析了高等學校及其專業學院的運行績效, 為科學評價高校自身資源配置效率提供決策依據. 通過研究得到如下結論.
(1) 根據綜合績效分析發現, 2015 年S 大學的教學與科研綜合績效水平較高, 大部分學院績效評價有效, 僅4 個學院的資源投入和成果產出失當. 進一步分析了這4 個教學與科研綜合績效無效學院的產生原因, 發現資源投入需要重點提升學科發展水平和優化師資隊伍結構, 而投入則需要在本科生培養、研究生培養和學術水平方面作相應提升.
(2) 根據歷年綜合績效評價的靜態分析發現, 2012—2015 年S 大學保持了良好的教學與科研總體績效水平, 每年的平均績效值均大于1. 具體到不同的學科類別, 文科類學院基本保持了較高的績效產出水平, 而理工類學院則存在一定的改進空間. 分析了不同學院的績效水平發現, 文科類學院的平均綜合績效值為1.056 6, 略高于理工類學院的1.002 8, 但不同學科類型學院的綜合績效總體水平差別不大. 另外, 文科類和理工類學院的教學與科研綜合績效水平相對均衡地分布, 學院的教學與科研綜合績效存在規模經濟.
(3) 根據綜合績效評價的動態分析發現, 2012—2015 年S 大學的全要素生產率指數緩慢下降,Malmquist 指數平均值為0.982 2,年均降低1.78%. 從結構上看,2012—2015 年Malmquist指數的分解指數變化分化明顯, 其中純技術效率變化增長2.57%, 技術進步變化基本持平, 規模效率變化下降1.59%, 說明S 大學管理因素對教學與科研綜合績效水平的提高起到了積極的促進作用. 從演化維度看, 2012—2015 年S 大學Malmquist 指數大于1 的學院有5 個, 而小于1 的學院有14 個, 說明大部分學院需要調整激勵措施, 改進工作方法, 提升績效水平.