廖蘇亮,吳國棟,段依竺,張 衡
(廣東省技術經濟研究發展中心,廣東 廣州510070)
近年來,我國科研誠信建設在工作機制、制度規范、教育引導、監督懲戒等方面取得了顯著成效,但“基因編輯嬰兒”[1]“漢芯事件”[2]“《腫瘤生物學》集中撤稿”[3]“明星博士學術造假”[4]等科研不端事件仍有發生,嚴重破壞科技創新的基石,造成了嚴重而惡劣的社會負面影響,科研活動監督引發社會各界高度關注。科研不端行為反映出科研活動監督的不可替代性,若缺乏有效的監督機制約束,科研活動將可能出現資金挪用、成果虛報、夸大、造假等科研不端問題[5],不僅嚴重破壞科技計劃實施效果,污染風清氣正的科研風氣,也給權力尋租和利益輸送提供空間[6],嚴重損害政府形象,降低政府民眾公信力。
隨著我國科技創新工作邁入新發展階段,在黨中央對科技管理體制“放管服”[7]“減負”[8]的改革要求下,科技監督的內涵逐漸向提升科技工作公開、公平、公正的透明度和管理效率,營造風清氣正的科研環境轉變,科技監督體系演變成由政府、項目管理者、項目執行者、社會監督等多個利益相關主體組成的復雜體系。因此深入研究科技監督體系內在運行機制,厘清各利益相關方之間的關系,促進各參與主體利益協同,對營造風清氣正的科研環境、提高科技創新治理水平質量、推進我國科技創新治理體系和治理能力現代化具有重要意義。
國內部分學者總結了我國科技監督系統運行現狀,提出國家或地方科技監督與評估體系的建設與完善建議。劉冬等[9]分析了我國科技監督評估的現狀、內涵和作用,指出監督體系中存在的問題并給出對應解決對策;吳艷等[10]研究了項目管理專業機構在國家科技計劃項目監督評估中的作用與定位,提出建立決策、執行、監督三位一體、互相協調又相互制約的管理模式;張娟[11]基于廣東省科技監督和評估管理的現狀,提出構建內部控制與外部監督的管理體系、完善監督信息化平臺建設提升信息化水平等對策;孫繼輝等[12]在梳理國內外科技監督評估體系文獻的基礎上,構建了一套適用于大連市的科技監督評估體系;戴紅玲[13]分析了科技項目執行過程中可能存在的經費使用問題,并從經費審計的角度提出科研經費監督的有關策略。
部分學者嘗試構建科技監督系統的理論模型,研究科技管理系統運行的內在機制。賈志濤等[14]基于演化博弈理論構建財政科技經費的監督者與使用者的行為策略模型,并研究第三方監督對科技經費使用者和監督者的策略選擇影響機理;劉桂蘭等[15]運用尋租和博弈論理論,研究我國科技管理系統的內在運行機制以及各主體間的博弈,提出我國科技監督體系存在的不足以及完善方法;蓋宏偉等[16]針對我國當前科技監督主體較單一、結構性較弱等問題,基于系統論和協同理論提出多元主體聯盟協同監督的運行模式;劉冬等[17]將科技項目看成是多重委托管理關系,以委托視角對科技項目管理和監督開展研究,提出科技項目管理監督評估對策;張同建等[18]基于結構方程模型研究科技項目實施中機會主義行為治理的微觀機理,從管理微觀層面提出機會主義行為治理和監督策略。
此外,還有學者研究了美國、歐洲、日本等科技發達國家的科技監督體系建設情況,探討國外經驗對我國科技監督體制機制建設的借鑒作用。王緯超[19]通過分析瑞典科技創新體系科技監督評估的特點和優勢,針對我國高校科研管理情況提出政策建議;俞向群[20]以英美等科技先進國家為研究對象,研究各國政治、財政與科技體制對其科技經費監督制度的影響,總結發達國家在科技項目經費監督制度建設方面的經驗;王靜[21]總結了英國近年來在國家科技計劃、科技政策、機構監督評估等方面出臺的制度和措施,以及科研誠信建設、科研不端行為處置,提出對我國科技監督評估的建議;黃建安[22]從科技發展規劃的監督層面,研究了美國、日本、德國等科技發達國家科技發展規劃實施的監督檢查機制,提出加強我國監督機制建設的相關建議。
上述研究從政策分析、案例剖析和數理模型分析等多個角度為我國科技監督提供了決策建議和方法。隨著國家對科技管理體制改革的不斷深入,政府部門不直接管理項目,而是由專業機構履行項目管理職責。從博弈理論角度看,現階段的科技監督系統已經演變成政府、項目管理方、項目執行者等多個利益相關方之間的動態博弈系統,系統中各博弈主體不斷通過外界反饋來調整自身策略,經歷反復博弈后最終形成穩定的演化均衡策略[23]。因此有必要針對當前科技監督系統,建立符合客觀實際的演化博弈模型,探索各博弈主體的動態演化過程及不確定性因素對演化策略的影響。
本文依據演化博弈理論,將當前治理框架下的科技項目管理體系簡化為政府、項目管理者、項目執行者3個主體組成的動態博弈系統。政府為科技創新治理體系的頂層設計者和政策制定者,其監督策略集為(積極監督,消極監督),積極監督指政府對科技計劃項目主動跟蹤、監測和管理,并根據項目實施情況對管理者和執行者采取必要的獎懲措施;消極監督指政府處于被動監督狀態。項目管理者的策略集為(主動監督、被動管理),主動管理是指項目管理方主動跟進項目進展,了解項目需求,在發現項目執行者不自律時主動采取監督措施;被動管理是指項目管理者僅根據政府監督要求,被動對項目開展跟蹤監督。項目執行方策略集為(自律,不自律),自律指項目執行方主動組織技術攻關,推進項目進展;不自律是指執行方不主動不作為,敷衍了事。由于演化博弈通常基于非完全理性決策,因信息不對稱及非完全理性決策的存在,各方常常在職責分工、理性思考、識別判斷、分析推理以及準確行為等多方面存在異質性和局限性。因此博弈過程所得出的結果并非是一次性選擇,而是博弈各方根據自身條件、外部環境、對方策略不斷進行動態調整的過程,對此本文作出假設如下:
假設1:政府(Government)選擇“積極監督”時,其在積極監督過程中的時間和物質成本為Cg1(Cg1> 0),獲得收益Eg1(Eg1> 0),主要包括積極監督所帶來的社會聲譽激勵效應和上級政府部門的肯定等;當政府選擇“消極監督”時,其付出的時間和物質成本為Cg2(Cg2> 0),選擇“積極監督”所需投入的人力、物力、財力成本為顯然高于“消極監督”成本,因此Cg1>Cg2。若科技項目執行過程中發生違背科研誠信、科研倫理甚至觸碰法律的行為,政府部門將會因監管不到位受到上級部門問責懲罰損失為Lg1(Lg1> 0)。若政府因“消極監督”且項目發生較大風險,將對社會造成一定的負面影響,產生包括政府公信力降低等聲譽損失、信譽損失等治理損失Lg2(Lg2> 0)。
假設2:項目管理者(Manager)選擇“積極監督”時,需要投入相應量的人力、物力和財力來跟蹤督促推動項目執行,為此付出的成本為Cm1(Cm1> 0),“積極監督”獲得上級部門肯定以及其他聲譽收益,為Em1(Em1> 0),同時獲得政府對其的補貼與獎勵為Em2(Em2> 0)。當項目管理者選擇“被動監督”時,投入的成本為Cm2(Cm2>0),但不履職盡責可能受到上級部門處罰Lm1(Lm1>0),單位聲譽受損Lm2(Lm2> 0)。顯然,積極監督的成本Cm1大于消極監督的成本Cm2,即Cm1>Cm2。
假設3:項目執行者(Executor)選擇“積極監督”時(執行者建立內部監督制度,或聘請第三方監督),需花費額外的人力和時間,成本為Ce1,但通過有效的監督手段,一方面積極推動項目執行,主動防范化解風險,另一方面獲取政府和管理者的信任,收獲行業聲譽和社會聲譽,收益為Ee1(Ee1> 0),此外還有機會可能得到政府財政其他資金支持,收益為Ee2(Ee2> 0)。若項目執行者選擇“消極監督”成本為Ce1,但若項目執行發生高風險性問題,一方面項目執行者的聲譽將會有極大負面影響Le1,另一方面項目執行者可能面臨來自政府的懲罰,損失為Le2,同時受到管理者的懲罰,損失為Le3。因“積極監督”需要花費額外的人力物力,因此積極監督的成本Ce1大于消極監督的成本Ce2,即Ce1>Ce2。
假設4:若因政府“消極監督”或項目管理者“消極監督”造成的監督缺位,最終可能導致項目執行者選擇“不自律”策略,此時發生重大風險的概率會大大增加,三方均可能因此承擔損失重大治理損失。政府面臨重大治理損失和聲望損失為Lg3,管理者面臨來聲望損失為Lm3,執行者面臨來自政府問責和聲望損失為Le5。
綜上,獲得假設1-4中提及的參數和解釋如表1所示。
表1 演化博弈模型參數設置
基于以上演化博弈各方的基本假定,可構建當前科技治理體系下的科技監督三方演化博弈的支付矩陣如表2所示。
表2 三方演化博弈的收益矩陣
演化博弈的數學模型選擇較多,如復制動態方程、最優反應動態方程等,其中復制動態方程的微分方程(組)因具有較好數學解析性而得到廣泛使用[24],本文中應用該演化機制微分方程來構建科技監督演化博弈模型。
首先假設政府選擇“積極監督”策略的概率為x,項目管理者選擇“積極監督”策略的概率為y,項目執行者選擇“積極監督”策略的概率為z,x,y,z∈[0,1]。根據表2中政府、項目管理者、項目執行者三方演化博弈收益矩陣,得到政府策略選擇分別為“積極監督”“消極監督”時,期望收益Ug1和Ug2,以及平均期望Ug分別為:
Ug1=yz(Eg1+Eg2-Cg1-Ee2-Em2)+y(1-z)(Eg1-Cg1-Em2)+(1-y)z(Eg1+Eg2-Cg1-Ee2)+(1-y)(1-z)(Eg1-Cg1);
(1)
Ug2=yz(Eg2-Lg1-Cg2)+y(1-z)(-Cg2-Lg1-Lg2)+(1-y)z(Eg2-Lg1-Cg2)+(1-y)(1-z)(-Cg2-Le5);
(2)
Ug=x*Ug1+(1-x)×Ug2;
(3)
項目管理者采取“積極監督”和“消極監督”時的期望收益Um1和Um2,以及項目管理者的平均期望收益Um為:
Um1=xz(Em1+Em2-Cm1)+x(1-z)(Em1+Em2-Cm1-Lm1)+(1-x)z(Em1-Cm1)+(1-x)(1-z)(-Cm1-Lm1);
(4)
Um2=xz(-Cm2-Lm2)+x(1-z)(-Cm2-Lm1-Lm2)+(1-x)z(-Cm2)+(1-x)(1-z)(-Cm2-Lm3);
(5)
Um=y×Um1+(1-y)×Um2;
(6)
項目執行者采取“自律”和“不自律”時的期望收益Ue1和Ue2,以及項目執行者平均期望收益Ue分別為:
Ue1=xy(Ee1+Ee2-Ce1)+x(1-y)(Ee1+Ee2-Ce1)+(1-x)y(Ee1-Ce1)+(1-x)(1-y)(Ee1-Ce1);
(7)
Ue2=xy(Ee3-Ce2-Le1-Le2-Le3-Le4)+x(1-y)(Ee3-Ce2-Le1-Le2-Le4)+(1-x)y(Ee3-Ce2-Le1-Le3-Le4)+(1-x)(1-y)
(Ee3-Ce2-Le5);
(8)
Ue=z*Ue1+(1-z)×Ue2;
(9)
根據式(1)~(9)構建政府、項目管理者、項目執行者博弈三方的復制動態方程組K:
(10)
根據式(10)構建復制動態方程組,用于表示科技監督系統中政府、管理者、執行者三者之間的策略調整速度和演化方向。由于博弈主體各自策略選擇的概率x,y,z均與時間t有關,且x(t),y(t),z(t)∈[0,1],所以方程組K的值域為[0,1]×[0,1]×[0,1]。
(11)
根據演化博弈理論,在非對稱博弈中,若演化博弈均衡E是演化穩定均衡,則E一定是嚴格納什均衡,而嚴格納什均衡又是純策略均衡,即在非對稱博弈中混合策略均衡一定不是演化穩定均衡。當K=(0,0,0)時,即當系統的策略調整速度為零時,得到政府、項目管理者、項目執行者三方的演化局部均衡點。其中E1(0,0,0),E2(0,0,1),E3(0,1,0),E4(0,1,1),E5(1,0,0),E6(1,0,1),E7(1,1,0),E8(1,1,1)為系統的8個平衡點,也是該演化系統的純策略納什均衡解。由這8個平衡點所構成的區域Ω={(x,y,z)|0 由式(10) (11)構成的微分方程組可得該系統的Jacobian矩陣J為: (12) 以上為利用演化博弈理論分析得出的科技監督系統在滿足基本假設條件下的計算模型。但通過復制動態方程求出的平衡點不一定是系統的演化穩定策略(ESS),參考Friedman[25]的理論,演化穩定策略可根據李雅普諾夫(Lyapunov)第一法則判斷: 若雅克比(Jacobian)矩陣的所有特征值均為負,則均衡點為漸進演化穩定策略(ESS) ; 若Jacobian矩陣的特征值至少有1個為正,則均衡點為不穩定點; 若Jacobian矩陣除為零的特征值外,其余特征值均為負,則均衡點處于臨界狀態,穩定性不確定[26]。因此,在不同的初始值條件下,系統會有不同的演化穩定策略,即系統的演化均衡策略對系統初始狀態具有依賴性[27]。根據上文分析,科技監督系統中,政府、管理者和執行者三方的均衡策略組合有8種,分別為(0,0,0)、(0,0,1)、(0,1,0)、(0,1,1)、(1,0,0)、(1,0,1)、(1,1,0)、(1,1,1)。 以點E1(0,0,0)為例進行分析,得到點E1的純策略納什均衡點的漸近穩定性如式(13)。 該矩陣的特征多項式如式(14)。 由式(13)和(14)可得到E1(0,0,0)的特征值(λ1,λ2,λ3)為(Eg1+Cg2-Cg1+Le5,Cm1+Cm2-Lm1+Lm3,Ee1-Ee3-Ce1+Ce2+Le5)。同理可得到其他均衡策略點的特征值。 為進一步確定各參數條件來確定各個均衡點的穩定性,確定演化博弈模型達到穩定狀態的均衡點,使得模型的構建更加符合客觀實際,且能更加精準地反映系統演化趨勢,本研究邀請多名相關領域專家,采取德爾菲(Delphi)咨詢法(至少2~3輪)與發放問卷相結合的方式(問卷信度系數Cronbach' s Alpha應大于0.7)獲得相關變量初值。通過專家反饋意見的統計與優化,設置演化博弈參數賦值初值為:Eg1=11、Eg2=8、Em1=8、Em2=6、Ee1=9、Ee2=5、Ee3=16、Cg1=3、Cg2=1、Cm1=4、Cm2=1、Ce1=4、Ce2=1、Lg1=6、Lg2=5、Lm1=4、Lm2=3、Le1=3、Le2=5、Le3=1、Le4=3、Lg3=15、Lm3=10、Le5=9。 根據構建的Jacobian矩陣和參數初值,依據Lyapunov第一法則得到博弈三方的均衡策略組合的穩定性如表3所示。 表3 均衡點的穩定性判斷與分析 科技監督的根本目標為保障科技計劃的產出績效,防范和化解重大風險。為保障目標實現,現實中科技創新監督工作的理想格局為政府“積極監督”、管理者“積極監督”、執行者“自律”的策略組合,恰為本研究中三方博弈系統的穩定點(x=1,y=1,z=1),本研究從多方演化博弈角度印證了多方監督的重要性與必要性。 在演化博弈系統中,由于各方常根據自身與其他博弈方的策略來進行自身策略調整,且參與博弈的各方可能存在一定的信息和反饋遲滯,各方策略的選擇概率將動態調整。例如,項目執行者通常根據政府和管理者的監督力度來調整對項目的實際投入,即政府和管理者“積極監督”時,項目執行者較大概率會采取“自律”策略;若項目實施因項目執行者的“不自律”而遇到重大風險問題,政府和項目管理者將加大監督極度,其“積極監督”策略選擇的概率將上升。為表征研究政府、項目管理者、項目執行者三方在博弈過程中的策略選擇情況和最終演化穩定狀態,本研究采用MATLAB對科技監督系統動態演化博弈開展建模和數值模擬,以進一步分析系統的均衡穩定性,探討各類不確定性因素對系統演化過程的影響。 首先探討政府策略的總體演化趨勢,分別設定政策“積極監督”的策略概率x分別為0.1、0.3、0.6和0.8,設定管理者“積極監督”的策略概率y在[0,1]區間以0.4的步長變化,執行者“自律”的策略概率z在[0,1]區間以0.4的步長變化,得到政府策略x在不同初值、不同策略組合下隨時間演化趨勢如圖1所示。從仿真結果可知,政府策略政府始終穩定于“完全監督”,即x=1的狀態,且初始策略越高,到達穩定點的演化時間越短。這主要是因為在當前科技創新治理體系下,政府是科技監督的首要權責主體,“積極監督”始終是政府的最佳策略選擇。值得注意的是,在政府“積極監督”策略x初值較小時,演化的時間較長,如圖1(A)中當x=0.1時,需要超過1個月的演化時間方能到達系統穩定點,在此過程中發生各種不確定性因素的可能性也會增加,因此政府在博弈初始就應該采取有關監督措施盡可能提高x初值以保障監督效果。 為進一步研究政府策略受其他博弈方策略影響情況。首先研究政府策略受管理者策略影響情況,設定政府“積極監督”策略x=0.2,項目執行者“自律”策略z=0.2,項目管理者“積極監督”的策略概率y在[0,1]區間以0.2的步長變化,獲得政府策略x隨管理者策略y的演化趨勢如圖2(A)所示。結果表明當y由0→1逐漸增大時,政府策略到達完全“積極監督”(x=1)的時間逐漸變長,主要原因是項目管理者履行部分監督職責,分擔政府監督壓力,使政府監督響應時間適當增長,也就是說政府策略隨著管理者積極監督策略提高而放松。 同理研究政府策略受執行者策略影響情況,設定政府“積極監督”策略x=0.2,項目管理者“積極監督”策略y=0.2,項目執行者“自律”的策略概率z在[0,1]區間以0.2的步長變化,獲得政府策略x隨執行者策略z的演化趨勢如圖2(B)所示。可以看出,當z由0→1逐漸增大時,政府策略到達完全“積極監督”(x=1)的時間逐漸變長,即執行者的“自律”緩解了政府的監督壓力。對比圖2(A)和圖2(B)可看出,政府策略趨勢同時受管理者和執行者的策略影響,且受執行者策略影響更明顯。 (A)x初值0.1;(B) x初值0.3;(C) x初值0.6;(D) x初值0.8圖1 不同條件下政府策略(x)演化 (A)政府策略(x)隨管理者策略(y)演化; (B) 政府策略(x)隨執行者策略(z)演化圖2 政府策略(x)隨管理者(y)和執行者(z)策略演化 設定管理者“積極監督”策略初值y分別為0.1、0.3、0.6和0.8,政府“積極監督”策略概率x在[0,1]區間以0.4步長變化,執行者“自律”的策略概率z在[0,1]區間以0.4步長變化,獲得管理者策略隨時間演化趨勢如圖3所示。 (A)y初值0.1;(B)y初值0.3;(C)y初值0.6;(D)y初值0.8圖3 不同條件下項目管理者策略(y)演變 仿真結果表明,在不同政府、執行者、管理者策略組合下,經過一段時間演化后項目管理者策略最終穩定于“積極監督”(y=1)狀態,主要原因為在管理者策略選擇中,“積極監督”比“消極監督”的收益高,在三方演化博弈系統中,“積極監督”是項目管理者的最優策略,但在政府完全“消極監督”(x=0)的條件下,管理者策略y需較長時間來達到穩定狀態,客觀分析主要是因為政府完全“消極監督”(x=0)時,管理者的監督權限有限,其策略需較長時間方能達到穩定狀態。 為進一步研究管理者策略受其他博弈方策略影響情況,設定項目管理“積極是監督”策略z=0.2,執行者“自律”策略x=0.2,政府“積極監督”的策略概率x在[0,1]區間以0.2的步長變化,獲得管理者策略y隨管理者策略x的演化趨勢如圖4(A)所示;從計算結果可以看出,當x由0→1逐漸增大時,管理者策略到達完全“積極監督”(y=1)的時間逐漸縮短。客觀上分析主要因為當政府監督越嚴格,執行者越自覺時,項目管理者既能得到豐厚的社會聲譽收益,還能獲得可觀的政府補貼,獲得綜合收益期望越高,越有動力開展主動監督。 同理設定政府“積極監督”策略x=0.2,項目執行者“自律”的策略概率z在[0,1]區間以0.2的步長變化,獲得管理者策略y(初值為0.2)隨執行者策略z的演化趨勢如圖4(B)所示。可以看出,當z由0→1逐漸增大時管理者策略趨勢變化幾乎相同,也就是說管理者策略受執行者策略影響較小。其主要原因是在當前國家科技治理體系下,項目管理者通常為政府部門的下屬單位,若不履行監督職責將面臨政府責罰和社會聲望損失。由此可見,博弈主體的策略選擇與其職能定位密切相關。 (A)管理者策略(y)隨政府策略(x)的演化;(B)管理者策略(y)隨執行者策略(z)的演化圖4 管理者策略(y)隨政府(x)和執行者(z)策略演化 首先探討項目執行者博弈策略選擇的總體趨勢,首先分別設定項目執行者“自律”策略y為0.1、0.3、0.6和0.8,設定項目執行者“自律”的策略概率z在[0,1]區間以0.1步長變化,項目管理者y在[0,1]區間以0.2步長變化,獲得到項目執行者策略變化如圖5所示。 仿真計算結果表明,在政府策略為完全“消極監督”(即x=0)時,項目執行者的策略將隨時間演化穩定于完全“不自律”狀態(即z=0),即在政府“監督缺位”情況下,項目執行者最優策略始終為“不自律”,而項目管理者策略變化僅能影響演化時間而無法改變其演化趨勢。這表明僅靠項目管理者的監督將引起系統“監督失靈”,究其原因一方面是項目執行者“自律”成本較高,需投入大量的人力物力保障項目實施;另一方面,現實中執行者有一定幾率在“不自律”情況下仍能通過項目驗收,存在一定的僥幸心理。在“監督缺位”和“監督失靈”的雙重條件下,執行者“不自律”將使重大風險性事件發生的概率大大增加,從對“基因編輯嬰兒事件”的調查結果可以看出,正是由于“監督缺位”和“監督失靈”同時存在,才導致此類惡性事件的發生率大大增加。 若設定政府的積極監督策略x發生略微調整,從圖6(A)中x=0突變致圖6(B)x=0.01時,項目執行者的策略隨即發生改變,呈現先降低后上升并最終穩定于圖6(B)中的完全“自律”(即z=0)狀態,這主要是因為當政府開始主動監督時,執行者通常選擇“自律”以獲得較高政府的其他補助和社會聲望,通過一段較長時間的博弈演化,執行者最后選擇對自己有利的“自律”。 (A)z初值0.1; (B) z初值0.3;(C) z初值0.6;(D) z初值0.8圖5 不同條件下項目執行者策略(z)演化 圖6 當政府策略(x)從0突變至0.01時項目執行者策略(z)的演化 為進一步研究執行者策略受其他博弈主體策略影響情況,設定執行者“自律”策略z=0.2,項目管理者“積極監督”策略y=0.2,政府“積極監督”的策略概率x在[0,1]區間以0.2的步長變化,獲得執行者策略z隨政府策略x的演化趨勢如圖7(A)所示。從計算結果可以看出,當x由0→1逐漸增大時,管理者策略到達完全“積極監督”(z=1)的時間逐漸縮短。客觀上分析,主要因為當政府監督越嚴格時,執行者不自律將受到責罰。同理研究項目執行者策略隨項目管理者策略影響情況,設定執行者“自律”策略z=0.2,政府“積極監督”策略x=0.2,項目管理者“積極監督”的策略概率y在[0,1]區間以0.2的步長變化,獲得執行者策略z隨管理者策略y的演化趨勢如圖7(B)所示。可以看出當y由0→1逐漸增大時執行者策略趨勢變化幾乎相同,僅達穩定狀態的演化時間隨著管理者策略y的增加而稍縮短,表明執行者策略受管理者策略影響較小,這主要是因為在當前科技管理體系下,以項目管理專業機構為代表的管理者缺乏對“不自律”行為的懲罰權利,如項目終止、資金收回、限制課題申報等,現有的獎懲權限和手段不足以對項目執行者造成收益影響,因此執行者策略并不隨管理者的策略調整。當政府監督力度不夠時,項目管理者的“積極監督”可以使得執行者到達穩定“自律”狀態的演化時間縮短,但因此管理者可作為政府監督職能的補充,但不能取代政府的監督作用。 (A)執行者策略(z)受政府策略(x)影響; (B)執行者策略(z)受管理者策略(y)影響圖7 執行者策略(z)隨政府策略(x)和管理者策略(y)的演化 本文基于有限理性觀點,針對現行科技監督體系構建了政府、項目管理者、項目執行者三方演化博弈模型,借助計算機仿真展現了三方演化博弈過程,為進一步研究科技監督及相關策略提供新思路。結果表明: (1)政府的監督作用不可替代,應積極履行監督職責。在政府“積極監督”的策略下,項目管理者最優策略為“積極監督”,項目執行者最優策略為“自律”。同時,在政府缺乏監督的情況下,僅靠項目管理者易引起“監督失靈”。 (2)項目管理者總是傾向于“積極監督”。在管理者的策略選擇中,“積極監督”比“消極監督”收益高,即在三方演化博弈系統中,“積極監督”均是項目管理者的最優策略。當前國家科技治理體系下,項目管理者通常為政府部門的下屬事業單位,若不履行監督職責,將面臨政府的處罰和社會聲望損失,因此,策略的選擇與其職能定位有關。當政府監督力度不夠時,項目管理者可作為政府監督職能的補充,但不能取代政府監督作用,政府依然是當前科技創新治理體系下的監督主體。 (3)項目執行者隨著政府監督策略做出調整,而受管理者策略影響較小。當政府主動監督時,執行者通常選擇“自律”以獲得政府的其他補助和社會聲望;但當政府不監督時,執行者通常選擇對自己有利的“不自律”。管理者履行日常管理的職責,但缺乏對“不自律”執行者的懲罰權利(項目終止、資金收回等),管理者策略調整不是執行者策略選擇的主要因素。 (4)在政府“監督缺位”的條件下,項目執行者的最優策略為“不自律”,原因主要項目執行者“自律”成本較高,須投入大量的人力物力推進項目。另一方面,在實際情況中,執行者有較大幾率在“不自律”情況下通過項目驗收,存在一定的僥幸心理。在“監督缺位”的條件下,發生科研不端、違背科研倫理等重大風險的概率將大大提升,對博弈三方均造成重大損失,特別是政府的聲望與治理損失。因此,為防范重大風險,政府和管理者均應履行監督職責。 需特別說明的是,本研究基于一定非理性決策的假設前提,隨著科技體制機制改革的不斷深入,科技創新治理體系的不斷完善,現實情況將更加錯綜復雜。例如隨著新博弈主體的增加,博弈策略選擇和影響也會大大不同,本研究中建立的動態博弈模型須根據現實情境進一步優化,以更好地展現現實科技監督系統運作中的博弈行為。4 演化博弈仿真計算
4.1 政府策略分析
4.2 管理者策略分析
4.3 執行者策略分析
5 結論