邱均平,孟炎镕,b(杭州電子科技大學.中國科教評價研究院,b.管理學院)
在“雙一流”建設的大背景下,提升科研實力、提供具有理論和實際價值的科研成果是高校發展的一個重要方向。高校科研產出的數量能在一定程度上反映其科研能力,但數量不是目的,科研質量或價值才是最終追求。科學研究成果質量以科研論文、學術著作、報刊文章等進行表達,具有創新性、科學性、實踐性等特性[1]。雖然我國科研生產力不斷提升,但科研影響力相對較弱[2]。進行高校科研成果質量研究,既可為“雙一流”高校科研的發展提供指揮棒和風向標,也可對具有探索性和復雜性的科研活動進行定量分析。同時,分析科研資源投入有效性是深入挖掘高校發展內在動力、提高科學管理水平的前提。
在已有的關于高校科研成果質量的研究中,譚春林等提出應注重質量創新,科研產出質量評價依據應體現于學術價值和社會貢獻,并明確了科研成果質量的評價方向和側重點[3]。潘健等基于全球視角,發現科研論文產出數量與質量并非完全對立,兩者的對立和同一蘊含在質量互變之中[4]。因此,對于科研成果質量的研究,不僅僅要依靠體現質的指標,還應重視量的指標。大部分學者通過構建指標體系對科研產出成果進行評價研究,缺乏統一的成果產出指標,且對具有代表性科研成果權重的主觀選擇具有很大的爭議性[5]。因此,不考慮成果指標權重的大小,根據指標的特性對高校質量進行分類研究具有一定的優勢。
大部分學者選取了論文數量、被引量、科研獲獎等作為科研成果的代表性指標。Abramo等[6]運用引文數作為科研產出的指標,計算了意大利大學的研究生產率;Li Jing等從發表論文數量、引文量、出版物等方面探討中國高校與世界一流大學在科研產出能力方面的差距[7]。對于科研資源投入有效性的研究,部分學者考慮的投入因素指標較少。張寶生等[8]運用門檻回歸方法研究了政府科技經費投入和研發人員的規模對科研產出的影響;蘇皚等[9]研究了科研經費投入、課題數量和師資隊伍投入與科研創新產出的影響關系。
Logistic回歸模型可以分析多因素投入的有效性,且能夠較好地解決各分類數據相關性檢驗與貢獻水平的問題[10]。為此,本研究不構建指標體系,而是基于突出學術影響力和貢獻指標變量,對我國114所“雙一流”高校進行自然分類,同時考慮科研資源投入因素,將杰出人才培養、基礎設施投入、科研隊伍建設、團隊合作能力和地區經濟實力作為自變量,將高校科研成果質量水平作為因變量,構建無序多分類Logistic回歸模型進行投入有效性分析,探究科研資源投入與產出之間的非線性關系。
全國“雙一流”大學名單為137所,考慮其中23所高校的性質及其在選取的科研指標中的表現很低,因此為了確保研究結果的說服性和準確性,剔除較為特殊的藝術語言類高校,如中央美術學院、中央音樂學院等。本研究從靜態的角度選擇114所“雙一流”高校,對其2020年的科研成果質量水平以及投入有效性展開研究,高校科研資源投入與成果產出的數據主要采集于教育部官方網站文件、自然科學基金網、各高校官方網站以及Web of Science學術發表與專利信息公共服務檢索平臺。
2.2.1 K-Means聚類
聚類面對的是沒有分類標簽的數據對象,它從給定的數據集中搜索數據對象之間存在的有價值的數據分布模式[11]。K-Means聚類是一種基于質心或距離的算法,筆者先取一個K值,再將數據劃分為K個類別,這樣同一類別內的數據相似度較高,便于區分[12]。
本研究主要應用SPSS Statistics 25.0軟件,基于歐幾里得距離確定聚類中心點,對114所高校的科研質量水平進行聚類,將科研質量水平相同的歸為一類。傳統的用簡單計數累加的評價辦法忽略了代表性成果的重要性,導致成果數量激增但影響力不足,自然聚類可以很好地避免這些問題。同時,聚類的結果比傳統的分類方法更加全面、合理,而且它可以有效地消除由于數據的微小差異而導致的區別,避免了直接排名的限制[13]。
2.2.2 無序多分類Logistic回歸
Logistic回歸是一種廣義的線性回歸分析模型。邏輯回歸理論揭示了一個因變量與多個互不相關的自變量之間的多元回歸關系[14]。本研究在高校科研質量的聚類基礎上,識別不同類高校的科研質量水平與選取自變量因素之間的關系,探究科研投入因素的有效性程度。不同的科研質量水平為因變量,由聚類結果得出為無序多分類變量。選取的自變量均為二元或多元分類變量,因此,本研究構建無序多分類Logistic模型。
假設有n個自變量,對應k個分類的因變量。從k個因變量中選一類作為對照組,且每個分類都可以作為對照組。對照組與剩余的k-1個分類分別進行回歸方程的構建。則因變量第j個分類的Logistics回歸模型為[15]:

式(1)中,j∈[1,k-1],i∈[1,n],βji為回歸系數,xi為第i個影響科研成果質量的自變量,Pj為因變量為第j類別的概率。
參考已有研究,選取的聚類變量要具有代表性,本研究在選取變量指標時,注重成果的實際價值和創新性[16]。高校科研質量水平由科研產出,即科研影響力和實際貢獻所決定。本研究將高校科研質量聚類指標變量設置為7種,為聚類過程的輸入變量,這些指標均可定量計算(見表1)。

表1 聚類變量指標表
高校的科研產出主要為學術論文。三大刊(Science、Nature、Cell)具有較高的影響力,其科研成果重大且新穎,因此發表在三大刊的論文數量體現了高校的科研產出力。發明專利體現的是先進的技術或方法,專利數量可以表現出科研機構的科研創新力[17]。因此,三大刊發文數和發明專利數量雖然是代表量的指標,但也能在一定程度上能反映科研質量。
對于代表質的成果指標,具有高被引量的論文往往代表著其具有較高的學術水平和學術影響力。三大刊被引量,代表論文具有較高的學術影響力;ESI高被引論文指某一篇SCI/SSCI論文近10年總被引次數位于某ESI學科所有相同出版年論文的前1%[18];SCI、SSCI和A&HCI被引量指標越高越能說明高校科研產出質量高,且相比于數量更注重內涵;科研獲獎代表科研機構的科研實力,具有一定的創造性和新穎性;會議報告數代表了高校較高的科研合作和交流能力,體現了某一學科的最新研究成果,能夠反映科研機構的學科影響力和創新性。
自然聚類可以自動區分不同的高校類型,能更好地反映“雙一流”高校的整體科研水平情況。本研究運用K-Means快速聚類算法對114所高校的科研成果質量水平進行聚類分析,根據實際的科研情況,選擇3個聚類中心點,得到了3個類群的中心點對應的科研成果質量情況。
經過計算,本研究選取的7個指標變量在3個類群中的差異是顯著的,即具有統計學意義。由最終的聚類中心可知(見表2),聚類中心點分別為(1796,5,883,561,247,44010,139)、(459,0,78,74,7,6402,23)、(1021,1,363,246,79,22397,48)。第一類各指標數是最高的,表明科研質量最優,第三類次之,第二類指標最低,即科研質量水平最不理想。每一類高校都有一個中心點,接近于中心點的高校各項指標處在同一質量水平上。各層次中心點指標之間具有明顯的層次性,其中ESI高被引論文數、三大刊被引量和科研獲獎這3個指標差異最大。

表2 最終聚類中心
各個類群的高校數量情況:第一類有18所高校,包括清華大學、北京大學、浙江大學等。第二類有68所高校,包括南京大學、蘇州大學、同濟大學等。第三類有28所高校,包括華東師范大學、第二軍醫大學、南京農業大學等。聚類結果顯示,“雙一流”高校整體的科研質量水平呈金字塔形結構。第一類高校數量最少,這類高校在各個科研產出指標情況最優,而各類指標較低的高校數量則較多。基于分析結果,將三類不同質量水平的高校劃分為優秀類、良好類和一般類,對于科研質量一般類和良好類高校來說,應有針對性地提高其科研質量。
已有相關研究大多考慮課題數量、師資隊伍投入、研發人員規模和科研經費投入等因素,其中科研經費投入僅對科研成果數量具有正向影響,對成果質量影響不顯著[19]。本研究將科研經費投入進行剔除,考慮基礎設施投入、杰出人才培養、科研隊伍建設、團隊合作能力和地區經濟實力因素可能會對科研產出產生影響,即投入因素是否具有有效性,選取了10個具體指標作為回歸模型自變量xi,i=(1,2,…,10)(見表3)。

表3 科研資源投入指標
(1)科研基礎設施投入。①科研基地不僅是學科建設的載體,也是培養創新型科研人才和促進科技成果創新的重要載體,其作為物力資本主要是財力投入長期積累而成,屬于存量概念,短期內相對較為穩定[20]。②科研項目為實踐教學和培養創新能力的良好平臺,高校申請的科研項目數在一定程度上反映了高校的科技創新力和產出力[21]。
(2)杰出人才是高校重要的科研資源,具有引領性作用。本研究選取中科院院士與工程院院士人數、國務院學科評議組成員人數、長江學者特聘教授人數和“杰出青年”人數指標代表高校的人才資源,在本研究調研的114所高校中有29所無中科院院士與工程院院士。國務院學科評議組成員人數不僅代表了高校的人才資源,而且展現了高校的學科發展力,在不同類高校中具有明顯差異。長江學者特聘教授人數、“杰出青年”人數體現了高校的人才科研能力,本研究調研的114所高校中有41所無長江學者特聘教授、47所無杰出青年。
(3)科研隊伍是科研的主力軍,會直接影響人力資源的質量,進而影響科研成果的數量和質量,因此,選取科研隊伍建設投入作為研究投入有效性的指標是合理的。本研究選取博士研究生導師和碩士研究生導師數量作為高校科研的人力投入,其代表著高校的科研產出力和人才培養能力。
(4)團隊合作能力因素中的創新團隊指標是指教育部“創新團隊發展計劃”入選團隊,創新團隊能反映高校的科研合作力和創新力。科學研究要兼顧科研的創新性和可操作性,科研團隊建設是科研發展的關鍵所在[22]。
(5)廖帥[23]等認為,人均GDP發達的地區投入的科技資源普遍較高,也能獲得較好的科研產出。本研究考慮到地區經濟實力因素,運用數據可視化呈現了114所“雙一流”高校在我國不同地區的分布情況(見圖1)。可見,經濟發展水平較高的東部地區,可能更有利于科研成果產出和“雙一流”高校的建設。筆者將科研質量作為因變量,一般、良好和優秀分別取值為1、2、3,將上述科研資源投入變量按數據特征進行劃分(見表4)。

表4 自變量劃分類型

圖1 不同高校類型的地區分布
4.2.1 初始結果
本研究運用無序多分類Logistic回歸模型將10個科研資源投入指標作為自變量,科研質量作為響應變量,進行科研資源投入有效性分析。由于自變量指標較少,可以采用Enter法,使所有自變量參與建模。以k(k=1,2,3)為參考類型,高校為其他類型的概率與為k類型的概率比值為[24]。本研究分別以良好和優秀為參照類別,建立以下4個Logistic模型,P1、P2和P3分別表示高校科研質量一般、良好、優秀的概率,βji為回歸系數。見公式(2)—(5)。

從表5初始模型擬合信息可知,該模型的-2倍對數似然值為79.647,P值小于0.05,即該模型總體上通過檢驗,說明Logistic模型能夠用于分析與釋解科研資源投入與科研質量水平的關系。此外,Cox&Snell R2為0.691,說明自變量可以解釋不同科研成果質量69.1%的形成原因,該模型擬合效果較佳。

表5 初始模型擬合信息
通過表6初始模型似然比檢驗可知,科研項目、中科院院士和工程院院士數、碩士研究生導師數和創新團隊數4個自變量的P值小于0.05,顯著影響科研質量水平。P值大于0.05的自變量對科研成果質量無顯著影響,應進行剔除,以優化初始模型。

表6 初始模型似然比檢驗
4.2.2 最終擬合模型
為形成最終的擬合結果,本研究采用偏似然估計法將國務院學科評議組成員數、長江學者特聘教授人數、科研基地、博士研究生導師數、地區分布和“杰出青年”人數變量從初始模型中進行逐一剔除。剩余變量與科研成果質量具有顯著相關性,最終模型中的中科院院士與工程院院士數、碩士研究生導師數、科研項目數和創新團隊數變量的相關性檢驗見表7。

表7 最終模型似然比檢驗
最終的回歸結果包括4個模型(見表8)。模型一和模型二以良好類高校為對照組,模型三和模型四以優秀類高校為對照組。選取不同的對照組,回歸分析結果也會有一定的差別。當exp(B)值小于1時,說明變量對此模型具有反向作用;當exp(B)值大于1時,說明變量對此模型具有正向作用。

表8 無序多分類結果分析
(1)模型一和模型二中,科研成果質量與科研隊伍建設的碩士研究生導師數量顯著相關,與杰出人才培養中的院士數顯著相關。從exp(B)值可以看出,模型一中碩士研究生導師數和院士數變量的exp(B)值小于1,而模型二中的exp(B)值大于1,即科研隊伍建設和杰出人才的培養對提高科研成果質量效果顯著,具有有效性。模型一中,科研基礎投入中的科研項目的P值大于0.05,無顯著作用;模型二中,其P值小于0.05,具有明顯的正向顯著作用。簡而言之,科研基礎設施投入可以提高良好類高校的科研成果質量,而在一般類高校中的促進作用較弱。從體現科研合作能力的創新團隊數來看,科研合作能力較強的高校達到優秀科研質量成果的概率是科研合作能力較弱高校的exp(3.48)倍,即32.66倍,可見創新能力和合作能力對于提升高校成果質量具有正向的顯著作用。
(2)在模型三和模型四中,基礎設施的投入、杰出人才的培養和科研合作能力均與科研成果質量有顯著的關系。對于模型三,科研隊伍的建設對一般類高校的科研成果質量無顯著影響,可以理解為,相比于優秀類高校,一般類高校科研隊伍是遠遠不夠的,還應該注重對其他投入因素的管理。在模型四中,碩士研究生導師數變量的P值小于0.05,意味著科研隊伍規模越大,人才資源培養能力越高,“一流師資”是“雙一流”建設的核心要素[25]。加強科研隊伍建設有利于科研成果質量的提升。模型三和模型四的科研項目變量和院士數變量的P值均小于0.05,即科研項目對提高科研成果質量效果顯著。可以解釋為,科研項目的申報可以鍛煉科研人員的創新力和生產能力,進一步提高其科研產出的質量。
從以上分析中發現,杰出人才培養對各類高校提高科研成果質量的顯著作用最大。科研隊伍建設、科研合作能力和基礎設施的投入可以提升良好類和優秀類高校科研成果質量,但對一般類高校的科研成果質量的促進作用相對較弱。
本研究收集“雙一流”高校的科研成果產出和資源投入的各指標,對高校科研成果質量和科研資源投入的有效性進行研究。結果顯示,不同科研水平的高校數量呈金字塔形結構,高校整體科研質量水平出現明顯的斷層,提高一般類高校的科研質量對“雙一流”高校建設和提高其整體實力至關重要。杰出人才培養、科研隊伍建設、科研合作能力和基礎設施的投入可促進不同類型的高校提升科研成果質量,地區經濟實力對科研成果質量無顯著影響。
杰出人才的能量持續疊加效應對于高校提高科研成果質量至關重要。高校應在科研管理體系中將科學研究成果數量與質量并重,對取得高質量成果的人才予以重點扶持,引導科研工作者撰寫高水平的論文,可以加大對人才的引進。對于處在不同科研質量水平的高校來說,應加強合作意識,協作開展科研項目。高校應看重科研工作者的合作創新思維和能力,鼓勵科研團隊的建設,激發團隊創造力。此外,高校應加強鍛煉科研工作者的科研能力,進一步挖掘科研團隊的潛力,促使其產生更具實際應用意義的科研成果。