楊 銳,楊 亮,李良強,張 楠,廖覓燕
(1.四川省科技促進發展研究中心,四川 成都 610041;2.清華大學 公共管理學院,北京 100084;3.四川農業大學 商學院,四川 成都 611830)
隨著科研活動的日益頻繁,科研誠信問題越來越成為世界性議題。科研誠信是科技創新的基石[1],政府和科技部門在科研誠信建設中扮演著引導、管理及懲治等重要角色,在科研誠信問題治理中發揮重要作用[2]。政府公共管理的主要手段即公共政策,現階段社會管理均通過新的公共政策選擇和實施而實現[3]。
美國作為科研誠信體系建設最完善的國家,早在1992年就設立了科研誠信審查辦公室(Office of Research Integrity, ORI),以此加強對科研活動中不端行為的監督[4]。我國于1999年印發了《關于科技工作者行為準則的若干意見》,2006年5月教育部宣布在人文社會科學委員會下設立社會科學學風建設委員會,以加強學術道德和學風建設,遏止科研不端行為[5];同年,《國家科技計劃實施中科研不端行為處理辦法(試行)》政策出臺,國家將“科研誠信”第一次寫入政策,此后各個部委紛紛從各自業務范圍出發制定了一系列加強科研誠信建設的政策法規[6]。2009年,科技部等十部門聯合發布《關于加強我國科研誠信建設的意見》,對科研誠信建設各個環節進行了系統指導和規范。隨著全面深化改革進入新階段,各部委接連頒布大量科研誠信相關政策,為科研誠信建設提供了明確方向和堅實保障。
現有研究主要關注科研誠信定義及治理等方面。王飛[7]從科研誠信教育角度出發對比中外教育現狀差異,發現當前我國科研誠信教育存在主體責任不明確以及高校機構科研誠信教育積極性缺失等問題;朱邦芬[8]認為,當前我國社會存在急功近利、道德水準普遍滑坡、高校學生唯分數的風氣,科研人員以各式各樣成果獎勵為標準的數字化管理評價體系導致現階段我國存在嚴重的科研誠信問題。
高校是科研誠信建設的第一責任主體[9],多數文獻著重從高校視角研究科研誠信相關議題。曹蓓等[10]認為,科技資源管理相對落后、科研評價監督機制存在問題以及高校學生和科研人員科研誠信訓練缺失導致高校學術不端事件頻發;蔣來、詹愛嵐[11]系統梳理近10年來國內發生科研不端行為的案例,從科研活動不同階段分析高校存在的不端行為,深入研究不端行為成因并提出“疏、堵、防、治”的綜合治理體系。
綜上所述,現階段對科研誠信的研究大多停留在理論層面,科研誠信治理結果研究較少,從政策文本視角切入的研究更為少見。科研失信治理不僅需要教育部門發力,更應聯合多方職能部門通力治理。在政策迭代、更新完善過程中,中國科研誠信體系建設脈絡呈現哪些發展態勢?是否具有階段性特征?為回答上述問題,本文采用文本挖掘方法,從中國科研誠信政策中提煉政策特征及演化邏輯,從中總結規律并為未來科技治理提供方向。
學界和業界通常采用“學術不端”“科研失信”或“科研不端”等負面定義作為科研誠信的研究對象[12]。趙瑞芹等[13]闡述了目前各國對學術不端的定義,發現國內外沒有統一標準,并對當前主要國家的科研誠信政策進行了描述性分析。1989年8月8日,美國公共衛生局[14]頒布了第一個關于科研不端行為的正式定義:科研不端行為是指在科研活動中發生的捏造、剽竊或篡改或者違背科研共同體公認規則的行為;董建龍[15]在研究國外科研誠信問題的基礎上,提出一個綜合性的學術不端定義,即在項目申報、研究計劃、項目執行、同行評議及成果發表等方面存在偽造、篡改、剽竊等背離學術道德和準則的行為;王聰等[6]根據國家2017年之前4部委對科研誠信的定義,認為科研誠信概念包括正面規范、準則(符合科研誠信的行為)和負面有問題的研究行為(違背科研誠信的行為);袁軍鵬等[16]通過對國內相關政策的整理發現,國內對科研誠信的定義多從科研人員自身角度出發,從而導致概念定義存在交叉。
本文認為,科研誠信內涵不但包括對科研人員從事科研活動規范、準則等建設性內容,還包括對信守科研誠信的激勵(如科技評價、科技獎勵等)和約束性內容(如科技監督、失信懲處等)。因此,本文在政策收集過程中綜合考慮上述影響科研誠信建設的因素,提取政策中的關鍵信息。
關于科研誠信問題產生的原因,Qiu[17]在《Nature》上發表觀點稱“在高影響力期刊上大量發表論文的壓力可能會鼓勵學術不端行為”,大多數學術評估需要提供學術論文,科研人員在就業、晉升、項目經費、論文發表等壓力下鋌而走險,接受調查的1/3的研究人員承認剽竊、偽造或捏造數據;劉蘭劍等[18]認為,引發科研誠信問題的因素包括個人因素、組織因素及環境因素,其中個人因素發揮著主體作用;Okonta & Rossouw[19]在2012年調研中發現,超過50%的受訪人員認為外部資助壓力、獲得認可、發表論文以及對不當行為的不充分譴責對科學不當行為產生了強烈影響;Haven等[20]通過問卷和焦點小組訪談混合實驗發現,監督不足、同行評審不嚴謹、草率評審、評審人盜竊思想行為、裙帶關系等是當前科研誠信中較為突出的問題,且在不同學科領域有所差異;危懷安等[21]提出一個科研誠信問題生成機理概念模型,認為主體性誘因和環境性誘因是科研誠信問題產生的刺激因素。其中,主體性誘因是科研誠信問題產生的內在根源,環境性誘因是科研誠信問題產生的前提條件;Fanelli等[22]通過對2010—2011年所有已撤銷或更正論文的Logistic回歸分析發現,學術不端行為更有可能發生在缺乏科研誠信政策的國家,因此應研究誠信政策、改進評價機制、加強科研誠信教育以及鼓勵研究人員透明交流。
在不同時期,造成科研不端的原因不同,國家、部委或者機構一般會遵照當時情況制定對策,有針對性地解決當下的科研誠信問題。由此,本文認為,科研誠信政策發展有一定的階段性特征。
1.3.1 國外科研誠信政策制定經驗總結
我國科研誠信建設進程整體上滯后于歐美發達國家[15,23],一些學者通過對國外科研誠信政策展開研究并汲取相關經驗,極大地促進了我國科研誠信政策發展。田瑞強等[24]從政策工具角度對美國學術不端行為治理政策進行量化分析,并對實踐案例進行文本抽取分析發現,美國學術不端治理形成了政策法規立體體系、多階段處理程序、梯度工具籃子;王飛[25]通過系統分析丹麥奧胡斯大學現有科研誠信政策以及相關實踐,提出了我國大學科研誠信建設的可行思路。政策制定不僅需要科學依據,政策執行過程中的協作對政策執行效果也會產生直接影響;黃軍英[26]通過分析美國科研誠信政策發現,白宮政策原則和規定是聯邦各部門的最高指導原則,其它部門必須在此前提下制定與本部門相符的科研誠信政策。
1.3.2 國內科研誠信研究情報學分析
王聰和鴻鵬[6]通過系統梳理科研誠信政策發現不同政策間相同概念界定不一致的情況,并進一步識別出科研誠信相關概念含義與具體使用情況;陳雨等[23]從政策文本內容分析和文獻計量分析角度,對國內外科研誠信相關概念進行歷史溯源,對科研誠信相關政策和里程碑性事件系統梳理,通過學術論文關鍵詞特點分析,揭示了國內外科研誠信研究熱點演進特征。結果顯示,國內科研誠信研究明顯滯后于國外;胡元姣[27]認為,當前我國科研誠信存在3個問題,即科研誠信管理問題、科研誠信體制問題及科研誠信教育問題,因此應加強科研誠信建設,從政策方面保證落實。政策在明確制度規范、界定各方權責及制度落實等方面發揮重要作用,是科研誠信建設重要的一環。
1.3.3 科研誠信政策文本分析相關研究
對于政策文本,少量學者使用定量分析、文本挖掘方法對政策進行了量化分析。靳彤等[28]使用政策文本計量和內容分析法對科研誠信政策文本從時序、機構、文本、內容等方面進行了探索;汪偉良等[29]在知網總庫中進行文獻檢索,在共詞網絡理論基礎上對當前科研誠信文獻進行分析,探析我國科研誠信研究現狀、結構。
綜上所述,以往學者對科研誠信定義、科研不端成因及科研誠信改善對策等進行了較為全面的研究,也不乏梳理政策脈絡的文章,但仍有一些問題值得探討:①當前國內對科研誠信相關問題的探討主要使用定性方法,其優勢是可以按照事先設定好的分析需求,有針對性地對某些政策點進行編碼和歸納總結,對特定主題挖掘效果較好。但是,若遇到大量文本,該方法就顯得低效,加之標注者學術背景、知識儲備及思維方式等差異可能導致結果出現偏差;②當前,科研誠信建設演進對象以文獻計量為主,對科研誠信政策的研究要么采用正向規則和準則,要么選取負向科研不端,少有學者在廣義科研誠信概念下進行政策分析研究。
鑒于此,本文以2000—2019年中央及各部委發布的與科研誠信相關的政策文本為研究對象,使用文本挖掘方法對近20年科研誠信相關政策文件分階段進行分析,探討各階段政策工具特點及演變邏輯。
本文政策文本來源于北大法寶。筆者通過對文獻研究的總結(陳雨等,2017;史昱,2019),結合曾起草過科研誠信文件的經驗,確定“科研誠信”“科研不端”“學術不端”在內的7個檢索詞。由于北大法寶數據庫不具備多個關鍵詞同時查詢的功能,本文將檢索詞分別在“法律法規—中央法規司法解釋”類別中查詢。本研究認為,科研誠信作為一種倡導性的道德約束詞匯,除國家層面出臺的少部分政策在標題中使用外,更多政策只在部分內容中對科研誠信進行規制。因此,本研究在檢索規則制定上采用“全文”“精確”檢索政策數據。在樣本數據采集上,將關鍵詞累積命中頻率小于10的認為是局部科研誠信政策。因此,樣本政策文本選擇只截取包含關鍵詞的(1個或者多個)段落;關鍵詞命中率大于等于10的政策將全文作為樣本。經人工篩選,剔除部分科技計劃申報通知、職稱評審通知、創新人才選拔通知等文件,并人工刪除非部委級別發文檢索結果數據,原始數據檢索及采納結果如表1所示。
在單個關鍵詞檢索完成后,本文對同源(來自同一份文件)數據進行合并,將同源文件歸并為1條數據,關鍵詞累計命中大于等于10的以全文樣本進行數據采集。最終獲取政策數量268份,按照采納類型區分,部分采納253份,全文采納15份;按照文件類型劃分,法律文件5份,行政法規17份,部門規章類197份,黨內法規33份,行業規定2份,團體規定14份。
由樣本數據統計結果發現,科研誠信建設最早在國家及部委層面于2000年提出。鑒于此,本文以2000-2019年為時間段,將此期間發布的科研誠信建設相關政策文本作為研究對象。進一步發現,不同類別政策中提及科研誠信的時間不同:部門規章始于2000年,法律文件是2002年,行業規定是2005年,黨內規定是2006年,團體規定和行政法規是2007年,司法解釋類僅在2008年提及“學術道德”。本文所選的科研誠信檢索詞基本上都最先在部門規章中提出,學術道德和學術風氣于2000年提出,學術不端于2003年提出,科研誠信和科研不端于2006年提出,學術造假于2007年提出,科研規范于2012年提出。危懷安和韋濱[21]對近20年來國內主要數據庫進行檢索發現,科研誠信及學術不端研究文獻在1999-2008年增長緩慢。在此期間,相關研究注重對科研誠信問題治理措施的探討及概念界定[23]。而政策作為指導性和方向性文件對學術研究發展具有引領性作用,學術研究發展一定程度上能夠反映政策發展。綜上所述,本文認為2000-2008年為科研誠信概念提出及科研誠信政策探索期。

表1 樣本政策檢索結果描述
根據以上分析,本文根據每年度政策文件發布總數、關鍵詞出現總數和每個政策關鍵詞平均出現數繪制樣本數據時間序列圖(見圖1)。由圖1可以看出,科研誠信政策文件發布數量總體呈增長趨勢,這與史昱[30]繪制的“國家層面科研誠信政策年度數量分布情況”一致,并且發文數量和關鍵詞平均在每個政策中出現的次數均在2013年存在一個明顯拐點。2009-2013年,政策以科技和教育部門共同規制為主,代表性政策為2009年8月26日科技部、教育部等10個部門聯合發布的《關于加強我國科研誠信建設的意見》,為推動科研誠信建設以及調動廣大科研人員積極性作出了重要貢獻,成為一個時期以來科研誠信的重要指導[31]。綜上所述,本文認為該階段為科研誠信政策建設期。
在2014-2019年,多領域、多部門聯合規制文件占據主體地位,尤其是2018年5月3日,中共中央辦公廳、國務院辦公廳聯合印發了《關于進一步加強科研誠信建設的若干意見》,該文件基本構建起現代科研誠信制度體系,明確了科研誠信建設要求。2014年6月14日,國務院印發了《社會信用體系建設規劃綱要(2014—2020年)》,這個文件首次從國家層面統籌規劃建立社會信用體系,對教育、科研領域誠信建設具有重大意義。綜上所述,本文認為該階段為科研誠信完善期。
本文通過文本挖掘法對科研誠信政策文本進行分析。文本挖掘也稱文本數據挖掘,通常是指從非結構化文本文檔中提取有趣且非常規模式或知識的過程,可被視為數據挖掘或來自結構化數據庫的知識發現的擴展[32]。文本挖掘能夠從非結構化文本信息中發現潛在的聯系、規律等,方便進一步抽取可理解、有價值的信息[33]。近年來,許多學者傾向于利用文本挖掘法對政策文本進行研究。袁野等[34]使用數據挖掘與數據可視化方法對中國內地16個省份人工智能產業規劃進行定量分析,從現有政策高頻關鍵詞及內容關聯度兩個方面對政策主體、研究熱點、重點領域進行分析;李芳[35]使用ROST CM文本挖掘軟件對現有民辦幼兒園認定管理政策文本進行文本挖掘,按照“普惠性民辦幼兒園”概念、認定條件、認定程序、管理監督、保障扶持5個維度,制定分析單元編碼表并歸類政策文本內容;吳瑜等[36]對2016-2019年科技政策研究進行量化分析,通過關鍵詞詞頻統計及聚類分析探討中美科技政策研究熱點,并對中美異同進行了比較。
通過政策文本分詞處理,可以得到政策高頻詞、詞與詞間的連接關系以及同類詞語間的分布狀況,本研究文本挖掘流程如圖2所示。
2.3.1 分詞及高頻詞分析
通過文本分詞能夠縮小研究細粒度,所有文本挖掘工作都在分詞基礎上進行。本文使用Python及jieba第三方庫進行分詞和頻數統計,對268份科研誠信文件分階段匯總,分別對3個階段文件進行預處理、分詞及詞頻統計操作。
在分詞過程中,本研究使用現有哈工大停用詞庫去除無意義的詞語。為提高分詞結果精度,首先,本文根據科研誠信政策文件內容,將“學術不端”、“科研不端”、“學術道德”等共108個詞語加入自定義詞庫;其次,使用jieba庫下的精準模式分別對3個階段進行文件分詞處理,為減少無關詞語的影響,本文基于詞性過濾除動詞及名詞之外的詞語,分詞后各階段詞語總數分別為4 585個、7 018個、21 010個。

圖2 科研誠信政策文本挖掘流程
2.3.2 關鍵詞抽取
本研究使用TF-IDF方法抽取政策文本中的關鍵詞。TF-IDF,英文全稱為Term Frequency-Inverse Document Frequency,是一種基于詞袋模型(Bag of Word)的關鍵詞抽取方法,在文本挖掘中被廣泛用于評估一個詞語對文本的重要程度,從而提取其中的關鍵詞[37]。
TF-IDF計算公式包括兩部分:第一部分的TF(Term Frequency)表示詞語在一個文檔中出現的頻率,假設文檔長度為doc_length,tf代表關鍵詞在該文檔中出現的次數,一個詞語詞頻越高表明其于這個文檔就越有意義,計算公式為:

(1)
第二部分IDF(Inverse Document Frequency)逆向文檔頻率衡量一個詞語的普遍重要性,包含詞語的文檔數量越少表明詞語越有代表性,通過IDF能夠有效減少文檔中一些介詞、連詞等詞語的影響,其計算公式為:

(2)
其中,df表示文檔頻率,即包含某個詞的文檔數目,N為訓練集中文檔總數。
某一文檔內的高頻詞,以及該詞語在整個訓練集中的低文件頻率,其能夠產生高權重的TF-IDF。因此,TF-IDF傾向于過濾掉常見詞語,保留重要詞語。TF-IDF計算公式為:
TF-IDF=TF*IDF
(3)
本文使用Python分別對3個階段文本關鍵詞進行抽取,同時過濾一些無實際意義且與本研究無關的詞,如“相關”、“重點”、“強化”,以及主題關鍵詞“科研誠信”、“學術道德”,最后將TF-IDF值由大到小排序并選取前60個關鍵詞進行共詞分析(見表2)。

表2 關鍵詞抽取結果(前60)
2.3.3 共詞網絡
共詞分析法最早由法國計量學家于20世紀70年代中期提出,該方法后來被運用到各領域[38]。共詞分析通過計算文本語料庫中一對詞語共同出現的次數反映詞語間的關系程度以及詞語所代表文本主題間的關系。在共詞分析過程中,共詞矩陣通常用來表示詞語間兩兩共詞的頻數,通過共詞網絡體現詞與詞間的關聯,網絡節點間遠近程度則反映了關鍵詞間的緊密程度[39]。共詞矩陣導入Gephi軟件中可形成共詞網絡圖,實現網絡可視化。本文形成的共詞矩陣樣例如表3所示。

表3 共詞矩陣(部分)
2.3.4 聚類
關鍵詞聚類能夠凸顯各關鍵詞間的類別聯系,聚類分析根據關鍵詞間共詞強度將關鍵詞劃分為不同類別[40]。
上文使用TF-IDF算法抽取268份政策文件中的前60個關鍵詞,設定閾值為20并生成共詞矩陣,最后使用K-means聚類算法對共詞矩陣中的關鍵詞進行聚類。本文使用手肘法確定K-means中的k值[41],其中誤差平方和公式為:

(4)
式(4)中,Ci表示第i個簇p為中的樣本點,mi為Ci的質心,SSE表示聚類誤差。由圖3可知,當k=9時曲線有明顯轉折,因此本文取k值為9,即對提取的關鍵詞通過K-means聚類算法聚為9個主題。
在探索階段,科教興國戰略的推進以及社會主義現代化建設事業的發展極大地推動了我國科教事業發展,尤其在高校市場化改革之后。在此過程中,教育主管部門在制定各類激勵評價政策時均對學術不端有所提及,如教育部于2002年印發的《關于加強學術道德建設的若干意見》,2004年教育部印發的《高等學校哲學社會科學研究學術規范(試行)的通知》,這些政策均對科研人員科研活動有約束性要求,但更多政策都在倡導通過科技評價制度改革促進科研活動開展。受2006年“漢芯事件”的直接影響,科技部制定了《國家科技計劃實施中科研不端行為處理辦法(試行)》。
由高頻詞可知,本階段主題可概括為“學術道德建設”。其中,“學術道德”共出現95次,詞頻率為0.020 7,在所有詞語中居于首位。這表明,該階段科研誠信問題相對不突出,科研人員依靠自身道德修養規制自身不端行為。設定閾值為8,得到第一階段的共詞網絡,見圖4。關鍵詞“建設”、“科技”位于共詞網絡圖中心,表明這些詞在網絡中比較重要。“建設”、“研究”、“科學”、“提高”等關鍵詞節點較大,表明這些詞在共詞網絡中出現次數較多。這進一步驗證了科研誠信政策起步階段多是概念完善及正向制度建設。這一階段,國家科研誠信政策重視從科研人員個體角度進行科研誠信建設,這其中就包括科學技術評價、科研行為規范、科研人員教育等具體方式,個人學術道德品質培養對科研誠信建設起到直接且顯著的作用。科研人員自身學術道德水平對科研行為有直接影響,如果科研人員道德素養沒有隨經濟發展而提高,就極有可能產生科研不端行為,“漢芯事件”即為其中的典型案例。

圖3 K與SSE關系

圖4 2000-2008年關鍵詞共詞網絡
這一時期國家整體科技實力及創新能力在促進社會發展過程中起到重要支撐作用,同時我國處于全面建成小康社會關鍵時期和深化改革開放攻堅期。這一階段,國家相關部門相繼發布了一系列針對高校、項目及基金道德建設的政策文件,如2009年教育部下發了《關于嚴肅處理高等學校學術不端行為》的通知,科學技術部、教育部、財政部等聯合發布了關于印發《關于加強我國科研誠信建設的意見》的通知。2012年,北京化工大學陸駿學術成果造假事件成為《教育部關于進一步規范高校科研行為的意見》出臺的誘因。
通過高頻詞可以發現,本階段主題可概括為“誠信建設機制”。其中,“建設”一詞出現次數最多,共出現121次,詞頻率為0.081 8。具體來看,本階段出現“學術不端”、“學風建設”、“制度”、“機制”等高頻詞,強調建設階段科研誠信治理的主要工作并突出本階段特點。設定閾值為16,得到第二階段共詞網絡,見圖5。關鍵詞“建設”、“完善”、“科學”等位于共詞網絡圖中心,表明這一階段科研誠信政策注重對現有制度、機制等的建立和完善。同時,“建設”、“科學”等關鍵詞節點較大,表明以上關鍵詞在網絡中出現次數較多。在網絡圖邊緣出現“弘揚”、“精神”、“營造”等關鍵詞,表明這一階段政策更加注重對社會誠信的引導以及誠信精神的弘揚。相較于第一階段,本階段政策對科研誠信問題的治理更加細化,重點是將科研誠信融入其它科研管理事務中,如科技計劃項目、教師誠信教育等。
這一階段有關科研誠信的文件數量快速增長,共頒布了145份政策文件。2018年,中共中央辦公廳及國務院辦公廳印發了《關于進一步加強科研誠信建設的若干意見》,引起全國性反響。相較于起步階段,科技部等十部門聯合發布的《關于加強我國科研誠信建設的意見》進一步強化了頂層設計,細化了具體實施措施。
由高頻詞可以發現,本階段主題可概括為“加強科研誠信體系建設工作”。該階段“科研誠信”一詞出現次數最多,共出現388次,詞頻率為0.142 1;其次是“宣講”、“調查”、“項目”及“管理”等高頻詞,表明此階段十分重視項目全過程的科研誠信管理,從立項到項目實施再到項目結題與評價,政府都從文件上進行了明文規定。設定閾值為25得到第三階段共詞網絡,見圖6。“建設”、“制度”、“完善”等關鍵詞位于網絡中心,在網絡邊緣出現“監督”、“發展”等關鍵詞。相比前兩個階段,這一階段的科研誠信政策更加注重細化監督管理過程,并且強調科研誠信全過程管理,從科研項目立項、項目實施到項目完成再到項目驗收審查,每個環節均完善了相應監督與追責條款。

圖5 2009-2013年關鍵詞共詞網絡 圖6 2014-2019年關鍵詞共詞網絡
使用K-means聚類算法對關鍵詞進行聚類,結果如表4所示。從中可見,Cluster 1包含機制、規范、創新、工作、教育等關鍵詞,所以可將該類別歸納為機制完善與規范;Cluster 2包含計劃、論文、專業、人員、違反、誠信等關鍵詞,所以將該類別歸納為失信行為懲治;Cluster 3包含責任、弘揚、成果、組織等關鍵詞,所以將該類別歸納為機構責任界定;Cluster 4包含國家、監督、評價、單位等關鍵詞,所以將該類別歸納為科研監督與評價;Cluster 5包含實驗室、學術風氣、研究生、師德及科技工作者等關鍵詞,所以將該類別歸納為高校學風建設;Cluster 6包含學術、建設、制度、建立等關鍵詞,所以將該類別歸納為制度建設;Cluster 7包含學風建設、學術規范、高校、職業道德及學生等關鍵詞,因此將該類別歸納為職業道德建設;Cluster 8包括發展、營造、社會、道德等關鍵詞,所以將該類別歸納為學術氛圍營造;Cluster 9包括管理、科研、科技、研究4個關鍵詞,因此將該類別歸納為科研管理。
根據前文聚類結果,本文統計3個階段不同類別間關鍵詞出現的總數,并將其歸一化以比較不同階段間的數值變化,歸一化公式如下:

(5)
其中,xmin表示最小值,xmax表示最大值。
政府通常會通過不同政策工具進行組合實現一個或多個政策目標[3]。科研誠信政策具有階段性特點,不同類別在階段間的變化趨勢如圖7所示。

表4 K-means關鍵詞聚類結果

圖7 不同類別階段變化趨勢
(1)多數類別政策條款數量呈上升趨勢。①對于機制完善與規范類相關政策,其數量不斷增長,總體來說科研誠信政策發展3個階段都十分重視機制完善與規范。早期科研誠信政策主要關注學術評價和監督機制建設與完善,以此建立科學評價體系。中后期進一步規范了相應監督與評價機制,如建立科技項目誠信檔案、建立同行專家評議機制等,進一步加大了對學術不端的懲治。此外,在科研誠信政策發展中后期更加注重多元機制建設,即出臺一個綜合科研誠信問題治理方案;②對于機構責任界定類政策,從探索階段到建設階段再到完善階段,有關科研活動中責任劃分的政策條款越來越多,對科研活動中各個環節不同主體責任的界定越來越完善。教育部在《高等學校“十二五”科學和技術發展規劃》中明確提出強化科研過程管理,加強科研誠信全方位監督。科研誠信政策起步初期主要目的是應對日益嚴峻的學術不端問題,這一時期,相關管理人員并未意識到對不同主體責任界定及通過科研活動監督加強科研誠信管理,雖然有部分政策提及,但并未引起足夠重視,也未涉得到實施。隨著時間的推移,科研誠信相關政策傾向于從源頭及全方面加強科研誠信管理,相應主題的相關政策條文數量有所增加;③對于科研監督與評價類政策,2003年,教育部《關于進一步發展繁榮高校哲學社會科學的若干意見》要求高校行政管理部門進行科學管理,建立公平競爭、科學評價的體制。隨著科研誠信治理的不斷深入,政府同時推動各學會加強科研評價與監督。根據科研監督與評價類政策變化曲線可以發現,隨著階段演進這類政策更加精細化、科學化;④科研管理類政策一直強調加強科技計劃、科技項目實施與科技經費管理。這類政策條款數量隨時間變化不斷增加,內容上隨著科研誠信研究的不斷深入,對科研項目的管理也越來越規范。后期科研管理類政策從項目決策、執行、評價等不同階段進行了規定和建議,并且開始注重信用管理。
(2)部分類別政策條款數量波動較為曲折。①對于失信行為懲治類政策,相關政策條款數量先減少后增加。早期科研誠信政策重視對科研失信行為的懲治,早在2002年教育部《關于加強學術道德建設的若干意見》就明確了部分學術風氣不正、學術道德失范的具體表現,并且強調通過建立學術懲戒處罰制度加強科研誠信建設。在建設階段,該類別政策數量相對較少,完善階段其數量急劇上升。在這期間,懲治對象范圍逐漸擴大,從對科研人員失范行為的懲治擴大到相關評估人員、監管人員等責任主體的系統懲治體系,同時強調不同部門間跨部門聯合懲戒;②對于高校學風建設類政策,政策條款數量相對較少,其數量變化呈現先增長后下降趨勢。通過數量變化趨勢可以發現,高校學風建設政策出臺相對較晚,高校是國家創新驅動發展戰略的重要驅動力,但同時也是科研誠信問題的重災區,由于科研誠信政策探索階段更多是對高校主體的行為規范,較少涉及學風建設。直到2011年教育部出臺《關于切實加強和改進等學校學風建設的實施意見》,各高校才充分認識到當前加強高校學風建設、學術規范的緊迫性,并提出系列措施加強高校學風建設,充分激發了高校各主體的創新積極性;③對于學術氛圍營造類相關政策,科技創新具有長期性及復雜性特征,3個階段均提到營造科研誠信良好氛圍。其政策條款數量變化較為平穩,先減少后增加,總體呈上升趨勢。科研誠信政策發展初期旨在營造誠信、寬松、多樣的良好學術環境氛圍,激發科研人員創新精神;④對于職業道德建設類政策,其政策條款數量先增加后減少。科研誠信政策發展中后期開始強調師德師風建設,教師言行舉止對學生具有強烈的影響,他們的首要責任就是教書育人,加強師德建設、嚴格教師考核標準能夠對學生思想行為產生警示作用。
(3)制度建設類政策條款數量持續減少。為鼓勵創新以及弘揚科學精神,各部門早在科研誠信政策探索階段便頒布了一系列加強科研誠信制度建設的政策,如學術懲戒處罰制度、科研誠信管理制度、科研工作者道德誠信檔案制度、科研成果鑒定評價制度等。總的來說,科研誠信制度建設相關政策條款數量呈現下降趨勢,但在政策內容上不斷細化,不端行為懲罰力度不斷上升,早期對于科研誠信活動主要是從局部管理入手,逐漸演變成全過程管理,形成一套從申請、計劃、審核、實施、驗收到評審的系統性政策保障體系。
科技創新是國家進步的重要動力,而科研誠信是科技創新的基石,加強科研誠信建設能夠推動高質量科技創新。本文基于文本挖掘技術,對2000-2019年268份科研誠信相關政策進行高頻詞分析、共詞網絡分析及聚類分析,總結了20年來科研誠信相關政策階段特征及演變趨勢,得出如下結論:
(1)政府對科研誠信相關政策的制定是一個由點及面再到點的變化過程。在科研誠信政策起步階段,政府對現有學術不端問題的認識不夠深入全面,且缺乏相關行為定義,既重視從科研人員個人層面對其具體行為進行規范約束,同時也注重加強對科研人員的教育引導。在科研誠信政策建設階段,政府逐漸意識到科研誠信發展是一個系統工程,不僅要提高自身自律水平,還要完善相關體制從而加強外在約束。科研誠信政策制度不斷完善,科技部關于《深化科技體制改革加快國家創新體系建設》的意見明確提出加強國家科研誠信制度建設,建立誠信檔案以便實現信息共享。在科研誠信政策完善階段,政策依然注重科研誠信建設頂層設計,但對引發科研誠信問題的各個方面都提出針對性措施,包括科研誠信監督、科研機構管理等,此時對科研誠信建設治理各個方面進行了細化,為政策執行實施提供了便利,科研誠信政策更加精細化。
(2)科研誠信政策中心點是一個不斷完善深化的過程。20年來,科研誠信政策發展重點呈現出“個人—環境—全過程管理”的變化邏輯。一方面,對科研誠信的監督由最初個人監督再到機構監督最后到科研誠信活動全過程監督,最終形成了一套嚴密的監督體系。同時,科研誠信政策發展中后期開始完善追責機制,界定各主體責任以提高科研誠信意識;另一方面,政策對科研誠信管理也逐漸專業化,建立相關人員信息檔案數據庫以便信用信息共享,起初各部門間溝通協作較少,不利于科研誠信管理,信息公開共享后部門間聯系增強,同時保證了公民的知情權。專業機構的引入使得原來存在弊端的自我管制系統變得更加科學化,從而完善了科研誠信管理。
本文通過文本挖掘法對科研誠信政策文件進行文本挖掘,梳理了20年來科研誠信政策文件發展脈絡和規律。一方面,本文結論可為政府部門政策制定及執行提供參考依據;另一方面,本文提到的一些管理方式變革為相關科研誠信管理部門提供了改進思路。但同時,本文還存在一些局限性:首先,只研究中央辦公廳、國務院辦公廳及國家各部委科研誠信政策,對地方科研誠信相關政策本文并未進行探討;②科研誠信政策收集可能不盡完善,對相關政策文本的檢索存在疏漏。未來需擴大研究主體,對地方科研誠信政策進行研究,并探討與國家科研誠信政策間的關系。