薛 雅 陳 靜
(1.上海市科學學研究所 創新政策研究室,上海 200031;2.上海觀滄智能科技有限公司 自然語言處理部,上海 201203)
隨著科技、經濟、產業、市場的快速發展,原有的傳統科研事業單位的管理體制機制不能完全適應新的發展需求。2012年,廣東提出培育發展新型研發機構,完善廣東區域創新體系;江蘇省把產學研聯合創新載體定義為新型研發機構。2015年9月24日,中共中央辦公廳、國務院辦公廳印發的《深化科技體制改革實施方案》,提出新型研發機構建設,形成跨區域、跨行業的研發和服務網絡,探索非營利性運行模式。2016年5月,中共中央、國務院印發《國家創新驅動發展戰略綱要》,國家推進創新的綱領性文件中正式出現了“新型研發機構”這種新的科研組織形式,提出要“壯大創新主體,引領創新發展。發展面向市場的新型研發機構。”2016年7月國務院印發《“十三五”國家科技創新規劃》提出“培育面向市場的新型研發機構等”,在頂層設計層面提出了規劃和發展道路。基于宏觀政策的指導,廣東、北京、江蘇、上海、浙江等多個省市也相繼出臺新型研發機構相關政策,在相關支持政策體系上不斷創新和發展,旨在集中力量培育適合當地特色的本土新型研發機構,依靠國家宏觀政策和地方支持政策,這一時期的新型研發機構在數量、機制完善、內部治理等方面都有了較大突破[1]。新型研發機構在投資主體、組織結構形式、內部運行機制、用人機制的開拓創新,在創新體系中發揮了越來越重要的作用。但與傳統研發機構相比,新型研發機構的數量少,發展水平亟待提升,如何通過體制機制的深化改革發掘科技創新潛力,激發社會力量參與科技創新,提高創新效率,很大程度上受新型研發機構政策影響。
隨著文本處理技術發展,政策研究的系統性與客觀性受到了越來越多關注。基于目前我國新型研發機構政策發展時間短,政策與執行的匹配度有待提高,部門間政策協調度不夠等問題。為避免綜合性政策對新型研發機構政策噪音干擾的基礎上,本文以國家層面及各省、自治區、直轄市的新型研發機構政策文本為全國性政策分析的依據,選取2014-2019年的124篇新型研發機構政策作為研究樣本,在扎根理論的基礎上從時間和重點地區兩個維度應用文本挖掘技術對政策文本進行不同視角的分析。通過詞頻及其相對占比和單位關聯度等統計指標來反映其數據特征,分析不同維度下新型研發機構政策的演進和特征,本文能夠對新型研發機構政策體系完善和科技創新實踐提供參考。
Anderson[2]認為政策變遷是通過頒布新政策或修正已有政策的循環過程。Brian H W[3]認為政策變遷可以劃分為創新、接續、維持和終結等不同階段。Hall P A[4]認為政策變遷可以分為兩種模式,分別是沒有改變政策范式的常規且漸進的,和改變政策范式的非常規且激進的的政策變遷。金雪軍[5]認為演化思想主要起源于凡勃倫、馬歇爾和熊彼特等, 并經納爾遜、溫特等的工作得到不斷地發展。吳忠民[6]對不同時期的社會政策中的價值取向變化進行研究分析,對不同時期選擇多領域的具體政策則采用了內容分析的方法。TERZIOVSKI M[7]形成了目前較為主流的案例研究的創新演進研究方法。史昱[8]通過構建三維的政策分析框架包括政策邊界、重心和層次,分析特征和問題,并預測相關科研誠信政策的發展趨勢。高峰[9]以CNKI檢索到的文獻題錄作為樣本數據,分析定義“架構完善度”和“節點累積強度”等概念,通過CITESPACE共詞聚類進行分析,得出我國科技創新政策研究工作的熱點演進圖。屈文建[10]結合文獻計量與內容分析法對高新技術產業政策的文本進行共現和聚類分析,分析高新技術產業政策在時空的分類與演進關系,采用多維標度法分析政策內容的交叉特征。王作軍[11]從政策主體、政策客體、政策目標3個方面識別科技政策維度,構建基于戰略、中觀與基礎層面的S-M-B科技政策模式系統框架,并運用博弈觀點分析科技政策模式作用機理。
Feldman R等[12]首次提出了文本挖掘的概念,此后的研究者在該領域進行了很多有成效的研究工作。O.Persson[13]提出了知識基礎的逐級擴大概念,即隨著共引閾值的降低,知識基礎也逐漸增大,并在相當長的時間內保持穩定。以Willet P[14]的G-HAC算法為代表的層次凝聚法和以Cutting D[15]的K-means等算法為代表的平面劃分法是目前較為主流的兩種類型。Choudhary A K等[16]總結了文本挖掘方法的相關理論,以及各種實際應用方法。Nassirtoussi AK等[17]總結了許多研究者采用文本挖掘方法來預測金融市場的相關研究。張永安等[18]采用文本挖掘方法對區域的科技創新政策分為兩類,分別是強制型和引導型,并從系統性角度進一步劃分為四種類型,包括權威、緊迫、指導及階段等。陳慧茹[19]對共詞分析法進行了研究,認為兩個關鍵詞共同出現的次數越多,兩者聯系越緊密,反之不然。杜偉錦[20]對地區科技成果轉化政策文本進行梳理挖掘后進行量化分析,從目標、工具、執行三個維度分析演進差異。吳瑜[21]用文本挖掘和數據可視化的方法,對2016-2019年中國和美國科技政策論文進行關鍵詞詞頻統計及聚類分析,對比研究中美異同。陳興蜀[22]基于特征關聯度的初始聚類中心選擇算法,用來解決K-means算法對初始聚類中心敏感的問題。馬玉新[23]將中國1995-2017年的企業技術創新政策劃分為4個階段,運用扎根理論提取各階段的關鍵詞,并分別對各個階段的關鍵詞和政策文本進行加權,利用余弦相似度的概念構建各階段關鍵詞加權共詞矩陣,并通過對各階段加權共詞網絡的小團體分析厘清了整體政策演進過程,分析規律并依此提出了相應的政策建議。張寶建[24]采用文本挖掘方法對1996-2017年國家科技創新政策文本數據進行分析,通過Rwordseg方法提取關鍵詞并構建相應的關系矩陣,K-means聚類方法將政策進行不同性質和內容的主題分析,并采用多層多維交叉的維度分析政策演化過程,結合科技創新實踐報告進一步分析政策文本的有效性。趙公民[25]選取2006-2018年4月出臺的廣東省科技金融政策文本作為樣本,在扎根理論的基礎上運用文本挖掘技術,對其進行詞頻、語義網絡以及中心性分析,并運用廣東省科技金融的實際運行模式做進一步驗證。楊銳[26]通過高頻詞識別、關鍵詞聚類以及共詞分析等技術分析268篇國家及部委相關科研誠信建設政策,采用文本挖掘法探索我國科研誠信政策主題趨勢的演變。
王立軍[27]從加大財政支持力度、強化人才激勵措施、落實稅費優惠政策等方面分析總結了廣東、福建和重慶等省市區支持新型研發機構發展的政策舉措。李金惠[28]梳理了近年廣東省包括其各地市針對新型研發機構出臺的相關政策,總結存在問題并提出相關完善建議。包則慶[29]梳理了粵、江、渝地區新型研發機構的財政支持經驗,結合福建省級新型研發機構后補助政策現狀以及實施過程中存在的問題,提出完善福建省級新型研發機構后補助政策的意見建議。楊詩煒[30]收集了國家及廣東省2010-2018年新型研發機構的相關政策,從政策力度和工具兩個維度對其進行量化分析,得出這些政策文件多為通知類文件、政策力度不高的結論,在政策工具使用方面,環境型工具的使用頻率最高,供給和需求型工具的使用仍需加強。張玉磊[31]以國內2003-2019年的文獻為樣本,采用系統性文獻回顧(SLR)和內容分析法等方法分析了國內新型研發機構的研究現狀及其知識結構,探索現有研究的缺失并嘗試尋找未來研究趨勢。
全國新型研發機構政策是隨著科技主體的體制機制改革發展應運而生。涉及到國家及各省市區關于新型研發機構政策,最早在國家和各省市區的綜合性政策中出現較多,發展陸續出臺了專門針對新型研發機構相應政策。為搜集全國范圍內新型研發機構的所有政策,保證文本數據資料全面可靠、真實詳盡,政策文本以國家層面及各省市區的新型研發機構政策文本為全國性政策分析的依據,以政策制定的國家、省市區各委辦局網站為主要的數據來源,通過對政策文件關鍵詞檢索、瀏覽、反復比對查找等方式搜集了2014-2019年國家及各省市區出臺的全部新型研發機構政策文件,通過源頭查找和文件追溯補充政策文本的遺漏數據。在重點省份研究中,各省也包含了其省會城市和重點城市,例如廣東省政策文本分析中包含廣東及廣州、深圳的政策文本,江蘇省包含江蘇省和南京市的政策文本,浙江省包含浙江省和杭州市的政策文本。政策的選取以地區分類,涵蓋了各地區的所有委辦局關于新型研發機構的政策。按年份分類,2014-2019年全國新型研發機構政策文本選擇的是國家和省市區層面的政策合計110篇;按重點地區分類,在重點省份的研究中政策文本合計69篇,各省包含了其省會城市和重點城市,年份分類與重點省份分類的政策中有部分政策是重疊的,所有政策文本共計124篇。
在數據收集整理過程中,本文對所有的政策文本進行了篩選和剔除,對于綜合政策中的新型研發機構的政策進行篩選,摘錄其中涉及到新型研發機構的部分,剔除與新型研發機構政策無關的政策文本以突出了新型研發機構政策的主體位置,增加了分析的準確度和有效性。此外,因為要對新型研發機構政策的發布年份的特征進行分析,本文收錄的文本包含已經失效的政策,例如廣東省《關于支持新型研發機構發展的試行辦法》,包含修訂過后的政策及修訂前的原政策,以提高文本研究的準確性和文章結論的普適性。遵循上述篩選原則,最終篩選出共計124篇新型研發機構政策文本作為樣本數據,通過全國范圍覆蓋、高精準的數據本文的研究,揭示全國新型研發機構政策的演進過程與特征分析。全國范圍內所有國家和省市區層面新型研發機構政策分布情況(見圖1)。本文涉及全部政策文本按年份分布情況如圖2所示。

圖1 新型研發機構政策分布情況

圖2 本文124項政策文本按年份分布情況
本文研究過程如圖3所示,首先確定本文所研究的全國新型研發機構的政策文本并如上文數據來源所示對所有的政策文本進行了篩選和剔除,然后進行文本無差別預處理,共得到了由12 666個無任何定義分類的普通詞集合WS(Word Set),在此基礎上根據扎根理論對文本展開深入的分析研究,通過人工干預和TF-IDF(Term Frequency-Inverse Document Frequency)方法建立了由124篇政策文本組成的新型研發機構政策特征關鍵詞提取的分類目錄。最后從時間和重點地區兩個維度對政策文本進行不同視角的分析,通過詞頻及其相對的占比和單位關聯度等統計指標來反映其數據特征,分析不同維度下新型研發機構的政策的演進與特征。

圖3 研究過程
本文首先進行文本無差別預處理,導入由采集所得124篇政策文本的內容組合而成的語料庫PS(Paragraph Set)。在中文自然處理中,詞是最小的具有意義的語言成分,首先基于語料庫PS進行中文分詞,選用中文分詞器提供常規分詞,組合使用以標點符號為斷點的方式進行斷點分詞。經初步去重操作和停止詞(Stopwords)篩選,共得到了由12666個無任何定義分類的普通詞集合WS(Word Set)。
因無任何定義分類的普通初始關鍵詞重復性高、數量較大,需要進行人工干預,扎根理論認為,只有對文本展開深入的分析研究,才能尋找文本的核心要義[32]。通過對政策文本意義進行仔細精讀,結合我國創新主體角色定位和新型研發機構的發展特點,基于扎根理論對初始關鍵詞進行篩選與歸類,篩選原則是剔除政策文本中的語義范圍廣但特征不明顯、對表征無顯著影響的高頻詞,如“科技”“非常”“實驗”“發展”“金融”“重大”“政策”等。特征關鍵詞的分類,首先根據政策的主體行為特征分為黨的領導、機構主體行為、政府行為、主體類型、機構定義、人才、成果轉移轉化、創新環境等8個一級分類CS(Category1 Set),再根據實際政策需求將這8個一級分類細分成25個二級分類SS(Subcategory Set),并通過二級分類意義涵蓋面的定義形成初步的關鍵詞集KS(Keyword Set)。三者成互相映射關系,最終得到初始分類模型如表1所示,據此可以通過映射關系進行 K <=> S <=> C 的轉化。
在上述步驟基礎上,對于特定場景再進行提取、歸類特征關鍵詞的工序。即從語料庫和初始分類模型出發,將無任何定義分類的普通詞初始關鍵詞W,提取并歸類為某個確定二級分類下的關鍵詞K的工序。用兩個可以統計指標加權計算的結果來表征普通詞能夠成為特征關鍵詞的可能性,指標一是從關鍵詞視角評估此詞在語料庫中體現的對于二級分類的直接貢獻度,指標二是從二級分類視角內部比較此詞在該二級分類的局部重要度與此詞在全語料庫分類的普遍重要度之比(用TF-IDF Term Frequency-Inverse Document Frequency 理論來表征)。具體過程如下:
2.3.1 計算直接貢獻度
假設每段文本的每個詞每次出現都為某個分類提供了貢獻,首先對語料庫的每段P根據其包含的關鍵詞K建立文本向量[K1,K2,K3,...Kn],其中Kn可重復出現。通過每個K可以轉化為其所隸屬的二級子類S, 得到此段從屬各二級分類的概率。計算公式如下:
(1)
式中P(S)表示該段屬于某二級分類的概率,P(K,S)表示該段文本內隸屬于某具體二級分類的關鍵詞出現的頻次。
再對每段P的文本進行分詞處理,建立普通詞的文本向量[W1,W2,W3,W4,...Wn],其中Wn可重復出現。加和得到每個W對于所有二級分類的貢獻。計算公式如下:
(2)
式中W(S) 表示某詞從屬于某二級分類S的概率,N表示為語料庫PS的大小,P(W)表示某段落包含具體該W的頻次,P(S)表示該段文本從屬于該二級分類S的概率。
2.3.2 計算TF-IDF
從二級分類視角出發,基于TF-IDF理論評估某詞在某二級分類下的特征性度。在此研究中的應用意義是:其中TF是對該詞對于詞二級分類局部重要性的度量,即如果某普通詞W在某二級分類下的文本出現頻率越大,則該次對于這個分類貢獻越大;IDF為倒排分類頻率,表示該次在整個語料庫的分布情況,語料庫中含有該次的文本越少,則該次表示特征時越重要。計算公式如下:
(3)
式中W(TF-IDF,S)為該詞在某二級分類S下的TF-IDF值,S(W)表示某二級分類出現該詞的頻次,S(Wmax)表示該二級分類下出現最多次的詞的頻次,N表示語料庫PS的大小,P(S)表示有該二級分類的文段的大小。
最后加權計算普通詞的兩個特征指標得到該詞對于所有分類可能性,取其最大可能性的分類,如滿足大于該分類閾值(Threshold),則該詞可以歸類為是隸屬于這個分類的K。通過多次迭代該過程,可以得到一個穩定的KS集(3 967個關鍵詞),即形成全國新型研發機構政策演進本文最終研究的有效二級特征關鍵詞合計3 967個。最終形成新型研發機構政策特征關鍵詞提取的分類目錄如表1所示。
在得到最終提取分類后,通過對于語料庫文本進行不同的視角數據源切片(包括年份切片和重點地區切片),經過統計指標來反映其數據特征。
2.4.1 詞頻及其相對占比
因新型研發機構的政策內容相對于其他科研主體類的科技政策尚處在探索發展階段,所以本文假設各級各部門單個政策的重要性是相同的,基于文本挖掘的詞頻分析法,認為如果某政策內容提及越為頻繁,則表明對其關注度越高,即特征關鍵詞一級或二級分類的權重可以用其分類項下所有特征關鍵詞的頻次及其相對占比來表征。

表1 新型研發機構政策特征關鍵詞提取的分類目錄
2.4.2 單位關聯度
某分類與其他分類連接越多,代表關聯越大(數值越大)。這樣每一級分類的關聯度數值即體現了它們與其他類別連接在一起的頻次,即基于共現網絡來體現任意兩個政策內容之間的關聯度。假設所有一級分類下每次獨立出現的關鍵詞作為構成全局網絡的節點,每個一級分類作為一個網絡群,其間每次出現關鍵詞作為一個獨立節點,可以與不屬于此一級分類下任意關鍵詞建立連接。由微觀關鍵詞之間組成關鍵詞共現網絡,將其連接頻次在宏觀上表達為一級分類之間的關聯程度組成分類共現網絡。為了規避各級分類在數據切片上提及詞頻不一導致關聯度偏向提及頻次高的一級分類的問題,對此做同單位量處理,得到單位關聯度。其具體計算方式如下:
對語料庫的每段P根據其包含的關鍵詞K建立向量[K1,K2, K3,...Kn],其中Kn可重復出現。每個K可以轉化為其所隸屬的一級分類C,據此可以得到分類對(Ci與Cj)之間共同出現的頻次,加和某個Ci與其他7個一級分類Cj組成的分類對共現的頻次,記為C1的總實際關聯度R實際。計算公式如下:
(4)
式中R實際(Ci)為某具體一級分類經定量統計后得出的總關聯度,R實際(Ci,Cj)為該一級分類和與之成對出現在同一段文本P內的其他一級分類的關聯度。
為避免關聯度偏向于提及頻次比較多的分類,需對各分類的關聯度作同單位量處理,即計算在同一提及頻次下的表現出來的關聯度,即為單位關聯度。根據梅特卡夫定律,其原意是表達網絡的價值與該網絡的節點數量的平方成正比,應用到此分類共現網絡,可以轉化為每政策內容分類其理論網絡關聯度與其包含的關鍵詞量(頻次)的平方成正比。據此可以求得每一級分類的理論關聯度。計算公式如下:
R理論(C)=C(W)2
(5)
式中R理論(C)為某具體一級分類的總理論關聯度, C(W)為該一級分類包含的所有關鍵詞的出現頻次。
最終通過計算R實際(C)R理論(C)的之比即得到該一級分類的單位關聯度,再將一級分類各項單位關聯度匯總后做單項百分比處理,得到每個分類的單位關聯度占比。計算公式如下:
(6)
(7)
式中R(C)為某一級分類的單位關聯度,R(R,Ci)為某一級分類的單位關聯度占總單位關聯度百分比占比。
全國新型研發機構的政策側重點及互相關聯分析為本文政策演化研究提供錨點,在政策內容分類維度的基礎上,采用文本挖掘的量化分析方法從時間和重點地區兩種角度對全國新型研發機構政策演化過程進行多層多維交叉分析。同時,結合創新的實踐響應及發展階段,系統揭示其演變軌跡和發展趨勢。
3.1.1 政策萌芽期(2014年)
在這一時期,新型研發機構作為一種新型的科研組織形式,其機構主體類型的定義和機構主體的行為被廣泛關注和討論,但是由于與傳統研發機構的組織形式等不同,其又有明顯的獨立性,基于新興創新主體企業的發展需求,此階段機構主體類型以“企業”為主。政策受新興創新主體創立時間短、傳統創新思維定勢以及創新主體管理運營經驗缺乏等各種因素的制約,政府行為此時占據著較重要的地位,需要在政策萌芽期對新興的創新主體進行跟蹤約束,以控制可能出現的風險。政策萌芽期從實施科研行為的主體創新人才入手,拓展與其他政策點的廣泛聯系,符合政策發布初期探索性的特征。
在政策萌芽期,根據表2一級分類項下的特征關鍵詞頻次最高的是機構主體“類型”和“行為”“人才”和“黨的領導”頻次最低,受重視程度不高;“人才”的單位關聯度最高,即“人才”這部分政策內容與其他政策內容的聯系最緊密,“機構主體類型和行為”與其他政策內容的單位關聯度最低,聯系最不緊密。說明在政策萌芽期新型研發機構的主體“類型”和“行為”作為一個新的政策點尚在政策探索階段,受到的重視程度最高,但對其定義和討論相對獨立,“人才”作為實施科研行為的主體在此階段與其他政策點有著廣泛的聯系,但受重視程度在此階段不高,“政府行為”也處于較重要的位置。具體根據表3,新型研發機構政策在政策萌芽期,機構主體行為側重“設施條件”和“收入”,政府行為側重“跟蹤評價”,機構主體類型以“企業”為主,此時“信息披露”和“人才環境”與其他政策點聯系較為緊密。
3.1.2 政策探索期(2015-2016年)
隨著新型研發機構發展,相關政策也處在探索階段,因為創新主體發展的特征,機構主體行為依然是政策發展最重要的部分,新型研發機構通過對創新主體體制機制的深化改革,發掘科技人才創新潛力,此階段成果轉移轉化是作為一項重要的功能需求而存在的,即很多新型研發機構的建立是為了彌補實驗室科研成果到商業應用的空白,政策發展與機構發展的階段相吻合,以激發社會力量參與科技創新,提高創新效率,政府在此階段為了促進新型研發機構發展,政策層面從跟蹤評價轉向更為直接的各項支持,民辦非這種組織形式的重要性有所提升,這符合新型研發機構發展的階段性特征,即其體制機制介于傳統研發機構和企業研發部門之間,可以較靈活的彌補現有體制機制的不足。“黨的領導”從2016年開始單位關聯度持續提升并維持較高水平,黨的十九大報告強調“堅持和加強黨的全面領導”。2019年科技部印發《關于促進新型研發機構發展的指導意見》明確全面加強黨的建設,強化政治引領。
在政策探索期,如表2所示,一級分類項下“機構主體行為”詞頻占比依然最高,受重視程度最高,“人才”和“成果轉移轉化”詞頻占比增長率較高,說明受重視程度獲得顯著提升,但“人才”項下的特征關鍵詞的單位關聯度下降率最大,其與其他政策點的聯系有了明顯下降,獨立性增強;“黨的領導”的單位關聯度在政策探索期顯著提升,相比較萌芽期與其他政策點有了更廣泛的聯系,成為了與其他政策點聯系最緊密的政策點。具體的,根據表3所示,機構主體行為“設施條件”依然最受重視,政府行為側重點從“跟蹤評價”轉向“支持”,機構主體類型中“民辦非”相較于其他類型在此時受重視程度有所提升,“成果轉移轉化”、人才“引進”和“環境”受重視程度提升最快;政府行為“信息披露”、人才“薪酬”和“評價”與其他政策點聯系最為緊密,機構主體行為“收入”、政府行為“約束問責”、成果轉移轉化“知識產權”與其他政策點聯系緊密程度增加較快。
3.1.3 政策快速發展期(2017年)
隨著新型研發機構進入快速發展的時期,創新主體在體制機制改革中的各種問題逐步顯現,政府監督管理的作用開始凸顯,對創新主體的跟蹤評價再次回到重要的位置,信息披露要求也越來越高,發展過程中人才薪酬和成果轉移轉化中的知識產權問題受重視程度增加,從薪酬和人才軟環境切實打造人才引進來、留得住的氛圍。此時人才評價、知識產權和民辦非組織形式與其他政策點有著廣泛聯系。
在政策快速發展期,除了“機構主體行為”仍然最受重視外,“政府行為”在這一時期有了大力發展,詞頻占比增長率最高,受重視程度僅次于“機構主體行為”,“機構主體類型”受重視程度降低;“黨的領導”的單位關聯度持續上升,其余政策點的單位關聯度均有下降,說明“黨的領導”與其他政策點聯系越來越緊密,但其他政策點各自的獨立性增加。具體的,根據表3所示,“機構主體行為”項下各政策點的趨于平衡,政府行為最重視“跟蹤評價”,但“信息披露”受重視程度提升最快,人才“薪酬”和成果轉移轉化“知識產權”也越來越受重視;此時期人才“評價”、成果轉移轉化“知識產權”、機構主體類型“民辦非”與其他政策點聯系最為緊密,機構主體類型“民辦非”“國際交流”“人才環境”與其他政策點聯系緊密程度增加較快。
3.1.4 政策完善期(2018-2019年)
新型研發機構發展呈現平穩的態勢,此時政策逐步進入完善期,在前期政策發展的基礎上,創新主體機構特征與機制重要程度提升,體制機制層面政策進一步細化完善,創新行為與其他政策點聯系更廣泛。人才評價在新型研發機構人才工作中的受重視程度一直不高,隨著人才工作進一步發展,人才評價政策有望得到進一步細化落實。創新環境中重要行業一直略高于國際交流,但相比較于其他類別,這兩項關鍵詞相差不大,說明新型研發機構政策對于國內外的創新環境都很重視。
在政策完善期,政策點的側重比例趨于穩定,與政策快速發展期相差不大,此時“機構特征與機制”詞頻占比增大,機構政策點細化,符合政策完善期特征;“黨的領導”與其他政策點聯系依然最緊密,“機構主體行為”“人才”“創新環境”與其他政策點聯系緊密程度增加。具體根據表3所示,政府行為依然最重視“跟蹤評價”,人才“薪酬”受重視程度繼續提升,機構“戰略需求”、機構主體類型“民辦非”受重視程度也有所提升;機構“收入”、政府“跟蹤評價”、創新環境“行業”與其他政策點聯系緊密程度增加較快。

表2 各政策時期特征關鍵詞一級分類的詞頻(及其相對占比)和單位關聯度
表4和表5是國家及各重點地區特征關鍵詞一級、二級分類的詞頻(及其相對占比)和單位關聯度,按照政策內容,國家層面及各重點地區的新型研發機構政策最重視的都是機構主體行為,但是具體側重點不一樣,國家、北京、上海側重機構業務,廣東、浙江、江蘇側重設施條件。政府行為方面,國家、浙江具體側重政府支持,北京、上海、廣東、江蘇側重跟蹤評價。機構主體類型方面,國家、上海、浙江側重科研類事業單位,北京、廣東側重企業,江蘇企業和科研類事業單位并重。人才工作方面,國家、浙江側重人才環境,北京、上海、廣東、江蘇側重人才引進。
國家層面相較于省市地區最重視機構主體行為,對機構主體類型和創新環境關注較少,創新環境和黨的領導提及頻次較少但與其他政策點關聯緊密。與其他重點地區相比,北京市最重視黨的領導和人才方面,尤其是人才引進;重視程度較低的是機構主體行為、機構體制與特征和成果轉移轉化;黨的領導和成果轉移轉化與其他政策點關聯緊密。上海市最重視成果轉移轉化包括轉移轉化和科技金融方面,同時與其他政策點聯系廣泛,上海政策點中黨的領導與其他地區相比與其他政策點關聯最為緊密。廣東省最重視機構特征與機制,特別是戰略需求;對黨的領導較其他地區關注少,但其與其他政策點關聯較緊密。浙江省最重視機構主體類型和創新環境,具體是關注科研類事業單位和行業環境;對政府行為和人才較其他地區關注少。江蘇省最重視政府行為,特別是政府跟蹤評價。

表3 各政策時期特征關鍵詞二級分類的詞頻(及其相對占比)和單位關聯度

表4 國家及各重點地區特征關鍵詞一級分類的詞頻(及其相對占比)和單位關聯度

表5 國家及各重點地區特征關鍵詞二級分類的詞頻(及其相對占比)和單位關聯度
本文采用系統、客觀分析工具研究全國范圍內新型研發機構相關政策的演化過程及特征,全面梳理了政策脈絡,為政策進一步制訂完善提供系統與客觀參考。采用文本挖掘的量化分析方法從時間和重點地區兩種分類角度對全國新型研發機構政策特征關鍵詞權重和互相關聯進行分析,對全國新型研發機構政策演化過程進行多層多維交叉分析,結合創新的實踐響應及發展階段,系統揭示其演變軌跡和發展趨勢,為我國新型研發機構政策制定提供參考。本文主要結論包括:
通過分析可以看出我國新型研發機構政策的演化路徑,綜合分析結果和科技創新實踐,將新型研發機構政策依次劃分為政策萌芽期、政策探索期、政策快速發展期和政策完善期。全國新型研發機構政策在發展的萌芽期,機構主體類型的定義和機構主體的行為被廣泛關注和討論的,此階段機構主體類型以企業為主,政府行為此時也占據著較重要的地位,需要對新興的創新主體進行跟蹤約束,控制可能出現的風險。隨著新型研發機構發展,政策探索期,此階段成果轉移轉化是作為一項重要的功能需求而存在,新型研發機構通過對創新主體體制機制深化改革,發掘科技人才的創新潛力,介于傳統研發機構和企業研發部門之間的民辦非組織形式的重要性有所提升,較靈活的彌補現有體制機制不足,政府從跟蹤評價轉向更為直接的各項支持。隨著新型研發機構進入快速發展的時期,創新主體在體制機制改革中的各種問題逐步顯現,政府對創新主體的跟蹤評價再次回到重要的位置,信息披露要求越來越高,人才薪酬和成果轉移轉化中的知識產權問題受重視程度增加,從薪酬和人才軟環境切實打造人才引進來、留得住的氛圍。隨著新型研發機構發展呈現平穩的態勢,政策逐步進入完善期,體制機制層面政策進一步細化完善,創新行為與其他政策點聯系更廣泛。
各重點地區新型研發機構政策根據自身發展側重點不同各有特點。國家層面的新型研發機構政策突出宏觀指導的特征,相較于重點省市地區最重視機構主體行為,具體在機構業務、政府支持、科研類事業單位、人才環境有所側重,創新環境和黨的領導提及頻次較少但與其他政策點關聯緊密。北京市新型研發機構政策相較其他重點地區,更重視黨的領導和人才引進方面,以人才工作為抓手側重政策實施的軟環境。上海市最重視成果轉移轉化包括轉移轉化和科技金融方面,上海政策點中,黨的領導與其他地區相比與其他政策點關聯最為緊密。廣東省最重視機構特征與機制,特別是戰略需求,對黨的領導較其他地區關注少,政策方向務實、可操作性強。浙江省最重視機構主體類型和創新環境,具體是關注科研類事業單位和行業環境;對政府行為和人才較其他地區關注少。江蘇省最重視政府行為,特別是政府跟蹤評價,相較于其他省份,江蘇更側重于成果轉移轉化型新型研發機構,其對于企業和科研類事業單位關注度并重,體現了江蘇政府對于新型研發機構利用社會資本可持續性發展的關注。
本文以國家層面及各省市區的新型研發機構政策文本為全國性政策分析的依據,運用文本挖掘方法對全國新型研發機構政策進行演進過程與特征分析,研究結果從本質上揭示了全國及各重點地區新型研發機構政策的演變規律與主題特征。本文針對研究結論提出如下建議:
(1)完善新型研發機構政策體系。目前新型研發機構政策根據創新主體行為發展的客觀事實而制定,尚在探索階段,缺乏系統性的共性的政策體系,各省市區也在國家政策的指導下探索與本地區原有科技創新發展情況相適應的政策,并根據新型研發機構的發展實際作出政策調整,建議根據創新實踐多元需求,充分考慮政策體系的復雜性、系統性等特征,在新型研發機構的共性問題上給予政策指導,在新型研發機構與傳統研發機構的本質上予以區分,有利于政策的針對性,避免政策的交叉重復,以及由此導致的過度或無效指導問題。新型研發機構政策的系統性既要從廣度上構建創新全鏈條的匹配政策制度,也要從深度上解決實際問題。建立健全政策的跟蹤反饋、監督追責等相關制度,完善政策實施效果統計評價機制。
(2)各省市區制定新型研發機構政策各具特色,政策之間通用性與差異性相協同。從以上分析可見全國各重點地區的新型研發機構政策各具特點,在遵循國家政策的基礎上都各自有側重點,隨著創新活動的快速發展,各省市區新型研發機構互相之間的合作交流甚至合作共建會越來越多,政策之間的協同性將會越來越受到關注,不同領域的差異性也會凸顯,在增強政策協同性的同時,政策的專用性需求也在增加,這對政策制定的的多元化需求將增加,找準政策需求,切實提高政策供給的水平與質量,進一步實現新型研發機構政策的整體協調發展。
(3)加強部門之間協調配合機制,有效避免政策銜接不暢的問題,切實發揮政策效果。政府各部門之間政策互認不足、政策資格認證手續繁瑣等實操過程中遇到的問題往往是政策實施不力的主要原因。因此,加強各政府部門間的溝通與協調,提高各級政策制定的協調度,簡化政策實操過程中的繁瑣手續,以確保各類政策制定的合理性和可操作性。在對科技創新的重點領域進行政策傾斜的同時,要關注政策的共性問題,在人、財、事、物等共性問題上,各政府職能部門達成共識,完善創新實踐過程中的政策措施,以實現政策制定與實施的有效統一。