曹樹金 岳文 玉





DOI:10.3969 / j.issn.1008-0821.2021.12.001
〔中圖分類號〕G250 2; G259 2 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2021) 12-0004-13
創新是指“人們為了發展需要, 運用已知的信息和條件, 突破常規, 發現或產生某種新穎、獨特的有價值的新事物、新思想的活動”。我國在黨的十八大提出, 實施創新驅動發展戰略,強調要推動以科技創新為核心的全面創新,堅持把創新作為引領發展的第一動力。2020 年9 月11 日, 習近平總書記主持召開科學家座談會, 強調基礎研究是科技創新的源頭, 要把原始創新能力提升擺在更加突出的位置。2021年5月28日, 習近平總書記出席中國科學技術協會第十次全國代表大會,指出當前我國原始創新能力還不強,創新體系整體效能還不高, 科技創新資源整合還不夠, 科技創新力量布局有待優化等問題。這充分表明,我國對于科技創新的高度重視,“科技創新”“原始創新” 和“自主創新” 已經成為中國新時代的關鍵詞,提高創新能力已是刻不容緩。提高創新能力的途徑之一是從信息資源中挖掘支持創新的情報,以發現知識,揭示規律, 引導創新活動。本文就情報學和情報工作對創新驅動、科技創新、原始創新所作的已有研究進行回顧, 運用可視化軟件Citespace,梳理當前國內外支持創新的情報學研究主題, 展望未來發展趨勢, 并提出相應建議,旨在為后續研究與實踐提供參考。
1數據來源與研究方法
本研究選用中國知網平臺數據作為中文論文數據來源, 直接以“情報支持創新” 為主題進行精準檢索后發現檢出文獻較少, 考慮到可能出現漏檢情況, 本研究對檢索詞進行不同方式的組合與檢索, 以保證研究樣本的代表性。2021年6月24日在CNKI數據庫中運用高級檢索: 將檢索主題詞設為(主題=創新)并且(主題=情報)并且((篇關摘=支撐)或者(篇關摘= 支持)或者(篇關摘= 助力),文獻分類目錄選擇“情報學、情報工作”, 檢索年限范圍不限。外文文獻數據來自Web of Science(WoS)數據庫, 選取WoS核心數據庫,以(((TS=(improve innovation) OR (TS=(for innovation)) OR(TS=(enhancing innovation))) AND TS =(informa?tion)) OR TS=(intelligence))為檢索式, 研究方向選擇“ INFORMATION SCIENCE LIBRARY SCI?ENCE”, 限定文獻類型為Article。為了保證分析結
果的準確性, 通過人工逐篇瀏覽的方式, 剔除掉內容與情報支持創新相關性較小或不相關的文章, 例如“近五年來國內外競爭情報對比研究” “Explo?ring the Role of Structural Holes in Learning: An Em?pirical Study of Swedish Pharmacies” 等, 與情報支持創新的研究關系不大。另外, 剔除掉非研究型論文, 例如書評、工作報告以及會議新聞等, 最終得到150 篇中文文獻樣本和111 篇英文文獻樣本。
在研究方法上, 本文采用文獻計量方法和可視化圖譜展示對國內外支持創新的情報學研究的相關文獻進行分析。本文通過統計數據和結果分析相結合的方法對相關論文發表數量進行研究; 在研究熱點和研究前沿分析上, 運用可視化工具Citespace,進行關鍵詞的聚類分析和突現詞檢測, 對數據進行布局, 并對標簽、節點以及顏色進行調節, 歸納該領域的熱點研究主題和前沿趨勢。
2中外文期刊論文發表趨勢分析
發文量的歷時變化是衡量特定研究領域發展態勢的重要指標。本文對檢索結果中的150 篇中文文獻樣本和111篇英文文獻樣本進行數據統計, 分析其時間分布如圖1所示。
通過分析樣本文獻的時間分布可知, 國內關于支持創新的情報學研究起步于1999年,國外的相關研究起步于1994 年, 在產出數量方面國內2 篇核心文獻,國外1篇核心文獻, 發文量均處于較低水平。2006年后,我國明確提出要建立以企業為主體、以市場為導向、產學研結合的創新體系,相關研究成果逐年增加, 2016 年中共中央、國務院發布實施《國家創新驅動發展戰略綱要》, 相關論文在2016 年達到最高峰。自2017年后, 產出數量雖有下降,但總體處于穩定增長趨勢。計算國內論文時間分布趨勢線, 得到擬合曲線的指數型函數為y =8E-112e0 128x,擬合程度較高(R2=07386>0),這在一定程度上說明情報學中支持創新的研究呈現逐年遞增的發展趨勢, 未來我國仍會繼續產出相關成果,并保持在較高水平。縱觀國外相關文獻的產出情況, 整體呈現穩定增長態勢, 其擬合曲線的指數型函數為y=2E-95e0109x, 得到R2=06621>0,表明情報支持創新的研究在國外受到一定程度的重視, 文獻數量處于穩步增長態勢。
3支持創新的情報學研究熱點主題分析
領域研究熱點主題可以通過對關鍵詞的聚類進行揭示。關鍵詞聚類分析是“以共詞分析為基礎,利用聚類的統計學方法, 把眾多分析對象之間錯綜復雜的共詞網狀關系簡化為數目相對較少的若干類群之間的關系并直觀地表示出來的聚類的過程”。本文利用Citespace繪制中英文論文的關鍵詞共現網絡, 由于聚類的序號越小, 類所包含的關鍵詞越多, 越具有代表性。通過試驗發現, 將中文論文聚類數設為K =15、英文論文聚類數設為K=16時代表性較弱, 因此本文將中文論文聚為14類, 英文論文聚為15類, 發現聚類效果最好。由于軟件采取自動抽取關鍵詞的方式進行聚類標注, 其產生的標注結果可能會過于具體化, 導致出現聚類主題不能被有效描述或不宜解讀等問題, 因此, 本文剔除意義模糊的類群, 包括: 英文論文的#3 collabora?tive filtering、#4 information technology affordance、#6 impact、#9 research and development、#10 global?ization、#12 diffusion。最終, 中文論文一共產生了14 個有效聚類, 英文論文產生了8個聚類, 生成關鍵詞聚類知識圖譜, 如圖2、圖3 所示, 并列出中英文論文聚類內的主要高頻關鍵詞, 如表1、表2所示。模塊化系數Modularity Q和平均輪廓系數Silhouette 是衡量關鍵詞聚類質量的標準, 其中Modularity Q 和Silhouette 值越接近1, 網絡的模塊性越好, 主題聚類越明顯。從圖2 可以看出, 中文論文關鍵詞共現網絡由372 個節點, 511 條連線組成。中文論文的關鍵詞聚類結果為Modularity Q=08692, Silhouette=0 9589, 表明聚類內部和聚類之間的關系密切, 關鍵詞聚類具有合理性。從圖3可以看出, 英文論文關鍵詞共現網絡由456個節點, 1305條連線組成, Modularity Q= 07957, Sil?houette=09342, 表明聚類結果較為合理。
為了便于描述概括, 結合圖和表, 以及對國內外研究樣本文獻的梳理, 考慮各類群的緊密程度,將支持創新的情報學研究主題歸類到8 個方面, 對聚類的整理歸類如表3所示。
3.1面向創新的競爭情報利用
競爭情報的有效利用作為提升和保持區域與企業競爭優勢的重要途徑不容忽視。目前, 國內外的研究傾向于企業競爭情報、產業競爭情報、區域競爭情報服務的方法與模式, 以及技術競爭情報的相關研究。競爭情報是實現企業技術創新的關鍵,融合企業內部信息實現企業技術創新共享是十分重要的。特別是在大數據時代, 企業競爭情報分析與利用正面臨著企業內外專利數據的有效集成和
可視化發展的問題, 如Bose R分析了可視化競爭情報工具的作用, 認為新興工具有助于企業快速高效地制定戰略計劃,提高競爭能力。在產業競爭情報的理論和實踐方面, 相關研究主要涉及競爭情報分析方法、產業競爭情報服務模式以及面向省域、縣域產業發展等。如Etzkowitz H等構建了基于共享的“三重螺旋服務模式”。在區域競爭情報服務方面, 學者們對如何獲取區域內創新主體對于競爭情報服務的需求以及影響服務的障礙因素進行了探討; 在服務體系和服務模式構建方面, 學者們對跨國競爭情報合作模式、多元化競爭情報服務模式、線上數據融合的聯動供給服務模式?、大數據時代下的競爭情報服務體系等進行了研究。國外更加注重對技術競爭情報的研究, 特別是技術競爭情報在維持競爭優勢中的作用、理論、方法和工具對于技術創新和商業決策的支撐作用。
3.2 面向創新的知識管理
知識管理是通過創造和應用知識提升組織績效的過程。知識共享是實現知識管理的前提, 同時也是知識創新的核心要素。當前關于知識共享的研究主要分為三大部分: 一是知識共享的機理研究; 二是知識共享的影響因素研究; 三是知識共享績效研究。智庫作為知識型研究機構, 為政府決策提供有利于決策的情報服務。知識管理作為智庫競爭力的核心, 其本質就是知識的開發利用和創新。學者們對知識管理視野下的智庫建設展開了研究, 認為智庫應從知識生產全過程視角開展知識管理活動,為了保障智庫產品的質量, 智庫情報機能問題應引起重視。
3.3創新識別的情報學方法
運用情報分析方法識別領域科技創新規律和創新路徑對于把握科技前沿至關重要。相關研究主要包括科技創新機會、創新演化路徑、突破性創新以及文獻創新點的識別。新技術的發展為企業的技術創新提供了可能, 對于技術創新機會的準確把握有助于企業的創新發展。創新機會識別的研究主要集中于對機會識別過程的研究, 主要包括創新機會識別過程影響因素分析、創新機會識別過程模型研究以及基于專利分析的創新機會識別過程研究。在做出創新決策之前, 需要考慮創新技術的發展周期和演化路徑。學者們對創新演化路徑識別方法進行了研究, 包括引文主路徑識別方法?、基于文本主題詞分析的識別方法以及多元關系融合的識別方法。突破性創新是指可以取代原有技術, 實現突破性進展的技術創新。目前,突破性創新識別方法主要包括專家判斷法、主題突變檢測法、引文網絡分析法、機器學習算法模型識別法等。
3.4面向創新需求的情報服務與人才信息素養培育
面向創新的情報服務是指在創新驅動發展的大背景下, 以信息和知識的搜尋、組織、分析、重新構建為基礎, 為其他主體提供知識密集投入的服務。提供情報服務的智庫、各類圖書館以及情報服務機構以創新領軍人才的情報需求?、高校圖書館用戶的真實情報需求、創新創業企業的情報需求等為驅動實現面向創新的情報服務。當前國外多從情報服務的研究方法層面展開研究,包括結構方程模型法、系統動力學模型法、博弈論模型法等。國內研究多從協同理論視角進行情報服務的研究, 包括服務模式的探索、知識服務實現技術、智庫情報服務的功能定位和體系構建以及協同創新平臺的建設等。
在面向創新的人才信息素養培育方面, 高校圖書館發揮了整合信息素養教育資源的作用, 包括構建協同教育模式、建立信息素養協同教育機制以及實施校企合作等。相關研究指出, 在創新導向下,應該更加注重人才的信息分析能力、科研創新能力、創新思維方式等方面的培養。
3.5應用于創新的情報學理論方法
情報學理論在網絡服務、區域發展、企業科研以及軍事國防等各創新領域中發揮著重要作用。在網絡服務創新中, 六度空間理論和相關性原理得到了廣泛應用, 提高了網絡服務的整體性能。在企業創新中, 知識管理理論、知識地圖理論以及競爭情報理論應用到企業的創新實踐中,促進了企業的持續創新發展。另外, 在分析科技情報的模式創新、教育方式創新以及分析學科動態的創新研究中, 知識圖譜理論也發揮著重要作用。從情報學自身來講, 情報學理論在與其他學科進行融合的過程中, 將自身的理論應用于創新, 使其得到延伸和發展, 推進創新理論與實踐的統一。
3.6面向創新的專利情報分析
專利情報服務在科技決策和創新資源配置等方面發揮著關鍵作用。高校圖書館與專利情報服務的探討是當前學者們關注的一大熱點。在需求分析方面, 學者們分析企業技術創新和產業技術創新的需求特征, 探討高校圖書館專利信息服務面臨的障礙并提出對策建議。在專利信息服務方式方面, 有的學者提出構建高校圖書館協同創新的網絡專利情報服務模式、地方專利信息服務管理方案以及面對政府、企業、高校及科研機構不同對象的嵌入式專利信息服務方式。在高校創新創業專利服務方面, 高校圖書館多是開展專利文獻檢索、專利情報服務平臺建設、開設相關課程, 加強專利情報教育以及專利數據庫使用培訓等方面。在專利情報服務高校科技創新的研究方面, 學者們利用專利情報分析對高校的技術創新進行評價以及從合作研究等方面結合專利數量對高校創新能力進行評價研究。企業技術創新和專利情報研究也是當前的研究熱點, 基于企業技術創新的專利情報價值被不斷地挖掘、研究與應用。相關研究主要涉及專利信息挖掘指標研究、開放共享的專利信息應用服務平臺建設、企業專利情報戰略體系構建等。
3.7情報、情報工作和情報服務對創新的作用
本主題主要包括兩方面的內容: 一是科技情報服務和科技情報工作對于科技創新的支撐作用; 二是文獻情報工作對于知識創新的推動作用。一方面, 科技情報服務和科技情報工作對于科技創新的支撐作用主要體現在3個方面: 一是資源的保障作用; 二是導向參謀作用; 三是推進科研成果轉化的作用。另一方面, 文獻情報工作對于知識創新的推動作用主要體現在3個方面: 一是文獻情報工作是知識創新的思想資源, 有效的文獻情報服務為知識創新提供信息資源和創新素材以提高科研效率; 二是文獻情報服務是知識應用的中介, 可以實現有效的知識擴散和轉移; 三是有利于創新人才的培養,為創新人才的培養提供強有力的信息保障 。
3.8面向創新的信息共建共享與平臺建設
創新活動需要開放且經過知識化關聯分析的信息資源服務的支持, 因此, 如何提高協作研究中知識的管理、傳播、融合與共享, 實現信息增值服務, 建立面向創新的情報平臺是當前學者關注的重點。為了發揮圖書館自身的資源優勢, 學者們探索了如何利用圖書館資源建設和共享來促進企業科技創新, 例如: 探索圖書館、科研機構院校以及商業數據庫之間的信息資源共建協作模式和以地域協作為主并注重各單位特色資源的信息資源共建協作模式等。在面向創新的政務信息資源建設與共享方面, 學者們相繼提出了優化政務資源共建共享的建議, 包括創新管理模式、基于社會進程與技術的政務信息整合模型、加強不同政府機構之間的數字化協作等方面。面向創新的情報平臺建設的研究主要包括以信息提供為主的科技信息創新服務平臺建設研究面向公共數字文化 、區域 、產學研協同創新的信息平臺建設研究。
4 支持創新的情報學研究趨勢
為了進一步探究支持創新的情報學研究趨勢,本文利用突變值檢測分析突現詞的動態變化特征,了解不同時期較為活躍的研究主題并追蹤該研究的未來走向。本文利用Citespace 中的突變值檢測算法對中英文樣本文獻進行關鍵詞的突現檢測, 并對檢測結果進行量化統計, 其中Strength 表示詞的研究熱度, Begin、End表示關鍵詞突變的起止時間, 如圖4、圖5所示。
從突現詞分析結果來看, 不同的突現詞出現在不同時期, 這表明支持創新的情報學研究呈現多元化特征。在中英文樣本文獻中, 強度最大的關鍵詞是專利和competitive intelligence, 其值分別為4.6和3.83; 最長突現時間是知識創新和knowledgemanagement,分別是9 年和7 年。值得注意的是,中英文論文近幾年突現的關鍵詞是學術評價、知識圖譜、顛覆性技術、innovative recognition、neuralnetworks、machine learning, 表明這些關鍵詞代表的研究主題在近期支持創新的情報學研究領域中較為活躍, 可認為是支持創新的情報學研究的前沿性主題。結合圖4、圖5 中近幾年的突現詞、本文采集的樣本文獻以及情報學的發展現狀可知:
近年來, 學者們將自然語言處理技術和機器學習技術引入到學術論文的創新評價中, 例如: 索傳軍等論述了將認知計算運用在學術論文評價的新思路; 楊京等提出一種利用Keygraph 算法基于研究主題對比的學術論文創新力評價方法。在創新識別方面, 對于創新的有效識別主要集中在對顛覆性創新的識別, 例如: Buchanan B等提出了一種用于發現特定領域是否存在潛在顛覆性技術的識別框架; 蘇敬勤等提出將“專利影響因子” 作為計量指標用于顛覆性技術的早期識別。目前, 對科學基礎研究中創新識別的研究較少。知識圖譜通過機器學習、數據挖掘以及信息可視化技術將復雜的領域知識展示出來, 用來揭示領域知識的演化路徑和發展趨勢, 已成為當前支持創新的情報學研究中的一個趨勢。例如: 中國科學技術信息研究所率先基于海量多源的科技創新要素, 利用可視化技術,進行中國科技創新圖譜的研究, 輔助科技創新管理與決策。為了可以更好地捕捉實體和關系間的復雜語義, Socher R等和Dettmers T等將神經網絡的方法引入到知識圖譜中實體間的向量表示。
5支持創新的情報學研究建議
結合中英文論文研究熱點主題、近幾年的突現詞、國家出臺的相關政策以及情報學的發展現狀,本文認為今后一段時間, 探索理論、方法和技術,利用文獻、信息、數據, 研究創新、監測創新和引導創新將成為在創新驅動發展戰略環境中支持創新的情報學研究的核心內容, “創新情報” 將貫穿整個情報學研究領域, “創新情報學” 將有可能應運而生。為此, 近期可以聚焦在以下幾個方面加強研究。
5.1面向創新的學術成果評價
在當前改革科技評價制度的背景下, 需要科學的學術評價推動學術創新。習近平總書記在全國科技創新大會上提出: 要改革科技評價制度, 建立以科技創新質量、貢獻、績效為導向的分類評價體系, 正確評價科技創新成果的科學價值、技術價值、經濟價值、社會價值、文化價值。對科技論文的評價應具體體現在對其創新點的新穎性、創新成果的有用性以及方法創新的科學性的測度。目前, 主題的自動識別、主題的分類和聚類等自然語言處理技術已有成熟應用, 將情報分析技術和人工智能相結合的方法運用于科技成果, 尤其是科技論文創新評價有相當的應用潛力和價值。
為了提高科技論文的創新質量, 必須研究科技論文創新內容的利用理論及其規律。聯合情報學、人工智能、計算機科學等相關學科的力量, 優化創新計量指標并與文本內容分析相結合, 充分發揮識別和分析創新知識單元方面的優勢, 應是未來學術論文評價研究的重點。另外, 目前的情報檢索系統或知識發現系統不支持對科技論文創新質量和創新價值的評價, 應對這方面進行理論、方法和應用探索, 引導學術評價向“重創新” 轉變, 為情報學支持國家創新戰略作出具體貢獻。
5.2創新情報的識別和抽取
從情報學角度研究創新是情報學支持創新的重要路徑之一, 從情報學角度研究創新就是要研究從創新活動和創新成果的記錄中, 識別各領域的創新成果、創新的要素、創新的路徑以及創新的方法。目前, 對科學基礎研究中創新識別的研究較少, 以論文為對象的學術創新的識別與挖掘研究是近年新興的研究方向[120] 。
未來創新情報的識別和抽取可以進行以下兩個方面的探索: 一方面, 是對公開出版的科技論文中創新點的識別和抽取, 探索利用人工智能技術抽取更加豐富的創新要素, 包括但不限于創新對象、創新基礎、創新層次、創新貢獻、創新類型等, 進而達到更加全面地針對科技論文創新進行識別的效果; 拓展深度學習方法在細粒度信息抽取方向的應用, 形成面向科技論文的創新情報挖掘和創新知識發現的理論方法; 另一方面, 從大量迅速增長的專利文獻中識別出具有技術前沿性的專利, 構建多維度的專利內容新穎性指標, 對突破性創新進行早期識別。同時, 對各領域發明專利所涉及的創新要素與創新規則進行深入分析, 探索更具操作性的理論工具體系, 挖掘創新要素之間隱藏的邏輯和規律,以提高行業的技術創新決策效率, 挖掘新的創新機會。
5.3創新情報的組織和檢索
當前,細粒度信息單元的識別和描述以及面向情境的信息檢索理論方法已經有一定的發展, 知識圖譜作為知識組織工具可以實現復雜的語義檢索和深度的知識服務, 知識圖譜方法和技術的利用在商業和學術領域也都有了一定的進展。這些探索為開展支持創新的情報組織與檢索研究提供了重要的理論前提和方法基礎。特別是這些年信息資源聚合、知識關聯以及可視化的相關研究已經逐漸深入, 這些可以使得支持創新的情報組織與檢索能夠取得較大的進展。
支持創新的情報組織與檢索研究可以進行以下主題的探索: 各類型、各領域、各主題文獻中創新情報特征的基礎研究、創新情報知識圖譜的自動或人工輔助構建、利用創新知識圖譜對文獻中創新情報進行描述、構建創新情報檢索系統或功能的情報組織機制以及基于創新知識圖譜的創新情報檢索方法和技術的研究。未來, 在創新情報組織的基礎之上, 知識組織將融合先進信息技術和豐富的經驗積累, 朝著組織對象的細粒化、組織原則的關聯化、組織功能的多樣化、組織目標的情境化、組織應用的交互化、組織形式的可視化以及組織工具的圖譜化等方向發展。
6結論
本文運用文獻計量學的方法, 以WoS核心數據庫和CNKI 數據庫中支持創新的情報學研究的期刊論文作為數據源, 借助可視化軟件Citespace, 對支持創新的情報學研究的文獻發表趨勢、研究熱點主題和研究前沿趨勢進行可視化分析和探討。得到以下結論:
1)從論文發表趨勢來看, 中外文期刊發文量呈現較為平穩的上升趨勢, 并都在2015年之后呈現快速上升的趨勢, 結合相關政策和國內外情報學的發展現狀, 表明該研究領域正在逐步受到學者關注, 影響力也相應提高。
2)研究熱點方面, 支持創新的情報學研究主要集中在面向創新的專利情報分析、面向創新的競爭情報利用、面向創新的知識管理、創新識別的情報學方法、面向創新需求的情報服務與人才信息素養培育、應用于創新的情報學理論方法、情報、情報工作和情報服務對創新的作用、面向創新的信息共建共享與平臺建設等方面。通過對比分析可以發現, 論文研究主題呈現多元化特征, 各主題既有交叉, 又有顯著不同。中外文論文研究主題各有側重點, 外文期刊論文研究熱點主要集中在信息技術、創新信息需求、創新知識發現等相關研究, 中文期刊論文研究熱點主要集中于情報學和情報工作對于創新的作用、面向創新的信息資源共建共享與平臺建設等方面。
3)近期支持創新的情報學研究可以主要進行以下幾個方面的探索: 面向創新的學術成果評價、創新情報的識別和抽取以及創新情報的組織和檢索。
目前, 對于支持創新的情報學理論、方法和技術探索尚處于初級階段。理論上, 情報學理論、方法和技術對科技和產業的創新活動的支持應該是高效可行的, 情報學的研究實踐應該以充分發揮情報學在這一領域的作用為重要目標。因此, 深化創新情報理論, 加強對支持創新的情報學的系統研究,甚至創新情報學, 是今后努力的一個方向。
(責任編輯:孫國雷)