艾繼濤,張仕華,鄭新章,宗國浩,王金棒*
1 中國煙草總公司鄭州煙草研究院,鄭州高新技術產業開發區楓楊街2號 450001;2 《中國煙草學報》編輯部,北京 100045
科技論文發表的數量指標和科技論文的被引用指標不僅可以衡量一個國家、行業或機構的科學研究活動、科研投入、學術水平、人才實力、科研效益的整體情況,也是科技生產力的具體體現[1]。其中,SCI論文更是被認為是測度知識產出水平的重要指標[2],雖然應防止簡單“以刊評文”,反對“唯論文”和論文“SCI至上”等不良傾向,但在過去的相當長一段時間,一般認為SCI論文代表了較高水平的科研成果,并與科研人員的職業發展密切相關,其發表情況和發表領域具有一定的參考價值。
近年來,科學計量和知識網絡分析作為專門的研究方法或領域得到了迅速發展,是情報研究人員應對大數據情景的重要工具[3]。朱晉偉等[4]、臧祺超等[5]分別以Web of science中“開放式創新”和“團隊社會網絡”文獻數據為對象,從知識網絡視角對相應領域的知識圖譜進行了整體分析,對相關行業科技創新均起到了積極推動作用。當前我國煙草行業正全面推動高質量發展,高度重視科技創新工作,特別是在面對傳統卷煙增長拐點,控煙壓力增大和新一代煙草制品的沖擊下,準確把握我國煙草科研工作現狀和發展趨勢,了解科研產出“家底兒”,對推動行業科研平臺建設、科技創新機制變革都有至關重要的作用。在國際煙草科技論文分析方面,鄭新章等[1]統計分析了2002—2006年CORESTA和TSRC兩個國際會議論文集,對國內外各研究主體的熱點領域、科技論文分布等進行了深度剖析。但自此之后鮮見相關研究報道,因此,本文采用文獻計量學、知識網絡分析和社會網絡學等情報分析研究手段,對我國煙草行業內單位2011—2019年度公開發表的SCI科技論文(不含綜述)進行了統計分析,以期對我國煙草科研能力與水平進行客觀評價,并通過定量分析探討其研究熱點或重點發文領域,為我國煙草科研人員準確把握科研選題以及管理部門制定相關科技政策等提供參考。
數據來源:在科技論文統計源的選擇方面,為盡可能全部覆蓋統計年度內我國煙草行業所發表的SCI論文,統計源包括中國煙草科教網文獻數據庫、煙草科研大數據論文上報系統、以及Web of Science的SCI核心合集論文數據庫。在檢索策略上,同時檢索作者地址或單位中的“tobacco or cigarette or cigar”和“China”字樣。檢索時間:2020年9月1日,經人工判讀清洗后,按照作者單位含有我國煙草行業單位進行篩選,獲得論文總數共2289篇(不含綜述)。
特別需要說明的是,中國農業科學院煙草研究所(中國煙草總公司青州煙草研究所,簡稱“青州所”)、河南農業大學煙草學院(國家煙草專賣局煙草栽培生理生化研究基地,簡稱“栽培基地”)等是我國重要的煙草領域科研機構,但因為不屬于嚴格意義上的煙草行業內單位,且與煙草相關的研究主要體現在與煙草行業單位合作的論文中,因此并未單獨參與分析。為方便統計,并與中科院各個研究所保持一致,青州所的論文歸并入中國農業科學院,栽培基地的論文歸并入河南農業大學。
采用北京正乙科技有限公司設計開發的文獻分析工具ITGInsight(通用科技文本可視化挖掘系統)進行文獻計量分析。采用HistCite軟件對檢索論文的本地引用情況進行統計分析。在單位歸并方面,為準確反映各省級工業和商業企業的科研情況,除其設立的煙草科研機構進行單獨分析外,其余均并入相應的省級公司。在技術領域分類分析方面,為使分析結果更貼近煙草行業實際,采用人工標引,重點參考了中國圖書館分類法(CLC)、煙草科技期刊欄目、CORESTA組織分學組設置、煙草科研大數據資源體系表等分類標準[6-7]。
圖1為2011—2019年我國煙草行業內單位發表的SCI論文和作者數量的分布情況。可以看出,變化趨勢可分三個階段,2011—2013年,二者基數較小但增長迅速,年均發文增長率為52.4%;2013—2018年,增速緩慢,年均增長率為4.7%;2018年后,又呈現快速增長趨勢,相比于2018年,2019年發文402篇,增長了28.0%。

圖1 2011—2019年我國煙草行業內單位SCI論文年度發文量Fig. 1 Annual publication volume of SCI papers in China's tobacco industry from 2011 to 2019
行業高被引SCI論文top20如表1所示。可以看出,高被引論文發表期刊影響因子普遍較高,最高的是Nature Genetics,IF(2019)=27.6,影響因子平均為7.5,中位數為6.2;從研究內容上分析,屬于煙草行業應用性研究的只有4篇,研究內容分別是關于抗TMV活性化合物、煙草秸稈的燃料化應用、植煙土壤增鉀菌的分離鑒定等,其中抗TMV活性化合物的研究受行業內外同行的關注度較高,被行業內外高頻次引用。其余論文多是基礎性或應用基礎性研究,顯示煙草行業科研力量產生了明顯了外溢效應。

表1 我國煙草行業SCI論文全球引用頻次Top20Tab. 1 The distribution of the top 20 highly cited SCI papers in China tobacco industry
發文量排名前15的行業內單位以及合作發表的行業外單位如表2所示。可以看出,煙草科研機構以及工業企業是SCI論文的主要產出單位,其中前三家單位優勢明顯,發文最多的是中國煙草總公司鄭州煙草研究院(以下簡稱“鄭州煙草研究院”),發文381篇,其次是云南省煙草農業科學研究院和云南中煙工業有限責任公司,分別有315篇和301篇。前20名中煙草商業企業有3家,分別是云南省煙草公司、河南省煙草公司和貴州省煙草公司,分別發表了59篇、37篇和34篇。

表2 發文量排名前15的行業內單位和行業外合作單位Tab. 2 The top 15 in-industry agencies and out-of-industry collaboration agencies in terms of number of published papers
與煙草行業內單位合作發表論文較多的行業外單位主要是中國科學院,269篇,其次是云南大學、云南民族大學、中國農業科學院和浙江大學等。除了中國科學院與中國農科院,以及具有顯著地域性特點的云南、河南、安徽院校外,浙江大學、中國農業大學也都深度參與了行業科技創新,并有后來居上之勢。
進一步分析了排名前30位單位的創新協作情況(見圖2),可見與行業內單位協作較多的單位具有明顯的地域性特點,關系比較緊密的有:鄭州大學與鄭州煙草研究院、中國科學技術大學與安徽中煙、云南民族大學和云南大學與云南中煙等。細化分析中科院系統的合作情況,可知全國共有55家研究院所與行業內單位合作發表SCI論文,其中聯合發表10篇以上的院所共有6家,分別是中科院大連化物所(45篇)、中科院昆明植物研究所(36篇)、中科院新疆生態與地理研究所(24篇)、中科院合肥物質科學研究院(13篇)、中科院南京土壤研究所(12篇)和中科院昆明動物研究所(11篇),其協作網絡同樣具有顯著的地域特點。

圖2 2011—2019年我國煙草行業內單位SCI論文與行業外單位的協作網絡分析Fig. 2 Collaboration network analysis of in-industry agencies and out-of-industry collaboration agencies in China's tobacco industry based on number of published SCI papers from 2011 to 2019
我國煙草行業內單位SCI論文共發表在700個期刊上,其中發文量在20篇以上的期刊共16個,見表3。在這16個期刊上,我國煙草行業2011—2019年合計發表論文554篇,占總數的26.7%,集中度相對較低。在主要發文的17個期刊中,《Talanta》、《Journal of Agricultural and Food Chemistry》、《Scientific Reports》和《Journal of Chromatography A》四個期刊影響因子超過了4,其余相對偏低。

表3 發文量在20篇以上的期刊排名情況Tab. 3 Ranking of journals with more than 20 published articles in China tobacco industry
為了評價已發表的SCI論文對行業科技創新的促進作用,以檢索到的2289篇文獻為基礎建立數據庫,統計數據庫內部的引用關系,見圖3所示。可以看出,已發表的SCI論文中有74%(1696篇)在行業內單位的被引頻次為0,且被引論文中也多以1次和2次為主,高被引論文占比相對較少(表1)。其中被引頻次40~51范圍的文章共6篇,見表4所示,全為云南中煙和云南民族大學合作發表,內容主要涉及煙草中有機化合物的提取及抗TMV活性的評價,說明行業內對此領域研究關注度較高,研究也比較集中。

圖3 2011—2019年行業內單位SCI論文庫內引用情況分析Fig. 3 Analysis of SCI papers cited by in-industry agencies from 2011 to 2019
對我國煙草行業內單位發表論文排名前100位的作者進行共現網絡分析,結果如圖4所示(由于重名問題并不嚴重,在可視化分析時未進行名字的消歧處理)。其中發文數超過40篇的有11位,以云南民族大學的Hu Qiufen和云南煙草科學院的Duan yanqing發文最多,分別有118篇和95篇,內容主要涉及植物源活性化合物(酚類、黃酮類等)的提取以及抗煙草花葉病毒活性、細胞毒性評價等。從發文作者的共現聚類網絡圖譜可以明顯看出,前100位作者主要有兩大創新集體,一個是云南中煙、云南煙草科學院和云南省煙草農業科學研究院組成的創新社區,聚類效果較為集中,該行業社區與行業外的云南民族大學和中山大學合作較為頻繁;另一個是以鄭州煙草研究院為主,聚類效果可分為4個小社區,分別對應鄭州煙草研究院內設的基因中心、質檢中心、化學室和香料室等研究部門,具有明顯的研究方向特色。除此之外,上海煙草集團和安徽中煙也分別形成了兩個小規模創新區域,其中上海煙草集團與南京大學的互動較為頻繁。

圖4 2011—2019年煙草行業SCI論文數量排名前100位的作者的共現網絡分析Fig. 4 Co-occurrence network analysis of the top 100 authors ranked by the number of tobacco industry SCI papers from 2011 to 2019
以第一作者為統計指標,采用單位消歧,2011—2019年發文6篇及以上的作者見表5所示,共有15位,涉及7家行業內單位,其中以國家煙草質量監督檢驗中心人數最多(5位),其次是云南中煙(3位)等。
2.5.1 技術領域分類的確定
目前科技文獻的分類主要依據中圖分類法,中國知網、WOS也有相應的文獻分類標準,但這些分類方法顆粒度較粗,難以契合煙草行業論文的實際,也難以挖掘到科研方向的發展趨勢。為更好地服務于煙草科技創新,突出煙草主體地位,本文中把與煙草行業直接相關的論文作為分析的重點,將與煙草行業無直接關系的論文歸入外延性研究類。對煙草相關論文,參考中圖分類法、煙草科技期刊欄目劃分設定分類標簽。分類的原則是契合當前煙草科研方向,并增加區分度,對于交叉領域的分類采用先具體再抽象的方法,即先考慮對象和目的,再按照方法區分。綜上設定論文分類標準如表6所示。

表6 2011—2019年SCI論文技術領域分類定義Tab. 6 Classification and definition of SCI papers based on technical field from 2011 to 2019

續表6
2.5.2 煙草相關技術領域總體分布情況
技術領域論文總體分析結果見圖5所示,可以看出,煙草病蟲害研究與防治領域、煙草化學、煙草生理生化、煙草生物技術、吸煙與健康等領域發表的SCI論文較多,分別有240,155,117,109和99篇,特別是煙草病蟲害研究與防治領域論文數量最多,顯示該領域是持久的研究熱點,也凸顯了煙草植保與煙草產業各方利益的高度相關性,此特點與CORESTA交流論文的特點相符。煙草工藝與設備、煙草栽培、煙草初加工(包括調制)等技術領域論文數量較少,僅分別有36,20,17篇。特別值得注意的是,近年來的熱點領域,如新型煙草制品、智能煙草類的論文數量極少,顯示在這些領域的我國科研發展較為滯后。

圖5 煙草相關技術領域SCI論文總體分布情況Fig. 5 The overall distribution of SCI papers in tobacco-related technical fields
2.5.3 重點技術領域發展趨勢分析
選擇重點技術領域,分析其年度分布趨勢,結果如圖6所示。可知各領域發文總量的年度趨勢有較大差異。煙草病蟲害研究與防治領域是持久的熱點,占比最大并保持平穩;煙草化學、煙草生理生化和煙氣科學領域保持穩定或略有縮減;吸煙與健康、煙草生物技術、植煙土壤與肥料領域持續保持上升態勢,與相關科研重大專項的實施年份緊密契合;而新型煙草制品領域和智能煙草領域剛剛起步。
同時,值得注意的是與煙草不直接相關的外延性研究領域論文數量上升幅度明顯,此類論文共有1113篇,占所有論文的48.6%,可以說煙草行業科研力量已有顯著的外溢效應,與行業外科研單位的協同創新效應明顯。進一步研究其特點可以發現,88.4%以上的此類論文的第一作者單位不是煙草行業單位,與2.2中行業內外合作不斷加強的趨勢相符。
我國煙草行業SCI論文數量快速增長,鄭州煙草研究院、云南省煙草農業科學研究院、云南中煙工業有限責任公司和上海煙草集團有限責任公司是發文最多的單位,并處于協同創新的網絡中心位置,與之協同的行業外單位有明顯的地域特點。我國煙草行業與行業外單位合作開展的基礎性、應用基礎性研究占所有論文數量的一半左右,與行業外科研力量的的協同創新效應明顯。這種趨勢與行業《“十四五”科技創新規劃》中對四類創新平臺的劃分和定位基本相符。
在具體研究領域方面,煙草病蟲害研究與防治領域的論文最為集中,再加上與之相關的基因、育種、土壤肥料等領域,構成了煙草農業研究的核心,預計將是持續的研究熱點。煙草工業類論文主要涉及到煙草化學、煙氣科學、吸煙與健康、減害材料、香精香料等領域,其內在核心主題可歸納為減害、合規和感官品質提升,與我國傳統煙草產業面臨的控煙壓力、國際競爭和新型煙草制品競爭的現狀相符,預計這些領域仍是長期的研究熱點。大數據基礎上的機器學習,或稱之為人工智能是革命性的工具,而智能煙草的研究方興未艾,根據其特點,人工智能預計將在工藝設備優化和中式卷煙感官品質提升等方向上發揮作用。在新型煙草制品領域,我國煙草行業起步較晚,發表的論文較少,在三種新型煙草制品的主要方向上,鑒于霧化電子煙在便捷性和開放性上的優勢,以及顯著的去煙草化趨勢,其創新活力更強,預計將成為主要的產品發展方向和研究方向。
本文中資料的收集可能不夠充分,技術領域的分類和判斷更具有一定的主觀性,進一步拓展數據來源,并充分利用大數據挖掘技術、機器學習技術對文獻進行智能分析和分類仍有待進一步深入研究。