仉曉紅
(曲阜師范大學日照校區圖書館 山東日照 276826)
文獻計量方法是利用數學或統計學方法,對文獻的外部特征數量進行描述,繼而對科學技術的現狀與發展趨勢進行評價和預測的研究方法。一般認為國外最早進行文獻計量學研究的是1917年文獻學家F.T.科爾和N.B.伊爾斯對比較解剖學出版物進行的統計分析。在我國公開發行的學術刊物上最早見到的文獻計量學相關論文,是1979年沈中和在《自然雜志》上發表的《新穎的〈科學引文索引〉》一文。之后,我國學者從80年代開始對文獻計量學方法及經典的定律開始了進一步的探索和驗證。隨著我國文獻計量學三十多年的發展,文獻計量分析方法在理論、實踐、應用等方面都已日漸成熟。
有學者對我國文獻計量研究論文進行過早期的階段性的分析,如發展階段、數量、內容、作者等,如汪冰教授的《我國文獻計量學十年研究與發展(1979—1989)》和范全清等學者的《我國文獻計量學研究30年之發展》(統計年份為1979-2008年)。也有學者從發展方向和宏觀理論上進行過闡述,如邱均平教授等的《我國文獻計量學發展的回顧與展望》。還有學者將文獻計量分析法在具體的某一學科領域的應用進行了闡述,如安源、張玲的《文獻計量學在我國圖書情報領域的應用研究進展綜述》。然而,近年來信息技術的突飛猛進為這一傳統的研究方法增加了新的特點,學術日新月異的繁榮進步和科學評價的需求更使得這一實證研究方法成為應用熱點,發文規模、應用范圍、作者群體、分析工具等都達到了前所未有的局面。本文以2009-2013年的數據源為依據進行分析,旨在展現文獻計量分析方法的最新應用進展,為后續的應用提供借鑒和參考。
本文以CNKI所收錄CSSCI來源期刊為數據源,限定高級檢索,檢索式為“文獻計量(或者)文獻統計(或者)文獻調查”,檢索年為“2009-2013”,共獲得615條結果。排除無關或一稿多投等文獻后,共獲得相關論文610篇。檢索日期為2014年12月22日。利用Bicomb書目共現分析系統提取相關論文信息,通過“年份”統計獲得各年發文量以便分析學術關注度;通過“期刊”統計獲得刊載文獻的期刊種類和出現頻次以便分析學科領域的分布;通過“第一作者”的數據提取為確定核心作者供了依據。文獻分析軟件和數據庫的統計采用人工閱讀統計進行分析。

表1 2009-2013年文獻計量分析類論文發文量分布
表1顯示2009-2013年文獻計量分析論文每年發文數量不低于100篇,且每年發文數量較為均衡。從2009年起圖書情報領域實證研究大規模展開,文獻計量分析方法重新成為各學科領域的應用熱點,大量以期刊、引文分析、影響因子、h指數等為關鍵詞的文獻不斷涌現,2009年的發文量比上年明顯增高。隨著應用領域的不斷擴展,2010-2011年發文數量日趨上升,在2011年達到首個歷史峰值128篇。隨著研究規模日益成熟,文獻計量學理論與方法應用研究的實際推廣逐漸向新的領域擴展,網絡計量學、信息計量學、情報計量學逐漸走進研究范圍,發文數量繼續增高,在2013年達到歷史最高值。圖1可以看出,2009-2013年發文量走勢明顯高于歷史記錄,年均122篇,五年累計發文總數為上一個五年的近2倍,發文峰值為2013年的142篇,這一時期文獻計量分析類文獻的學術關注度達到歷史最高。
2.2.1 學科統計
2009-2013所發表的文獻計量分析類論文共涉及到20個學科或領域。發源于圖書情報學的文獻計量分析方法依然在本學科領域應用最為廣泛,以363篇、60%的發文量獨占鰲頭。有160篇論文分布在新聞學與傳播學、管理學、教育學,且發文數量比例大體相當,分別為10%、9%、8%,是除圖書情報領域外文獻計量方法集中較多的三個學科。經濟學、體育學各有文獻20、18篇,累計比例為6%,它們可以看做是此種方法應用的第三梯隊學科。心理學、社會科學總論、語言學、歷史學、社會學的發文量介于4-10篇之間,說明這些學科的學者也在開始注重文獻計量分析的應用。另外統計學、政治學、法學、環境科學、民族學、馬克思主義、中國文學、藝術學、考古學也對文獻計量分析方法初有涉及,累計發文占總數的3.1%。
2.2.2 高影響力論文的學科分布
本文借鑒普賴斯定律來確定高被引論文。本次檢索的論文最高被引頻次為14,通過以下公式可知被引頻次大于等于3的論文即為高被引論文。

高被引論文共有67篇,占被引總比28.9%,被引351次,篇均被引5.24次。其中圖書情報類期刊分布43篇,占比64.2%,可見圖情學科在文獻計量分析應用方面的研究規模和影響力仍居首位。新聞學與傳播學期刊分布14篇,占比21.0%,應用力度和影響力是僅次于圖書情報類的第二大學科。另外有10篇、占比15%的的高被引文獻分別來自科學學、管理學、體育學和其他綜合社科領域。
610篇相關論文共來自國內130種期刊,載文量排在前17位的期刊共有論文403篇,占總比66.1%。而載文量小于等于4的期刊多達101種,共載文113篇,占總數18.6%。少數載文量較高的期刊在文獻計量分析方法應用方面的討論已形成規模,成為相關研究的主要陣地,而且文獻計量分析方法涉及學科種類多,應用領域廣泛。
根據布拉德福定律確定該研究領域的核心期刊區,《情報科學》、《情報雜志》、《中國科技期刊研究》即為文獻計量分析類核心期刊,期刊的發文量大于等于59篇。
從專業優勢和應用深度來看,文獻計量分析方法更容易受到圖書情報學領域作者的青睞。統計可知共有1 012位作者參與了撰寫,其中有590位作者具有圖書情報學研究背景,或者直接從事圖書情報事業,占作者總數的56.4%。統計中還發現,有501位具有圖書情報專業背景、占專業總數85%的作者參與了非圖書情報領域學科的論文撰寫,這是將專業知識運用到其他學科領域的例證,體現了圖情專業工作者的學科服務意識日趨加強。
通過對作者群體進行研究,可以把握學科科研活動的深度和廣度,對于科研活動的管理、組織、協調和引導都有積極意義。本次統計五年內發文量最高的作者為36篇,通過普賴斯定律可知本次調查的核心作者被引頻次下限為3,依據以下公式可獲得第一作者發文量的下限:

發文量大于等于3篇且單篇被引頻次超過4次的作者即為文獻計量分析應用的核心作者,見圖1。

圖1 核心作者發文量及最高單篇被引頻次統計
邱均平教授是我國文獻計量學的代表人物和突出貢獻者,這一時期他的論著不僅全面系統地闡明科技文獻的加工、控制、交流和利用的機理,還借助文獻計量學的原理和方法對科學計量學和網絡計量學領域作了有力的探索,被譽為“我國文獻計量學和科學計量學的主要奠基人”[1]。趙蓉英教授傾向將文獻計量延伸至知識網絡、知識交流、知識管理的研究,并在知識圖譜和可視化的研究方面卓有建樹。湯建民教授的研究側重科學學領域的文獻特征分析,在期刊評價研究、國內社科領域文獻特征研究方面形成研究體系。姜春林教授在期刊網絡結構、期刊評價等方面均有涉及,并也善于運用知識圖譜和可視化技術。
一般來說,只有那些達到較高研究水平,在當前處于科研前沿的課題和作者群體,才能得到基金資助。2009-2013年610篇論文中標明基金支持的有310篇,占文獻總數的59.1%,說明我國文獻計量分析類論文受到制度性基金支持較多,但支持力度還有加大的空間。從歷年情況看基金支持率呈不斷上升趨勢。從資助基金的分類來看,國家級的多于省部級的,省部級的多于校級的,它們分別占基金文獻的62%、24%、14%,說明文獻計量分析類論文受到資助的基金層次較高。
基金論文共分布在108種期刊上,2009-2013年,基金論文被引率(被引文獻篇數/發文篇數)為62.5%,而同期的非基金論文被引率為49.4%,前者高于后者。基金論文篇均被引頻次為5.31,非基金論文篇均被引頻次為2.11,也是前者高于后者。可見,基金論文無論在影響廣度還是在影響深度上都要勝于非基金論文。
通過進一步的內容分析筆者發現,研究者不僅僅局限于通過簡單的數值、圖表等數據對文獻外部特征的物理描述,也并非止步于對所得信息的簡單觀察和推理,而是注重深挖其中所隱含的規律,將定量分析與定性研究相結合,力圖利用有效的文獻統計數據作為研究的有力依據,得出新的研究結論。即使是純粹的文獻計量分析,選取的往往也是研究者較少涉足、研究力量稀缺、研究主題新穎、情報價值較高的專題。以上這些特點正是基金論文質量高、影響力大的原因所在。
2.6.1 數據庫統計
運用文獻計量分析法做研究離不開數據來源,對數據源的選擇決定了統計源的可靠性,也直接影響到統計結果的代表性和研究結論的科學性。通過文獻內容調研得知,共有451篇論文明確說明了統計數據的出處,占總數的73.9%。依據的數據庫有20個,其中涉及到科技期刊、科技圖書、專利文獻、學位論文、科技年報、網絡數據等資源。中文數據庫12個,外文數據庫5個。有285篇論文的數據源為中國知網(CNKI),信息量大、文獻類型豐富、數據分類精細、客戶普及范圍廣等特點使它成為首選數據庫。本次統計中有126篇、占總數20.1%的論文依托Web of science產生,其中的SSCI和SCIE以高質量的期刊為優勢吸引了眾多研究者,數理、生化、醫用等研究領域的文獻依賴于此數據庫。115篇論文基于CSSCI的數據,高影響力、遵循文獻計量學規律,采取定量與定性評價相結合的聚類特征,受到人文社科類專業進行文獻計量分析研究者的青睞。通過調查還發現,在被統計文獻中有45篇論文的數據來源并未依賴數據庫,而是來自研究者對研究對象實物的直接調查,這樣的方法大多適用于計量目標分散、沒有固定數據庫來源的調查對象。既沒有明確標明數據庫的名稱,也未說明統計對象的數據來源,這種論文缺少文獻計量分析文獻應有的要素,這就會影響數據的可信度。雖然類似文獻只占很少的比例,但也應引起研究者的注意。
2.6.2 計量分析軟件統計
隨著計算機系統性能的不斷更新,文獻計量的數據收集、整理分析等各個環節對計算機輔助功能軟件產生了極大的依賴。近五年來610篇運用文獻計量分析類論文中有561篇使用了分析軟件,占總數92.0%。2009-2013年分析軟件的每年使用率不低于82.7%,年均使用率近93%,特別是2013、2014兩年的使用率都超過了97%,五年的使用率呈逐漸上升趨勢。文獻計量分析軟件工具的使用給文獻計量分析工作帶來極大的便利,文獻計量分析文獻對它們的依賴與日俱增。
五年來相關論文共使用了12種分析軟件,從使用率由高到低排列依次是Excel、SPSS、Matlab、Citespace、Histcite、ISTIC/ISIS、JCR、SAS、EVIEWS、WINISIS、DA、Keynote。Excel作為最常用的軟件,主要用來做繁重的計算和數據匯總等工作,便捷易行的特點使它的多種圖形繪制功能得到較為普遍的使用,使用率為86%,成為文獻計量分析者的首選軟件。SPSS則能夠提供從簡單的統計描述到復雜的多因素統計方法,諸如數據的二維相關、多元回歸、因子分析等等,由于它在社會科學和自然科學領域都發揮巨大作用,因此應用學科較為廣泛的文獻計量分析論文也較多使用它,使用率為51%,成為該領域第二大分析軟件。成熟的可視化技術的引進促進了知識域可視化這個新領域的創建,造就了科學知識圖譜的興起,近年來,由美國德雷塞爾大學的陳超美博士基于JAVA平臺開發的以定量分析為主的可視化工具CiteSpace在國內得到了廣泛的使用。本次統計中有395篇論文使用了CiteSpactⅡ,特別是在圖書情報學、經濟學、教育學等學科分布較廣。MATLAB的優勢是能將高性能的數值計算和可視化集成在一起,并提供大量的內置函數,被廣泛的應用于科學計算、控制系統、信息處理等領域,它的二維和三維繪圖功能更加直觀地實現了文獻計量中科學曲線、統計曲線的繪制。
本次調查還發現,有近90%的軟件運用者常根據研究目的的不同,在同一文獻中將多個分析軟件結合使用。例如共引聚類分析與詞頻分析的結合、共詞分析與引文網絡的結合以及同被引分析和文獻耦合分析的結合等,這樣可以充分利用不同分析軟件之間的互補性和結果上的對比性,獲得更加準確可靠的統計結果。綜合以上分析結果可知,隨著信息技術的高速發展,文獻計量分析類論文的軟件使用正朝著集成化和可視化方向發展,在一定程度上反映出我國文獻計量方法和技術有了較大的進步。
2009-2013年,源于圖書情報學的文獻計量分析方法應用在我國學術界達到前所未有的狀況。學術關注度達到歷史最高時期。學科領域跨度較大,以圖書情報類為龍頭,逐漸向科學學、新聞學與傳播學、管理學、教育學、醫學等社會科學和自然科學的多個研究領域擴展。研究內容主要集中在對某一研究領域或某一研究主題進分析、對特定期刊進行影響力評價等方面。一批成果卓著的核心作者群正在形成,研究前沿逐漸指向網絡和網絡計量。從影響力方面來看,圖書情報領域仍居應用之首,跨領域研究和期刊選文的學科界限模糊是這一時期的發文特點。文獻計量類文獻受基金支持力度較大,基金論文多為質量上乘之作。輔助研究手段日益綜合化、多樣化、自動化,數據龐大、品質層次高的數字化平臺是重要的數據源,日漸可視化、智能化的文獻分析軟件使得文獻計量分析的應用如虎添翼。
[1]何汶.計量·評價·管理——記信息管理領域的開拓者和帶頭人邱均平教授[J].中國地質大學學報(社會科學版),2006,(6):1-6.