唐飛鳳
引文分析法在我國圖情領域的應用研究——基于CNKI2000-2013的數據分析
唐飛鳳
[提要]以2000-2013年CNKI中國期刊全文數據庫圖情學科領域核心期刊中研究引文分析的文獻作為研究對象,對發文量年度分布、核心著者、來源期刊等數據外部特征進行統計分析,重點對圖情領域引文分析法的研究類型及主題分布進行系統歸類和詳細闡述,旨在對近13年我國圖情領域引文分析法的研究作出總體概括,并對研究前沿加以分析,對研究的不足提出建議,以期對后繼研究提供有益參考。
引文分析;圖書情報;引文
引文分析法是目前信息計量學最活躍的研究領域之一,廣泛應用到績效評估、期刊評價、人才評價、用戶需求分析、學科趨勢預測等諸多領域。只是我國引文分析起步較晚,20世紀90年代以來,引文分析方法研究取得了許多新的進展,學者們在對引文分析法的理論基礎進行再認識的基礎上,不斷引入新的概念和方法,并對引文分析法的應用條件、適用范圍、中外引文分析法等進行研究和比較,不斷探索引文分析法的歷史及發展趨勢。
本文以引文分析法作為研究對象,分析21世紀以來該研究方法在圖書情報領域中應用,對近13年我國圖情領域引文分析法的研究得出一個總體概括,并對研究概況加以分析,提出改進建議,以期對后繼研究提供有益參考。
本研究所使用的數據來源于CNKI的中國期刊全文數據庫。筆者在該網站的期刊數據庫中進行高級檢索,將學科領域限定為“圖書情報與數字圖書館”,以“引文分析”、“引文分析法”為關鍵字對2000-2013年進行精確搜索,來源類別限定為“核心期刊”,檢索時間為2014年5月24日。經檢索,一共得到論文822篇。通過對論文進行逐篇分析篩選,去除重復文章,剔除不相關文章,最終得到有效論文798篇。
數據的外部特征包括載文量、論文年度分布、期刊分布、著者分布等,這類特征可以從收集到的數據直觀獲得。對這類特征的考察,可對圖情領域的引文分析研究有一個大致的總括的直觀了解。
1.發文量年度分布
引文分析法是圖情領域比較常見的一種研究方法。如前所述,在中國知網對學科領域、、期刊來源等進行限定,共得到相關論文822篇。根據筆者統計,自2000年來,引文分析法不斷得到關注,相關研究論文從2000年的23篇不斷增長,2005年達到56篇,2009年發文量為96篇,達到近13年來的峰值。此后各年發文量也保持在65篇以上,步入穩定的發展階段,盡管近幾年論文量相比2009年略微下降,但總體上仍舊呈不斷上升趨勢??梢?,引文分析作為圖書情報領域學科分支的獨立子學科屬性正在增強,其內涵正在得到不斷豐富和發展。
2.核心著者統計
通過對論文著者進行統計,能發現圖書情報領域引文研究領域權威和核心著者,這對于梳理學科發展脈絡、把握研究前沿具有重要意義。筆者對798篇論文的1157位作者進行發文統計,依據普賴斯提出的有關計算核心作者的公式Mp=0.749,其中,Npmax為最高產作者的論文數。經統計,Npmax=19,此時,Mp=0.749×=3.265,取整,即發表4篇以上論文的為這一領域的核心著者。因此,圖情領域引文分析法研究的核心作者35人,約等于全部作者總數1157的平方根,基本上符合普賴斯定律。
而就核心著者發文量統計而言,筆者統計為:邱均平以19篇傲居首位,發文最多,是引文分析領域的權威,他的研究內容比較廣泛,包括奠基性的理論論述以及新方法的引入等。排名第二的是趙星,共發文11篇,其研究側重于期刊評價和科研評估。緊隨其后的是姜春林,其研究多關注CSSCI的文獻分析、影響因子分析等。
3.來源期刊分析
對798篇論文進行期刊來源統計,可知這些論文來自于177種不同期刊。根據布拉德福定律對于某主題核心期刊判定的描述,筆者將圖情領域研究引文分析法的期刊分為核心區期刊、相關區期刊和邊緣區期刊。依照布拉德福定律,各個區的文獻數量相等,即為266篇。經統計,載文量10篇以下的期刊屬于邊緣區,11至40篇的期刊屬于相關區,40篇以上的期刊屬于核心區。其中,核心區期刊4種,相關區有12種,而邊緣區有161種,基本符合布拉德福定律關于三個區域數量關系的描述。核心區及相關區16種期刊包含論文數531篇,占圖書情報領域論文總量的66.54%,可見,目前國內引文分析研究在期刊分布上還是存在較大的產量區分度?!秷D書情報工作》、《情報科學》、《情報雜志》、《西南民族大學學報》是圖情引文分析領域的核心區期刊。
筆者在對798篇論文充分閱讀的基礎上對論文進行分析,就論文研究類型及主題逐篇進行人工標引,認為引文分析法在圖書情報領域的應用主要分為理論層面和應用層面兩大類。其中,理論層面的研究包括理論方法研究、趨勢進展分析;應用層面的研究包括某種期刊/學報分析、某類期刊分析、特定學科分析、專題分析、數據庫分析、科研評估、館藏資源建設、研究生論文分析、文獻需求研究等9類。各研究類型及研究主題的分布中理論層面共計197篇,占論文總量的24.68%,其中,研究理論方法的論文138篇,研究趨勢進展的論文59篇。而本文只側重占75.32%的應用層面的研究分析。
1.某種期刊分析
應用層面中,比例最大的是對某種期刊或學報的分析,這類論文204篇,占總量的25.56%。該主題的論文均將某一特定期刊作為研究對象,對該期刊的引文量、引文類型、引文語種、引文年代、引用期刊、被引率、自引率、普賴斯指數、最大引文年限、文獻半衰期等指標進行統計分析,以反映該刊的引文特點,揭示該刊在其學科的學術影響力,為進一步提升刊物質量提供依據,并對促進該學科的深入研究起到推動作用。
2.特定學科分析
應用層面中排名第二的是對特定學科的分析,論文量132篇,占總量的16.54%。該主題論文大體上基于CSSCI、ESI、InCites、SSCI、CNKI等數據庫一段時間內的引文數據,對某一特定學科進行分析,主要分為學術著作分析、期刊影響力分析、研究概況分析。學術著作分析是通過對圖書引用情況的統計分析,推出特定學科領域最具學術影響的學術著作,評價其學術影響。期刊影響力分析是在對學科領域進行限定的前提下,對數據庫內相關學科的期刊從被引次數、影響因子、被引速率和被引廣度等方面進行探討期刊目前的研究狀況,對特定學科期刊的總體學術水平、學科地位以及各期刊的學術質量進行綜合性評估。研究概況分析多從引用數量、引文類型、引文文種等方面出發,對特定學科的研究深度、學科發展速度、國內外成果吸收情況等進行分析評價,概括特定學科學術研究水平,揭示學科動向與進展,歸納不足之處及改進建議。例如,周文博(2012)等人運用引文分析法對目錄學論文進行統計,從引文量、引文學科種類、高被引作者和高被引論文數量及被引次數、共被引次數等方面分析目錄學發展現狀,并運用聚類分析法、多維尺度分析法等引文分析的多元統計方法探討目錄學研究的不足。
3.專題分析
專題分析是指對引文分析法研究領域中某一分支的專題研究。專題涉及的領域囊括圖情研究的各個方面,如引文分析的特定評價指標研究、引用實證分析、引文可視化分析、引用網絡分析等。該主題論文共計102篇,占所有論文的12.78%。以專利引文分析這一專題為例,彭愛東(2004)從專利技術的被引頻次出發,概述了專利引文分析在企業競爭情報中的具體應用;楊祖國(2005)等人采用專利引文分析方法,分析技術循環時間、高被引專利、專利地域分布等特點,對中國專利被其他專利引用情況進行統計,研究中國專利技術的重要性和影響力以及發展規律;閆雪(2009)等人采用引文分析法,對聯想集團的技術競爭策略、技術基礎領域以及技術更新速度進行了引文分析,是專利引文分析在企業競爭力研究中的應用的創新性嘗試。
4.其他分析
其他如:某類期刊的分析共計34篇,占總量的4.26%;數據庫分析共計46篇,占總論文量的5.76%;科研評估的論文共38篇,占論文總量的4.76%;館藏資源建設共計23篇,占2.88%;以研究生論文作為研究對象的共15篇,占論文總量的1.88%;文獻需求研究這一主題論文共7篇,占總量的0.88%。這類研究文章雖然不多,但是對圖情領域的研究起著彌足珍貴的補充作用。
本文以CNKI中國期刊全文數據庫圖情學科領域核心期刊作為數據來源,將引文分析法在圖情領域的應用作為研究對象,采用Excel2010和NoteExpress作為研究工具,總結歸納了發文量年度分布、核心著者、來源期刊等數據外部特征,對圖情領域引文分析法的研究類型及主題分布進行系統歸類和詳細闡述,旨在對近13年我國圖情領域引文分析法的當前研究作出總體概括,對后繼研究提供有益參考。需要指出的是,筆者在對論文的研究類型及主題分布進行數據分類統計時,是基于自身的知識體系和邏輯判斷能力,存在一定的主觀性。另外,由于本人能力有限,未能對引文分析法在圖情領域應用的不足及改進作出系統闡釋,這些問題有待圖情領域學者作出進一步的研究。
[責任編輯:上官濤]
唐飛鳳(1974—),女,邵陽學院圖書館館員,研究方向為圖書館情報學和中國古代文學。(湖南邵陽422000)