[摘 要]
以CNKI數據庫刊載的近十年(2000—2005年和2006—11年)我國文獻計量學研究論文為數據源進行共詞分析,利用Bicomb和SPSS軟件,并借助聚類分析和因子分析,研究高頻詞間的關系,探討了國內近十年文獻計量學的研究主題:引文數量分析、引文網狀或鏈狀關系研究、科學知識圖譜與信息可視化及網絡計量學。
[關鍵詞]文獻計量學;共詞分析;聚類分析
[中圖分類號]G250.252[文獻標志碼]A
[文章編號]1005-6041(2012)05-0041-04オ
1 前 言
文獻計量學是借助文獻的各種特征數量,采用數學與統計學方法來描述、評價和預測科學技術的現狀與發展趨勢的圖書情報學分支學科[1]。國外的文獻計量學研究始于1917年,至今經歷了三個發展階段[2—3]。我國的文獻計量學研究較國外要晚半個多世紀,發展歷程分為三個階段,即起步階段(1979—1982年)、發展初期階段(1983—1987年)和全面發展階段(1988年至今)[4]。隨著信息技術和網絡的發展,文獻計量學的研究在內容和手段上也產生了新的發展趨勢,使文獻計量學研究往更廣、更深的方向發展。
本文試圖通過對近十年國內文獻計量學領域文獻高頻關鍵詞的共詞分析,深入揭示其研究結構,進而探討研究維度、學科背景和理論基礎,以期進一步把握近十年我國文獻計量學的研究現狀、研究重點和發展趨勢。オ
2 數據處理
共詞分析法是一種內容分析的方法,主要是通過對能夠表達某一學科領域研究主題或研究方向的專業術語共同出現在一篇文獻中的現象的分析,判斷學科領域中主題間的關系,從而展現該學科的研究內容與結構[5]。
作為共詞分析的基本單元,本研究所利用的關鍵詞樣本均來自于CNKI全文數據庫,收集過程如下:以“文獻計量學”為關鍵詞,通過關鍵詞路徑檢索,選擇模糊檢索,分別設定檢索時間范圍為2000—2005年和2006—2011年,檢索截止時間為2011年10月31日,共檢索到2000—2005年1 434篇文獻,其中去掉190篇無關鍵詞的文獻,剩下1 244篇文獻,關鍵詞共計1 448個;2006—2011年2 575篇文獻,其中去掉364篇無關鍵詞的文獻,剩下2 211篇文獻,關鍵詞共計2 838。
借助中國醫科大學醫學信息學系崔雷等人開發的書目共現分析系統Bicomb,進行詞頻統計處理,2000—2005年和2006—2011年分別選擇出詞頻不小于10次和20次的關鍵詞,從而都確定了共有42個高頻關鍵詞作為共詞分析的基礎。オ
3 共詞分析
聚類分析就是對共詞關系網絡中的詞與詞之間的距離進行數學運算分析,將距離較近的詞聚集起來,形成一個個相對獨立的類團,使得類團內屬性相似性最大,類團間相似性最小[6]。本文首先用Bicomb軟件分別提取2000—2005年和2006—2011年兩個時間段頻次不小于10次和20次的詞篇矩陣,然后利用SPSS分別對兩個時間段的詞篇矩陣進行系統聚類法分析,選擇組間距離法和二值變量中的“Ochiai”系數,采用樣本聚類。詞篇矩陣是指對關鍵字段中出現一定頻次的主題詞等字段在每篇文獻中的出現情況進行搜索,最終生成“詞篇矩陣”,是關鍵詞共詞矩陣形成的基礎[7]。
根據兩個時間段的因子分析碎石圖,顯示最佳的公共因子個數區間為[6,8],本研究將聚類個數的范圍值選定為6~8個,結果如表1和表2所示。通過分析和對比,結合關鍵詞的屬性,本研究認為2000—2005年和2006—2011年8個分類最適合。
表1 2000—2005年各樣品所屬類別表
關鍵詞8 類
7 類
6 類
文獻計量學111
引文分析222
統計分析331
核心期刊443
期刊111
文獻計量222
引文331
載文分析222
論文331
學報331
分析331
網絡計量學554
作者331
統計331
關鍵詞
8 類
7 類
6類
科技期刊443
參考文獻 222
情報學111
文獻665
作者分析222
網絡信息計量學554
中國776
普賴斯指數
2
2
2
圖書館學
1
1
1
影響因子
4
4
3
科學計量學
5
5
4
載文
3
3
1
醫學論文
1
1
1
科技論文
2
2
2
關鍵詞
8 類
7 類
6類
期刊評價
4
4
3
評價
3
3
1
文獻分析
7
7
6
半衰期
2
2
2
循證醫學
1
1
1
信息計量學
5
5
4
期刊研究
2
2
2
SCI
4
4
3
發展趨勢
1
1
1
載文量
3
3
1
數據庫
6
6
5
計量學
6
6
5
高校學報
2
2
2
布拉德福定律
8
5
4
表2 2006—2011年各樣品所屬類別表
關鍵詞8 類
7 類
6 類
文獻計量學
1
1
1
引文分析
1
1
1
統計分析
1
1
1
文獻計量
2
2
2
期刊
1
1
1
載文分析
1
1
1
核心期刊
1
1
1
期刊評價
1
1
1
作者
1
1
1
科技論文
3
3
3
引文
1
1
1
CSSCI
1
1
1
科技期刊
1
1
1
影響因子
1
1
1
關鍵詞8 類
7 類
6 類
作者分析
1
1
1
網絡計量學
4
4
4
載文
1
1
1
定量分析
5
2
2
文獻分析
6
5
5
論文
1
1
1
分析
1
1
1
h指數
5
2
2
中國
7
6
4
科學計量學
5
2
2
文獻計量學分析
6
5
5
被引分析
1
1
1
計量分析
7
6
4
文獻計量分析
3
3
3
關鍵詞8 類
7 類
6 類
文獻
7
6
4
SCI
3
3
3
共詞分析
2
2
2
情報學
2
2
2
研究熱點
2
2
2
學術影響力
1
1
1
信息計量學
5
2
2
Web of Science
5
2
2
針灸療法
8
7
6
學術期刊
1
1
1
載文量
1
1
1
研究論文
6
5
5
詞頻分析
2
2
2
圖書館
4
4
4
4 討 論
根據上述分析結果,結合相關論文內容,我國文獻計量學大致可分為以下幾個方面:1)引文數量分析,主要指文獻分析和期刊評價;2)引文網狀或鏈狀關系研究;3)科學知識圖譜與信息可視化——科學計量學的研究熱點;4)網絡計量學研究。
4.1 引文數量分析
隨著文獻計量學的不斷發展,引文分析方法也隨著不斷豐富并逐漸完善,但最基本的也是最基礎的引文分析方法是從引文數量角度進行研究,主要用于評價期刊和論文[8]。
4.1.1 期刊評價。 2000—2005年期刊評價研究在原有的評價指標基礎上,嘗試加以一些指標、算法和統計學等處理結果[9—11]。2006—2011年,期刊評價研究側重于不同指標對比評價期刊,評價指標之間的相關性研究等[12—17]。
4.1.2 論文評價。2000—2005年,基于文獻計量學的論文評價研究主要利用引文計量法[18]、綜合模型法[19]、文獻計量法[20]、等比遞降法[21]、引文分析法[22]等方法對期刊論文、學位論文等進行學術評價。2006—2011年,論文評價研究主要利用直接和間接評價法、論文引證系數、主成分分析法、h指數法和層次分析法等定量研究方法和專題組討論法為代表的定性研究法評價論文的學術影響力、作者科研能力或者機構科研水平[23—25]。
4.2 引文網狀或鏈狀關系研究
從引文間的網狀關系或鏈狀關系進行研究,主要用于揭示學科的發展和聯系,并展望未來前景等,主要指引文耦合、同被引、詞頻分析、共詞分析等。引文耦合反映引證文獻之間的關系,同被引反映被引證文獻之間的關系[8]。
4.2.12000—2005年引文網狀關系研究分析。綜合上述分析結果和檢索相關主題,2000—2005年對引文間網狀或鏈接關系研究相對較少,主要集中在同被引實證、詞頻分析及聚類分析。
4.2.22006—2011年引文網狀關系研究分析。隨著文獻計量學的不斷發展,2006—2011年引文網狀或鏈狀關系研究引起越來越多人的關注。該階段的引文網狀或鏈狀關系研究集中在引文耦合、同被引、詞頻分析及共詞分析。
4.3 科學知識圖譜與信息可視化——科學計量學的研究熱點
2000—2005年科學計量學的研究只停留于對數據庫的分析上,沒有向系統化和計算機化發展,沒有形成以自己的數學模式為基礎的計算機輔助的計量科學;科學計量學的研究領域與范圍受限,其研究較多集中在科學領域,關于技術領域的計量學研究卻較單薄。科學計量學的研究忽視了成果的推廣[26]。
2006—2011年,科學研究的指標體系、期刊評價、引文分析等內容仍然是科學計量學界研究的重點,其前沿動態也依次經過洛特卡定律、引文分析、合作研究等方向[27];其中科學知識圖譜與信息可視化是研究熱點。
4.4網絡計量學
2000—2005年該階段的網絡計量學研究現狀[28]:1)理論研究:主要研究網絡信息計量學作為一門學科存在而必須解決的基本問題;網絡信息計量的新概念和新規律;2)指標、算法和方法、工具研究;3)實證研究;4)應用研究。該階段的研究重點和熱點是有關域名分析與鏈接分析、網絡影響因子(WIF)、網絡搜索引擎和網絡數據挖掘等問題。
2006—2011年該階段關于網絡計量研究方法主要涉及網絡信息的鏈接分析法、網絡信息內容分析法、網絡影響因子分析法、圖論法、聚類分析法、網絡引文方法等方面,其中關于鏈接分析方法的文獻最多。應用研究主要體現在四個方面[29]:1)網絡資源管理中的應用;2)電子核心期刊評價中的應用;3)數字圖書館資源建設中的應用;4)在社會科學研究、科技發展和決策中的應用。オ
5 結 語
綜上所述,根據多元統計分析方法,文獻計量學研究主題可分為四個領域:1)引文數量分析,主要是期刊和論文評價研究,其中h指數是研究熱點;2)引文網狀或鏈狀關系研究,其中引用認同、引證圖像、引文聚類、詞頻分析和共現分析是研究熱點和重點;3)科學知識圖譜與信息可視化——科學計量學的研究熱點;4)網絡計量學,其研究熱點是網絡鏈接分析、網絡影響因子、評價、網絡搜索引擎等。
本文研究方法是定量和定性相結合的方法,采用聚類分析方法進行研究。本研究存在的局限性是:首先數據本身不夠完善,沒對關鍵詞進行規范處理,也沒標準主題詞表可參考;其次關于高頻關鍵詞的閾值仍是有待談論的問題,只根據筆者經驗確定,未能全面反映整體的狀況;最后,只選取了2000—2011年的數據,只揭示某個階段的學科結構,并不能反映整個學科發展狀態。下一步研究應該對其數據進行預先處理,選取更廣泛的時間范圍,結合多種分析方法,如加入戰略坐標和可視化分析等,進行分析,從而揭示更加全面客觀的學科研究主題結構和發展趨勢。
[參考文獻]
[1] 李 穎.中國文獻計量學實用研究的新進展[J] .現代情報,2005(4):168—170.
[2] 邱均平.文獻計量學[M].北京:科學技術文獻出版社,1988.
[3] 范全青,郭維真,鳳元杰.我國文獻計量學研30年之發展[J] .情報資料工作,2009(3):30—60.
[4] 邱均平,段宇鋒,陳敬全,等. 我國文獻計量學發展的回顧與展望[J] .科學學研究,2001, 23(2):143—148.
[5] 董 偉.國內近十年數字圖書館領域研究熱點分析——基于共詞分析[J] .圖書情報知識,2009(5):60—65.
[6] 王莉亞,張志強,衛軍朝. 基于共詞分析的近十年國外圖書情報學研究主題分析[J] .情報雜志,2011,30(3):50—58.
[7] 崔 雷.書目共現分析系統[EB/OL].[2011-11-08].http://www.doc88.com/p-01172739499.html.
[8] 邱均平.信息計量學[M].武漢:武漢大學出版社,2007.
[9] 邱均平,張 榮,趙蓉英. 期刊評價指標體系及定量方法研究[J] . 現代圖書情報技術,2004(7):23—27.
[10] 趙大良,苗 凌,蔣汀華. 期刊質量評價的二維排序方法[J] .編輯學報,2005,17(4):307—308.
[11] 姚 紅. 基于灰色關聯分析法的期刊綜合評價[J] .情報科學,2003,21(7):730—734.
[12] 張 琳. CSSCI教育學期刊特征因子與影響因子比較分析[J] .情報雜志,2011,30(7):34—37.
[13] 趙 茜. 主成分分析法在科技期刊引用計量指標測評中的應用[J] .科技與出版,2011(3):69—71.
[14] 郭 強,趙 瑾,劉新新,等. 下載次數與被引次數的同一與差異性研究[J] . 圖書館理論與實踐,2011(6):43—104.
[15] 鄭德俊. 期刊評價中的關鍵指標評析及相關性研究[J] .圖書情報工作,2011,55(4):143—147.
[16] 許海云,方 曙. 中文學術期刊評價中引文分析指標間關系的實證研究——基于2010年版中國期刊引證報告(擴刊版)[J] .圖書情報知識,2011(4):73—79.
[17] 黃賀方,孫建軍,李 江. 期刊影響力評價指標之間的相關性研究[J] .情報科學,2011(9):1322—1326.
[18] 郭麗芳.評價論文學術質量的文獻計量學指標探討[J] .現代情報,2005 (3): 11—12.
[19] 王孝寧,何 苗,何欽成.基于文獻計量學研究方法的科技論文定量評價[J] .科學學與科學技術管理, 2004 (4): 15—18.
[20] 郭繼軍,何欽成.科技論文評價中的文獻計量學分析[J] .中華醫學圖書館雜志, 2001(11): 60—61.
[21] 黃學忠.科研成果(或論文)量化評價體系的建立及初步應用[J] .中華醫學科研管理雜志, 2004 (3): 145—146.
[22] 王 巖,劉雅娟.運用引文分析進行論文評價的方法初探[J] .科研管理, 2001(1): 133—138.
[23] 龍 莎,葛新權.科技論文學術水平評估[ J].科技與管理,2007 (1): 133—135,138.
[24] 金 晶,何 苗,王孝寧,等.不同學科領域自然科學論文學術影響力評價與比較的可行性研究[ J].科技管理研究, 2009(14): 279—284.
[25] 章 娟,段志光,王 彤. 科學論文評價方法運用的比較分析——以世界一流生物醫學科學家為例[J] .科學學研究,20009,12(27):1809—1814.
[26] 羅式勝.從文獻計量學、科學計量學到科學技術計量學[ J].圖書館論壇, 2003(23): 151—153.
[27] 郭美榮,蘇 學.科學計量學前沿演進可視化研究[J] .情報雜志,2010,29(12):1—4.
[28] 邱均平,張 洋.網絡信息計量學綜述[J] .高校圖書館工作,2005,25(105):1—12.
[29] 2005—2010年我國網絡計量學研究現狀淺析[EB/OL] .[2011-11-16]. http://wenku.baidu.com/view/6fe0658302d276a200292ed0.html.オ
[收稿日期] 2012-04-12
[作者簡介]李燕萍(1979—),女,碩士,館員,廣東藥學院圖書館。