李燕波
摘 要 論文對目前常用的兩種文獻計量可視化工具CiteSpace和HistCite的功能進行比較分析。通過設計八個文獻計量學指標作為兩種工具的實驗分析指標,以SCI中2003—2012年電子政務主題的1388篇研究性文獻為實驗文獻樣本,對這兩種工具在事先設定好的八個文獻計量學指標中的功能表現進行分析。最終從具體分析功能、圖譜可讀性和支持的數據格式三個角度對這兩個工具的功能進行了對比。
關鍵詞 文獻計量學 可視化分析 CiteSpace HistCite 電子政務
分類號 G250.252
Analysis of the Functions of the Two Bibliometrics Visualization Softwares based on the E-government Research
Li Yanbo
Abstract Under the purpose of the two bibliometric visualization tools CiteSpace and HistCite comparative analysis, eight bibliometric indicators are designed as the comparative indicators for the functions, and 1388 papers on e-government research are download from the Web of Science during 2003-2012 as the experimental literature sample. Based on these, functions of these two tools are compared by this paper. It compares their functions from the analysis functions, the knowledge mapping readability and the data format.
Keywords Bibliometric. Visualization analysis. CiteSpace. HistCite. E-government.
1 文獻計量可視化工具研究現狀
從1926年洛特卡定律的發現[1],到美國化學家格羅斯兄弟文獻學史上的第一次引文分析研究[2],再到1934年布拉德福定律[3]和1948年齊普夫定律[4],國外學者二十世紀二十年代到六十年代為文獻的定量研究做出了重要貢獻,但這些先驅者早期的定量研究均是分散、不系統的。直到1969年,英國情報學家阿倫·普里查德發表《文獻統計學還是文獻計量學?》一文[5],首次使用“文獻計量學”這一術語,取代了“文獻統計學”。這就將研究對象從期刊擴展到所有的書刊文獻,使有關文獻的定量研究統一在文獻計量學學科之下,至此文獻計量學研究逐漸走向系統化、廣泛化。為適應文獻信息量的增加,計算機、數學等方法在文獻計量學中的應用研究逐漸展開,由此便產生了文獻計量可視化的研究。20世紀50年代開始,加爾菲德開發的科學引文索引開始大規模的商業性應用,為文獻計量可視化的發展奠定了堅實的基礎。大量的文獻計量學研究轉向基于引文分析的可視化研究中,這其中的先驅當屬加爾菲德對DNA研究歷史圖的產生,是在1964年用手工繪制的[6]。從那以后,文獻計量可視化研究逐漸成為計算機科學、圖書情報學研究的熱點。經過近70 年的發展,在引文分析理論、復雜網絡與社會網絡分析理論、信息可視化技術的推動下,信息可視化逐漸成為國內外文獻計量學一個嶄新的研究熱點[7]。文獻計量可視化工具是文獻計量可視化研究的具體實現手段,總體來說,時下常用的文獻計量可視化工具主要源于三大領域。一是計算機科學領域的數據、信息、知識與知識域可視化研究;二是圖書情報領域的引文分析可視化、知識地圖和知識網絡等研究;三是復雜網絡系統和社會網絡分析的研究。目前三者的研究方向和內容正在走向融合。文獻計量可視化工具可以分為兩類:一類為各種文獻數據庫附帶的文獻計量工具,(如Web of Science、中文社會科學引文索引、中國知網等),但可視化功能較弱;另一類為提供文獻計量功能的軟件,如美籍華人陳超美開發的CiteSpace、加菲爾德開發的HistCite、佩爾松開發的Bibexcel、Vladimir Batage lj和Andrej Mrvar開發的Pajek、印第安納大學開發的Science of Science、荷蘭萊頓大學開發的VOSViewer等,而這其中CiteSpace、HistCite由于其較強的可視化功能被國內外學者所廣泛使用。
2 CiteSpace與HistCite功能分析
2.1 CiteSpace核心功能
CiteSpace軟件主要基于共引分析理論和尋徑網絡算法等,對特定領域文獻(集合)進行計量,以探尋出學科領域演化的關鍵路徑及其知識拐點(以關鍵論文為代表),并通過一系列可視化圖譜的繪制來形成對學科演化潛在動力機制的分析和學科發展前沿的探測。其所應用的主要數據包括Web of Science論文、Derwent 專利、Scopus等外文數據庫論文,近幾年由于國內用戶的廣泛使用,該軟件又通過增加數據格式轉換模塊而實現了中文CSSCI、CNKI數據庫格式的計量分析。CiteSpace軟件的核心功能是探測和分析學科研究前沿的歷時性變化趨勢以及研究前沿與其知識基礎之間的關系,陳超美博士在軟件中設計了四個核心分析指標以實現這一功能,見表1。
表1 CiteSpace核心分析指標
2.2 HistCite功能
該軟件系SCI的發明人加菲爾德開發,能夠用圖示的方式展示某一領域不同文獻之間的關系??梢钥焖賻椭覀兝L制出一個領域的發展歷史,定位出該領域的重要文獻,以及最新的重要文獻。HistCite目前用于分析的文獻信息只能來源于Web of Science數據庫(以下簡稱WoS),HistCite核心分析指標見表2。
表2 HistCite核心分析指標
3 CiteSpace與HistCite功能實驗比較研究:以國際電子政務主題文獻為例
3.1 數據來源
在WoS數據庫中獲取電子政務相關的研究性論文(包括期刊論文、會議論文和綜述)1388篇。本文主要采用CiteSpace與HistCite兩種可視化軟件對電子政務這一主題的八種文獻計量學指標進行比較分析,見表3。
表3 文獻計量學指標
3.2 作者、機構和國家及其合作分布
3.2.1 CiteSpace的發文量和合作關系分析功能
(1)發文量及合作關系分析功能。CiteSpace可以形成作者、機構和國家及其合作分布可視化分析圖譜。其中每一個結點代表一個作者、機構或國家,結點大小反映的是發文量的多少,結點年輪顏色反映的是發文時間分布,色調由暖及冷指的時間由近及遠,點擊在任何一個結點上通過點擊鼠標右鍵,便可具體了解某個結點所代表的作者、機構或國家的發文按時間分布的具體數值。結點之間的連線反映的是作者、機構或國家具有合作關系。CiteSpace的這些功能不僅有助于研究者發現相關主題的權威研究作者、機構或國家,而且對研究者挖掘該主題的研究團隊、跨越機構或國家的合作具有十分有效的幫助,這為考察該主題的知識流動及共享提供了一個清晰的線索。而且由CiteSpace生成的圖譜顏色豐富、信息量大。
(2)作者共被引分析。CiteSpace可以根據作者發文被引及共被引情況,生成作者共被引分析圖譜。其中結點大小反映的是該結點所代表的作者被引頻次的高低,結點的年輪顏色反映的是該作者被引歷史,通過在該結點點擊右鍵可以具體了解該作者的被引頻次隨年度變化數值;結點之間的連線代表作者之間具有共被引關系(以下同)。結點外圈的顏色若是紫色,則代表該結點的中心性≥0.1(以下同),點的中心性是一個用以量化點在網絡中地位重要性的圖論概念,它是指網絡中經過某點并連接這兩點的最短路徑占這兩點之間的最短路徑線總數之比。中間中心性高(在CiteSpace可視化圖譜中,中心性≥0.1便認為較高)的點往往位于連接兩個不同聚類的路徑上,是十分重要的結點,需重點考察其研究內容。CiteSpace的作者共被引分析可以使眾多的著者按照同被引關系形成一個著者相關群,揭示出學科專業人員的組織結構、聯系程度,進而反映出學科專業之間的聯系及其發展變化狀況[1]。
3.2.2 HistCite的發文量及其被引分析功能
HistCite可以顯示閾值范圍內(即本研究中設置的被引頻次≥30次的論文)的總作者數、機構數和國家數。也可以對作者、機構和國家的發文量、作者發文當前主題內被引頻次、WoS被引頻次三個文獻計量學指標的分布進行分析,而且通過點擊■、■、■三個按鈕可以分別對這三個指標進行排序,這些功能有助于研究者通過不同指標識別電子政務研究的發文情況、相關重要論文以及在WoS范圍內具有較高影響力的論文,為發現重要的作者、機構和國家和經典文獻提供線索。但是該工具無法直接對作者、機構、國家發文的文獻計量學指標進行可視化圖形分析,只能在數據基礎上借助EXCEL作圖分析。而且該工具無法進行合作分析。為節省篇幅,僅列出作者發文分布分析,見表4。
表4 HistCite的作者分析二維表
3.3 期刊及其共被引分布
3.3.1 CiteSpace的共被引分析功能
期刊的共被引關系強弱反映了期刊的親疏遠近關系,通過期刊共被引分析可以挖掘學術期刊之間的關系并且進行期刊分類,考察學科的內部知識結構和聯系情況[9]。CiteSpace可以按期刊被引情況生成期刊共被引分析圖譜,由此可以揭示對某一主題研究具有重要推動作用的期刊以及期刊的共被引關系。但是,CiteSpace無法實現期刊載文量分析。
3.3.2 HistCite的載文量及其被引分析功能
表5顯示了HistCite對電子政務研究主題的期刊載文分布結果。這一功能與前述作者、機構和國家分布分析所具有的功能一致。但該工具只提供了期刊的主題內和WoS范圍內的被引分析,未能提供期刊的共被引分析。
表5 HistCite的期刊發文及被引分析二維表
3.4 學科分布及共現關系
CiteSpace是根據WoS數據庫的學科劃分標準而對相關主題的研究學科進行劃分的,而WoS數據庫的學科劃分是依據期刊所屬學科進行劃分的。因此,CiteSpace學科共現圖譜中結點較大的學科說明這個學科的相關期刊上發表這一主題的論文較多。學科之間的連線同樣是學科共現關系的揭示,通過這種學科共現考察可以了解跨學科研究情況。
3.5 關鍵詞及其共現分布
3.5.1 CiteSpace的關鍵詞頻及其共現分析功能
一般認為詞匯對在同一篇文獻中出現的次數越多,則代表這兩個主題的關系越緊密。統計一組文獻的關鍵詞或主題詞兩兩之間在同一篇文獻出現的頻率,便可形成由這些詞對關聯所組成的關鍵詞共現網絡,關鍵詞共現分析可應用于研究領域的識別和熱點分析、橫向和縱向分析領域、識別學科的發展過程和特點、找出領域或學科之間的關系等[10],同時可以了解某一特定主題的微觀研究領域。CiteSpace不僅能夠揭示高頻關鍵詞,還能夠揭示具有共現關系的關鍵詞,這為深入、細致的研究某一主題提供了十分有效的途徑。CiteSpace生成的關鍵詞共現圖譜可以將具有共現關系的關鍵詞按其研究的主題進行人工聚類分析。
3.5.2 HistCite的關鍵詞頻分析功能
HistCite的關鍵詞分布分析是以“words”(即單個關鍵詞)進行統計分析的,而且不具備“words”之間共現關系的分析,只能按“words”的詞頻數、當前主題內被引頻次、WoS被引頻次三項指標定量統計(見表6),而且無可視化的圖譜,只能以二維表格的形式呈現。HistCite由于不能反映關鍵詞的共現關系,因此在微觀主題揭示方面具有較明顯的缺陷,如表3列出了按詞頻排序的前5位電子政務有關的“Word”,其中的很多單詞專指性很低,如GOVERNMENT、BASED、INFORMATION等,這使得無法通過這些高頻詞進行微觀主題的分析。
表6 HistCite的關鍵詞詞頻及被引分析二維表
3.6 文獻被引分析
3.6.1 CiteSpace的文獻共被引分析功能
CiteSpace除可以生成文獻共被引圖譜以揭示文獻被引頻次高低和文獻間的共被引關系外,還可以生成時間線圖譜和時區圖譜。時間線圖譜可以將研究主題各微觀知識領域進行聚類,同一聚類排在同一水平線上,并根據時間順序進行排列,從而展示研究主題各微觀知識領域的歷史成果,從中可以研究主題的重要奠基性文獻。時區圖是另一種側重于從時間維度上來表示知識演進的視圖,可以清晰地展示出文獻的更新和互相影響情況,它將結點定位在一個二維坐標系中。根據結點首次被引用的時間,結點被放在不同的時區中,并且所放位置的高度依次增加。一個從左到右,自下而上的知識演進圖就直觀的展示出來,位于坐標系靠左、靠上的結點可以認為是該知識領域的研究前沿。
3.6.2 HistCite的文獻被引分析功能
HistCite可以通過對從WoS下載的文獻依據被引頻次編制引文編年圖,這也是該工具的主要功能。點擊HistCite主界面最上方的“Tools”-“Graph Maker”-“Make Graph”按鈕,即可得到相應的引文編年圖。引文編年圖可以從GCS和LCS兩個角度進行編制,如果引文編年圖編制時選擇所有文獻,則用GCS和LCS編制的結果是一樣的;在實際繪制過程中,以 LCS 為依據編制引文編年圖更能體現研究的外延和分析的針對性,因此選擇LCS較為合適。圖1為采用HistCite編制的引文編年圖,每一個圓圈表示一篇文獻,圓圈大小代表文獻被引頻次的多少。被引頻次越高,圓圈就越大。帶箭頭的連線代表文獻節點之間的引用關系,箭頭指向的文獻是被引文獻,圓圈內所標數字指明該節點文獻在文獻集合中的順序號。引文編年圖以從上到下的空間順序表示由先到后的時間順序,各文獻按照其發表年份的先后給予序號并安排在圖中相應位置。通過HistCite生成的引文編年圖,可以清楚地觀察到電子政務研究的歷史沿革、研究文獻之間的繼承關系以及在各研究階段的發展程度。圖中,2010—2012年的文獻節點是空白,表明在這個時間段內沒有具有一定影響力的經典文獻,這與文獻被引與時間的累積性相關。而較大的結點如158、220、324、343、225等代表的文獻具有較高的被引頻次,因此可以認為是電子政務研究中較經典的文獻,通過對這些經典文獻的分析,可以一定程度上了解電子政務研究的知識基礎與研究前沿。
然而,被引頻次僅僅是文獻影響力高低的反映,而文獻的共被引卻能夠反映文獻與文獻之間的研究方向或研究主題的關聯,兩篇文獻共被引的頻次越多,說明它們學術研究方向的關聯性越強。由此推而廣之,由多篇文獻間的共被引關系形成的文獻共被引聚類,反映了聚類文獻之間共同的研究方向和關注的熱點主題[11]。HistCite無法實現文獻共被引分析,因此通過該軟件提供的引文編年圖不能夠實現文獻的聚類,也就無法從引文分析的角度揭示解釋熱點主題以及知識結構。
3.7 兩種工具比較結果
表7 兩種可視化工具的比較結果
CiteSpace和HistCite均是基于引文分析的文獻計量可視化分析工具,因此其基本的原理依據是一致的。CiteSpace的核心特色是可以實現文獻計量學指標網絡結構的揭示(共現、共被引網絡),相對而言,HistCite無法揭示網絡結構,其核心特色表現在可以實現各文獻計量學指標的文獻集內和WoS兩種范圍的被引頻次分析,而CiteSpace的被引頻次分析只限于考察主題的文獻集內。具體來講兩種工具在功能上存在以下差異,如表7所示。
4 結語
通過CiteSpace和HistCite兩種可視化工具的比較可知,CiteSpace的功能更加豐富,而HistCite功能較為單一。但無論使用多么智能的可視化工具,在進行某一主題研究時,可視化工具只能提供我們一個研究線索,在具體研究時需要我們輔以深入、全面的文獻調研和專家咨詢才能使研究結果更科學。筆者認為,未來文獻計量可視化研究重點一方面要在知識單元間的測度更加精確與合理上下功夫。例如,通過計算機語義理解,解決一詞多義和一義多詞等詞形與詞性問題等;另一方面要進一步實現方法的融合與改進,進一步完善相關算法。例如,在共引分析中,根據兩被引文獻(或作者等)在同一文獻中的共被引強度給予不同的權值。
參考文獻:
[ 1 ] Lotka A J. The frequency distribution of scientific pr-
oductivity[J]. Journal of the Washington Academy of Sciences,1926,16(12):317-323.
[ 2 ] Gross P L K, Gross E M. College libraries and chemical education[J].Science,1927,66(1713):383-406.
[ 3 ] Bradford S C. Sources of information on specific subj-
ects[J]. Engineering,1934,23(3):85-88.
[ 4 ] Zipf G K. Selected studies of the principle of relative frequencies of language[M].Cambridge:Harvard Univ-
ersity Press,1932.
[ 5 ] Pritchard A. Statistical bibliography or bibliometrics?[J]. Journal of Documentation, 1969,25(4):348-349.
[ 6 ] Garfield E, Sher I H,Torpie R J. The Use of Citation Data in Writing the History of Science[M]. Philadelphia:Institute for Scientific Information,1964.
[ 7 ] Milgram S. The Small World Prolem[J].Psychology Today,1967 (2):60-67.
[ 8 ] 邱均平.信息計量學[M].武漢:武漢大學出版社,2007:408-409.
[ 9 ] 王賢文,劉則淵.基于共被引率分析的期刊分類研究[J].科研管理,2009(5):187-195.
[10] 吳曉秋,呂娜.基于關鍵詞共現頻率的熱點分析方法研究[J].情報理論與實踐,2012(8):115-119.
[11] 潘黎,侯劍華.國際高等教育研究的熱點主題和研究前沿:基于8種SSCI高等教育學期刊2000—2011年文獻共被引網絡圖譜的分析[J].教育研究,2012(6):136-143.
表6 HistCite的關鍵詞詞頻及被引分析二維表
3.6 文獻被引分析
3.6.1 CiteSpace的文獻共被引分析功能
CiteSpace除可以生成文獻共被引圖譜以揭示文獻被引頻次高低和文獻間的共被引關系外,還可以生成時間線圖譜和時區圖譜。時間線圖譜可以將研究主題各微觀知識領域進行聚類,同一聚類排在同一水平線上,并根據時間順序進行排列,從而展示研究主題各微觀知識領域的歷史成果,從中可以研究主題的重要奠基性文獻。時區圖是另一種側重于從時間維度上來表示知識演進的視圖,可以清晰地展示出文獻的更新和互相影響情況,它將結點定位在一個二維坐標系中。根據結點首次被引用的時間,結點被放在不同的時區中,并且所放位置的高度依次增加。一個從左到右,自下而上的知識演進圖就直觀的展示出來,位于坐標系靠左、靠上的結點可以認為是該知識領域的研究前沿。
3.6.2 HistCite的文獻被引分析功能
HistCite可以通過對從WoS下載的文獻依據被引頻次編制引文編年圖,這也是該工具的主要功能。點擊HistCite主界面最上方的“Tools”-“Graph Maker”-“Make Graph”按鈕,即可得到相應的引文編年圖。引文編年圖可以從GCS和LCS兩個角度進行編制,如果引文編年圖編制時選擇所有文獻,則用GCS和LCS編制的結果是一樣的;在實際繪制過程中,以 LCS 為依據編制引文編年圖更能體現研究的外延和分析的針對性,因此選擇LCS較為合適。圖1為采用HistCite編制的引文編年圖,每一個圓圈表示一篇文獻,圓圈大小代表文獻被引頻次的多少。被引頻次越高,圓圈就越大。帶箭頭的連線代表文獻節點之間的引用關系,箭頭指向的文獻是被引文獻,圓圈內所標數字指明該節點文獻在文獻集合中的順序號。引文編年圖以從上到下的空間順序表示由先到后的時間順序,各文獻按照其發表年份的先后給予序號并安排在圖中相應位置。通過HistCite生成的引文編年圖,可以清楚地觀察到電子政務研究的歷史沿革、研究文獻之間的繼承關系以及在各研究階段的發展程度。圖中,2010—2012年的文獻節點是空白,表明在這個時間段內沒有具有一定影響力的經典文獻,這與文獻被引與時間的累積性相關。而較大的結點如158、220、324、343、225等代表的文獻具有較高的被引頻次,因此可以認為是電子政務研究中較經典的文獻,通過對這些經典文獻的分析,可以一定程度上了解電子政務研究的知識基礎與研究前沿。
然而,被引頻次僅僅是文獻影響力高低的反映,而文獻的共被引卻能夠反映文獻與文獻之間的研究方向或研究主題的關聯,兩篇文獻共被引的頻次越多,說明它們學術研究方向的關聯性越強。由此推而廣之,由多篇文獻間的共被引關系形成的文獻共被引聚類,反映了聚類文獻之間共同的研究方向和關注的熱點主題[11]。HistCite無法實現文獻共被引分析,因此通過該軟件提供的引文編年圖不能夠實現文獻的聚類,也就無法從引文分析的角度揭示解釋熱點主題以及知識結構。
3.7 兩種工具比較結果
表7 兩種可視化工具的比較結果
CiteSpace和HistCite均是基于引文分析的文獻計量可視化分析工具,因此其基本的原理依據是一致的。CiteSpace的核心特色是可以實現文獻計量學指標網絡結構的揭示(共現、共被引網絡),相對而言,HistCite無法揭示網絡結構,其核心特色表現在可以實現各文獻計量學指標的文獻集內和WoS兩種范圍的被引頻次分析,而CiteSpace的被引頻次分析只限于考察主題的文獻集內。具體來講兩種工具在功能上存在以下差異,如表7所示。
4 結語
通過CiteSpace和HistCite兩種可視化工具的比較可知,CiteSpace的功能更加豐富,而HistCite功能較為單一。但無論使用多么智能的可視化工具,在進行某一主題研究時,可視化工具只能提供我們一個研究線索,在具體研究時需要我們輔以深入、全面的文獻調研和專家咨詢才能使研究結果更科學。筆者認為,未來文獻計量可視化研究重點一方面要在知識單元間的測度更加精確與合理上下功夫。例如,通過計算機語義理解,解決一詞多義和一義多詞等詞形與詞性問題等;另一方面要進一步實現方法的融合與改進,進一步完善相關算法。例如,在共引分析中,根據兩被引文獻(或作者等)在同一文獻中的共被引強度給予不同的權值。
參考文獻:
[ 1 ] Lotka A J. The frequency distribution of scientific pr-
oductivity[J]. Journal of the Washington Academy of Sciences,1926,16(12):317-323.
[ 2 ] Gross P L K, Gross E M. College libraries and chemical education[J].Science,1927,66(1713):383-406.
[ 3 ] Bradford S C. Sources of information on specific subj-
ects[J]. Engineering,1934,23(3):85-88.
[ 4 ] Zipf G K. Selected studies of the principle of relative frequencies of language[M].Cambridge:Harvard Univ-
ersity Press,1932.
[ 5 ] Pritchard A. Statistical bibliography or bibliometrics?[J]. Journal of Documentation, 1969,25(4):348-349.
[ 6 ] Garfield E, Sher I H,Torpie R J. The Use of Citation Data in Writing the History of Science[M]. Philadelphia:Institute for Scientific Information,1964.
[ 7 ] Milgram S. The Small World Prolem[J].Psychology Today,1967 (2):60-67.
[ 8 ] 邱均平.信息計量學[M].武漢:武漢大學出版社,2007:408-409.
[ 9 ] 王賢文,劉則淵.基于共被引率分析的期刊分類研究[J].科研管理,2009(5):187-195.
[10] 吳曉秋,呂娜.基于關鍵詞共現頻率的熱點分析方法研究[J].情報理論與實踐,2012(8):115-119.
[11] 潘黎,侯劍華.國際高等教育研究的熱點主題和研究前沿:基于8種SSCI高等教育學期刊2000—2011年文獻共被引網絡圖譜的分析[J].教育研究,2012(6):136-143.
表6 HistCite的關鍵詞詞頻及被引分析二維表
3.6 文獻被引分析
3.6.1 CiteSpace的文獻共被引分析功能
CiteSpace除可以生成文獻共被引圖譜以揭示文獻被引頻次高低和文獻間的共被引關系外,還可以生成時間線圖譜和時區圖譜。時間線圖譜可以將研究主題各微觀知識領域進行聚類,同一聚類排在同一水平線上,并根據時間順序進行排列,從而展示研究主題各微觀知識領域的歷史成果,從中可以研究主題的重要奠基性文獻。時區圖是另一種側重于從時間維度上來表示知識演進的視圖,可以清晰地展示出文獻的更新和互相影響情況,它將結點定位在一個二維坐標系中。根據結點首次被引用的時間,結點被放在不同的時區中,并且所放位置的高度依次增加。一個從左到右,自下而上的知識演進圖就直觀的展示出來,位于坐標系靠左、靠上的結點可以認為是該知識領域的研究前沿。
3.6.2 HistCite的文獻被引分析功能
HistCite可以通過對從WoS下載的文獻依據被引頻次編制引文編年圖,這也是該工具的主要功能。點擊HistCite主界面最上方的“Tools”-“Graph Maker”-“Make Graph”按鈕,即可得到相應的引文編年圖。引文編年圖可以從GCS和LCS兩個角度進行編制,如果引文編年圖編制時選擇所有文獻,則用GCS和LCS編制的結果是一樣的;在實際繪制過程中,以 LCS 為依據編制引文編年圖更能體現研究的外延和分析的針對性,因此選擇LCS較為合適。圖1為采用HistCite編制的引文編年圖,每一個圓圈表示一篇文獻,圓圈大小代表文獻被引頻次的多少。被引頻次越高,圓圈就越大。帶箭頭的連線代表文獻節點之間的引用關系,箭頭指向的文獻是被引文獻,圓圈內所標數字指明該節點文獻在文獻集合中的順序號。引文編年圖以從上到下的空間順序表示由先到后的時間順序,各文獻按照其發表年份的先后給予序號并安排在圖中相應位置。通過HistCite生成的引文編年圖,可以清楚地觀察到電子政務研究的歷史沿革、研究文獻之間的繼承關系以及在各研究階段的發展程度。圖中,2010—2012年的文獻節點是空白,表明在這個時間段內沒有具有一定影響力的經典文獻,這與文獻被引與時間的累積性相關。而較大的結點如158、220、324、343、225等代表的文獻具有較高的被引頻次,因此可以認為是電子政務研究中較經典的文獻,通過對這些經典文獻的分析,可以一定程度上了解電子政務研究的知識基礎與研究前沿。
然而,被引頻次僅僅是文獻影響力高低的反映,而文獻的共被引卻能夠反映文獻與文獻之間的研究方向或研究主題的關聯,兩篇文獻共被引的頻次越多,說明它們學術研究方向的關聯性越強。由此推而廣之,由多篇文獻間的共被引關系形成的文獻共被引聚類,反映了聚類文獻之間共同的研究方向和關注的熱點主題[11]。HistCite無法實現文獻共被引分析,因此通過該軟件提供的引文編年圖不能夠實現文獻的聚類,也就無法從引文分析的角度揭示解釋熱點主題以及知識結構。
3.7 兩種工具比較結果
表7 兩種可視化工具的比較結果
CiteSpace和HistCite均是基于引文分析的文獻計量可視化分析工具,因此其基本的原理依據是一致的。CiteSpace的核心特色是可以實現文獻計量學指標網絡結構的揭示(共現、共被引網絡),相對而言,HistCite無法揭示網絡結構,其核心特色表現在可以實現各文獻計量學指標的文獻集內和WoS兩種范圍的被引頻次分析,而CiteSpace的被引頻次分析只限于考察主題的文獻集內。具體來講兩種工具在功能上存在以下差異,如表7所示。
4 結語
通過CiteSpace和HistCite兩種可視化工具的比較可知,CiteSpace的功能更加豐富,而HistCite功能較為單一。但無論使用多么智能的可視化工具,在進行某一主題研究時,可視化工具只能提供我們一個研究線索,在具體研究時需要我們輔以深入、全面的文獻調研和專家咨詢才能使研究結果更科學。筆者認為,未來文獻計量可視化研究重點一方面要在知識單元間的測度更加精確與合理上下功夫。例如,通過計算機語義理解,解決一詞多義和一義多詞等詞形與詞性問題等;另一方面要進一步實現方法的融合與改進,進一步完善相關算法。例如,在共引分析中,根據兩被引文獻(或作者等)在同一文獻中的共被引強度給予不同的權值。
參考文獻:
[ 1 ] Lotka A J. The frequency distribution of scientific pr-
oductivity[J]. Journal of the Washington Academy of Sciences,1926,16(12):317-323.
[ 2 ] Gross P L K, Gross E M. College libraries and chemical education[J].Science,1927,66(1713):383-406.
[ 3 ] Bradford S C. Sources of information on specific subj-
ects[J]. Engineering,1934,23(3):85-88.
[ 4 ] Zipf G K. Selected studies of the principle of relative frequencies of language[M].Cambridge:Harvard Univ-
ersity Press,1932.
[ 5 ] Pritchard A. Statistical bibliography or bibliometrics?[J]. Journal of Documentation, 1969,25(4):348-349.
[ 6 ] Garfield E, Sher I H,Torpie R J. The Use of Citation Data in Writing the History of Science[M]. Philadelphia:Institute for Scientific Information,1964.
[ 7 ] Milgram S. The Small World Prolem[J].Psychology Today,1967 (2):60-67.
[ 8 ] 邱均平.信息計量學[M].武漢:武漢大學出版社,2007:408-409.
[ 9 ] 王賢文,劉則淵.基于共被引率分析的期刊分類研究[J].科研管理,2009(5):187-195.
[10] 吳曉秋,呂娜.基于關鍵詞共現頻率的熱點分析方法研究[J].情報理論與實踐,2012(8):115-119.
[11] 潘黎,侯劍華.國際高等教育研究的熱點主題和研究前沿:基于8種SSCI高等教育學期刊2000—2011年文獻共被引網絡圖譜的分析[J].教育研究,2012(6):136-143.