梁曉婷
摘 ?要:分析知識圖譜工具相關文獻,發現其研究主要集中在以下四個方面:(1)知識圖譜工具介紹性研究;(2)知識圖譜工具比較研究;(3)知識圖譜工具應用性研究;(4)知識圖譜工具反思性研究。通過探討知識圖譜工具研究現狀,為日后研究人員提供參考,以提高知識圖譜工具應用水平。
關鍵詞:知識圖譜;可視化;工具;研究熱點
中圖分類號:G350 文獻標志碼:A 文章編號:2095-2945(2019)22-0156-03
Abstract: By analyzing the literatures related to knowledge mapping tools, we found that the research mainly focused on the following four aspects: (1) introductory research of knowledge mapping tools; (2) comparative study of knowledge mapping tools; (3) applied research of knowledge mapping tools; (4) reflective research of knowledge mapping tools. By discussing the current research status of knowledge mapping tools, this paper provides reference for future research to improve the application level of knowledge mapping tools.
Keywords: knowledge map; visualization; tools; research hotspots
1 統計分析
目前已有的關于知識圖譜的研究主要圍繞其應用方面的研究,而關于知識圖譜工具本身的研究并不多,筆者于2019年3月30日以“知識圖譜”為檢索詞,在CNKI全文數據庫進行題名檢索,得到2005-2019相關文獻3058篇。添加“工具”、“軟件”之后,得到2011-2019文獻共37篇。本文針對知識圖譜構建工具研究,在詳細分析這些文獻之前,借助CNKI自帶可視化分析工具對這37篇文獻做一個宏觀分析。
從圖1可知,論文年度數量分布呈現明顯的遞增趨勢和階段性特征,可將國內知識圖譜工具研究簡單分為兩個階段:(1)初始階段(2011-2016年):此階段知識圖譜工具研究初漏端倪,相關研究不多;(2)快速增長階段(2016-至今):此階段論文數量快速增加,從2016年開始陡增,2019年文獻不全僅供參考。目前2019年文獻已經明顯超過2018年,可預測文獻將持續增長,研究將繼續保持高研究熱度,并進入研究熱點時期。
2 知識圖譜工具主題分析
通過詳細閱讀文獻內容,發現研究主要集中在以下幾個方面:(1)知識圖譜工具介紹性研究;(2)知識圖譜工具比較研究;(3)知識圖譜工具應用性研究;(4)知識圖譜工具反思性研究。
2.1 知識圖譜工具介紹性研究
早期關于知識圖譜工具的研究主要介紹各種工具的背景、功能,其中介紹國外工具較多,楊思洛[1]等從知識圖譜繪制流程闡述了Bibexcel、CiteSpace、ColPalRed、IN-SPIRE、Leydesdorff、Network workbench Tool、Science of Science、VantagePoint、VOSviewer 9種工具;邱小花[2]等對Sci2軟件介紹與評價。
2.2 知識圖譜工具比較研究
知識圖譜工具比較研究目前較多,其中有國內外對比,還有就幾種工具本身的比較,VOSviewer和Citespace進行比較研究[3],SPSS和TDA進行比較研究[4],對Pajek、CiteSpaceII、UCIENT、Bibexcel、Gehphi、VOSviewer、VantagePoint、NetworkWorkbenchTool、Sci2 Tool、 In-SPIRE、SciMAT、 Histcite 12種工具從數據格式、數據預處理、構建關系矩陣、數據標準化處理以及所支持的知識圖譜分析方法5方面對比軟件優劣勢[5]。通過實例對Bibexcel、CiteSpace、SPSS、TDA和Ucient在共詞分析、作者合作和文獻共被引方面比較研究[6]。對VOSViewer和NWB Tool這兩種工具從基本特征、知識圖譜繪制各階段存在的差異以及所繪制圖譜的特點三個方面比較研究[7]。對HistCite、NWB、ROST CM、Sci2、SATI、SciMAT、Bibexcel、BICOMB、UCIENT、gCLUTO、VOSvi
ewer11種工具進行對比分析[8]。
2.3 知識圖譜工具應用性研究
目前知識圖譜工具應用研究已經應用到各個領域、學科、主題,有徐浩利用CiteSpace的學科領域擴散特征研究[9];肖婉[10-11]、楊麗娟[12]、張苗[13]、鐘名揚[14]利用CiteSpace進行實證應用研究;李文鵬研究了面向開源軟件項目的軟件知識圖譜構建方法[15];李素梅利用CiteSpace和VOSviewer對國內圖書館大數據進行研究[16];其中應用研究占了主要部分,除了應用于各個領域外,還從不同功能從引文分析、共現分析、多維尺度、社會網絡、可視化的角度出發對常用的軟件工具進行理論與應用研究。
2.4 知識圖譜工具反思性研究
知識圖譜研究通常要對大量數據進行處理,選擇合適的數據處理工具非常重要。這些研究工具的功能有所不同,如Wordsmith、Bibexcel、Bicomb主要用于前期的數據處理,將數據轉換為其他軟件可處理的格式;CiteSpace、SPSS、Pajek、Ucinet、Netdraw可對特定格式的數據做深層次處理,這兩類工具通常結合使用。從相關文獻看,研究工具的選擇與研究方法、數據源有較強的關聯性。在采用共詞、聚類和因子分析時,多選擇SPSS;在采用社會網絡分析時,選擇Ucinet和Pajek;在對WOS的引文數據分析時多用CiteSpace。由于繪制知識圖譜的方法有多種,因而相關的工具也有多種。工具的功能雖有側重性,但多有交叉。
3 知識圖譜工具應用中存在的問題
筆者對知識圖譜工具應用中存在的問題進行總結概括,整體上表現在:雖然涌現出很多先進的知識圖譜構建方法和優秀的軟件,在學術界得到了廣泛應用;但存在少數使用者盲目使用、應用層次低等問題;具體表現在以下幾個方面:
3.1 缺乏全面、系統的理論基礎知識
知識圖譜研究最早出現于國外,近幾年才被國內研究者引入國內。引入者多利用知識圖譜構建方法進行實證研究,忽略了基礎理論知識的深入研究與創新,導致實證研究中存在“水土不服”等問題。主要表現在:
3.1.1 數據處理噪聲較大
在數據處理上主要表現在:第一,關鍵詞選擇問題。(1)關鍵詞個數選擇問題,大量文獻表明可參考齊普夫定律和個人經驗確定合適的個數,選擇不同個數的關鍵詞分析結果也會有所差異。(2)關鍵詞的舍棄問題,一些宏觀、沒有具體意義的關鍵詞大量存在會影響分析結果,例如趨勢、網絡、研究等含義寬泛的關鍵詞。(3)關鍵詞的規范和補充問題,由于關鍵詞不是規范化的,所以要進行補充、修訂。第二,關鍵詞合并問題,這個問題出現在大量文獻中。對于相似、相近關鍵詞的合并,不同知識圖譜構建方法合并順序有所不同,如多元統計分析、社會網絡分析在導入可視化軟件之前對源數據進行合并,進而進行深層次分析。而利用CiteSpace進行可視化時,由于源數據的特殊格式只能直接導入,但軟件對可視化后的圖譜可以進行相應的合并操作。但在研究中發現利用CiteSpace等工具進行圖譜分析的很多文獻都沒有進行關鍵詞合并,例如聚類和聚類分析,圖書館和library,這種情況大量出現在同一個圖譜中。如果噪聲過大,將導致最終的分析結果偏離真實情況。
3.1.2 圖譜構建缺乏參考標準
在對源數據進行預處理之后,緊接著進行知識圖譜構建。實驗前,必須確定合理的參數,對于不同的知識圖譜構建方法參數設置方法不同,譬如利用Spss進行多元統計分析時,對于因子分析、聚類、多維尺度分析都存在多種可選擇的方法,從已有的文獻中可看出并沒有統一的標準,爭議較大。而應用CiteSpace進行分析時,參數設置包括時間切片的選擇、相似度的選擇、閾值的設置都會影響最終結果。試驗中,節點個數的選擇、閾值的調整都會影響后期結果的解釋。國內文獻的發表不需要提交后臺數據以及相關證明,論文結果的真實性很難進行回溯性檢驗。
3.1.3 結果解釋問題
得到大量知識圖譜之后,接下來的工作就是圖譜解釋,這是知識圖譜分析非常關鍵的環節。在解釋圖譜時,不僅僅要熟悉各個圖譜,還要熟悉所研究領域的背景知識。從已有的文獻來看,不少文獻得出的結論往往趨于表面、宏觀,有些結論并不需要圖譜分析就能得到。不恰當的知識圖譜解析導致:(1)結論不可靠;由于目前人文學科發表的論文通常不提交實驗數據,所以無法實際驗證,這完全依靠學者的學術道德。(2)結論信息量過少;揭示的結論過于表面化,只是操作工具的演示。(3)深層次的信息被忽略;利用知識圖譜分析的目的是使結論直觀化、形象化,并且能夠通過圖譜分析挖掘隱藏于深處的、隱性的、潛在有價值的信息。
3.2 實證研究過于盲目
對已有的文獻進行閱讀分析發現,雖然相對以往來說,開始側重實證研究,但實證研究中仍存在不少問題,主要表現在:(1)國內學者對大多數主題進行了知識圖譜分析,事實上,并不是每個主題都適用于圖譜分析,有的是由于主題性質問題;有的新主題文獻量并不大,用以知識圖譜分析數據并不充分。所以選題的時候要慎重,不能為了使用工具而盲目進行圖譜分析。(2)實證研究層次較低,結論淺顯。在國外研究的基礎上,國內研究者紛紛轉向實證研究。但查閱已有的知識圖譜相關研究文獻發現,國內一些知識圖譜的研究過于初級,只是將文字形式轉化為圖表、圖譜形式,而缺少深層次信息的挖掘、揭示。(3)研究形式、結論趨于模塊化,缺乏創新。國內研究者熱衷于國外已有的知識圖譜構建方法流程,幾乎全部參考國外的研究模式,而沒有自身的創新之處。
參考文獻:
[1]楊思洛,韓瑞珍.國外知識圖譜繪制的方法與工具分析[J].圖書情報知識,2012(06):101-109.
[2]邱小花,李國俊,肖明.Sci2——一款新的知識圖譜分析軟件介紹與評價[J].圖書館雜志,2013,32(09):79-87.
[3]廖勝姣.科學知識圖譜繪制工具VOSviewer與Citespace的比較研究[J].科技情報開發與經濟,2011,21(07):137-139.
[4]廖勝姣.科學知識圖譜繪制工具:SPSS和TDA的比較研究[J].圖書館學研究,2011(05):46-49.
[5]肖明,邱小花,黃界,等.知識圖譜工具比較研究[J].圖書館雜志,2013,32(03):61-69.
[6]岳曉旭,袁軍鵬,高繼平,等.常用科學知識圖譜工具實例對比[J].數字圖書館論壇,2014(05):66-72.
[7]左麗華,肖仙桃.知識圖譜可視化工具VOSViewer和NWB Tool的比較研究[J].情報科學,2015,33(02):95-99.
[8]鐘秀梅,崔雷.科學映射工具在醫學知識圖譜構建中的比較[J].醫學信息學雜志,2015,36(04):48-53.
[9]徐浩,錢愛兵,朱學芳,等.科學知識圖譜繪制工具CiteSpace的學科領域擴散特征研究[J].情報雜志,2017,36(05):69-74+68.
[10]肖婉,張舒予.國外網絡欺凌研究熱點與實踐對策——基于Citespace知識圖譜軟件的量化分析[J].比較教育研究,2016,38(04):66-72.
[11]肖婉,張舒予.混合學習研究領域的前沿、熱點與趨勢——基于Citespace知識圖譜軟件的量化研究[J].電化教育研究,2016,37(07):27-33+57.
[12]楊麗娟,張璇.知識圖譜視野下的中國旅游人類學研究現狀的可視化分析——基于CITESPACE軟件和CNKI數據庫[J].旅游研究,2016,8(03):20-27.
[13]張苗,蘭夢婷,陳銀蓉,等.國外土地利用與碳排放知識圖譜分析——基于CiteSpace軟件的計量分析[J].中國土地科學,2017,31(03):51-60.
[14]鐘名揚,倫艷華.基于知識圖譜軟件分析近十年我國高等教育研究現狀——以CNKI期刊(2005~2014年)數據為例[J].河北科技大學學報(社會科學版),2015,15(02):94-99.
[15]李文鵬,王建彬,林澤琦,等.面向開源軟件項目的軟件知識圖譜構建方法[J].計算機科學與探索,2017,11(06):851-862.
[16]李素梅.國內圖書館大數據研究的知識圖譜分析——基于CiteSpace和VOSviewer軟件的計量分析[J].河南圖書館學刊,2017,37(05):124-126.