摘 要 在知識圖譜理論的基礎之上,本文選擇Citespace V可視化軟件,對CNKI中1992~2016年間我國內存數據庫研究的文獻進行了分析,繪制內存數據庫研究的關鍵詞、作者等知識圖譜,來分析我國內存數據庫研究的熱點。
關鍵詞 內存數據庫 Citespace V 知識圖譜
一、引言
知識圖譜應用數學、圖形學、信息可視化技術等理論和方法,與傳統的科學計量學引文分析方法結合,用可視化的圖譜形象地展示學科的結構與發展,[1,2]知識圖譜理論與方法近年來成為科學計量學研究的最前沿。
在當前情況下我國對內存數據庫的研究還處在一個逐步發展的狀態,需要我們從比較全面的角度去研究其發展現狀,以便在未來更好、更深入地進行關于這方面的研究。
二、數據來源與方法
(一)數據來源
首先,在中國知網CNKI總庫中,選擇“期刊”“高級檢索”,以“內存數據庫”為主題,對1992~2016年之間所發表出來的文章進行檢索,一共得到的記錄有933條。然后從中以ref格式下載這933篇論文,以備之后分析所用。
(二)研究方法
Citespace是美國費城德雷塞爾大學陳超美教授研制并開發的信息可視化應用軟件,在本文中使用Citespace工具然后將ref的文件格式轉換為txt格式,再將轉換后的格式導進Citespace V軟件中實行可視化分析,主要對關鍵詞、作者等分析,運行繪制我國內存數據庫的知識圖譜。
三、統計與分析
(一)文獻時間分布分析
以5年為間隔的論文年篇數分布統計結果見圖1。從圖1可以看出,我國學者對內存數據庫方面研究所發表的論文數增長趨勢較為平緩,內存數據庫的研究漸漸地引起我國研究學者的關注;尤其是最近的5年里,關于內存數據庫的研究越來越熱門。
(二)文獻關鍵詞分析
關鍵詞是對研究主題的高度歸納,對有關文章的關鍵詞使用共現分析,可以發掘出該領域的研究熱點。因此,對933篇論文進行關鍵詞共被引分析。第一步,將1992~2016年間每一年為劃分的單位,選擇“Keywords(關鍵詞)”為節點,再選取各個時間區中被引用頻次高的前50個關鍵詞,來生成關鍵詞共被引的圖譜。
第一,關鍵詞共現分析。在生成圖譜后,在右方選出“聚類視角”選項,并點擊“自動聚類”標簽。可以得到清楚的關鍵詞共被引聚類知識圖譜(見圖2),圖中的每個圓點都表示一個節點,圓點越大即該詞匯出現的頻率越高;兩者中間的連接表示這兩個節點共同在一篇文獻中出現,線段越粗代表著聯系越緊密,反之亦然。共有738個節點,1594個連接,網絡密度為 0.0059。從圖譜中可以知道,“內存數據庫”這一詞的出現頻率最高,其次是“實時數據庫”“大數據”“數據庫”等。
取詞頻(7次以上)排序統計,得33個頻率高的關鍵詞,結合關鍵詞知識圖譜,可以看出在內存數據庫研究領域,實時數據庫、大數據、并發控制、物聯網等都是其研究的熱點。內存數據庫也屬于實時數據庫的一種,其特點就是在內存的數據庫中,數據庫的所有或者需要存取的數據放于內存中,這樣本來需要對磁盤進行的訪問就取消了,保證了存取速度的快速性。
(三)發文作者分析
對933篇文章進行發文作者共被引的分析,在這中間發表文章次數較高的作者在可視化圖譜中所顯示為的節點比較大。共有776個節點,525個連接,網絡密度為0.0017。從中可以看出,劉云生出現的次數最高,之后是李國徽、廖國瓊等,他們之間共同合作的文章比較多。再者,其他我國內存數據庫研究領域的學者很多都在獨自研究。好多的研究團隊會由導師及學生這樣的組合組成。例如華中科技大學教授李國徽教授與其學生,武漢工商學院盧炎生教授與其學生。
四、結語
本文使用了可視化的技術對我國內存數據庫的研究進行了一些分析,展示我國內存數據庫研究領域的研究熱點、重要的學者等,揭示我國內存數據庫研究的狀況。通過對1992~2016 年間我國內存數據庫研究文獻的知識圖譜分析,可知我國內存數據庫研究發文數量穩步增加,國內學者也不斷加大了對內存數據庫的探究。實時數據庫、分布式數據庫、大數據、物聯網、云計算等為我國內存數據庫研究的主要方向。劉云生教授是我國內存數據庫研究范疇內產出最多的學者,然后是李國徽教授、廖國瓊教授、吳紹春教授等。
(作者單位為上海大學)
參考文獻
[1] 沈建通,姚樂野.多元統計與社會網絡分析法在知識圖譜應用的實證研究[J].情報雜志,2009,28(8):33-36.
[2] 王璟,夏培玲,夏培英.基于知識圖譜的體育科學研究前沿和熱點[J].體育成人教育學刊,2011,27(3):32-35.