摘要:當今社會信息技術發展日新月異,互聯網技術、數據庫技術、人工智能技術等在各個領域的應用日臻成熟;信息化數字化時代的到來,信息的獲取和利用日益方便和快捷,為科學研究提供了不可或缺的分析基礎,這些都為科學計量學的研究奠定了發展基礎。
關鍵詞:圖書情報學知識圖譜聚類分析
1. 緒論
知識圖譜(Mapping Knowledge Domains)是顯示科學知識的發展進程與結構關系的一種圖形,它以科學知識為計量研究對象,屬于科學計量學范疇[1]。它是基于內容分析、引文網絡分析和信息可視化的一種可視化顯示知識以及相互關系的一種圖形,已經成為當前科學計量學中比較熱門的研究方法。知識圖譜在圖書情報學領域也稱為知識域可視化或知識領域映射地圖,是現實知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系[2]。
2. 圖書情報學知識圖譜的構建
2.1 數據獲取和處理
對于高頻主題詞的提取,目前國內外還未形成統一權威的標準。大多數學者在選擇小樣本主題詞時都是按照詞頻大于某個特定值的方法,認為大于這個特定值即可認定該主題詞是高頻主題詞。此外還需要考慮提取的高頻主題詞占所有主題詞詞頻的比重,根據主題詞累積詞頻的變化截取高頻主題詞。
2.2 共詞分析
共詞分析是一種內容分析技術,它通過分析在同一個文本主題中的款目對共同出現的形式,確認文本所代表的學科領域中相關主題的關系,進而探索學科的發展。共詞分析的主要作用是通過對高頻主題詞的聚類,發現研究對象的分析熱點和主要內容,深入揭示相對應的研究結構,進而系統探討其研究維度、學科背景和理論基礎,以期進一步把握其研究現狀、學術熱點及發展趨勢。
2.3 相關分析
相關分析是研究現象之間是否存在某種依存關系,是以分析變量間的線性關系為主,是研究它們之間線性相關密切程度的一種統計分析方法[3]。通過相關分析,界定任意兩個主題詞之間的距離,以及這種距離所代表的關系,從而進一步確定主題與主題直接或正或負的聯系。
相關分析是整個數據處理過程中比較簡單的一步,卻至關重要。SPSS的統計分析是建立在相關系數的基礎上,需要基于相關矩陣表進行。因此,須將以上共詞矩陣經過特定的相關性轉化為相關矩陣,以便SPSS統計分析。共詞矩陣轉化為相關矩陣通過Excel來完成,具體步驟是:在Excel中加載宏,導入分析工具庫-VBA函數,使用Excel中自帶的數據分析模塊進行相關系數的計算,通過“工具”-“數據分析”-“相關系數”,對共詞表中的每一列進行相關系數的運算,由此可以得到完整的100*100的相關矩陣表。得到100*100主題詞相關矩陣后,就可以通過SPSS統計分析工具進行因子分析,聚類分析以及多維尺度分析,并構建圖書情報學知識圖譜。然后通過SPSS對主題詞進行了一系列的因子分析、聚類分析和多維尺度分析,在此基礎上得到圖書情報學研究的各個大類,
3. 圖書情報學知識圖譜的解讀
3.1 基于主題詞的總體分析
對主題詞的總體分析主要是對研究范圍內選取的樣本進行SPSS分析后獲取的前100位的主題詞上,在圖譜構建中主題詞對應的百分比就表示在這一年該主題詞出現的次數占該年所有提取的主題詞總詞頻數的比重。“平均比重”則表示該主題詞在研究年限范圍內的平均值;“變化狀態”表示研究年限范圍內的變化情況,會有“持續上升”和“持續下降”兩種情況;“無顯著規律”則表示該主題詞在研究年限內變化比較反復;研究年限中的“末年比初年增長幅度”表示末年比初年的增長比例,用以衡量該主題詞在末年的關注度和熱度相較初年的情況,比例越高,增速越大,發展越快。
3.2 學科發展的現狀與熱點
通過前文的統計分析和當前科學研究趨勢可以將圖書情報學研究的結果進行具體分類,當前對于圖書情報學研究的文獻顯示,通過對2005-2011年的主要樣本進行分析后能夠將圖書情報學圖譜分為11個大類,從而得出當前圖書情報學的科學發展現狀與熱點分別是:醫學信息學、信息計量學與出版、圖書館系統、計算機技術與管理、網絡信息資源、信息管理與信息系統理論、電子資源、網絡資源與醫學圖書館、數字圖書館、教育與信息素養、信息行為與信息共享。
3.3 科學發展態勢
綜合以上對圖書情報學11大類研究主題的內容剖析和現狀分析,可以看出,現階段的學科發展主要集中在圖書館實體研究、資源對象以及學科基本信息理論三個方面[4]。而在每個方面下,又有不同的發展側重點,如在實體研究中,主要是根據系統的觀點,將圖書館劃分為結構、職能、作用、類型、表現形式各不同的子元素,研究多集中在學術圖書館、圖書館人員和圖書館的地域研究上;在資源對象方面,主要是將圖書情報學的研究對象——信息資源作為研究主導,尤其是針對目前網絡信息資源迅猛發展的情況,因此研究多集中在網絡資源的檢索與評價方面;在學科基本信息理論方面,研究則多集中在管理和技術兩大方面,其中管理側重于對信息資源管理和知識管理的研究,而技術更多的是面向檢索技術和存儲技術的研究[5]。
4. 結論
在知識經濟發展的大環境下,知識圖譜的應用受到了越來越多的關注,而關注的增多必將會帶來更深入的研究。如今對知識圖譜的研究多數還只是局限在對某個特定主題的分析之上,對學科和領域的研究不是很多。因此,各個學科在審視自身發展的同時,可以借助知識圖譜的分析,可視化地顯示學科發展的態勢和走向,為研究方向提供參考。
參考文獻
[1] 肖明李國俊楊楠. 基于詞頻分析的國內情報學研究熱點(1998~2007)[J]. 情報雜志,2009(28): 21-25.
[2] 陳蘭杰. 國內情報學理論2008年研究熱點及發展趨勢[J]. 情報雜志, 2009(28(8)): 55-58.
[3] 嚴怡民. 現代情報學理論[M]. 武漢: 武漢大學出版社,1996.
[4] 梁戰平. 開創情報學的未來——爭論的焦點問題研究[J]. 情報學報, 2007(26(1)): 14-19.
[5] 周承聰. 信息生態鏈中的信息流轉[J]. 情報理論與實踐,2007(30(6)): 725-727.
作者簡介:
金葉(1982-),女,山西長治人,學歷:中南大學醫藥信息系2009 級碩士研究生在讀,職務:長治醫學院信息管理系教師。