關鑫
摘? 要:隨著信息化時代的飛速發展,圖書情報領域也經歷了非常大的變化,網絡的普及以及電子終端的廣泛使用,也出現了讓各種信息載體中的共現信息定量化的共現分析法,這個方法能夠更為精準深入地挖掘潛在的知識,去發現研究對象之間的關系,揭示深含的意義。該文對共現分析法進行了一些分析,并對其對圖書情報領域可視化的研究做出一些討論。
關鍵詞:共現分析法? 圖書情報領域? 可視化研究
1? 共現分析法的概述
1.1 共現分析法的理論基礎
共現分析的一大理論基礎是在從事某一科學專項研究的科學家,不管其知識背景怎樣,也不管社會背景的區別,他們一般存在對同一個課題的研究中所使用的詞匯以及參考文獻都是相同的。所以,在文獻中出現量很大的關鍵詞就成為研究對象,來研究這些詞匯之間的關聯,挖掘詞匯之間的意思,這就建立起了一個對知識結構的描述,然后就可以根據這些內容從微觀層面上對一個學科或者是相關主題的熱點研究分析。
在社會學里科學家往往是將社會、經濟、技術、概念等都進行整合,在研究中為了證明自己的研究及發現,一般會采用一些相關的文獻研究來作為文章發表的內容參考,建立起與參考文獻的關系,也根據情況建立一個知識結構的網絡描述,這樣也就能從宏觀層面上對一個學科或者是相關主題的熱點研究分析。
1.2 共現分析法的類型
共現分析法的研究對象很廣泛,有對文本中的重要詞匯、作者名稱、分類號、標引詞條等,根據研究對象來分又可分為共詞分析和共引分析兩類。
(1)共詞分析。共詞分析即是利用文獻中的共同出現的關鍵詞來反映文本之間的關聯情況,從而來確定該文獻中所代表的學科以及主題結構的研究重點。一般情況下關鍵詞出現的情況越多,就表示這些關鍵詞與主題內容更為貼近。共詞分析主要是利用包容系數及聚類分析等統計分析方法將眾多分析對象之間錯綜復雜的共詞網狀關系以圖形或數值的方式直觀地表示出來。
(2)共引關系。共引關系是指兩篇文獻同時被后來的文獻所引用,用共引的強度是表示同時共同引用這兩篇文獻的次數進行測試,一般認為共引的強度越大,文獻之間的關系則更為親密。共引關系主要是利用聚類分析、多維尺度分析等多元統計的分析方法將許多的分析對象互相之間的復雜關系簡化成數目較少的不同類別的關系表達出來。
2? 基于共詞分析法對圖書情報領域的分析
關鍵詞是為文獻標引而從論文中選取出來的,是文獻的學術思想觀點的集合。關鍵詞共現是指兩個或者兩個以上的關鍵詞在同一篇文獻中同時出現。
2.1 構造關鍵詞共詞關系矩陣
在圖書情報系統中通過計算機程序可以統計出指定期間的論文關鍵詞出現的頻率,再以關鍵詞的出現頻次來排序就可以得出關鍵詞的排列表,然后經過科學計量學的方法來將同類似的同義詞也進行整理,即可確定兩個階段的關鍵詞表,我們就可以關鍵詞表來作為共詞分析圖書情報領域中研究熱點的學科。
2.2 構造相關矩陣
在實際的共詞分析的過程里,關鍵詞兩個共現的頻次的原始矩陣其實反映的也是一種表象,要真正體現其間的共現關系是需要對詞頻率進行處理。包容化的處理能夠反映出兩詞之間的關系,一般包容處理的公式有包容指數、相互包容系數法、臨近指數法等。
2.3 基于共詞分析法對圖書情報領域的分析
通過共詞分析法等對于我圖書情報學科的研究主題及領域進行了分析,微觀上看出我國圖書情報學科的發展變化有幾下幾種。
(1)熱點研究領域穩中有變。從研究主題中發現我國基本研究領域及重要研究熱點都是非常穩定的,但是隨著信息技術的不斷發展,以及社會發展規律的變化,已經出現信息資源建設等研究重點,而且這一類的研究也已經非常成熟了,同時也擴大了研究的新范圍。
(2)熱點研究領域出現新特征,在分析中發現我國圖書情報領域的研究熱點領域也出現許多新特征,比如知識管理的效能化、信息檢索的數字化、信息資源建設的網絡化、用戶服務的專業化等。
(3)研究內容和領域的其他特性。分析表明我國圖書情報的主要研究熱點較為突出,依然是保持著學術特色,與此同時也有許多新的研究熱點不斷出現,因此可以看出,我國圖書情報學的研究內容和領域都是有一定的發展性、傳承性、連續性、穩定性及變化性的。
3? 基于共引分析法對圖書情報領域的分析
共引分析法一般是分別利用傳統的多元統計分析以及先進的社會網絡分析方法和相關軟件來對圖書情報領域最具影響力的主流學術進行作者共引分析,借助可視化技術來展示我國圖書情報學術流派及學科結構的詳細內容,然后從宏觀層面來揭示其中的學科熱點及學科力量。
共引分析法的作者選擇中因為涉及到學科研究者的評價,所以也是目前作者共被引分析法中的一個難點,在目前主要是通過作者的文獻被引用的頻次量來選擇作者的。而一般由共引分析法中可以得出被引用文獻的頻次越高,出現兩作者同被引的概率也就越大,一般被引用的作最多的作者應該都是圖書情報領域的帶頭人,肯定是在學術界中的有很高聲望的人。
3.1 建立作者共被引數原始矩陣
根據作者共被引有不同的形式可以分為純作者共被引分析、第一作者共被引用分析、特定作者共被引分析等等。利用計算機程序在引文數據庫中根據要求進行統計,形成作者共被引次數的原始矩陣。一般是對稱矩陣。在同被引分析的過程里會舍去對實際分析意義幫助不大的數據,讓數據縮減使研究更為精確。
3.2 原始短陣轉化為相關矩陣
因為原始矩陣中作者被引頻次的不同非常容易造成數據的懸差過大,要想消除影響而得到更容易解釋的結果從而能夠進一步核查分析對象之間的程度,可以將短始矩陣轉換為相關矩陣來進行分析。
3.3 基于共引分析法對圖書情報領域的分析
從分析結果分析,宏觀層面上我國圖書情報的熱點研究及結構研究的領域有如下特點。
(1)熱點研究領域已經形成。由相關研究中可以看出情報學理論以及圖書館學科理論的研究是近十年來我國圖書情報的主要研究重點,可是作為主導研究的這兩個理念包容性非常強,研究的內容也是非常廣泛,在研究的方面不夠深入,導致學術的流派不是非常明顯,而且許多的學者也都只是站在理論的方面進行研究和探討。而國外的圖書情報學科內容劃分為信息計量學、網絡信息資源建設、情報檢索這三大核心領域,剛好與此相反。
(2)學科研究力量不均衡。根據分析的圖譜顯示出我國圖書情報研究中,圖書館學理論及情報學理論的研究人員占據主導,但是在其余方面的研究力量都很弱,學術集團的實力是呈梯形遞減的情況分布,這種不均衡的情況需要進一步加強的。
(3)新的研究領域已出現。目前我國圖書情報學科也已經在信息技術革命中開始對數字圖書館的領域、信息資源管理以及分析領域進行研究,并且還形成一定的基礎,這是令人高興的研究。
4? 結語
在該文的研究中,針對共現分析中的共詞分析及共引分析法對于圖書情報領域進行了研究,從關鍵詞頻到作者共引分析中了解到圖書情報分析的領域及學科重點,并且探索出新的研究領域,相信隨著社會進步、信息技術以及學科的不斷研究發展,我國的圖書情報領域將會有更加壯大的發展。
參考文獻
[1] 李杰.安全科學結構及主題演進特征研究[D].首都經濟貿易大學,2016.
[2] 李炯.基于共現分析的圖書情報領域可視化研究[D].山東大學,2014.
[3] 秦長江.基于科學計量學共現分析法的中國農史學科知識圖譜構建研究[D].南京農業大學,2009.