趙蓉英 吳勝男
(武漢大學信息管理學院 湖北武漢 430072)
館藏資源一直是我國圖書情報實踐領域和教學科研領域的核心主題之一。對館藏資源研究主題進行分析,有助于圖書情報機構更好地了解新信息環境下館藏資源研究的特點及發展趨勢,提高圖書館的知識服務能力和水平以及館藏利用率,從而針對用戶需求提供準確、有效的知識服務。為了了解我國圖書情報領域館藏資源研究的主題分布情況和我國館藏資源研究的主要研究主題,本文應用共詞分析、層次聚類以及戰略坐標的方法,繪制出我國館藏資源研究的主題戰略坐標圖,直觀地展示出館藏資源研究各主題的發展情況以及核心研究內容。最后通過對我國館藏資源研究的主題分析,就我國在該領域的研究提供建議,為館藏資源研究的發展與成熟提供強有力的支撐,這也是本文的研究意義和目的之所在。
本文依托CNKI數據庫的中國學術期刊網絡出版總庫、中國學術期刊全文數據庫以及中國博碩士學位論文全文數據庫,“館藏資源”進行主題檢索,共獲得論文4455篇。經過數據去重之后,共得到相關論文4365篇。
本文主要采用共詞分析、層次聚類以及戰略坐標分析的方法,以檢索到的4365篇論文為數據源,利用自編的VBA程序以及SPSS19軟件生成我國館藏資源研究的高頻關鍵詞矩陣以及主要的關鍵詞類團。通過計算每一類團中各關鍵詞的粘合度值,表達類團中各關鍵詞對聚類成團的貢獻程度,確定每一類團的核心概念;同時通過計算不同關鍵詞類團的向心度和密度值,繪制出我國館藏資源研究中不同研究主題的戰略坐標圖,描述各研究主題內部聯系情況和主題間相互影響的情況。
本文以檢索到的與館藏資源相關的論文為數據源,套錄每一篇文獻的關鍵詞,統計各關鍵詞的詞頻,考慮到多數關鍵詞出現的頻次較低,從而導致共現的頻次也低,而且過于零散的詞頻分析結果無法深入的展示出各研究主題的產生演變情況以及主題間的交叉融合情況,從而阻礙了對于某一研究總體研究趨勢的把握。因此本文截取了前98個、頻次大于20的高頻關鍵詞作為本文的研究對象(見表 1)。

表1 我國館藏資源研究高頻詞列表(頻次大于20)
在得到我國館藏資源研究的高頻關鍵詞列表后,本文利用自編的VBA程序,統計其共現關系,生成了高頻關鍵詞的共現矩陣。但是這種共現矩陣所反映出來的關鍵詞之間的關聯只是一種表象,因為兩個關鍵詞共現頻次的多少直接受到各自詞頻大小的影響。為了真正揭示關鍵詞之間的共現關系,本文引入了表現關鍵詞共現相對強度的指標——Salton指數。
Salton指數的計算公式為:

其中n和n分別表示關鍵詞i、j出現的頻次,n表示關鍵詞 i與 j共現的頻次。
利用Salton指數,本文得到了我國館藏資源研究高頻關鍵詞之間的相對共現強度矩陣(見表2)。
將上述矩陣輸入到SPSS 19軟件中,對其進行聚類分析,發掘關鍵詞矩陣中關聯強度大的主要詞群,從而揭示出我國館藏資源研究的主流領域。在聚類的過程中,聚類方法主要選用層次聚類法,其原理是先將所有n個變量看成不同的n類,然后將性質最接近的兩類合并為一類;再從n-1類中找到最接近的兩類加以合并,依此類推,直到所有的變量被合并為一個大類。類內部個體特征之間具有相似性,不同類間個體特征的差異性較大。聚類標準采用歐式距離平方,并選用Z分數對矩陣中的數據進行標準化的處理。最后得到我國館藏資源研究高頻關鍵詞共現聚類樹圖。根據聚類結果,同時參考相關的文獻,本文最終將我國館藏資源研究的高頻關鍵詞聚為17類。
上述得到的高頻關鍵詞聚類結果,是通過詞間距離的遠近而形成的類團。這些類團只能顯示出哪些關鍵詞之間的關聯較強,而對于這些類團的中心概念卻無從得知。為了對各類團的主題進行正確的分析,本文引入了鐘偉金等學者提出的粘合力思想,用以衡量類團內各主題詞對聚類成團的貢獻程度,表達每個主題在類團的聚集過程中所起作用的程度。在類團中,粘合力最大的詞稱為中心詞,中心詞在確定類團的名稱與性質中起至關重要的影響,能夠表征某一類團的核心概念。計算公式為:

其中 N(A)表示關鍵詞 Ai的粘合度,F(A→B)表示關鍵詞A與同一類團其余關鍵詞的共現頻次。根據上述公式,本文計算出了17個類團中每一個關鍵詞的粘合度值,并以此為基礎,對17個類團進行主題分析。因為篇幅的限制,本文只列舉出子類團1的關鍵詞粘合度計算結果(見表3),其余的類團只列出其主題分析結果。

表3 我國館藏資源研究子類團中關鍵詞粘合度值列表
從列舉的各關鍵詞的粘合度值可以判斷出,這個類團所研究的主要內容是館藏的電子期刊資源利用、整合以及利用率的評價。按照以上方法,其余類團的主題分析結果如下所示:
類團2:各類型圖書館網絡數字資源共享建設以及開發利用;類團3:基于用戶需求的館藏資源建設以及開放存取;類團4:公共圖書館館藏文獻資源建設發展;類團5:圖書館信息服務、讀者服務以及管理創新;類團6:高職院校圖書館基于教育職能的圖書館建設;類團7:檔案館館藏資源建設;類團8:基于讀者需求的醫院圖書館工作以及讀者服務模式與質量研究;類團9:開架借閱對大學生素質教育的影響;類團10:知識經濟時代下的圖書館資源與服務;類團11:各類型圖書館虛擬館藏文獻資源的共建共享;類團12:學校圖書館學科館員的參考咨詢;類團13:各類型圖書館的藏書建設;類團14:館藏資源的數字化、網絡化以及信息自動化建設;類團15:信息時代館藏資源的知識管理研究;類團16:基于讀者需求調查的個性化服務研究;類團17:館藏資源的知識產權研究。
本文將館藏資源研究的高頻關鍵詞進行共現、聚類以及粘合力指標的計算后,得到了我國館藏資源研究的主題,粘合力的計算進一步確定了館藏資源研究的具體主題內容。但問題也隨之出現,即共詞聚類分析以及粘合力指標的運用只有助于了解某研究領域內具體的研究主題,然而各研究主題的發展狀況以及成熟度卻無法揭示,同時對于不同主題之間的關系以及該研究領域內核心研究主題的確定也無從了解。因此,為了考察我國館藏資源研究領域不同研究主題的研究地位以及發展潛力,本文引入了戰略坐標這一概念。
戰略坐標是LAW在1988年提出的,用來描述某一研究領域內部聯系情況以及領域間的相互影響情況。在戰略坐標地圖中,有兩個非常重要的指標——密度與向心度來衡量某一研究領域各主題類團的內部發展狀況以及主題類團間的相互影響狀況。
密度是一種用來衡量主題類團內部關聯強度的指標,它表示該主題類團維持和發展自己的能力。類團密度有很多種計算公式,可以用本主題類團內所有關鍵詞間兩兩共現頻次總和的均值、中位數或者平方和來表示。由前文介紹的粘合力指標得知,粘合力是用來表示主題聚類類團中各個關鍵詞的重要程度,而密度是對類團內部聯系的緊密程度的表示,因此從概念上來看,二者有著十分密切的聯系。有學者也在研究中表明,類團密度的計算公式可以用粘合力來表示,具體的表示方法如下:

向心度用來衡量一個類團與同一研究領域的其它類團聯系的緊密程度。向心度越大,說明某一研究領域的一個主題類團與其它主題類團有著緊密的聯系,因此該主題在這一研究領域中就占據核心地位。向心度的計算可以用某一類團中關鍵詞與其余類團中的關鍵詞兩兩出現頻次的總和,平方和或者平方根來表示。類團內關鍵詞數量的多少對于類團的向心度的影響很大,因此本文對于向心度的計算方法進行了改良,即將用某一類團中關鍵詞與其余類團中的關鍵詞兩兩出現頻次的總和除以該類團內的關鍵詞總數,從而解決了這一影響。

表2 我國館藏資源研究高頻關鍵詞共現的Salton指數矩陣(部分)
綜上對于密度以及向心度的表述,本文計算出了我國館藏資源研究領域各主題類團的向心度以及密度 (見表 4)。

表4 我國館藏資源研究領域各個主題類團密度以及向心度值列表
戰略坐標圖以向心度和密度為參數繪制成的二維坐標圖,其典型結構是橫軸表示向心度,縱軸表示密度,坐標的原點在兩個軸的中位數或者平均數。這個地圖將每一個二維空間的題目領域劃分為4個象限,可以用來描述各主題的研究發展狀況。按照上述繪制主題戰略坐標圖的方法,本文繪制出了我國館藏資源研究的主題戰略坐標圖(見圖 1)。

圖1 我國館藏資源研究主題戰略坐標圖
從圖中可以清晰地發現,沿著X軸方向,向心度值越大,在戰略坐標圖中,主題類團所在的位置越偏右,向心度越大,這說明了該主題類團與其它主題類團關聯十分緊密,具體則表現為這種主題類團中的關鍵詞與其它主題類團中的關鍵詞能形成搭配在同一篇文獻中出現,即兩個主題類團中的關鍵詞共現頻度較高。這些都充分說明了該主題類團在所屬領域占有重要地位,是其領域內的核心主題或者關注熱點,具有強大的生命力,不易消失。沿著Y軸方向,密度值越大,在戰略坐標圖中,主題類團所在的位置越偏上,密度越大,這說明該主題類團內部的關鍵詞聯系非常緊密,在所屬領域中該主題研究已經趨向成熟。同時本文以向心度以及密度平均值的相交點(0.86,0.32)作為坐標原點,將整個戰略坐標圖分為四個象限。下面對處于四個象限中的主題類團分別作具體分析。
類團17所代表的研究主題 “館藏資源知識產權研究”位于戰略坐標圖的第一象限,擁有的密度與向心度值都很高,這表明此研究主題不僅內部關聯緊密,而且與其它研究主題也存在著較強的聯系。這種情況說明了兩個問題,一是該象限的主題類團是所屬學科的重要研究內容以及研究熱點;二是主題類團中的關鍵詞是所屬學科研究的活躍主題,受到關注也很多,且與其余主題研究關聯密切。
戰略坐標圖第二象限中的類團2所代表的各類型圖書館網絡數字資源共享建設以及開發利用研究主題以及類團7所代表的檔案館館藏資源建設研究主題密度值很高,向心度值卻較低。這表明這些研究主題內部關聯緊密,已經自成一體被很好地研究過,形成了相對獨立的研究領域,但是這些研究主題與其他研究主題聯系不是十分密切,在學科表現不活躍,生命力不太頑強,因此這些主題發展到一定規模后,可能會由于沒有有效的提升動力而慢慢消失。
處于密度以及向心度都較低的第三象限的主題類團有類團 1、類團5、類團6、類團9、類團 10以及類團 12,它們分別代表的館藏的電子期刊資源利用、整合以及利用率的評價、圖書館信息服務、讀者服務以及管理創新、高職院校圖書館基于教育職能的圖書館建設、開架借閱對大學生素質教育的影響、知識經濟時代下的圖書館資源與服務、以及學校圖書館學科館員的參考咨詢;這些研究主題內部結構松散,與其他的研究主題聯系不密切,屬于所在研究領域關注較少的邊緣研究領域,研究尚不成熟,有待于進一步發展。
戰略坐標圖第四象限中的主題類團 3、4、8、11、13、14、15、16的向心度很高,說明這些主題類團與其它主題類團的聯系緊密,在所屬研究領域表現活躍,是其它主題類團重視的研究主題,但是自身內部結構松散,發展不夠成熟。在后續研究的發展中,由于研究主題分散容易演化成相關主題。因此總體來說,這類研究主題具有一定的發展潛力,但是由于自身聯系不緊密,結構不穩定,易分解。
通過上述對于我國館藏資源研究的主題分析,可以發現我國館藏資源研究雖然取得了一定的成果,但是仍然有很大的發展空間。位于戰略坐標圖四個象限中的研究主題為了取得后續的發展,都需要進行一定程度的努力,而努力的最終目標就是向著第一象限前進,成為所屬領域的研究熱點和活躍主題。為此,本文提出了以下建議:
⑴館藏資源的知識產權研究想獲得發展要做到研究上的“深”與“廣”。眾所周知,事物的發展是一個循環往復,不斷上升的過程,有著特定的生命周期規律。由于受到社會需求、技術發展等多種因素的影響,某些反映某一領域研究熱點以及核心內容的研究主題可能會被其它新的研究熱點以及主題所代替。所以,位于戰略坐標圖第一象限的研究主題——館藏資源知識產權研究是目前館藏資源研究領域發展成熟度與活躍度都很高的研究主題,為了保持住其研究地位,要在研究上做到“深”與“廣”這兩方面。從研究深度上來說,該研究主題要做更深層次的研究,使其發展的更加成熟,內部結構更加穩定;從研究廣度上來說,該研究主題要注重與其它研究主題的聯合,從而形成更廣泛的研究,推動該研究主題更上一個層次,從而拓寬其所屬領域的研究視野。
⑵對于圖書館、檔案館館藏資源的共建共享研究要注重研究范圍的拓展。圖書館、檔案館館藏資源的共建共享等主題位于戰略坐標第二象限,對于此類主題的研究目前已經相對成熟且獨立,因此這些研究主題為了獲得新的發展,就需要有效的提升動力。此類研究主題需要拓寬研究范圍,尋找與其它主題合適的契合點,從而形成新的知識研究點,為此類主題的研究注入新鮮的血液,從而促進該主題領域的發展。
⑶位于第三象限的研究主題可以作為館藏資源研究新的研究思路和研究方向。存在于戰略坐標第三象限的研究主題包括館藏電子資源的研究,高職院校圖書館基于教育職能的館藏建設,以及在當今時代背景下的圖書館服務研究等等,從發展狀況上來看,這些主題內部結構松散,研究尚不成熟;但是從研究內容上來看,這些主題均是館藏資源研究結合當今的時代背景、研究主題以及社會需求發展起來的新興研究主題,它們可以作為館藏資源研究新的發展方向,為館藏資源的研究發展提供借鑒和思考。因此該類研究主題為了取得進一步的發展,一方面要加強自身的理論研究,夯實研究基礎,為后續研究發展做鋪墊;另一方面要抓住時機,尋找與發展成熟的研究主題完美的結合點,成為館藏資源研究新的發展思路與研究方向。
⑷館藏資源的開放存取、知識管理、虛擬館藏以及信息化建設等研究要提高主題的一致性。第四象限的研究主題多而分散,包括了館藏資源的開放存取、知識管理、虛擬館藏以及信息化等主題。經過分析發現,這些主題大多都是館藏資源研究與其他領域通過結合而形成的研究主題,研究的新穎性強。但是這些主題也存在著致命的弱點,即內部聯系不緊密,易分裂分化相關主題。為了克服這一缺點,這些研究主題在研究的過程中要注意主題一致性,尋找研究主題的共性,將所有研究圍繞這一共性去展開,使主題內部形成穩定的結構,從而促進該類研究主題的發展成熟。
本文系統的分析了我國館藏資源研究的主題分布情況以及發展狀況,但是由于本文分析的數據源僅限于學術論文,沒有統計專著、研究報告等其它類型的數據,此外由于檢索策略以及共詞分析固有的缺陷,本文中的分析難免有片面或者疏漏的地方。在后續研究中,筆者將致力于改善這一狀況,以便更全面客觀地反映館藏資源研究的發展狀況。
[1]梁立明等.科學計量學:理論探索與案例研究[M].北京:科學出版社,2006.
[2]楊穎,崔雷.基于共詞分析的學科結構可視化表達方法的探討[J].現代情報,2011,(1):92-96
[3]鐘偉金,李佳.共詞分析方法研究(二)[J].情報雜志,2008,(6):141-143.
[4]馮路,冷伏海.共詞分析方法理論進展[J].中國圖書館學報,2006,(2):88-92.