周文博 傅榮賢
(1.黑龍江大學信息管理學院 黑龍江哈爾濱 150080;2.黑龍江大學信息資源管理研究中心 黑龍江哈爾濱 150080)
隨著信息時代的到來,中國目錄學正處在從古典目錄學向現(xiàn)代目錄學邁進的初期階段。〔1〕近年來,有關(guān)目錄學研究回顧和展望的定性分析論文屢見不鮮,但定量分析論文卻寥寥無幾,而且在為數(shù)不多的定量分析論文中,研究方法也仍停留在文獻計量學的相關(guān)領(lǐng)域,由于文獻系統(tǒng)的高度復雜和不確定性,其分析結(jié)果的準確性和實證性也有待加強。而信息計量學作為文獻計量學的發(fā)展方向〔2〕,在計量對象的廣泛性和計量結(jié)果的準確性方面都有很大提高。本文通過信息計量學中作者共被引分析(Author Co-citation Analysis,ACA)的相關(guān)方法,運用信息可視化技術(shù)繪制出作者共被引圖譜,在直觀形象地揭示目錄學研究的學科結(jié)構(gòu)、學科力量分布及研究熱點的同時,將定性分析具體化,從而以更新的角度更科學深入地反映出目錄學的發(fā)展現(xiàn)狀,并進一步預測其發(fā)展趨勢。
高影響力作者的選擇是ACA分析的關(guān)鍵一步,目前尚無統(tǒng)一的選擇方法。為了更突出所選作者的高影響力,本文采用h指數(shù)這一國際上學術(shù)評價的新指標,即“h篇論文分別被引用了至少h次”作為統(tǒng)計標準,這不僅表明評價對象的發(fā)文質(zhì)量高,也表明其發(fā)文數(shù)量多。〔3〕
在數(shù)據(jù)庫選擇上,為了使檢索結(jié)果更全面,我們選擇了中國學術(shù)期刊網(wǎng)全文數(shù)據(jù)庫(CNKI)中的中國學術(shù)期刊網(wǎng)絡出版總庫(CAJ)作為數(shù)據(jù)來源。首先,以“目錄學”為檢索詞,時間跨度為1950~2011年,分別按題名、關(guān)鍵詞和主題,以精確匹配方式進行檢索,再通過閱讀標題、關(guān)鍵詞和摘要,排除不相關(guān)文獻、重復文獻及書評、人物傳記等,得出有效文獻4236篇。檢索時間為2011年11月30日。同時為了更好地反映作者的學術(shù)關(guān)聯(lián)程度,又剔除了10篇可能對作者共被引分析結(jié)果造成影響的綜述性論文,如文獻〔4〕。然后將剩余4226篇文獻的題名、作者、被引次數(shù)信息導入Excel表格,計算每位作者的h指數(shù)。經(jīng)過統(tǒng)計,h指數(shù)為3及以上的作者16人,占總作者人數(shù)的4.34%。另外為使分析結(jié)果更加精確,筆者將h指數(shù)為2且總被引次數(shù)較多的頭兩位作者也劃入高影響力作者群體中。由此共檢索出高影響力作者18人。如表1所示。

表1 高影響力作者分布
對表1進行分析發(fā)現(xiàn),18位高影響力作者中有17位分布在高校,其中有11位教授,并且有半數(shù)以上為博導,除此之外還有5位來自高校圖書館,他們憑借豐富的理論知識和實踐經(jīng)驗構(gòu)成了目錄學研究的核心群體;同時從作者的教育背景看,有11位畢業(yè)或就職于武漢大學,4位畢業(yè)或就職于北京大學,可見武大和北大是我國目錄學研究領(lǐng)域的兩支主要力量,這主要因為兩所高校均是百年學府,為目錄學興盛奠定了深厚的文化基礎(chǔ)。
高影響力作者選擇后要建立共被引矩陣。為此,本文采用了在CAJ下載文獻集合,進行逐篇統(tǒng)計作者共被引次數(shù)的方法。這種方法雖然繁瑣,但經(jīng)過多次排查可以提高統(tǒng)計結(jié)果的準確性并能有效降低漏檢率。但應該注意兩點:1、部分文獻對高影響力作者的論文多次引用,要避免重復統(tǒng)計;2、要確保每篇被引用的高影響力作者的論文滿足檢索條件,即在目錄學范圍之內(nèi)。將統(tǒng)計完的共被引次數(shù)輸入矩陣,共得到(18 17)/2=153組不同的數(shù)據(jù)。該矩陣為對稱矩陣,對角線取該作者和其他作者共被引次數(shù)最大值+1來表示〔5〕。如表2所示。

表2 作者共被引矩陣(部分)
共被引矩陣建立之后需要對其進行標準化處理,以便更好地觀測相似性。但可以將其作為輸入矩陣在SPSS(Statis-tical Product and Service Solutions)軟件的聚類和多維尺度分析中自動實現(xiàn),無需把轉(zhuǎn)化后的矩陣作為輸入矩陣。〔6〕
本文采用的聚類方法是分層聚類,其原理是將每個作者看成一類,然后把距離最近的兩類依次合并,直到把所有作者歸為一類。這種聚類方法可以獲知同行作者的數(shù)量、構(gòu)成、活動規(guī)律等多方面情況,若把某專題研究的同行作者聯(lián)合起來,加強學術(shù)交流,開展聯(lián)合攻關(guān),將大大促進目錄學研究的深入和發(fā)展。〔7〕將表2導入SPSS17.0,采用組間平均鏈鎖法(Between-group Linkage),不相似測度方法選擇平方歐氏距離(Squared Euclidian Distance),標準化方法選擇Z得分,以減少計算誤差,得到聚類分析樹狀圖。如圖1所示。由樹狀圖可直觀看出18位高影響力作者被分成四類,這也是目錄學研究的4個主要團體。如結(jié)合作者的發(fā)文情況,可進一步歸納出這四類研究團體的主要研究方向。第1類主要是古典目錄學方面。第2類主要是國外目錄學和近代目錄學家研究方面。第3類主要是目錄學基礎(chǔ)理論方面,即目錄學定義、研究對象、研究方法等問題的商榷與探討。第4類各方面均有涉及,尤其在數(shù)字目錄學、書目情報等前沿問題上有較深研究。

圖1 聚類分析樹狀圖
第1類研究群體中有傅榮賢、王國強、程煥文和喬好勤,后3人均畢業(yè)于武漢大學,說明武大在古典目錄學研究方面處于重要地位。
第2類研究群體中作者的共被引次數(shù)相對較少,這主要因為他們的研究方向雖大致相同卻各有側(cè)重,在國外目錄學研究中,王京山側(cè)重英美、王錦貴和陳光祚側(cè)重蘇聯(lián)(俄國),司莉則側(cè)重西方描述目錄學;在對近代目錄學家研究中則包括康有為、梁啟超和王重民。
第3類群體人數(shù)最多,共有6人,說明這一群體的研究內(nèi)容是當前整個領(lǐng)域的熱點。其中劉國華、李志來自湖北經(jīng)濟學院圖書館,張洪元、王友富和黃先蓉畢業(yè)或就職于武漢大學,這也顯示了學術(shù)群體的地域性和學術(shù)思想的傳承性。
第4類只有彭斐章、柯平和王新才,其被引次數(shù)分居前三位,共被引矩陣也顯示出三人共被引次數(shù)最高,可以說是目錄學研究領(lǐng)域的學術(shù)帶頭人。他們的研究方向為數(shù)字目錄學、書目情報等前沿問題,同時對整個領(lǐng)域內(nèi)的各個研究方向均有涉獵,與每個研究群體都有交叉,說明三人在目錄學研究領(lǐng)域處于核心地位,影響最大。
多維尺度分析是分析研究對象相似性或差異性的一種多元統(tǒng)計方法,在多維尺度分析圖中,各點之間的距離顯示了作者的相似性的高低。〔8〕將表2導入SPSS17.0,測度方法選擇平方歐氏距離,標準化方法選擇Z得分,分析結(jié)果如圖2所示。

圖2 多維尺度分析圖
Stress和RSQ是多維尺度分析的信度和效度估計值,Stress是擬合量度量,其值越小說明擬合度越好,一般在0.2以內(nèi)是可接受的;RSQ值越大越好,在0.6以上是可以接受的。〔9〕在本次多維尺度分析中,Stress=0.12651,RSQ=0.92468,說明分析模型的擬合度較好,能反映出目錄學領(lǐng)域作者的學術(shù)關(guān)聯(lián)。
從圖2可以看出,第1類作者分布在第三象限,除傅榮賢和王國強外,其余兩位均不夠緊密,結(jié)合發(fā)文情況可以發(fā)現(xiàn),4人研究方向雖大致相同,但程煥文對英美目錄學有所涉獵,喬好勤對目錄學理論、專科目錄學和目錄學教育都有所分力〔10〕,而傅榮賢和王國強聚類緊密,還因為二人都對出土簡帛有所關(guān)注,這表明古典目錄學的研究對象有所拓展。第2類作者較為分散,大都分布在一二象限,由于作者研究內(nèi)容差異,所以作者間交叉力度不大。第3類群體之間距離較小,說明他們的關(guān)聯(lián)程度較大,而且這個群體處于Y軸最右方,說明其研究內(nèi)容是整個目錄學研究領(lǐng)域的基礎(chǔ)。第4類群體處于整個象限的中心區(qū)域,周圍各群體均有向其靠攏之勢,說明該群體在整個領(lǐng)域中處于核心地位,其研究內(nèi)容對整個領(lǐng)域具有指導作用,其中第3類群體與之最近,說明受其影響最大。這與聚類分析所得結(jié)果基本一致。
多維尺度雖然可以較好地觀察到變量之間的關(guān)系,但只能體現(xiàn)相似性,無法顯示變量之間的強弱關(guān)系。〔11〕因此將表2導入社會網(wǎng)絡分析軟件Ucinet6中,得到作者共被引網(wǎng)絡圖譜(如圖3所示),可以很好地展現(xiàn)各作者間的聯(lián)結(jié)關(guān)系。圖3中圓點代表各高影響力作者,連線代表他們之間的共被引關(guān)系,其中線條越粗代表兩位作者共被引次數(shù)越多,其研究領(lǐng)域也越相近。〔12〕從圖3可以看出中間部分作者連線較粗,表明共被引強度大,研究方向相似。其中彭斐章、柯平和王新才處于中心地帶,且三人之間連線最粗,說明其共被引強度最大,對其他作者影響也最大,這與以上分析結(jié)果相符。

圖3 作者共被引網(wǎng)絡圖譜
通過上述分析可以獲知我國目錄學研究的一些基本情況。首先,作為一門古老的學科,我國目錄學正在與時俱進,處于從古典時期“辨章學術(shù),考鏡源流”向現(xiàn)代書目情報服務拓展的過渡時期,群體4主要引領(lǐng)整個領(lǐng)域的前進方向,其作者論文被引次數(shù)較高,利用率高,但由于人數(shù)較少,說明尚處于現(xiàn)代目錄學的發(fā)展初期。同時整個領(lǐng)域的研究熱點仍集中于基礎(chǔ)理論研究,說明學科發(fā)展尚不成熟。其次,目錄學領(lǐng)域研究已形成核心研究群體和研究方向,這些核心群體對其他研究群體和個人影響很大。再次,研究群體有明顯的學術(shù)帶頭人,其被引次數(shù)相對較高,同時該領(lǐng)域與其他學科有一定的交叉和融合,不但有其他學科的作者在進行目錄學的研究,如司莉研究方向為知識組織與知識管理,而且從發(fā)文情況看,越來越多的研究者也將注意力放在與網(wǎng)絡、信息和計算機相關(guān)的書目情報上。最后,可以看出,今后一段時間內(nèi)我國的目錄學研究仍會以數(shù)字目錄學和書目情報為前沿,這也體現(xiàn)了信息化、數(shù)字化的時代要求。
1.王新才.中國目錄學:理論、傳統(tǒng)與發(fā)展.北京:國家圖書館出版社,2008:98-99
2,7.邱均平.信息計量學.武漢:武漢大學出版社,2007:9-408
3.劉圣君,屈寶強.我國圖書館聯(lián)盟研究的作者共被引分析.新世紀圖書館,2011(8):67-68
4.鄭永田.2000年以來我國目錄學研究綜述.圖書館雜志,2008(1):2-7
5,6.邱均平,馬瑞敏.網(wǎng)絡環(huán)境下ACA方法的應用研究.圖書情報工作,2008(2):85-87
8,9.譚榮波,梅曉仁.SPSS統(tǒng)計分析實用教程.北京:科學出版社,2007:145-166
10.鄭永田.試論喬好勤目錄學思想.圖書館論壇,2008(2):97-100
11,12.邱均平,馬瑞敏,李曄君.關(guān)于共被引分析方法的再認識和再思考.情報學報,2008(27):69-74