〔摘 要〕論文通過收集中國期刊網上關于個人數字圖書館的文獻,對其時間分布、期刊源分布、作者分布以及關鍵詞頻次進行分析,說明當前的研究現狀。
〔關鍵詞〕個人數字圖書館;My library;統計;分析
〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)11-0076-05
The Bibliometric Analysis of Personal Digital Library
in China Based on the CNKI’s DocumentsSong Limei1 Wu Ruomei2
(1.Library,Northeast Normal University,Changchun 130000,China;
2.School of Media Science,Northeast Normal University,Changchun 130000,China)
〔Abstract〕Through collecting research papers about personal digital library literature from the net of CNKI,the authors made a statistical analysis of the documents from the aspects such as time distribution,original journals distribution,unit distribution of authors and frequency of keywords,and have explained the status quo of personal digital library in China.
〔Keywords〕personal digital library;my library;statistical analysis
信息社會的興起,產生了信息服務的需求,而隨著個性化信息服務的興起,個人數字圖書館也因此而產生了。個人數字圖書館產生于國外,對其的研究大約始于20世紀90年代。一經推出,其研究和應用受到了國內業界的廣泛關注。作為一個新生事物,對個人數字圖書館概念的理解并不統一。對其的理解國內有3種看法;①認為它是一個由網絡連接的“互聯空間”或“信息空間”,它利用IE瀏覽器中的書簽功能,收集適合個人信息需求的網址并分類歸檔,目的是便于直接調用和查詢網絡資源。②相當于主動服務主頁技術在圖書館服務中的應用,圖書館在公共信息平臺上為用戶開辟個人信息區,利用信息推送技術向用戶提供具有個性化特點的信息,并按用戶要求定制的特殊用戶界面。③認為它是在個人計算機上采用全文數據庫軟件,將有關的網上信息和自創的數字化資源進行采集、存儲,成為有組織的知識信息集合,以供個人利用的數字圖書館[1]。本文的研究沒有區分這幾種含義的不同,直接以檢索系統CNKI為統計源,對我國有關個人數字圖書館的研究文獻進行統計和分析,期望能夠對讀者了解我國個人數字圖書館研究現狀有所幫助。
1 研究方法
本研究采用文獻計量學方法。文獻計量學是一種基于數學和統計學的定量分析方法,其主要研究對象是文獻的外部特征。科學知識量的增長及其規律與科學文獻的增長及其規律是緊密聯系的,科學文獻的數量等特征直接反映了科學知識量的變化情況[2]。所以,文獻計量方法的應用能夠從某些角度反映某一領域的研究現狀。
本研究主要考查以下特征:①論文年代。論文時間分布可以反映研究縱向的發展狀況。②來源。一般而言,來源指文獻的載體,包括報紙、期刊、科技報告、學位論文、政府出版物、會議文獻等。而本研究立足于CNKI上的數據,因此此處來源主要指各種期刊、報紙以及學位論文等。③詞匯。科學文獻是由自然詞匯科學排列而成的,文獻存儲與檢索又都是人工語言進行,因此詞匯在情報活動中有非常重要的作用,也就成為文獻計量學的研究對象。具有某些情報特性的詞匯有:關鍵詞、敘詞、導引詞、限定詞等。為了研究方便,本次研究的詞匯對象是關鍵詞。關鍵詞可以揭示研究成果的總體內容特征、研究內容之間的內在聯系、學術研究的發展脈絡與發展方向等。④論文作者。作者是研究領域的靈魂,某一領域的研究成熟與否可以看該領域是否形成了核心研究群體。確定核心研究者的意義,對研究者來說,可以對自己進行較科學的定位;對閱讀者來說,指導其選擇所需文獻。
2 數據獲取
數據源抽取策略的恰當與否直接影響著情報研究的質量。不同的文獻數據庫在數據的表現形式、收錄范圍、主題表達、數據加工質量程度上都有所差別。應根據項目的要求,選擇不同的數據庫[3]。鑒于CNKI數據庫的收錄范圍的全面性及數據庫更新的及時性,本研究選取了該數據庫作為文獻來源。

在CNKI上,截止2008年12月26日,分別以“個人數字圖書館”為關鍵詞或題名(精確檢索),檢索到92篇文章。以“My library”為關鍵詞或題名(精確檢索),同樣,檢索到論文87篇。共179篇。剔除內容上相關度不大的,以及一稿多投和誤檢,共有106篇(不包括9篇碩士論文)。選取這106篇文獻,利用Excel對數據進行處理。
3 結果統計與分析
對選擇文獻的信息從以下幾個特征進行簡要的統計與分析。
3.1 論文的年代分布
表1及圖1表明:從數量上可以看出,2000年我國對個人數字圖書館的研究剛剛起步。且在這一年發表的惟一一篇文章是介紹國外的個人數字圖書館[4]。9年來我國個人數字圖書館研究的論文在數量上,2005年是個分界點,2005年以前呈現逐年上升的趨勢,2005年之后數量下降,到2008年又有所回升。這種年代分布反映了2000年以來,網絡和信息環境的形成給個人數字圖書館帶來了發展契機,并成為圖書情報界信息服務機構的研究熱點。2005年可以看作是成熟期,數量很大。
3.2 論文的期刊分布

筆者對論文的期刊分布作了統計,發表關于個人數字圖書館的文章的期刊共有42種。其中,26種圖書情報學期刊,7種學報,9種其他種類的期刊。除106篇論文以外,還有8所大學的碩士論文(見表4)。
從表2和表3我們可以看到,關于個人數字圖書館的文章大多數還是發表在圖書館學情報學期刊上,發表在學報上和其他期刊上的還很少。在106篇文章中,有88篇發表在圖書情報學刊物上,占總量的83.02%。其他類期刊發文量占總量的百分比不到17%。這說明圖書館情報學刊物是個人數字圖書館進行學術交流與探討的主要場所,在國內的研究群體也是圖書館學情報學界。My library還沒有引起其他領域人員很大的關注,特別是技術領域。從某種角度上講,這種現象也表明,盡管個人數字圖書館研究的論文數量在2005年以后出現下降趨勢,但是這不說明個人數字圖書館的研究在國內已經走向成熟。因為個人數字圖書館的實現需要技術支撐,技術是實現個人數字圖書館的基礎。雖然圖情界有技術人員的存在,但畢竟是少數。所以,圖情界需要與技術領域的人員合作才能真正使個人數字圖書館得以實現。
圖2顯示了,發文量在3篇以上的期刊的種類。這13種期刊都屬于圖書館學情報學期刊。發文量在前三位的是《現代情報》、《科技情報開發與經濟》和《圖書館雜志》,這三種期刊(排除其他因素在外),可以看作是研究個人數字圖書館的核心期刊。其中,《現代情報》的發文量遙遙領先,有13篇,占總量的12.26%,占圖書情報類期刊發文總量的14.77%,可以看出該刊對個人數字圖書館研究的重視。而《圖書館雜志》最先發表了關于個人數字圖書館的文章,說明該刊對圖書館界動態關注的很及時?!冬F代圖書情報技術》發文量排在第五,這也說明了個人數字圖書館需要技術的支撐,而且也說明了圖書館學情報界對其的研究開始從理論上的探討轉向技術實踐。

3.3 論文的作者分析
3.3.1 作者統計
對論文的作者進行統計,包括第二、第三等所有作者在內,參與發表文獻的作者有125人,其中不計算重復。出現2次的有19人,占總人數的15.2%,出現3次的有4人(朱慶華、李昕、石德方和李軍),占3.2%;出現4次的有1人(張銀犬),占0.8%;出現5次的有1人(陳光祚教授),占0.8%。從作者出現的次數可以看出,陳光祚、張銀犬、朱慶華、李昕、石德方和李軍是研究個人數字圖書館的核心人物。但是從其出現頻次來看,并不高,這也說明對個人數字圖書館進行持續研究的人很少。個人數字圖書館是個性化信息服務的一種方式,其發展需要更多的人參與并能夠持續地進行研究。

鑒于篇幅,表6只列出出現2次及以上的第一作者。若按第一作者統計共有88人。其中出現2次的有7人(李書寧、蓋明媚、蔡翠盟、王曉清、肖雪、楊琨和李芳),占總人數(88)的7.95%;出現3次的有3人(張銀犬、石德方和李昕),占3.41%;出現5次的有1人,占1.14%。
3.3.2 合作者的分析
兩次統計的不同,主要是因為合作方式的存在。隨著對合作者問題研究的逐漸深入,人們規定了合作度和合作率兩個計量指標反映某學科領域內作者合作智能的發揮程度,數值越高,合作智能發揮越充分[5]。
合作度=(一定時期內相關文獻)作者總數/(一定時期內相關文獻)論文總數×100%
合作率=(一定時期內相關文獻)合作論文數/(一定時期內相關文獻)論文數×100%
在原始數據的基礎上,統計出作者總數為125,論文總數為106,所以合作度為1.18。合作論文數為35,論文總數106,所以合作率為33.02%。由于沒有統計其他的學科或領域的合作度和合作率,所以在此沒有很好的對比,無法反映出合作度和合作率的高低。在邱均平教授的《基于文獻計量的國內外信息資源管理研究比較分析》的文章里,我國信息資源管理領域的合作度和合作率分別為1.46、42.5%。邱教授認為這是很低的,與之進行對比,可以發現我國個人數字圖書館的研究的合作度和合作率也是相當低的。
3.4 作者的單位分析
只考慮第一作者的來源單位,可以得出表7:
鑒于篇幅,表7只列出發文在2篇以上的單位。經過綜合,共有68個單位來源,其中文獻數量為2篇的有12個單位,占總單位數的17.65%;數量為3篇的有7個單位,占10.29%;數量為4篇的有1個單位,占1.47%;數量為10篇的有1個單位(武漢大學信息管理系),占1.47%??梢钥闯觯錆h大學信息管理系、中科院文獻情報中心和南京大學信息管理系都是重點研究單位。從發文在2篇以上的21個單位來看,大學有8所,發文量24篇,占總量的22.64%;科研機構1所;其他12個單位均是圖書館,發文量28,占26.42%,可見大學和圖書館是主要的研究機構。
3.5 關鍵詞的頻度分析

分析文獻的關鍵詞出現頻度得到表8。
經統計,共有103個關鍵詞,出現330次。有的詞與詞之間有關聯,如信息服務、文獻信息服務歸為一類,信息資源、數字資源等都歸為一類。
不考慮個人數字圖書館和my library兩個關鍵詞,出現次數最多的3個關鍵詞是個性化服務、個性化信息服務和數字圖書館,各出現23次、20次和15次。因為個人數字圖書館是在個性化服務興起的背景下產生的,它是個性化服務的一種比較成功的模式,所以與個性化服務和具體的個性化信息服務緊密聯系在一起。個人數字圖書館的另外一種理解是公共數字圖書館為用戶提供個性化服務的平臺,稱作my library或我的圖書館,所以個人數字圖書館的研究是基于數字圖書館基礎之上的。它的出現也與公共數字圖書館聯系在一起。另外,出現頻次較多的關鍵詞有信息組織、門戶、信息資源開發、個人知識管理、用戶服務和個性化定制。個人數字圖書館是基于個性化服務的或者說是面向用戶的一種個人知識管理的模式之一。個人計算機上的個人數字圖書館就是個人知識管理的一個軟件系統。所以,其不可避免的與個人知識管理、個性化定制和用戶服務出現在一起。從出現的頻次看,個人數字圖書館中的信息組織方式、信息資源開發是其目前的研究熱點。門戶也是基于個性化服務的一種信息服務形式,目前與個人數字圖書館聯系在一起是因為二者的比較研究以及基于portal門戶技術的個人數字圖書館研究較多。另外,高校圖書館、資源共享和OAI也是目前的研究熱點。
4 結論與研究不足
通過對我國個人數字圖書館研究的相關文獻進行統計分析,可以發現,我國個人數字圖書館研究已經積累了一定的研究成果,而且有一批學者加入該領域進行研究,但仍然存在一些問題。
4.1 結 論
首先,從文獻總量的變化來看,我國個人數字圖書館方面的研究在不斷增加,但不是很穩定。其次,從文獻來源來看,這一領域的研究水平還有待提高,大多數期刊并沒有形成一個固定的專欄來刊登個人數字圖書館方面的文章,這也是文獻數量有限原因之一。再次,從作者來看,有一定量的作者涉獵該領域,但真正致力于該領域研究的高水平作者很少,核心研究者也很少。最后,從內容來說,主要集中在少數幾個主題上,研究范圍和研究領域有待擴大,應該體現多學科性。
4.2 研究的不足




本文采用文獻計量學方法對我國個人數字圖書館的研究狀況進行統計分析,存在以下不足:①數據量的不足。本研究立足于CNKI的相關文獻,并不能完全反映當前情況,應該采集更多的數據。由于數據量的不足,可能會使研究結果不夠全面。②研究方法應用不足。主要反映在兩方面:一是沒有完全利用文獻計量學方法,只選取其中的某幾個特征進行研究;二是只對文章的外部特征進行分析,沒有結合內容進行深入分析。另外,關鍵詞的不一致性,有的相同主題的文章,用的不同的關鍵詞。在統計時也會產生誤差。
參考文獻
[1]肖雪.論個人數字圖書館[J].圖書館雜志,2004,(2):16-19.
[2]邱均平,等.基于文獻計量的國內外信息資源管理研究比較分析[J].中國圖書館學報,2008,(5):37.
[3]孫志茹,張志強.文獻計量法在戰略情報研究中的應用分析[J].情報理論與實踐,2008,(5):706-710.
[4]戴華勝.美國“個人數字圖書館”——主動服務主頁技術在圖書館服務中的應用[J].圖書館雜志,2000,(8):68-69.