〔摘要〕基于SCI數據庫對1995-2010年國外有關“數字圖書館”的研究論文,從文獻增長、地區分布、出版機構分布、學科分布、作者等方面采用文獻計量的分析方法,揭示了近十幾年來國內外“數字圖書館”在該學科領域取得的巨大進步。
〔關鍵詞〕數字圖書館;SCI;文獻計量分析
收稿日期:2011-03-28
作者簡介:陶 蕾(1977-),女,館員,碩士,研究方向:圖書館資源建設,發表論文6篇。
DOI:10.3969/j.issn.1008-0821.2011.06.028
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821(2011)06-0107-06
A Quantitative Analysis of Digital Library Research Articles Based on SCI
Tao Lei
(Library,Shanghai University,Shanghai 200444,China)
〔Abstract〕Based on the research results titled with digital library retrieved from SCI,author made a quantitative analysis from different aspects including papers increasing,area distribution, publication distribution,discipline distribution,authors etc.We can learn the research situation of digital library and the huge progress has made in this field all over the world during past several years.
〔Key words〕digital library;sci;literature quantitative analysis
“數字圖書館”概念一經提出就得到了世界廣泛的關注,紛紛組織力量進行探討、研究和開發,進行各種模型的試驗[1]。筆者對cnki中國知網進行檢索發現:目前“數字圖書館”相關文獻的計量分析結果,只揭示了國內研究的文獻規律,國外該類文獻并未進行揭示,而發達國家對數字圖書館的研究非常活躍,因此使用其他研究工具對國外期刊該類文獻進行計量研究是非常必要的。
1 研究工具和數據來源
本文選擇Web of Science的著名產品SCI為主要研究工具,它收錄了10 000多種世界權威的、高影響力的學術期刊,每一種期刊都是根據其所屬學科領域的影響而選擇的[2]。利用SCI的分析功能再加上EXCEL電子表格的圖表功能,對國外1985-2010年有關“數字圖書館”研究的論文,從多個方面進行文獻計量研究。
進入SCI數據庫,搜索該數據庫內所有有關“數字圖書館”的論文,檢索式為:主題=(electronic librar*)OR 主題=(virtual librar*)OR 主題=(digital librar*)入庫時間=所有年份.數據庫=SCI-EXPANDED.精煉依據:文獻類型=(ARTICLE)入庫時間=1985-2009.數據庫=SCI-EXPANDED.共檢索出數字圖書館的相關論文3 498篇(截止2010年12月27日),本文將以此3 498篇論文作為來源數據展開分析,揭示“數字圖書館”研究的文獻發展規律。
2 文獻增長計量分析
2.1 按出版年的文獻情況
國外數字圖書館早在1991年啟動和實施:1991年俄亥俄州政府做出了啟動俄亥俄網的決定,該網絡定名Ohio LINK;1993年美國國家科學基金會、國家宇航局和國防部高級研究署聯合公布了《數字圖書館啟動計劃》,領導、組織和資助美國的數字圖書館研究和開發;1994年在美國得克薩斯召開了第一次數字圖書館的理論研究會議,會議的議題是“第一屆數字圖書館理論與實踐年會”;同年11月美國國家圖書情報科學委員會又主辦召開了“第七屆國際情報新技術大會”,對“全球數字圖書館”問題展開了較為深入的討論;1995年在比利時布魯塞爾召開了全球信息社會討論會,這次討論會被視為西方主要發達國家在社會信息化進程中的一個重要里程碑[3]。表1是SCI數據庫中有關“數字圖書館”研究的論文發表情況:
表1 SCI數據庫中“數字圖書館”研究的論文數量(1995-2010年)
由表1可以看出,國外“數字圖書館”的研究論文從1995年開始出現在SCI收錄的期刊中,15年來該領域論文一直保持增速,從1995年的6篇迅速增加,到2010年論文數量達到了頂峰371篇。
2.2 文獻增長曲線
(1)對于文獻的增長規律,用指數曲線來擬合,得到著名的普賴斯指數增長模型,具體見圖1:
圖1 SCI數據庫中“數字圖書館”研究的論文數量指數增長模型(1995-2010年)
從圖1看出:1995-2004年10年間,論文數量和普賴斯指數增長模型擬合較好,2005年以后,文獻數量的發展開始趨緩,這是由本身普賴斯曲線的局限性造成的:若依據預測學中的趨勢外推法,利用普賴斯曲線來預測未來某個時候科學文獻的總量,而預測期長于10年以上,則很難期望得到可靠的結果[4]。
(2)對于文獻的增長規律,用線性曲線來擬合,得到文獻線性增長模型,具體見圖2:
圖2 SCI數據庫中“數字圖書館”研究的論文數量線性增長模型(1995-2010年)
科學文獻線性增長模型不僅適用于描述某些知識領域或某些類型的文獻增長,而且科學文獻未來的發展將更多地傾向于直線模型[4]。從圖1和圖2可以看出:1995-2004年論文數量呈指數增長,而2004-2010年間,論文數量和線性增長模型擬合得非常好,正如勒希爾所指出:我們將從文獻指數增長的過去,迎向線性增長的未來[4]。
3 國家地區論文分布
在有關“數字圖書館”的3 498篇論文中,除了有56篇不含國家地區字段的數據,其余的3 442篇論文通過SCI的分析功能,分布在91個國家地區,其中分布論文最多的前20位國家地區見表2:
表2 SCI數據庫中“數字圖書館”研究的論文地區分布
從表2可以看出:論文發表的國家地區分布非常集中,美國、英國、德國等發達國家的論文數量處于名列前茅,其中美國的論文數量更是達到41.42%,這是因為在20世紀90年代,美國、加拿大、英國、法國等發達國家對數字圖書館的研究非常活躍,相繼出臺了一系列數字圖書館重點建設項目:美國國會圖書館國家數字圖書館項目、加拿大數字圖書館先導項目、英國elib項目、法國國家數字圖書館項目等,并投入了巨大的人力、物力,取得了許多重要的成果[5]。
值得注意的是:我國被收錄的數字圖書館領域的論文數量排名第五,達到了196篇,其中183篇是英文投稿。從1997年開始,SCI數據庫開始有中國地區的論文記錄,1997-2000年,國內數字圖書館研究比較緩慢,2000年后開始蓬勃發展,許多數字圖書館的研究課題也是在1999或2000年之后才真正形成[6]。SCI數據庫每年收錄國內論文的情況如表3,指數增長模型如圖3:
表3 中國地區論文情況
續表3
圖3 國內論文指數增長模型
4 出版機構分布
4.1 出版機構論文發表情況
SCI檢索出的3 498篇論文里,除了63篇不包含出版機構字段的數據,其余3 435篇論文分散在2 780個出版機構,發文最多的出版機構發表了46篇研究成果,只發表1~2篇的出版機構有2 281家,占所有出版機構的82.1%。具體的數據見表4:
表4 出版機構論文發表情況
4.2 高產出的出版機構
(1)通過SCI的分析功能,得到發表論文超過15篇的出版機構一共55家,具體的出版機構名稱見表5:
表5 發表論文超過15篇的出版機構
從表5可以看出:美國的出版機構占絕對優勢,55家出版單位中美國包攬35家占64%;其余20家出版機構占36%,分別來自英國(6家出版機構),意大利(3家出版機構),法國、新加坡、加拿大(各2家出版機構),德國、巴西、中國、俄羅斯、澳大利亞(各1家出版機構)。
(2)拿表5和晏爾伽、朱慶華在《1996-2005年SCI—E數據庫中數字圖書館研究文獻定量分析》一文中的數據對比,數字圖書館歷經5年的發展進程,取得了許多重要的研究成果:
①產出量在15篇以上的出版機構由15家,迅速增加到55家,說明數字圖書館作為起初的一個概念已經發展成一個成熟的產業,關于它的研究和應用正在蓬勃開展;
②在晏爾伽、朱慶華《1996-2005年SCI—E數據庫中數字圖書館研究文獻定量分析》一文中提到的15家高產出機構:美國伊利諾艾斯大學、新加坡南洋理工大學、美國北卡羅來納大學、美國羅特格斯州立大學、美國馬里蘭大學、美國亞利桑那大學、美國卡耐基梅隆大學、美國加利福尼亞大學洛杉磯分校、美國加利福尼亞大學圣巴巴拉分校、美國加利福尼亞大學伯克利分校、新加坡國立大學等,參照表5依然是數字圖書館領域的領跑者,排名最前的美國伊利諾艾斯大學(UNIV ILLINOIS)圖書信息學院與美國北卡羅來納大學(UNIV N CAROLINA)圖書信息學院,據美國大學2007年Library Information Studies圖書館和情報研究專業排名,這兩所大學的圖書信息學院并列為圖書情報專業的第一名[7],這里從數字圖書館文獻量的角度印證了其研究地位。
③中國科學院在表5中排名第6,已經是世界范圍內數字圖書館研究的佼佼者。而5年前晏爾伽、朱慶華在論文中提到的15家高產出機構中,并未包括中國科學院,這說明2005年之后中國的數字圖書館研究蓬勃發展,并且中國科學院成為國內的該學科領域的領頭羊。
④無論是5年前還是現在,IBM公司作為企業,一直致力于數字圖書館的研究,其余都是各國的高校研究機構。這說明無論國外還是國外,關于數字圖書館的核心機構主要是高校,公司企業對于數字圖書館的研究較少涉及,這個結論和邱均平在《1999-2008年國內數字圖書館研究論文的計量分析》一文中對國內研究情況的結論是一致的。
5 學科分布
經過SCI的數據分析,這3 498篇論文里,除2篇不包含學科類別字段的數據,其余3 496篇論文分布在180個不同學科領域,其中分布最多的學科領域情況見表6:
表6 數字圖書館論文分布最多的前10名學科領域
從表6可以看出:首先,國外關于數字圖書館的研究論文主要存在于計算機科學、情報科學圖書館科學以及各類交叉學科,其中計算機科學這個學科分布的論文最多,并且涉及了軟件和硬件、理論和應用、甚至人工智能等幾乎計算機科學的各個分支;其次,生物、化學、醫學等學科也占了很大的比例,這是因為這些學科有較大的基礎數據庫,如基因數據庫,分子數據庫等,科研工作者往往需要頻繁的調用這些數據,這就迫切需要建設這些領域的專業數字圖書館,此外,SCI數據庫中的生物、醫學類期刊收錄的較多也是一個原因[8]。
6 作者分布
6.1 洛氏定律推論杰出科學家
按作者進行分析數據,除了4個ANON(匿名作者)外,這3 498篇論文一共有11 267個作者參與,其中發表論文最多的作者發表了32篇;其次是16篇,具體統計數據見表7:
表7 數字圖書館研究論文作者發文數
根據普賴斯對洛特卡定律的一個重要推論:杰出科學家中最低產的那位科學家所發表的論文數,等于最高產科學家發表論文數的平方根的0.749倍[4]。在本次研究中最高產科學家發表論文數為32,則杰出科學家中最低產的那位科學家所發表的論文數應為4.2篇,取整數為5篇。
普賴斯還曾試圖找出全體科學家總數中杰出科學家的比例關系。經過進一步推導和計算,得出杰出科學家人數與全體科學家總數之比,等于0.812除以最高產科學家發表論文數的一半[4]。在本次研究中最高產科學家發表論文數為32,則杰出科學家的比例計算得到為5%。
表7的統計數據表明:發文5篇以上的作者共87人,占總作者數的0.77%;這87名發文5篇以上的杰出科學家共發文652篇,僅占總論文量18.6%,明顯低于50%,這說明數字圖書館核心作者群尚未形成[8]。
6.2 杰出科學家的地區分布
在晏爾伽、朱慶華《1996-2005年SCI—E數據庫中數字圖書館研究文獻定量分析》一文的研究中,發文5篇以上的核心作者中以美國作者居多,占到一半以上,再次說明美國在數字圖書館研究領域的領先地位。另外新加坡南洋理工大學有4位作者發文多于7篇,共發表文獻49篇,占到所有新加坡數字圖書館研究文獻(58篇)的84.48%,有較高的集中性。發展中國家只有中國清華大學的兩位作者發文7篇以上,從側面說明比起發達國家,發展中國家的數字圖書館研究處于相對滯后的位置[8]。
而2010年檢索后,本文的研究結果是:發文5篇以上的核心作者中仍然以美國作者居多,占到34.5%,最多的發文13篇,說明美國在數字圖書館研究領域一直保持領先地位;而中國發文超過5篇的作者有11位,僅次于美國,其中最多的發文12篇;接下來是英國、法國、德國、韓國,各有8位、5位、4位作者發文超過5篇;發文最多的作者在瑞士,共發文32篇。說明發展中國家在近五年來,對數字圖書館投入了高度關注,并且獲得了高質量的研究成果,研究能力得到了極大提升,在國際數字化圖書館舞臺上也開始占有一席之地。具體情況參見表8:
表8 數字圖書館研究論文發文量超過10篇的作者
7 來源出版物分布
按來源出版物分析,3 498篇研究論文分布在1 120個出版物,其中分布排名前20位的出版物見表9:
表9 論文分布排名前20位的出版物
從表9可以看出,情報科學類的刊物出版的最多,其次是計算機科學類的刊物。根據布拉德福定律的基本闡述,“按某學科載文量等級排列的期刊劃分為3個區,使每一個區所包含的相關論文數量相等,即恰好等于全部期刊發表的該學科文章總數的1/3,第一區(核心區)所涉及的文章來自數量不多但效率最高的期刊”[4],依照布拉德福的區域法表9中列出的23種期刊的累積載文百分比為32.76%,所以可以初步確定這23種期刊是研究“數字圖書館”的核心期刊。
8 結 論
本文利用SCI數據庫及其分析功能,通過對1995-2010年這15年間的國內外有關“數字圖書館”的論文進行了計量分析,可以看出:近五年來國內外對“數字圖書館”的研究持續蓬勃發展,“數字圖書館”從最早的實驗室概念已經變成一種社會工程,并廣泛應用于生活、科研與教育的方方面面。我國在這幾年間的研究成果是顯著的,從榜上無名到躋身于該學科領域研究的佼佼者之一,說明我國近年來對數字圖書館事業的高度關注和巨大投入。事實上,數字圖書館絕不僅僅是數字化的圖書館,它更應該是文化的傳播媒體,是數字資源組織、開發和利用的基礎,建設數字圖書館,提高數字信息資源開發利用水平是增強綜合國力和國際競爭力的必然選擇,符合人民群眾不斷增長的物質文明、精神文明、政治文明和生態文明的需要,數字圖書館已經成為評價一個國家信息基礎設施的重要標志[9]。
參考文獻
[1]什么是數字圖書館?[EB/OL].http://www.edu.cn/ruanjianyingyong1720/20061108/t20061108204163.shtml,2011-03-01.
[2]湯森路透[EB/OL].http://www.thomsonscientific.com.cn/productsservices/webofscience,2011-01-01.
[3]國外數字圖書館的啟動和實施[EB/OL].http://news.xinhuanet.com/it/2002-05/27/content411040.htm,2011-03-01.
[4]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:50,56,105,194-195.
[5]鄭淼磊,梁晨.近10年國外數字圖書館重大項目進展研究[J].科技情報開發與經濟,2010,(21):8.
[6]熊靜,廖建蘭.1994-2005年我國數字圖書館論文的計量分析[J].圖書館學刊,2006,(1):50.
[7]有關圖書情報專業的美國大學的最新排名情況[EB/OL].http://zhidao.baidu.com/question/71611604,2011-02-18.
[8]晏爾伽,朱慶華.1996-2005年SCI-E數據庫中數字圖書館研究文獻定量分析[J].情報科學,2005,(12):1825-1826.
[9]鄭建明,胡唐明.社會事業視野下的數字圖書館建設[J].情報科學,2011,(1):6,10.