蘭 瑛(東莞理工學院)
云計算技術在我國數字圖書館領域應用的現狀
蘭瑛
(東莞理工學院)
以CNKI中國知網為對象,檢出數字圖書館云計算論文736篇,按照檢出文獻類型、發表時間、期刊、作者、機構、基金和
等項目進行統計分析,探討我國數字圖書館領域云計算技術應用的主要現狀、基本特點與一般規律,剖析存在的問題和不足,促進圖書館云計算技術的快速應用。
云計算;數字圖書館;文獻計量學
云計算(Cloud Computing)的定義有數十種甚至上百種,現階段廣為接受的是美國國家標準與技術研究院(NIST)的定義:云計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網絡訪問,進入可配置的計算資源共享池。[1]我國學者劉鵬教授指出:云計算是一種商業計算模型,它將計算任務分布在大量計算機構成的資源池上,使各種應用系統能夠根據需要獲取計算力、存儲空間和信息服務。[2]云計算具有超大規模、虛擬化、高可靠性、通用性、高可擴展性、按需服務、極其廉價等特點,現已廣泛應用于云物聯、云存儲、云游戲、云安全等相關領域。云計算技術在數字圖書館的應用也成為當前國內外圖書情報領域的研究熱點。筆者以云計算技術在國內數字圖書館領域研究與應用的文獻為基礎,采用文獻計量學方法統計分析中文期刊上發表的數字圖書館云計算論文,通過高頻關鍵詞的統計分析和共詞聚類發現當前國內數字圖書館云計算研究和應用的熱點,剖析存在的問題和不足,為云計算技術在數字圖書館領域的應用提供第一手資料,促進云計算在圖書館的快速應用。
利用CNKI的跨庫檢索、高級檢索功能和“主題”字段,檢索出包含“云計算”、“數字圖書館”或“數字化圖書館”三個關鍵詞的論文736篇,檢索時間為2016年1月10日。同時,采用文獻計量學方法,對736篇相關論文從文獻種類、發表時間、期刊、作者、機構、基金和關鍵詞等項目進行聚類和文獻計量學分析,厘清我國數字圖書館云計算技術研究與應用的主要現狀、基本特點與一般規律。
2.1文獻類型與論文年代分布
736篇論文的文獻類型包括期刊(686篇)、博碩士學位論文(32篇)、國內外會議論文(11篇)、報紙論文(1篇)、專利文獻(1篇)、科技成果(5篇),論文的年代分布見表1。
2.2期刊
736篇論文中有686篇發表在中文期刊上,其中,發表論文在4篇以上(含4篇)的40種期刊見表2。表中百分比為某種期刊或某些期刊(載文量相同的期刊種數)刊發論文占期刊論文總數686篇的比例,如:《科技情報開發與經濟》雜志發文28篇,占比4.08(28/686);《圖書館理論與實踐》《圖書館學研究》2種期刊合計發表論文42篇,占比為6.12%(42/686)。

表1 736篇數字圖書館云計算論文的發表時間(單位:篇)

表2 我國數字圖書館領域云計算論文的期刊分布(單位:篇)
2.3作者與機構
通過利用CNKI的分組瀏覽功能,選取了發表文章最多的前40位作者進行統計,其中,最高發文為52篇,有1人;1人發表37篇、1人發文6篇、3人各發表論文5篇、3人各發表論文4篇、15人各發文3篇、16人各發文2篇(詳見表3)。這40人中有3人來自公共圖書館,其余37人均來自全國普通高等院校。高校37位高產作者累積發文191篇,占論文總數的26%,說明高校是數字圖書館云計算研究與應用的重要基地,也說明高校圖書館豐富的數字化資源需要通過云計算和后臺資源調度實現資源共享,提高數字化資源的利用效率。
按照CNKI的分組瀏覽功能聚類,40所機構(活躍機構)累積發文263篇,占論文總數736篇的35.7%。其中34所高校發文238篇;公共圖書館5所發文22篇;CALIS管理中心發文3篇。按機構進行聚類,情況如下:蘭州商學院(70)、渤海大學(10)、南京大學(9)、武漢大學(9)、華中師范大學(7)、南通大學(7)、黑龍江大學(6)、吉林大學(6)、山東大學(6)、北京郵電大學(6)、信陽師范學院(6)、西安電子科技大學(6)、齊齊哈爾大學(5)、浙江工業大學(5)、黃岡師范學院(5)、中國礦業大學(5)、華東師范大學(5)、福建省圖書館(5)、云南省圖書館(5)、湖南師范大學(4)、遼寧師范大學(4)、安徽大學(4)、南陽師范學院(4)、中山大學(4)、桂林理工大學(4)、上海大學(4)、西安科技大學(4)、漯河醫學高等專科學校(4)、福州大學(4)、南昌大學(4)、遼寧行政學院(4)、湖北工業大學(4)、燕山大學(4)、中國國家圖書館(4)、黑龍江省圖書館(4)、南京圖書館(4)、南京信息工程大學(3)、江蘇師范大學(3)、云南大學(3)、CALIS管理中心(3)。

表3 高產作者發文情況(單位:篇)
2.4基金資助
據不完全統計,包括國家社會科學基金、國家自然科學基金在內的至少23種基金資助了我國數字圖書館云計算研究與應用項目,合共產出52篇基金資助論文,基金論文比約為7%(52/736)。其中,國家社會科學基金、國家自然科學基金、國家重點基礎研究發展計劃等三種國家級基金資助論文24篇,教育部跨世紀優秀人才培養計劃、江蘇省教育廳人文社會科學研究基金等20種省部級基金項目資助論文28篇。按基金分組:國家社會科學基金(13)、國家自然科學基金(10)、江蘇省教育廳人文社會科學研究基金(5)、湖南省教委科研基金(3)、湖南省社會科學基金(2)、山東省軟科學研究計劃(2)、黑龍江省博士后科研啟動基金(1)、海南省自然科學基金(1)、河南省軟科學研究計劃(1)、浙江省教委科研基金(1)、河南省教委自然科學基金(1)廣東省自然科學基金(1)、湖北省自然科學基金(1)、江西省自然科學基金(1)、甘肅省教委科研基金(1)、江蘇省科委社會發展基金(1)、福建省教委科研基金(1)、跨世紀優秀人才培養計劃(1)、山東省科委基金(1)、陜西省教委基金(1)、上海科技發展基金(1)、河南省科技攻關計劃(1)、國家重點基礎研究發展計劃(1)。
2.5
是論文中有實質意義的詞,某個詞出現的頻率越高,有關這個
的研究越熱門。按照
出現頻次進行排序,得到了論文數量靠前的30個
云計算(536)、數字圖書館(406)、圖書館(72)、云服務(47)、高校圖書館(35)、云存儲(33)、虛擬化(30)、服務模式(26)、信息資源(25)、信息服務(24)、云圖書館(24)、云服務模式(22)、資源共享(22)、信息安全(21)、云計算技術(19)、大數據(19)、移動圖書館(16)、個人數字圖書館(12)、應用(11)、云計算機(11)、數據中心(11)、云計算架構(10)、策略(9)、虛擬機(9)、數據存儲(9)、智慧圖書館(9)、高校數字圖書館(8)、數字資源(8)、安全(8)、云計算技術應用(8)、圖書館聯盟(8)、物聯網(7)、數據挖掘(7)、基礎設施即服務(7)、數據安全(7)、對策(7)、共建共享(7)、三網融合(6)、SOA(6)、圖書館建設(6)。
3.1文獻品種多樣化提示要多途徑多渠道獲取數字圖書館云計算文獻
736篇數字化圖書館云計算研究論文中,期刊論文686篇居第一,占93%,是獲取相關文獻的重要信息來源。會議論文、博士學位論文、碩士學位論文、專利文獻、科技成果、報紙等文獻僅占論文總數736篇的7%,是獲取數字圖書館云計算論文的補充。
3.2數字圖書館云計算研究經歷了快速發展和穩定兩個階段
云計算概念于2006年8月9日由GOOGLE首席執行官埃里克·施密特首次提出,次年GOOGLE與IBM開始在美國大學校園推廣云計算計劃,取得巨大成功,由此引起了社會的廣泛關注。[3]2008年湯幟在“新觀點新學說學術沙龍系列活動之二十四:數字時代圖書館的創新與共享”中探討了云計算與圖書館共享合作的問題,[4]這是國內最早就云計算在圖書館資源共享領域應用進行的探索與思考。同年,陳洋[5]指出云計算能為數字化圖書館提供技術支撐,最大程度地降低數字化圖書館的運維成本,實現全球級資源共享。2009~2015年,國內發表了736篇數字圖書館云計算研究論文,顯示了云計算技術在數字圖書館的應用正在成為熱點。基于文獻計量學的研究,發現我國數字圖書館云計算研究經歷了兩個階段:快速發展階段和穩定階段。2008~2012年為快速發展階段,這一階段的論文增長速度雖不均勻,但數量穩定增長,2008年1篇(來自萬方數字化資源系統,中國知網未收錄)、2009年11篇、2012年167篇,顯示出國內同行在國外新技術新理念的吸收應用上比以往更加敏感和積極,加速了云計算技術在我國的應用進程,促使數字圖書館領域云計算研究成為圖書館學情報學界的熱點。2013~2015為穩定階段,每年論文產出呈現出逐步回落態勢,但幅度不大,說明云計算技術從引進和應用熱轉換為人們對云計算技術應用后的冷靜思索和全方位評估,人們較以往更為客觀全面地權衡云計算技術應用于數字圖書館的信息安全問題和信息資源共享問題等。[3]
3.3核心期刊尚未形成
從分組瀏覽的結果來看,40種學術期刊累積發文占比為60%(410/686),按照二八定律,只有當數量占20%的期刊發表80%論文時,核心期刊才算形成。[6]據此推斷,數字圖書館云計算研究的核心期刊尚未形成。40種期刊的學科分布情況為:圖書情報檔案學期刊29種發文666篇,其中15種為核心期刊,發文150篇;其他5種期刊發文35篇,論文產出呈現出較為明顯的集中—離散分布規律,說明我國數字圖書館云計算研究以圖書館學情報學檔案學人員為主體,該選題引起了圖書情報檔案學核心期刊編輯的高度關注。
3.4核心作者群和活躍機構群正在形成,高校成為重要的研究場所
發表論文最多的40位核心作者累積發表論文199篇,僅占論文總數的27%;發表論文最多的40所機構發表論文263篇,僅占論文總數的35.7%。依據核心作者和核心機構形成的二八定律,可知我國數字圖書館云計算研究與應用方面的核心作者不多,核心作者群和活躍機構群正在形成的過程中。37位核心作者來自高校、34所機構為普通高校,說明高等院校作為一支舉足輕重的力量引領著數字圖書館云計算研究。
3.5高級別基金的資助推動了我國數字圖書館云計算研究與應用
國家級別基金和省部級基金的資助使我國數字圖書館云計算研究與應用風生水起,在不到8年的時間里已經取得了較為豐碩的研究成果。全國和省部級基金的較廣泛支持、全國圖書情報檔案界和計算機界同仁領域的重視,促進了我國數字圖書館云計算研究與應用的興起,也催生了高質量高水平論文。100%的省部級以上基金論文、約50%的國家級基金論文顯示了數字圖書館云計算研究論文質量和水平均較高,這一點可從15種圖書館學情報學檔案核心期刊發文占期刊論文總數686篇的20%(150/686)得到印證。
3.6熱點不熱,創新乏力
根據詞語共現規則,排除數字圖書館、云計算兩個的同義詞和近義詞,合并部分
的下位詞,合并同義詞和近義詞,去除涉及范圍大但沒有實質意義的高頻詞如應用、策略、對策等,同時去除含圖書館或云計算的詞,得到的高頻
有11個:服務(119)、資源(55)、存儲(42)、虛擬(39)、數據(37)、安全(36)、物聯網(7)、基礎設施即服務(7)、共建共享(7)、三網融合(6)、SOA(6)。其中服務、資源、存儲、虛擬、數據、安全等
的文獻都在30篇以上,可以稱為數字圖書館云計算研究的熱點;物聯網、基礎設施即服務、共建共享、三網融合、SOA等
的文獻均不到10篇,有可能在今后一段時間里成為研究熱點。從國內發表的數字圖書館云計算論文來看,涉及資源與服務的文章相對較多,涉及云計算技術的文章較少,說明當前數字圖書館云計算研究技術含量不高,熱點不熱,創新乏力,須進一步提高研究水平。
云計算概念從提出到研究與應用尚不足10年時間,在我國數字圖書館的研究與應用不到8年。從總體上看,我國數字圖書館云計算研究經歷了快速發展和穩定發展兩個階段,圖書情報檔案領域期刊是主要發文場所,核心期刊發表論文占比高,高校成為數字圖書館云計算研究的重要陣地,高級別基金論文比例高。但文獻計量學分析顯示出的問題不容忽視:多樣化文獻的集成搜索,核心作者和活躍機構不多,研究應用的技術含量不高,研究熱點分散等。可以這么說,2008年對云計算與數字圖書館創新與共享的思考促使人們將眼光瞄準了云計算技術在數字圖書館的應用,數字圖書館資源調度、整合、檢索與數據挖掘也給了云計算技術應運而生的機遇。從總體上看,數字圖書館云計算論文的產出并非易事,在經過快速增長的幾年之后逐步趨于穩定,且有逐年下降的勢頭,這不能不讓人擔憂數字圖書館領域云計算技術應用瓶頸的問題——來自不同數據庫商的異構多樣化書目數據庫集成搜索和知識產權保護。如果數字圖書館領域云計算技術僅在一個圖書館或一所重點高校的多校區圖書館應用,這難免不讓人產生“殺雞用牛刀”的感覺。如果不能從根本上消除數據庫商一家獨大、野蠻漲價的勢頭,不能讓資源共建共享成為數字圖書館的主流目標,那云計算技術在數字圖書館的應用就真成了一句空話。綜合國內的研究現狀和進展,可以發現數字圖書館云計算研究與應用還存在以下一些問題與不足:認知程度較低,研究核心力量缺乏;研究內容單一,存在低水平重復;研究力量分散,缺少合作溝通;研究層次不高,忽視研究質量和水平。這些主要問題,需要在今后的研究和應用中逐步解決。
[1]十種方法保持云中數據安全[EB/OL].[2015-12-27].http://netsecurity.51cto.com/art/201308/4079 75.htm.
[2]百度百科.云計算[EB/OL].[2015-12-20].http: //baike.baidu.com/link?url=7c37t1AIHxocF.
[3]鐘輝新.國內近5年云計算研究文獻統計與可視化分析——兼論基于“云”的數字圖書館研究熱點[J].情報探索,2012(5):5-8.
[4]湯幟.云計算與共享合作[C]//中國科學技術協會學會學術部.新觀點新學說學術沙龍文集24:數字時代圖書館的創新與共享.中國科學技術協會學會學術部,2008.
[5]陳洋.云計算與數字化圖書館技術發展[J].現代圖書情報技術,2008(z1):7-11.
[6]佟礦.計算機輔助教學的現狀與發展[J].中國醫學教育技術,2013,27(3):255-257.
Application Status and Development of Cloud Computing Technology in Domestic Digital Library
Lan Ying
With the keywords of“cloud computing”and“digital library”in CNKI,this article makes a statistical analysis on the 736 articles of retrieved according to article type,post time,issued journals,author,organization,keywords,etc,to reveals status,characteristics and general rules of cloud computing application in domestic digital libraries.Meanwhile,it analyzes the existing problems so as to promote the application of cloud computing in libraries.
Cloud Computing;Digital Library;Literature Metrology
G250.76
B
1005-8214(2016)10-0083-04
蘭瑛(1978-),男,計算機應用碩士,電子工程師,研究方向:信息技術管理與研究。
2016-01-20[責任編輯]王崗