柏藝瑩
(天津社會科學院圖書館,天津300191)
大型計算機于20 世紀80 年代一次巨大變革后,客戶端-服務器服務形式也同時出現,云計算技術產生是對于信息技術軟件領域又一次重大的創新。大數據時代,云計算的應用激發出信息技術的創新與革命,并對計算機、傳媒、通信等現有網絡格局產生深刻影響。圖書館作為滿足公眾知識信息資源獲取的重要平臺,實現圖書館數字化信息管理以及完善圖書館服務功能,是云計算進入圖書館領域的價值體現。目前,學術界對云計算并沒有確切而完整的定義,結合云計算的功能特征,筆者在此處借鑒美國國家標準與技術研究院(NIST)定義:云計算是一種按使用量付費的模式,這種模式提供可用、便捷、按需的網絡訪問資源,進入可配置的計算資源共享池(資源包括網絡、服務器、存儲、應用軟件及服務),這些資源能夠被快速提供,只需投入很少的管理工作或與服務供應商進行很少的交互[1]。云計算應用于圖書館服務過程中,對圖書館服務模式產生較大影響[2],相關主題領域研究成果較為豐富,并且有學者開展持續性研究,而大數據環境驅動下,云計算在圖書館領域的應用研究成為了學術界關注的焦點之一。因此,借助文獻計量學分析方法對其研究現狀進行探究,具有重要的理論意義和實際價值。筆者以近10年該主題相關的文獻資源為對象進行分析與梳理,明晰該主題領域的研究現狀,總結歸納研究熱點,探究主題領域發展趨勢,以期對我國有關云計算在圖書館領域實際應用提供理論指導。
筆者以《中國學術期刊全文數據庫》(CNKI)收錄的云計算技術在圖書館應用的相關研究成果為研究對象,借助Excel、UCINET、SATI 及可視化分析軟件Net draw,遵循科學嚴謹的研究思路,進行定性與定量融合的研究,從而對近11 年我國有關云計算在圖書館領域的應用研究進行計量分析。首先對該領域總體分布特征即論文分布時間、學科、高產機構和基金資助等4個方面進行闡述[3];其次是從論文高頻作者的合著現象即核心作者群分布、核心作者合著現象、整體網絡密度3 方面進行分析;接著對高頻關鍵詞的耦合關系即高頻關鍵詞群分布、耦合現象、中心性分析、小團體性分析4個角度進行述評;最后結合數據分析提出建議。
文獻樣本是通過對CNKI 文獻數據庫進行高級檢索,選擇了文獻目錄中“信息科技”范圍內的“圖書情報與數字圖書館”,并以“云計算”AND“圖書館”為檢索式,進行關鍵詞檢索,數據檢索時間段為2009(2009 年是關注該領域最早文獻刊發時間)至2020 年,檢索具體時間是2020 年6 月15日。按照以上條件進行檢索共獲得相關文獻594篇,為了進一步提升檢索效度,結合人工篩選,去除會議通知、戰略協議、資料不完整等文獻以及去重篩選后,總共獲得有效數據文獻548篇。
某一領域特定時間內,文獻發表數量以及變化情況反映出該領域研究規模、發展速度、受關注程度以及預測未來的發展趨勢[4]。筆者根據548篇文獻的發表時間進行統計分析,制出文獻年度分布情況表(表1)和折線統計圖(圖1)。經過數據分析可以看出,該領域研究的總體發文量呈現增長的趨勢,于2012年達到關注的最高峰,單年發文量達到近九年的16.91%。同時,2012 年也是該領域關注的分割點,2009年到2012年是成長期,每年都會有相對于前年更大的增長,從而也反映出該領域受關注度的范圍的擴大;2012 年至2017 年進入了穩定期。在云計算發展的大事記中2008年1月出現了世界上的第一個服務應用、IBM成立大華區云計算中心、Google公司推出徹底融入云計算時代的Google Chrome 瀏覽器以及亞馬遜、微軟陸續開展的云計算服務,增強了各界學者對于云計算的關注;2009年以后云計算服務平臺、操作系統的陸續問世,進一步推動了云計算在各領域的應用以及創新,也引起了學者對此研究的關注,研究成果達到相對較高的年增長量[5]。其中,2020年雖然只有上半年的數據,但是以說明學界對該選題研究的持續關注。

表1 文獻發表年度分布情況

圖1 文獻發表年度分布情況

表2 文獻發表關聯學科分布
同一主題文獻研究在不同學科領域會有不同的研究傾向以及研究深度,對于文獻學科領域歸屬研究,可以分析出主題研究主要應用的領域,即該主題應用的廣泛性,同時也可以分析出該主題研究應用影響最大的學科領域,可以為未來各界研究機構的研究方向提供一定的引導。
數據統計分析主要是按照統計數據由大到小的順序進行數據排列,如表2所示。在前期進行檢索時,是對文獻分類里面的圖書情報與數字圖書館進行檢索,所有篩選的文章都涉及圖書情報與數字圖書館學科。而計算機軟件與計算機應用、法學、政治、信息通信、科學學與科技管理等學科分別占88.50%、2.37%、0.36%、0.36%和0.18%,由此說明云計算在圖書情報與數字圖書館的應用研究,更多融合計算機軟件與計算機應用學科領域的知識,同時嘗試從法學、政治、信息通信及科學學與科技管理等學科視角切入,開展云計算在圖書館的應用研究,一定程度上也反映了有關云計算研究涉及學科分布的廣泛性,同時揭示了云計算研究過程中的學科交叉性。
某一主題領域論文期刊結構分布的情況,可以分析出該主題領域的核心期刊,為后期深入研究提供參考依據[4]。

表3 高產期刊分布表

表4 我國主要基金資助分布
根據有關云計算在圖書館領域應用研究發表的期刊以及期刊本身屬性,可以分析出文獻研究側重點以及反映出該領域研究熱點所在學科領域。筆者將文獻數量在9 篇以上的期刊進行匯總并制成表3,依據期刊內容不同將期刊進行分類。由此可知,有關該主題研究的期刊涉及到的學科主要包括:科技信息、圖書館學、情報學、檔案學、電子科技、科技與經濟等。云計算在圖書館領域的應用研究,不僅關系云計算與圖書館兩個主題領域,還涉及信息技術以及與圖書館相關學科的研究,即云計算在圖書館領域應用研究是借助多學科知識開展的,同時借助多學科期刊進行傳播交流。信息技術與電子科技方面的研究更多是從技術層面上研究如何進一步提供升提供理論研究支撐,而圖書館相關學科領域的研究則是為云計算在圖書館領域更好地應用提供各種可能性研究。同時,結合高產期刊分布表可以看出,對于某一特定主題研究,并不能僅僅局限于該領域的期刊,還要注意關聯學科期刊的研究成果發布,從而能夠更加全面地把握有關該主題的研究現狀以及進展。
科研基金資助分布情況反映出該領域研究的質量與層次,同時也反映出該領域研究受重視程度。采用EXCEL對548篇文獻資源的基金資助情況進行統計,共計42 篇文獻受到基金資助,約占7.66%,國家級基金約占5.29%,地方省級基金資助約占2.37%。
結合以上數據分析,可以看出來對于該主題的研究整體需要進一步關注和支持。現有的支持是以國家級基金為主,地方級科學基金支持為輔。在宏觀的引導下,各省市級有關機構的支持力度將成為推動該主題領域長期可持續發展的重要外在驅動力,也是更好發揮云計算技術在大數據時代作用,更好地促進云計算在圖書館領域應用的關鍵。
核心作者群的分布情況可以看出研究該主題學者的心態傾向分布,在對該主題進行研究時,是傾向于熱點追捧,還是長期的學術研究。

表5 作者發文情況統計

表6 核心作者發文情況分布
根據表5數據統計,548篇有效文獻中,文獻作者共501人,其中467人發表1篇,占所有作者總數的93.21%。根據洛特卡定律,1篇論文作者比重應在60.79%進行浮動,該領域內計量得出數據與經典學科參考值相距甚大[6],表明近11年間我國云計算在圖書館領域應用研究存在某一時段研究過熱的現象。此外,文獻發表1 至兩篇的作者達到494人,占有效文獻作者總數的98.60%,反映出云計算在圖書館領域應用研究的核心作者較為集中,大部分學者對于該領域研究很大程度上是出于對學術熱點的追捧,不能進行深入長期的研究分析。與此同時,從表6 核心作者分布情況,可以看出該領域研究的學科的代表人物,如:李卉、黎春蘭、王紅、秦珂等。
根據普賴斯定律M≈0.749· N max ,其中M是核心作者的最低發文值,Nmax 是最高產的作者發文量,本研究中Nmax 為4 篇,計算得出M(M 約為1.498)取臨近最大整數值兩篇,因此發文量大于等于兩篇的作者可初步列入核心作者候選群(見表6)。在我國云計算在圖書館領域的應用研究領域中,核心作者有37 位,占所有作者總數的7.39%,核心作者的發文總數共計86 篇,占有效文獻的15.69%,并未占到全部發文量的半數。
在特定領域內核心作者合著現象,不僅可以直接反映出該領域內作者之間相互合作的關系,還能反映出與核心作者持有相同或相近觀點的作者分布情況。
筆者借助Ucinet 軟件生成合著者關系網絡圖(見圖2)。每一個小方塊都代表著一位作者。作者發文的數量可以借助方塊的大小進行表示,方塊之間連線的粗細程度反映出關聯作者之間的合作次數,合著頻率越高,合著作者之間的連線會越粗。從圖2 可以出來,保留了合著作者,同時里面包含核心作者,連線權重相對大的,是節點作者發表期刊較少或合著較少。
從圖2整體上看,作者合著網絡呈現局部聯通特征,較多的文獻作者處于游離狀態。構成交流圈的文獻作者通常是長期關注該主題領域發展的小群體,游離狀態的文獻作者呈現兩種情況,一種是初次關注該主題領域,一種是多次發文,但是相互間溝通較少。以上現象在一定程度上反映了兩個方面的問題:第一,該主題領域的學術知識交流范圍相對較小,宏觀整體交流不夠活躍。第二,大部分學者處于對于該主題領域的熱點關注狀態,不利于該主題領域的快速發展。

圖2 作者合著關系網絡
整體網絡密度的數值越大,對行動者影響越大,不僅為個體提供社會資源也成為限制個體發展的重要力量。利用Ucinet 社會網絡分析軟件進行network——cohesion 內聚——density 流程操作[8],獲得整體網絡密度分析結果見表7。

表7 作者合作網絡密度

表8 部分高頻關鍵詞統計表
根據圖2 分析結果可知,在2009 年至2020 年之間,關于云計算在圖書館應用研究領域的作者合著整體網絡密度為0.0017,網絡中關系的標準差為0.0354,由此可知整體網絡結構較為疏松,即學者行為產生影響較小,相互間交流較少,網絡關系本身對于該領域學者之間的影響也不顯著。以上現象表明在未來一段時間內,云計算在圖書館領域的研究與應用存在較大的發展空間以及需要學者持續關注、溝通交流與合作。
關鍵詞主要是反映文獻的核心內容、主要服務、基本特色等特征,筆者通過對高頻關鍵詞進行統計分析,進而對一定時期內該領域的研究重點進行明確以及識別該領域研究熱點[9]。
根據數據統計結果分析,在548 篇有效文獻中,關鍵詞按照頻次出現的高低順序進行排序,最后選定出現頻次不小于7 次的關鍵詞作為分析對象,截取部分分布情況表見表8。
從表8可以看出,“云計算”出現517次。大數據時代背景下,云計算技術在圖書館不同的領域均可嵌入應用。根據高頻關鍵詞統計可以將關鍵詞分為:第一類,反映該領域發展背景的關鍵詞,例如“大數據”“物聯網”“虛擬化”等;第二類,反映云計算作用圖書館類型,比如“數字圖書館”“移動圖書館”(頻次為1)、“圖書館聯盟”(頻次為3)等;第三類,反映在該領域的實際運用,比如“云服務”“云存儲”“信息安全”等;第四類,反映出云計算作用下圖書館長期的發展方向,比如“服務模式”“服務創新”“信息資源建設”等。這些關鍵詞反映出云計算在圖書館領域應用的空間以及方式,即云計算與圖書館的契合點,在一定程度上也反映了該領域未來發展方向以及值得關注的焦點。
關鍵詞耦合現象,是對一定范圍內高頻關鍵詞的聚類關系的描述,在學術界可以運用該關系推斷對應范圍內研究主題的熱點與前沿[10]。筆者利用SATI 對有效文獻的關鍵詞進行提取,并生成關鍵詞矩陣,將矩陣數據導入Ucinet 軟件,利用NetDraw 繪制關鍵詞耦合關系網絡圖(見圖3),在網絡圖中關鍵詞的節點用方形表示,形狀的大小代表在網絡中的作用大小。節點之間用實線進行連接,實線越粗細表示關系的緊與密。筆者將從中心性和小團體兩個角度對云計算在圖書館應用研究領域的高頻關鍵詞耦合關系進行分析。

圖3 關鍵詞共現知識圖譜
從圖3 中,可以看出“云計算”“圖書館”“大數據”“云計算技術”“信息技術”“虛擬化”“互聯網”“服務”“發展模式”等分詞之間的連線較粗,其中“云計算”與“圖書館”之間距離最近,而云計算相關的技術和功能,在圖書館服務中逐步融合應用,由此說明云計算在圖書館領域應用的可行性、多樣性,很好地促進計算機應用與圖書館信息資源的連接[7]。大數據、數字化背景下,已有的文獻研究成果更多地關注數字圖書館建設與開發以及數據安全等方面。
4.3.1 點的度數中心度
點的度數中心度指的是在一個社會網絡中,與某成員直接發生聯系的其他成員的點數,又分絕對中心度(Degree)和相對中心度(NrmDegree),后者是前者的標準形式[8]。對此網絡進行點的度數中心度分析,結果見表9。Out Degree 指關鍵詞發出關系的點數,即主體關鍵詞主動聯系的關鍵詞數量,InDegree 指關鍵詞接受關系的點數,即主體關鍵詞被聯系的數量。NrmOutDeg、NrmInDeg分別是這兩者的標準值。由于數據量較大,表9以InDegree 列為關鍵值降序排列,省略了部分數據。由表9 可知,關鍵詞之間的聯系是相互對稱的,是同步的相互引用。
4.3.2 點的中間中心度
點的中間中心度衡量的是某關鍵詞控制網絡中其他關鍵詞之間聯系的能力,它既依靠關鍵詞與鄰接關鍵詞之間的直接關系,還取決于關鍵詞與網絡中所有其他關鍵詞之間的關系[8]。前者關注關鍵詞的活動,后者關注對關鍵詞的控制。也就是說在其他成員之間是否發揮“橋梁”作用以及作用的程度。表10中Betweenness指中間中心度。
從分析結果可以看出,中間中心度最高的是“云計算”“圖書館”“大數據”“信息服務”等關鍵詞,說明這些關鍵詞處于控制交往關系的權力地位,也就是說在該領域發揮著重要作用以及該領域的研究熱點主要是集中在這幾個方面。
點的度數中心度與點的中間中心度分析結果表明,有關云計算主題的研究關注點相對集中,一方面集中性研究有助于關注點的深入研究,另一方面也表明在未來的研究中可以進行拓展性研究,增加研究的關注點,完善并拓展云計算的研究領域。
4.3.3 小團體分析
社會結構是在社會行動者之間實存或潛在的關系模式,凝聚子群是一個行動者集合,在此集合中,“行動者之間具有相對較強、直接、緊密、經常的或者積極的關系”[8]。凝聚子群研究則是從某種社會結構中找出凝聚子群。筆者從小團體節度分析,即K-叢分析和節點距離分析進行計量。


表9 關鍵詞網絡:點的度數中心度

表10 關鍵詞網絡:點的中間中心度

圖4 關鍵詞聚類分析結果(部分)
K-叢分析是一種凝聚子群分析,首先將子群從整體網絡中分離出來,通過了解子群對集群的影響來分析節點之間的緊密程度[8]。筆者令K 值取2,構建2-叢分析,共找到3824 個2-叢(詳見圖5)。結合K-叢的概念,2-叢的規模為n 時,則每個因子就至少與n-2 個其他因子有直接的聯系。所有的2-叢中,規模最大的是7,也就是至少與5個關鍵詞曾有共現關系。但從整體來看,大部分2-叢規模是4,即大部分關鍵詞產生共現的現象,只是和兩個關鍵詞有關,說明網絡共現關系的范圍一般。
基于上述研究,筆者得出以下結論:2009 至2020 年間,我國有關該主題領域的學術研究快速形成規模,但需要持續關注與深度研究;在大數據背景下研究的熱點突出,符合時下信息技術發展的趨勢以及圖書館數字化建設過程中未來的發展走向,期待有更多不同領域的學者持續關注該主題領域的發展,進行創新研究以及合作交流。為促進我國云計算研究繁榮筆者建議采取以下措施:
研究小團體的形成,是研究主題走向成熟的一種外在特征。同時,研究主題的深入也需要借助穩定的小團體,開展持續性、延伸性的研究。我國云計算在圖書館領域的應用研究,對圖書館建設實踐產生了深刻的影響,但是伴隨背景環境的弱化或者新形勢背景的產生,對于其在特定領域的研究就會很大程度上被削弱。如何弱化外在客觀條件的影響作用,是保持云計算在圖書館領域研究占據較為穩固地位的核心問題。而小團體的形成,一方面表示有部分研究者對于特定主題的相關研究形成了較為一致的研究觀點或者看法;另一方面小團體會有更高的概率,保持對該領域研究的持續性和系統性,有利于該主題領域研究能夠得到深化,并始終維持一定的研究熱度,以此促進該領域研究的成熟與發展。
云計算在圖書館領域的應用研究,雖然較多成果傾向于理論研究,但是伴隨研究的深入,對于具體的實操性研究的需求會逐漸增加,由此需要較大的經費支撐。“巧婦難為無米之炊。”理論研究尚且可以借助已有的文獻典籍,所需的經費資源相比較工科實驗類學科較少,但是云計算在圖書館領域的研究應用,伴隨研究的深入,一些相關的基礎設備的應用具有必然性。根據“資金資助分布”情況分析,現有經費來源是以國家級基金為主、地方級科學基金支持為輔,各省市地方或者院校機構單位,在一定程度給予經費方面的支持是保障該領域研究持續深入的重要支撐。根據“高頻關鍵詞耦合現象分析”分析結果可知,云計算在圖書館領域的應用研究,主要與“信息服務”“大數據”“云服務”“大數據”“物聯網”“虛擬化”相關,并推動著“數字圖書館”“移動圖書館”“圖書館聯盟”等新形態的成長與發展,與此同時催生了圖書館領域的“云服務”“云存儲”“信息安全”等方面的問題,研究領域及視角的拓展,豐富著該領域的研究內容,同時也表達了該領域對于相關經費支持的較大的研究需求。
正如社會的發展需要綜合型人才,云計算在圖書館領域的應用研究,同時并非是單一的應用操作,而是需要借鑒融合多個學科領域的知識,開展跨學科的研究,以豐富該領域的研究內容,沉淀該主題的研究思想。在以上研究中發現該主題研究涉及到的學科主要包括:科技信息、圖書館學、情報學、檔案學、電子科技、科技與經濟等。由此可知,對于云計算在圖書館領域的應用研究,不同領域的研究學者,借助自身不同的專業背景,結合自身的專業素養,利用專業知識,開展豐富理論的研究,并拓展技術層面研究工作。比如,云計算在圖書館領域的應用研究,有關服務、信息存儲、信息安全等的研究,是云計算作用下圖書館長期的發展方向及拓展深化的方向,云計算在圖書館領域的應用研究必將大大豐富圖書館學研究的內容和視野。
不管是“云計算”“云計算技術”“信息技術”“虛擬化”,還是“互聯網”“大數據”,在圖書館服務深化創新的過程中,需要緊跟時代需求,并以讀者需求為導向,進行云計算在圖書館領域應用的創新性、可行性、多樣性的研究和升級。由此,在大數據、數字化背景下,需要在已有文獻研究的基礎上,融合時代特征,關注云計算應用背景下圖書館數字化建設與開發以及數據安全等方面的研究。同時關注新的時代環境及新的服務形式下,相配套的圖書館治理模式和治理體系研究與構建。對于云計算在圖書館領域的研究形成全面配套的研究框架及體系,同時注重該領域的理論研究與實證研究的相結合,以此豐富云計算在圖書館領域研究的內容,促進云計算在圖書館領域研究的繁榮,在保證與時俱進的同時,延伸該主題領域研究的深度,并拓展其廣度。