胡麗琴
摘要:本文對大數據在圖書采訪工作中的應用進行了研究,發現雖然大數據應用已是當前各行業的熱門發展方向,但是在圖書采訪工作中的應用情況整體比較落后。有一些實力強的圖書館已有大數據應用于采訪工作的實踐,采訪人員有更多決策參考依據,提高了采訪質量。但大部分圖書館對大數據的應用還處于比較簡單的階段。本文認為采訪人員應積極主動推動大數據應用,從而更好地完成采訪工作。
Abstract: This paper studies on application of big data in the books acquisition work, and found that although the big data is the current hot trend in many industries, but it is relatively backward. In some libraries people make good use of big data in books acquisition, but most libraries in the application of big data is still in relatively simple stage. This paper argues that acquisitioning staff should promote the application of big data to do better books acquisitioning work.
關鍵詞:圖書館;大數據;采訪
Key words: library;big data;books acquisition
中圖分類號:G25 文獻標識碼:A 文章編號:1006-4311(2018)33-0268-02
0 引言
大數據(Big Data)是指“那些大小已經超出了傳統意義上的尺度,一般的軟件工具難以捕捉、存儲、管理和分析的數據[1]”。上世紀80年代美國已經有人提出大數據的概念,而計算機和互聯網技術的發展,使各類記錄的數據量激增,近幾年“大數據”已成為人們關注的熱點。2013年11月,我國十多位院士向高層建議我國應制定大數據國家戰略,并在發展目標、發展原則、關鍵技術等方面做好頂層設計,提出了包括構建大數據研究平臺、構建大數據良性生態環境、構建大數據產業鏈等,并提出“在安全、醫療、衛生、教育等公共服務領域開展大數據應用示范,提高應急處置能力和安全防范能力,提升服務能力和運作效率[2]”。2015年8月,《國務院關于印發促進大數據發展行動綱要的通知》(國發〔2015〕50號)發布,明確了發展大數據的指導思想、發展目標和發展任務,為未來我國大數據發展與應用指明了方向。同年10月,《中共中央關于制定國民經濟和社會發展第十三個五年規劃的建議》發布,明確提出了“實施國家大數據戰略,推進數據資源開放共享”。在國家政策層面的導向和各行業發展的需求下,大數據在我國的發展進入了快速發展的時期。2014年12月,我國第一家大數據交易平臺北京中關村數海大數據大數據交易平臺正式發布上線,2015年4月14日,我國首個大數據交易所在貴陽掛牌。其后,武漢、河北、上海、浙江等地相繼創建了大數據交易平臺或交易中心。以貴陽大數據交易所為例,截至2018年8月,交易金額已經累計突破3億元,會員數量2000多家,可交易的數據總量超過150PB[3]。可以說,我們已經身處大數據的環境之中。
1 大數據應用于圖書館采訪工作的背景
圖書館的建設發展與國家和社會發展的節奏息息相關。大數據環境下,圖書館的各項工作不僅遭遇到了壓力,同時也迎來了發展的機遇。圖書館作為文獻信息資源中心,為讀者提供各類紙質圖書、期刊雜志報紙以及電子資源的閱讀和利用服務。利用互聯網及計算機技術,讀者能夠方便快捷的從圖書館借閱或者獲取自己需要的資源。但在大數據環境下,讀者在其他領域體驗到了企業基于用戶大數據分析的優質服務,對比圖書館相對落后的服務模式難免會產生體驗舒適度的落差,讀者可能會因此放棄圖書館而轉到其他途徑獲得所需要的服務。另一方面,圖書館面對壓力如果能順應潮流,積極利用大數據為讀者提供更優質的服務,則會開拓圖書館發展的新領域。本文從圖書館采訪工作的角度,對我國圖書館目前在大數據領域開展的服務進行了研究,試圖總結和提出圖書館利用大數據的實踐方式和途徑,以期在今后的工作中有更大的進步和發展。
2 基于大數據的圖書采訪輔助系統
基于大數據的圖書采訪輔助系統主要是指通過收集分析館藏、流通和檢索等環節的數據,實現圖書采訪的輔助決策功能。以復旦大學圖書館開發并使用的圖書采訪輔助決策支持系統為例,通過“從網絡底層、圖書館集成管理系統、數據庫廠商等多途徑獲取圖書館的現有館藏數據、流通數據和OPAC檢索日志數據,構建基于圖書館流通日志的圖書借閱數據倉庫維度模型和基于OPAC日志的點擊流數據倉庫,實現對不同類型的數據進行多維度統計分析[4]”。通過圖書采訪輔助決策支持系統,復旦大學圖書館的采訪人員能夠對已有館藏進行各類分析從而結合本館的資源建設策略進行調整和優化,還能通過流通和檢索數據的分析來獲取館藏的利用情況以及讀者想要閱讀的圖書信息。南昌大學圖書館的中文圖書采訪輔助系統通過在匯文系統上加掛數據采集系統來實現,系統提供的數據包括“作者簡歷與背景、作者在該領域發表的論文數量和論文被引用情況(基于CNKI平臺)以及作者以前的作品被讀者借閱的頻次以及數量[5]”。采訪人員在對新書書目進行篩選時,通過關聯數據采集系統的作者信息掌握新書作者在本專業領域的影響力及在本館的受歡迎程度,由此做出是否購買的決定。經統計,南昌大學圖書館通過輔助系統采選的的圖書,“零借閱率下降了30%[5]”。清華大學圖書館2013年開始建立了以學者為中心的知識關聯網絡,通過海量文獻數據的分析自動甄別出清華大學目標學者,獲取這些學者的相關學術信息,因而在參訪工作中能利用這些信息進行決策[6]。
其他基于大數據的系統如四川省圖書館陳雪樵等人提出的“基于大數據的圖書館應用系統”平臺[7]、蘭州商學院馬曉亭設計的圖書館大數據資源整合平臺[8]等。但這些系統基本停留在設計階段,尚未得到實際應用。
通過大數據的挖掘和分析,圖書采訪輔助系統能夠幫助采訪人員更準確地掌握本館的資源建設和利用情況,采訪工作更精準更符合館藏原則和讀者需求。
3 基于圖書館信息管理系統的數據應用
雖然基于大數據的圖書采訪輔助系統對高質量的采訪工作來說有很高價值,但系統的建設依賴于圖書館的綜合實力,只有少數大館才有人力財力來實現。對大多數圖書館來說,也可以退而求其次,在采訪工作中直接利用圖書館信息管理系統提供的數據分析功能,也能有效地提高采訪質量。如江蘇匯文軟件公司的Libsys圖書館管理系統,其最新版本LibsysV5.5增加“集成匯文云服務采訪協同應用,基于匯文云服務的大數據分析,為采訪人員提供必要的決策幫助[9]”。
3.1 信息管理系統統計功能模塊的應用 圖書館信息管理軟件都自帶各種功能模塊,其中的統計模塊一般能實現對系統數據的各種挖掘和統計分析功能,與采訪相關的功能如流通綜合統計、利用率分析、館藏文獻統計、讀者成分分析等。如能充分利用統計模塊,對館藏的實際利用情況進行精確的評估,就可作為采訪工作的參考依據。如遼寧科技大學圖書館在中文圖書采訪工作中利用匯文系統中的統計功能,對館藏的類目結構、學科機構進行了數據分析對比,發現了重點學科、新增專業和停辦專業相關館藏建設中存在的一些問題,并據此調整優化了原有的采訪原則[10]。
3.2 信息管理系統檢索功能模塊的應用 檢索功能記錄了讀者在使用圖書館信息管理軟件的過程中的痕跡,采訪人員可以通過檢索功能提供的數據了解讀者關注度高的圖書信息,從而及時采購圖書。如匯文系統的書目檢索系統有熱門檢索詞、熱門借閱、熱門圖書及被讀者收藏最多的圖書等排行。清華大學圖書館的水木搜索平臺提供清華人物和熱門標簽兩種熱門搜索,還根據讀者搜索次數繪制了熱點研究學科的年度變化曲線。采訪人員可通過統計的熱門檢索詞或讀者收藏的數據及時購買讀者關注的圖書,也可以參考熱門借閱和熱門圖書根據實際的流通頻率增加熱門圖書的復本。
隨著大數據應用的逐步升溫,各種圖書館信息管理系統都在逐步增強大數據的挖掘和分析功能,因此圖書館的采訪人員也可直接利用這些功能作為采訪工作的輔助手段,提高圖書采訪質量。
4 大數據在圖書采訪中的應用現狀分析
結合上述研究,大數據在圖書采訪中的應用現狀主要包括下面兩個方面。
4.1 大部分圖書館采訪人員的技術實力不足以實現大數據的應用 數據獲取途徑最佳是能在圖書館已有信息管理系統基礎上開發出適合本館的采訪工作平臺,能收集匯總來自出版社、書商、讀者等各方面產生的大量數據,包括書目信息、作者信息、讀者借閱等等。數據獲取后的分析也是大數據系統必備的功能,目前的數據分析能力現狀與數據獲取能力都取決于圖書館所用信息管理系統及采訪工作平臺的功能。但是目前只有少數圖書館能自行開發并使用基于大數據的圖書采訪輔助系統,其他大部分圖書館還依賴于軟件公司的信息管理軟件所提供的數據。雖然這些數據也在一定程度上對采訪工作有幫助,但軟件公司提供的都是同質性的數據及分析,缺乏個性化的、滿足本館采訪需求的輔助決策功能。數據分析人員是大數據得以應用的人力基礎,但是圖書館采訪人員中以圖書情報等相關專業人員為主,要完成海量數據的分析工作是非常困難的。雖然采訪人員有利用大數據的迫切愿望,但實際的數據處理能力并不足以完成大數據的分析工作。
4.2 大數據在各圖書館采訪工作中的應用冷熱不均 雖然大數據是近幾年各領域的熱門,但在圖書館工作中卻表現出冷熱不均的情況。清華大學圖書館、復旦大學圖書館等大館表現出積極的態度,自行開發利用大數據技術平臺挖掘數據價值,尤其在采訪工作中提供輔助決策依據。但其他中小館則局限于技術和財力,雖有心追隨大數據的潮流,卻只能盡量在現有的信息管理軟件基礎上獲得有限的大數據和數據分析。除圖書館實力的影響外,管理者的發展思路也影響了大數據的應用。一些中小館的管理者還處于“守成”的思想階段,即使認同大數據的發展趨勢,也沒有將大數據與圖書館的發展聯系起來。同時,管理思想的局限性也影響了采訪人員的工作主動性。
5 總結
本文對大數據在圖書采訪工作中的應用進行了研究,發現雖然大數據應用是當前各行業的熱門發展方向,但是在圖書采訪工作中的應用卻比較落后。大部分研究處于理論研究階段,只有少數圖書館已經有大數據應用的實踐經驗,這些實踐經驗證明大數據應用于圖書采訪工作能提高采訪質量,使得采訪人員有更多決策參考依據。因此,采訪人員應該積極推動大數據在采訪工作中得到利用,爭取館領導的思想和技術支持,從而盡快利用大數據更好地完成采訪工作。
參考文獻:
[1]涂子沛.大數據:正在到來的數據革命,以及它如何改變政府、商業與我們的生活[M].桂林:廣西師范大學出版社,2013.
[2]中國互聯網絡信息中心互聯網政策研究全球動態[EB/OL].[2018-06-23].http://www.cnnic.cn/gcjsyj/qyjsyj/hlwzcyj/qqdt/201312/t20131205_43369.htm.
[3]貴陽大數據交易所發展成就[EB/OL].[2018-08-23].http://www.gbdex.com/website/view/aboutGbdex.jsp.
[4]張計龍.大數據驅動圖書館業務應用與服務創新[J].上海高校圖書情報工作研究,2013(03):1-6.
[5]袁芳.大數據環境下圖書館文獻資源建設模式的變革[J].圖書情報工作,2015(18):91-94.
[6]中國新聞出版網.大數據環境下清華大學圖書館的實踐[EB/OL].[2018-06-23].http://www.chinaxwcb.com/2013-08/ 29/content_276028.htm.
[7]陳雪樵,等.基于“大數據”的圖書館應用系統平臺設計思路[J].四川圖書館學報,2016(02):15-18.
[8]馬曉亭.大數據時代圖書館數據整合系統構建研究[J].圖書館建設,2014(06):83-87.
[9]江蘇匯文軟件有限公司Libsys5.5正式推出[EB/OL].[2018-06-23].http://www.libsys.com.cn/product_libsys55.php.
[10]吳玉,張作來,苗永菊.大數據時代高校圖書館面向學科建設的中文圖書采訪機制[J].中國冶金教育,2015(06):81-85.