何聰
摘 要:近年來,國內外的圖書館都在轉變觀念,重視圖書館中各類數據的收集、存儲和管理,在用戶數據管理軟件開發、用戶利用文獻資源的數據分析與共享、文獻資源選擇的用戶主導決策等方面進行了有益的嘗試。本文分析了大數據時代下圖書館文獻資源的構成體系,并討論了再造文獻資源建設模式及其方法,提出了相應的措施。
關鍵詞:大數據技術;圖書館大數據;文獻資源建設;圖書館變革;模式創新
1 圖書館大數據的構成體系
隨著互聯網的發展,網絡化傳播、數字化出版、移動化閱讀成為人們的首選,尤其是隨著社會化媒體的發展,博客、微博、微信、朋友圈的發展,作者、讀者的身份逐漸模糊,個人既是信息內容的消費者,同時又是內容的生產者和傳播者。海量用戶參與到數字信息生產、傳播、出版的各個環節,形成了大量的出版、傳播、閱讀與使用數據。從數據生成角度,可以分為專家生成的專業數據、用戶生成內容和信息設備采集生成內容。
依據用戶生產、傳播、瀏覽、閱讀、收藏、購買、利用等數據進行存儲、管理和分析,建立讀者數據庫,管理讀者信息并分析其關注的問題,發現其興趣、愛好、閱讀和購買習慣,可為圖書館進行有針對性、即時性的購買提供精準化的推薦或推送信息,提高圖書館經費的使用效率和效果,改進圖書館資源購買的方式,提高資源規劃的科學性和預見性。
在大數據環境下,圖書館必須開展全方位、全過程、跨部門、跨機構、多途徑地采集、存儲、加工和整合用戶在本圖書館網絡系統、其他網絡環境、社交網絡、移動閱讀、監控設備和傳感器等信息來源的數據,圖書館必須開展與出版商、數據庫供應商和信息資源平臺之間的數據共享與合作,才能全面、準確地掌握讀者的閱讀行為、閱讀興趣與閱讀需求、閱讀需求以及閱讀方式變化趨勢等數據資產,為改進圖書館管理與服務效率,變革文獻資源評價、選擇的標準與方法,提高文獻資源建設的科學性、預見性、系統性等工作提供決策支持。
2 大數據有助于再造文獻資源建設模式
2.1 大數據為資源采購提供決策支持
頻繁變化的應用背后,不變的是永恒的數據。大數據的研究機構Gartner認為:“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。圖書館大數據的來源也呈多樣性的特征,它包括圖書館業務數據、文獻數據和用戶數據3種基本類型。用戶使用數據是指用戶在使用圖書館信息資源或信息設施的過程中可以被計算機所記錄的用戶信息行為數據,既包括網絡環境中的信息行為數據,也包括物理空間中的信息行為數據。
圖書館系統通過大數據技術的運用,掌握讀者使用資源的交互數據,如圖書瀏覽、數據庫訪問、檢索、下載記錄、評論、推薦等信息,可以更加有效地評估讀者對各種資源的使用情況,尤其是通過挖掘用戶檢索日志,對那些被多次檢索而圖書館又缺藏的資源的購買和補充提供非常有力的依據,能夠更全面、更精準、更及時地掌握單個圖書館或者某個系統、某個地域全部圖書館的用戶對信息資源獲取與利用的情況,為圖書館文獻資源的采訪決策、優化配置和數據庫的刪選調整提供科學的依據,也為圖書館再造文獻采訪模式提供有力的保障。
2.2 大數據推動“讀者決策采購”模式的發展
近年來,國內外各類圖書館普遍面臨文獻采購經費投入減少的問題,無論是外文紙本期刊還是外文數據庫的購買都出現不同程度的下降,這對捆綁銷售、集團購買和整庫或全庫購買等方式都會帶來不利影響。由于經費困難等因素,國外有部分圖書館已經停止以大宗交易(bigdeal)(整庫購買、捆綁銷售)方式購買期刊資源,代之以按篇付費(pay-per-view,PPV)等模式。按篇付費方式訂購期刊論文,或按需購買單本電子圖書和按需出版等方式的興起,實際上是讀者決策采購(patrondrivenacquisition,PDA)在圖書館資源訂購中的體現。
2.3 大數據創新圖書館資源的動態管理機制
文獻資源的有效組織和科學管理是圖書館文獻資源建設的重要組成部分。有些圖書館往往重視資源的購買而忽視資源的有效組織和整合。互聯網時代的知識生產呈冪級數增長,知識體系的更新更加頻繁,人們在圖書館檢索中不只需要獲取某一知識點,更需要獲得知識體系。知識體系的動態構建和檢索結果的有效呈現需要大數據的數據處理技術給予支撐。谷歌知識圖譜、搜狗知立方、百度知識圖譜等搜索引擎的推出,為用戶的搜索關鍵詞返回多種媒體形式、多種知識點組成的知識關聯結果,這大大擴展了用戶搜索的知識體系,值得圖書館界學習和借鑒。
3 創新圖書館文獻資源建設的措施
3.1 樹立大數據思維
維克托·邁爾-舍恩伯格在《大數據時代》一書中討論了關于大數據的3個思維變化:1)不是隨機樣本,而是全數據;2)不是精準性的,而是具有混雜性,尤其是大數據的簡單算法比小數據的復雜算法有效;3)不是因果關系,而是相關關系。就圖書館而言,大數據思維是一種重視用戶數據,重視用戶使用行為,平等對待用戶需求的理念,按照用戶的需求抉擇圖書館資源建設和服務的理念。同時,要求圖書館重視對圖書館和科研機構等相關數據的存儲、管理、分析和利用,徹底改變過去在圖書館管理、資源建設和服務工作中憑表面印象就決定的思維方式和決策方法。
3.2 培養大數據館員
大數據將重建圖書館的知識管理體系。面對大量異質、異構的數據,圖書館需要解決大數據的可表示性、可處理性、可融合性及可靠性等關鍵問題。這就需要一批掌握大數據分析工具來對數據進行有效挖掘、分析預測的數據館員,需要一批從關注資源技術、圖書館技術轉變為關注知識技術和用戶技術,從提供勞動力密集服務轉變為提供方法、工具與計算密集型服務的分析師,通過數據挖掘軟件和Citespace、LiterMiner等可視化工具來繪制科學知識圖譜,了解和預測科學發展前沿和動態,提供有針對性的、個性化的推送服務。
3.3 充分利用現有大數據工具,精準推送文獻
Altmetrics是一種基于社會網絡的學術影響力評價方法,該方法利用Altmetrics工具收割文獻管理系統和社交網絡中涉及某一研究成果的相關信息,通過對這些信息進行計算達到評價該學術成果影響力的目的,目前網絡上已有多種此類工具,如Altmetric.com、ImpactStory、PlumAnalytics等。另一方面,OA資源作為館藏資源的重要組成部分,越來越受到人們重視,但是圖書館在收集OA資源時往往缺乏參考工具,Altmetrics在一定程度上為我們提供了依據。南昌大學圖書館利用Altmetric.com通過MEDLINE主題詞、匹配PUBMED提問等條件進行設置,每季度向醫學院相關課題組提供學科影響力排在前10名的論文,大受歡迎。
4 結語
總之,大數據技術正在對圖書館的資源評價、選擇、組織和服務等工作產生越來越大的影響,圖書館應當科學有效地采集、存取、管理數據,并通過分析,提煉出有價值的信息,支持管理層作出及時有效的決策。需要指出的是,我們對大數據不能迷信,大數據不是萬能的,它也存在自身局限性。我們必須從本單位的實際情況出發,循序漸進,量力而行,切忌好大喜功。
參考文獻
[1]孫坦.開放信息環境:學術圖書館信息資源建設的重新定義[J].中國圖書館學報,2013(3):9-17.
[2]張計龍.大數據驅動圖書館業務應用與服務創新[J].上海高校圖書情報工作研究,2013(3):1-6.
[3]陳超.圖書館如何迎接大數據時代?[J].圖書館雜志,2014,33(1):4-7.
[4]烏恩.智慧圖書館及其服務模式的構建[J].情報資料工作,2012(5):102-104.
[5]葉蘭.研究數據管理能力成熟度模型評析[J].圖書情報知識,2015(2):115-123.