楊方銘,章 華
(淮安信息職業技術學院圖書館,江蘇 淮安 223003)
大數據環境下圖書館服務變革探討*
楊方銘,章華
(淮安信息職業技術學院圖書館,江蘇淮安223003)
論述大數據的特征,闡述大數據對圖書館服務、館藏的影響和作用,提出需要在分析和挖掘圖書館相關大數據的基礎上創新圖書館服務,圖書館應朝著一體化的個性化服務、面向創新的知識服務和智慧化服務的方向發展。
大數據;圖書館服務;數據挖掘;數據分析
從字面上看,大數據是一個表示龐大規模數據的抽象概念。如果僅在數量上,大數據和以前的“海量數據”“超大規模數據”等概念之間并無太大區別。目前,關于大數據,學界尚未形成統一的定義,但是存在一些共識,大數據是一個用來描述海量的結構化、半結構化和非結構化數據的動態概念,這些數據的容量非常巨大以至于很難用傳統的數據庫和軟件技術進行存儲、管理和處理。其中,數據量并不是必須達到TB級或PB級才算是大數據,它的數量是隨著技術的進步而改變,過去或目前的大數據,在未來可能不再是大數據。它的理念是通過包括互聯網在內的多種渠道收集研究對象的多維度數據,再對海量數據進行關聯分析和數據挖掘,發現被研究對象的潛在行為模式或規律[1]。
圖書館大數據環境具有 “4V+1C”特征:(1)Variety。數據種類多,包括結構、半結構和非結構等數據類型,具有較強的異構性。(2)Volume。圖書館利用監控、服務終端采集讀者行為數據和系統運營數據,使其圖書館數據日益龐大。(3)Velocity。圖書館采集到的大部分數據均為用戶行為和應用服務等方面的數據,它的分析處理時效性很強。(4)Vitality。圖書館依據用戶需求和服務實際情況對大數據進行處理和分析,其需要很強的時間和空間適用性。(5)Complexity。圖書館需要采用高效算法對異構數據進行處理分析,其難度很大[2]。
2.1館藏收集范圍擴大與知識挖掘
隨著移動服務的普及和社交媒體的流行,圖書館收藏的數據源開始擴展到視頻、音頻、數據流等非結構化數據。針對如此復雜的數據,圖書館需要利用大數據技術和理念處理好以下幾個問題:(1)大數據的收集。圖書館需要收集的大數據主要包含自身網絡應用子系統產生的數據和外部Internet產生的數據,收集范圍是圖書館需要采集有價值的數據與可以采集到數據的相互交融的數據。(2)大數據由大變小,即如何處理和清洗大數據。圖書館要想利用大數據,就必須掌握大數據處理流程和方法,對大數據進行抽樣、篩選、壓縮、索引、提取元數據等操作,把海量數據變小。然后,采用主題分析,核心概念提取,選用上位詞、普選利用下位詞、縮小數據范圍等方法對大數據進行分析和挖掘。(3)怎么對大數據進行價值提煉。隨著圖書館越來越重視個性化服務,圖書館系統與網絡日志、監控與服務視頻、音頻、圖片、網絡行為及增值服務等非結構化數據量將超結構化數據量。因此,圖書館需要對非結構化數據進行結構化解讀和梳理,利用群體智慧提煉和發酵數據的價值。
2.2以用戶為中心的服務創新
在大數據環境下,圖書館館藏數量的激增、非機構數據占主體、數據種類繁多等特征,使圖書館不能再利用傳統的信息搜集、組織、分析、傳遞與提供利用的服務模式以滿足用戶的信息需求,而是要在搜集、組織、分析、挖掘數據的基礎上,提煉知識,關注知識服務的全過程,利用數據了解服務中發生了什么,分析和預測科研創新合作過程中、解決用戶問題過程中發生了什么,以便在關注用戶的結構化信息需求時,創新服務模式,通過對非結構化、半結構化、結構化數據的分析來滿足用戶急劇擴張的知識需求。
其具體措施是:(1)加強用戶研究與交換數據的利用,對用戶數據進行深度分析并建立用戶模型,開展精準服務、知識關聯服務,提供預測性信息服務產品;(2)將現有成熟的信息采集工作模式與先進的數學模型結合,實現工作效率的提升;(3)關注和融入社交網站,擴大圖書館的受眾面,實時了解讀者的需求,提升圖書館在讀者個人文化生活中的作用和影響[3];(4)圍繞用戶的問題、科研創新提供服務。
3.1圖書館服務走近用戶
大數據對圖書館工作的沖擊及其理念對圖書館服務的影響,迫使圖書館不能只重視館藏數字化及其數據存儲量,而是要強化圖書館對大數據的分析和挖掘的能力。讓館藏建設走向知識組織,把無序的網絡空間變成有序的數字知識服務系統,保證用戶高效、系統、可靠地獲取所需要的信息[4]。圖書館還要加強隨時隨地為用戶提供服務的能力,滿足他們對知識服務的需求,為用戶科學創造提供必需的情報服務,讓用戶在科研過程中體驗到圖書館細致入微的科研服務,真正體現以用戶為主的服務思想。在服務方式上,圖書館要改變過去只注重吸引大量用戶到圖書館而不注重服務效果的服務方式,切實做到把圖書館服務延伸到用戶的第一線,用大數據理念預測用戶需求,提供精確服務,真正讓圖書館服務走近用戶。
3.2一體化的個性化服務體系
隨著大數據技術與理念應用到各行各業,圖書館也要轉變信息資源建設觀念與信息服務理念,改變信息資源的選擇、組織與存儲方式,從海量數據中窺探用戶行為,并與已有業務流程、服務模式融合,創造新的方法讓圖書館服務更具價值。圖書館長期為用戶提供信息服務,積累了大量用戶資料,在此基礎再研究用戶的網絡行為、學習行為、個人背景等數據資料,利用Hadoop、NoSQL等大數據處理技術,挖掘用戶的知識背景、興趣、學習風格、情感、社會關系等信息,利用語義網、信息檢索、個性化推薦等技術,與用戶行為模式相似的其他用戶歷史數據進行對照,并深層次分析、組織數字資源,讓圖書館系統能夠針對用戶的搜索信息行為,提供個性化語義搜索服務;針對用戶的瀏覽行為,提供個性化語義導航服務;針對用戶的提問行為,提供個性化的問答服務;針對用戶的自主學習行為,提供個性化定制服務;針對用戶需求,進行語義分析、語義擴展等步驟來明確用戶真實意圖,根據用戶本體,利用個性化推薦引擎為用戶推薦符合需求的知識內容。這樣,最終建立以數據為中心,以用戶、服務、信息、技術和應用為一體化的個性化服務體系。
3.3面向創新的知識服務
在大數據環境下,圖書館的服務策略建立在對大規模復雜數據搜集、組織、整理、分析和挖掘的基礎之上,因而圖書館服務項目更具有針對性和操作性[5]。圖書館經過對海量數據的統計性搜索、比較、聚類、分類等分析歸納,能夠完成數據價值的挖掘和讀者需求的預測,再利用大數據技術對多個信息平臺的數據進行過濾整合,實現依據讀者需求的變化而提供差別化的知識服務,滿足用戶智慧集群和群體創造的需要,滿足多用戶合作學習、合作科研、多元知識交互分析、利用與交流的需要,進而把知識服務嵌入到用戶學習、科技創新的過程中,形成面向用戶科研創新的知識服務模式。
其模式以解決用戶問題為核心,深入解決問題的各個環節,擁有解決問題的探索、構建和測試等服務機制。此服務建立用戶數據庫,跟蹤和整理大量文獻(館內外信息資源),對比、篩選與組織相關內容,鑒別、分析可能的結構和趨勢來構建宏知識,利用大數據技術進一步挖掘知識結構中的沖突、變異和可能性,分析知識內容的發展趨勢與路徑,支持對科技創新、未來演變方向與可能性的挖掘與預警,從而開拓和激發創新思路與路徑。通過對多樣化數據和信息的關聯與分析,來支持具體領域的具體問題及其解決方法的分析,再根據需求的動態變化不斷調適,與用戶共同探索問題的解決方案[6]。
3.4智慧化服務
大數據是數據世界的智慧基因,分析和應用大數據是獲得智慧的關鍵[7]。傳統分析數據基本上都是抽取樣本,事先確定收集什么樣的數據,然后尋找“已知的未知(Known unknows)”,也就是證實某一結論正確。而大數據分析則是以全部數據為對象,發現未知的未知,也就是找到一些未曾想到的結果。大數據這種發現未知的未知功能為實現圖書館服務智慧化開辟了途徑。利用大數據技術能夠了解用戶信息行為、意愿、信息需求、知識應用能力及服務需求等,還能夠預測用戶科研創新將要發生什么,從而提供智慧服務。
3.5數據分析與數據挖掘是圖書館提供服務的基礎
在大數據時代,大數據資源已成為關系圖書館服務質量和館藏資源結構科學性的關鍵因素。人們將拋棄隨機采樣的調查方式,轉向分析大量數據;人們不再瘋狂追求分析數據的精確度,轉向注重對事物發展趨勢的預測;人們不再重視事情的前因后果,轉向關注挖掘事物之間的關聯性。因此,圖書館數據資源的質量、管理和分析,將成為圖書館服務質量提升的基礎,成為準確分析用戶需求、制定科學的管理與服務策略、服務質量提升的關鍵。
圖書館通過對互聯網上的知識點 (詞匯或專有名詞)進行搜索,并對知識點進行關聯、描述,建立知識點的知識數據庫,再利用一定算法、鏈接技術和匹配技術,能夠實現基于知識的知識推送服務,即網絡在線閱讀中提供動態的專有名詞解釋或提示服務;通過分析圖書館與用戶之間、不同服務數據之間、用戶與服務數據之間的關系數據,能預測用戶需求,提供針對性服務和個性化定制服務,還能合理調配館員,充分調動他們的工作積極性;通過對用戶借閱信息、下載使用數字資源行為、瀏覽網站行為、檢索信息行為等記錄信息進行分析,并與用戶行為模式相似的其他用戶歷史數據進行對照,能提供基于用戶隱性知識的推送服務;通過對圖書借閱率、流通量、訪問數字資源類型及時間、學習行為、利用資源模式等記錄進行分析,能針對性地采購用戶需要的信息資源;通過對讀者閱讀習慣、學習方式、獲取資源方式等數據進行分析,能科學合理地完善圖書館工作流程與服務模式。因此,大數據時代,圖書館需要對用戶數據進行分析、處理和預測,以便提供更好的服務。
在大數據時代,圖書館要真正將服務嵌入用戶的學習、科研、教學、科技創新、管理決策等活動過程中,提供以知識、信息、智力、工具的應用為特征的知識服務,則需要搜集、分析、挖掘各種類型、各種結構的數據資源和用戶的行為數據資源。只有這樣,圖書館的服務范圍和領域才會得到更大的擴展和延伸,并且數據分析服務、數據挖掘服務會成為圖書館服務體系創新的制高點[8]。
[1]李善青,趙輝,宋立榮.基于大數據挖掘的科技項目查重模型研究[J].圖書館論壇,2014(2):78-83.
[2]陳臣.大數據時代一種基于用戶行為分析的圖書館個性化智慧服務模式[J].圖書館理論與實踐,2015(2):96-99.
[3]吳敏慧.大數據與圖書館信息服務新構想[J].圖書館理論與實踐,2015(2):14-16.
[4]馮國權.互聯網思維下圖書館服務變革[J].圖書情報工作, 2015(2):25-30.
[5]楊海燕.大數據時代的圖書館服務淺析[J].圖書與情報, 2012(4):120-122.
[6]張曉林.研究圖書館2020:嵌入式協作化知識實驗室?[J].中國圖書館學報,2012(1):11-20.
[7]韓煒.大數據時代公共圖書館消除數據不平等的路徑選擇[J].圖書館論壇,2014(3):14-21.
[8]程蓮娟.美國推進大數據的應用實踐及其有益借鑒[J].情報資料工作,2013(5):110-112.
(編發:章忠平)
A Study of the Reform of Library Service Based on Big Data
YANG Fang-ming,ZHANG Hua
(Library of Huai’an College of Information Technology,Huai’an 223003,China)
This paper discusses the characteristic of big data,elaborates the influence and function of big data on library services and collections,points out innovations of library service which is based on the analysis and mining of big data related to the library.The integration of personalized service,the innovation of knowledge service and the intelligent service are the direction of library development.
big data;library service;data mining;data analysis
G250.73
G250.73
A
2095-5197(2016)01-0048-03
* 本文系2014 年中國職業技術教育學會科研規劃項目:“高職院?;訉W習平臺的構建與實踐研究”(編號:201410Y02)的研究成果之一。
楊方銘(1981-),男,館員,碩士,研究方向:信息服務與信息咨詢;章華(1963-),女,館員,大專,研究方向:圖書館服務。
2015-11-10