馮穎



摘 要:文章闡述了大數(shù)據(jù)給圖書(shū)館信息服務(wù)帶來(lái)的轉(zhuǎn)變,提出了大數(shù)據(jù)圖書(shū)館服務(wù)的發(fā)展方向,分析了基于大數(shù)據(jù)的圖書(shū)館信息服務(wù)模式和資源流程,并研究了大數(shù)據(jù)模式下的圖書(shū)館信息模式與個(gè)性化服務(wù)方式。
關(guān)鍵詞:大數(shù)據(jù);主動(dòng)服務(wù);信息可視化;智能用戶(hù)分析
中圖分類(lèi)號(hào):G250 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-1588(2017)02-0093-03
近年來(lái),隨著移動(dòng)信息技術(shù)、大數(shù)據(jù)技術(shù)、數(shù)據(jù)處理技術(shù)的發(fā)展,圖書(shū)館的信息模式也在不斷地革新和優(yōu)化。在圖書(shū)館信息服務(wù)中,各類(lèi)跨行業(yè)、定制化、個(gè)性化的業(yè)務(wù)需求不斷增多,對(duì)圖書(shū)信息數(shù)據(jù)的抽取、挖掘和分析成為推動(dòng)圖書(shū)館信息服務(wù)水平提升的關(guān)鍵。大數(shù)據(jù)技術(shù)的發(fā)展為圖書(shū)館信息模式的創(chuàng)新提供了良好契機(jī),構(gòu)建基于大數(shù)據(jù)的圖書(shū)館“數(shù)據(jù)—信息—知識(shí)—智慧”信息服務(wù)模式,能更好地推動(dòng)圖書(shū)信息數(shù)據(jù)轉(zhuǎn)化為潛在知識(shí)服務(wù),進(jìn)而創(chuàng)新信息服務(wù)模式,提升數(shù)字化、智能化、個(gè)性化服務(wù)水平。
1 大數(shù)據(jù)帶動(dòng)圖書(shū)館信息模式的轉(zhuǎn)變
根據(jù)維基百科的定義,大數(shù)據(jù)是一種數(shù)據(jù)集,能夠通過(guò)常用的軟件工具來(lái)獲取、存儲(chǔ)和管理,具有種類(lèi)多、流量大、體量大、價(jià)值高的特點(diǎn)。此外,大數(shù)據(jù)的處理時(shí)間超過(guò)常規(guī)數(shù)據(jù)處理的可容忍時(shí)間,不僅數(shù)據(jù)量巨大,而且增長(zhǎng)迅速。大數(shù)據(jù)是一種寶貴的信息資產(chǎn),數(shù)據(jù)中蘊(yùn)藏著豐富的信息內(nèi)容,圖書(shū)館用戶(hù)在圖書(shū)信息網(wǎng)站、購(gòu)物平臺(tái)、社交網(wǎng)絡(luò)等信息平臺(tái),都會(huì)產(chǎn)生并留下大量的數(shù)據(jù),這類(lèi)大數(shù)據(jù)信息包含圖片、聲音、視頻等多媒體信息,最終形成海量的圖書(shū)館用戶(hù)大數(shù)據(jù)。大數(shù)據(jù)對(duì)圖書(shū)館信息模式的轉(zhuǎn)變有巨大的推動(dòng)作用,具體如下。
1.1 從被動(dòng)服務(wù)向主動(dòng)服務(wù)轉(zhuǎn)變
傳統(tǒng)的圖書(shū)館服務(wù)以被動(dòng)服務(wù)為主,管理員對(duì)圖書(shū)資源進(jìn)行信息加工,經(jīng)過(guò)信息資源的采集、存儲(chǔ)、集成、分享,形成信息產(chǎn)品推送給用戶(hù)。這個(gè)信息流是以管理員為中心的單向流動(dòng)的過(guò)程,用戶(hù)處于一種被動(dòng)接受的狀態(tài),很難將自身需求傳遞回圖書(shū)館[1]。
大數(shù)據(jù)的出現(xiàn)有助于圖書(shū)館向主動(dòng)式服務(wù)轉(zhuǎn)變,建立以用戶(hù)需求為中心的信息服務(wù)模式,為用戶(hù)提供個(gè)性化信息服務(wù)。如:圖書(shū)館根據(jù)對(duì)用戶(hù)評(píng)論、滿(mǎn)意度反饋調(diào)查等大數(shù)據(jù)的分析結(jié)果,提取出用戶(hù)的實(shí)際需求、閱讀習(xí)慣、閱讀頻次,并將之反饋給管理員,再由管理員進(jìn)行信息資源的采集、存儲(chǔ)、集成和分享,形成符合用戶(hù)個(gè)性化需求的信息產(chǎn)品。
1.2 從內(nèi)向型服務(wù)向外向型服務(wù)轉(zhuǎn)變
傳統(tǒng)的圖書(shū)館服務(wù)屬于內(nèi)向型服務(wù),服務(wù)載體以紙質(zhì)書(shū)籍、報(bào)刊、檔案為主,知識(shí)傳播途徑較為單一。移動(dòng)信息時(shí)代,圖書(shū)館的服務(wù)載體日益多元化,通過(guò)智能手機(jī)、電腦、電視等都可以進(jìn)行圖書(shū)信息傳播,信息資源獲取途徑也不斷拓展,打破了傳統(tǒng)圖書(shū)服務(wù)模式的時(shí)空限制。
大數(shù)據(jù)模式下,圖書(shū)館信息途徑更加外向,信息受眾也更加寬泛,目前包括首都圖書(shū)館、廣州圖書(shū)館、上海圖書(shū)館等在內(nèi)的圖書(shū)館都允許社會(huì)人員入館,開(kāi)放式的大數(shù)據(jù)圖書(shū)館成為發(fā)展趨勢(shì),傳統(tǒng)“讀萬(wàn)卷書(shū)、行萬(wàn)里路”的信息獲取方式已經(jīng)過(guò)時(shí),“秀才不出門(mén),便知天下事”的大數(shù)據(jù)閱讀已成為現(xiàn)實(shí)。
2 基于大數(shù)據(jù)的圖書(shū)館信息服務(wù)模式研究
大數(shù)據(jù)是數(shù)字世界的智慧基因,來(lái)自圖書(shū)館用戶(hù)的使用數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)和社會(huì)網(wǎng)絡(luò)數(shù)據(jù)都能夠匯聚為大數(shù)據(jù),圖書(shū)館自身即可被視為一個(gè)大的數(shù)據(jù)集,不同地區(qū)的圖書(shū)館可以聯(lián)合構(gòu)建大數(shù)據(jù)圖書(shū)館,不同地區(qū)的圖書(shū)館數(shù)據(jù)之間存在數(shù)據(jù)交換和資源共享。圖書(shū)館通過(guò)對(duì)大數(shù)據(jù)的整合與分析,洞悉用戶(hù)的真實(shí)需求。圖1為圖書(shū)館大數(shù)據(jù)應(yīng)用的支撐技術(shù)與實(shí)現(xiàn)方法。
圖1顯示,圖書(shū)館大數(shù)據(jù)應(yīng)用主要基于分布式數(shù)據(jù)存儲(chǔ)、網(wǎng)絡(luò)分析挖掘、圖計(jì)算技術(shù)、可視化技術(shù)等,對(duì)各類(lèi)源數(shù)據(jù)進(jìn)行收集、整合、存儲(chǔ)和處理、分析,最終轉(zhuǎn)換為個(gè)性化服務(wù)。圖書(shū)館大數(shù)據(jù)結(jié)構(gòu)復(fù)雜、種類(lèi)眾多、容量巨大,對(duì)數(shù)據(jù)的處理過(guò)程是信息工作人員對(duì)信息的再次加工與分析的過(guò)程。
國(guó)外對(duì)移動(dòng)圖書(shū)館和大數(shù)據(jù)應(yīng)用的研究起步較早,由此衍生出的個(gè)性化服務(wù)也較多。目前,美國(guó)高校可以提供基于Windows Phone、Kindle、Blackberry等多個(gè)系統(tǒng)的圖書(shū)數(shù)據(jù)服務(wù),很多高校都實(shí)現(xiàn)了數(shù)字圖書(shū)館服務(wù)。如:耶魯大學(xué)所有紙質(zhì)圖書(shū)均印有二維碼,用戶(hù)可以通過(guò)掃碼直接鏈接圖書(shū)資源,還可以通過(guò)大數(shù)據(jù)收集提供多媒體資源的移動(dòng)信息檢索;斯坦福大學(xué)圖書(shū)館用戶(hù)可以通過(guò)智能手機(jī)終端獲取各類(lèi)移動(dòng)信息,包括視頻、音頻、樂(lè)譜等。
在國(guó)內(nèi),清華大學(xué)、中國(guó)人民大學(xué)等高校的圖書(shū)館,以及國(guó)家圖書(shū)館、首都圖書(shū)館等技術(shù)先進(jìn)的圖書(shū)館也在大數(shù)據(jù)應(yīng)用方面展開(kāi)了一系列探索,國(guó)內(nèi)很多圖書(shū)館已經(jīng)基本實(shí)現(xiàn)館藏?cái)?shù)字化,并借助大數(shù)據(jù)提供了一系列特色服務(wù)[2]。如:國(guó)家圖書(shū)館的“掌上國(guó)圖”、杭州數(shù)字圖書(shū)館的“文瀾在線(xiàn)”等。大數(shù)據(jù)信息模式通過(guò)數(shù)據(jù)挖掘和分析最終得出用戶(hù)行為分析結(jié)果,從而為圖書(shū)館個(gè)性化服務(wù)提供支撐。
如圖2所示,圖書(shū)館大數(shù)據(jù)的信息架構(gòu)可以分為四層,分別為大數(shù)據(jù)的采集、存儲(chǔ)、處理和應(yīng)用。其中,圖書(shū)館大數(shù)據(jù)主要采集來(lái)自國(guó)內(nèi)外數(shù)據(jù)庫(kù)的論文、著作以及社交網(wǎng)絡(luò)數(shù)據(jù)等,包括文字、圖片、影像、視頻等多種表現(xiàn)形式。圖書(shū)館數(shù)據(jù)浩如煙海,要想從數(shù)據(jù)中成功提取所需要的信息,需要借助Hadoop技術(shù)、Map Reduce技術(shù)、SQL(Structured Query Language,結(jié)構(gòu)化查詢(xún)語(yǔ)言)技術(shù)等,將大數(shù)據(jù)存儲(chǔ)到云服務(wù)器,通過(guò)云計(jì)算技術(shù)對(duì)大量的圖書(shū)文件系統(tǒng)和元數(shù)據(jù)庫(kù)進(jìn)行整合,實(shí)現(xiàn)多渠道、多類(lèi)型、大異構(gòu)的信息存儲(chǔ)服務(wù)[3]。
3 基于大數(shù)據(jù)的圖書(shū)館個(gè)性化服務(wù)研究
基于大數(shù)據(jù)的圖書(shū)館個(gè)性化服務(wù)能夠幫助用戶(hù)融入其中,構(gòu)建充分適用于互聯(lián)網(wǎng)、移動(dòng)終端、智能手機(jī)、本地用戶(hù)等多種接入方式的大數(shù)據(jù)知識(shí)共享平臺(tái)。大數(shù)據(jù)技術(shù)強(qiáng)大的數(shù)據(jù)處理和分析能力,不僅能夠幫助用戶(hù)克服時(shí)空局限,與信息管理員進(jìn)行實(shí)時(shí)反饋與交流,還能夠幫助用戶(hù)借助大數(shù)據(jù)個(gè)性化服務(wù)方式,通過(guò)新媒體傳播、互動(dòng)百科、學(xué)術(shù)論壇等方式來(lái)發(fā)布信息,實(shí)現(xiàn)圖書(shū)信息的閉環(huán)傳遞和反饋。
3.1 信息可視化服務(wù)
移動(dòng)信息時(shí)代圖書(shū)信息資源日益多樣化,用戶(hù)對(duì)信息提供方式的要求日益提升,希望能夠?qū)崿F(xiàn)反饋信息可視化。大數(shù)據(jù)信息量大、價(jià)值密度低、數(shù)據(jù)層次多,因此通過(guò)大數(shù)據(jù)挖掘提取出有用信息,并以可視化形式呈現(xiàn),能夠大大提高圖書(shū)館用戶(hù)對(duì)圖書(shū)信息檢索的評(píng)價(jià)。常見(jiàn)的圖書(shū)可視化技術(shù)包括標(biāo)簽云、歷史流、空間信息技術(shù)等,通過(guò)大數(shù)據(jù)的可視化輸出,能夠提高用戶(hù)的查準(zhǔn)率。
清華大學(xué)圖書(shū)館將圖書(shū)館服務(wù)嵌入搜索引擎中,將購(gòu)買(mǎi)的66,000多種電子期刊資源與Google Scholar等平臺(tái)進(jìn)行關(guān)聯(lián),并嵌入大數(shù)據(jù)的圖書(shū)可視化技術(shù),將電子館藏大數(shù)據(jù)信息整合為XML文件并存儲(chǔ)在特定服務(wù)器,從而使Google Scholar等平臺(tái)能夠定期抓取。當(dāng)用戶(hù)在相關(guān)搜索引擎進(jìn)行搜索時(shí),可以根據(jù)用戶(hù)的檢索自動(dòng)連接到清華大學(xué)的館藏資源,并能夠可視化呈現(xiàn),用戶(hù)通過(guò)標(biāo)識(shí)性的文字就能夠獲取閱讀權(quán)限,從而極大地提升了資源的查準(zhǔn)率和資源共享率[4]。
3.2 個(gè)性化圖書(shū)信息服務(wù)
要做好圖書(shū)館信息服務(wù),應(yīng)該充分利用大數(shù)據(jù)技術(shù)的優(yōu)勢(shì),并與云計(jì)算技術(shù)、無(wú)線(xiàn)通信技術(shù)、傳感和網(wǎng)絡(luò)技術(shù)相結(jié)合,實(shí)現(xiàn)圖書(shū)館數(shù)據(jù)從基礎(chǔ)設(shè)施架構(gòu)到用戶(hù)服務(wù)模式的變革,進(jìn)而幫助用戶(hù)克服閱讀時(shí)間、地點(diǎn)、內(nèi)容、終端類(lèi)型等條件的限制,結(jié)合移動(dòng)圖書(shū)館、手機(jī)圖書(shū)館、云計(jì)算圖書(shū)館、泛在圖書(shū)館等新的服務(wù)形式,真正實(shí)現(xiàn)以用戶(hù)需求為中心的信息模式與個(gè)性化服務(wù)。
如表1所示,以國(guó)家圖書(shū)館的“掌上國(guó)圖”和杭州數(shù)字圖書(shū)館的“文瀾在線(xiàn)”為代表,國(guó)內(nèi)一些技術(shù)先進(jìn)的圖書(shū)館已經(jīng)逐步對(duì)館藏進(jìn)行數(shù)字化,并基于大數(shù)據(jù)技術(shù)對(duì)數(shù)字資源進(jìn)行分析、存儲(chǔ)和整合,提供參考咨詢(xún)、圖書(shū)館微博、讀者薦購(gòu)等服務(wù)。圖書(shū)館將海量的無(wú)序數(shù)據(jù)進(jìn)行整合,通過(guò)開(kāi)放鏈接和數(shù)據(jù)混搭的方式對(duì)其進(jìn)行推送,對(duì)于來(lái)自互聯(lián)網(wǎng)、移動(dòng)終端、本地等不同路徑的圖書(shū)館用戶(hù),圖書(shū)館能夠基于大數(shù)據(jù)提供的海量資源,提供具備個(gè)性化參考咨詢(xún)的一站式檢索服務(wù)。在個(gè)性化知識(shí)發(fā)布方面,圖書(shū)館能夠通過(guò)學(xué)術(shù)博客、圖書(shū)館網(wǎng)站等來(lái)發(fā)布圖書(shū)信息;在個(gè)性化知識(shí)交流方面,讀者既能夠在知網(wǎng)空間發(fā)表心得,也能夠通過(guò)互動(dòng)百科、學(xué)術(shù)論壇等方式參與知識(shí)交流。此外,互聯(lián)網(wǎng)用戶(hù)還能夠借助泛在網(wǎng)絡(luò)和虛擬社區(qū)來(lái)參與圖書(shū)信息交流,大數(shù)據(jù)的可視化技術(shù)也極大地提升了圖書(shū)館個(gè)性化服務(wù)的效率。
3.3 用戶(hù)智能化分析服務(wù)
數(shù)據(jù)挖掘即從大數(shù)據(jù)中提取出各類(lèi)有價(jià)值信息,并將之應(yīng)用于對(duì)圖書(shū)信息用戶(hù)閱讀習(xí)慣、信息行為、信息軌跡的分析上,同時(shí)借助這些分析來(lái)預(yù)測(cè)用戶(hù)需求,從而提供智能化推送服務(wù)[5]。此外,圖書(shū)館還能夠借助智能化分析服務(wù),對(duì)現(xiàn)有資源進(jìn)行綜合分析,預(yù)測(cè)未來(lái)有可能存在的系統(tǒng)故障、用戶(hù)需求響應(yīng)障礙、信息安全等方面的問(wèn)題。
圖3是大數(shù)據(jù)圖書(shū)館讀者閱讀行為分析判定流程圖。如圖3所示,大數(shù)據(jù)圖書(shū)館會(huì)全面而規(guī)范地搜集用戶(hù)行為數(shù)據(jù),基于大量的存儲(chǔ)數(shù)據(jù)對(duì)用戶(hù)行為事件進(jìn)行初步過(guò)濾,通過(guò)科學(xué)分類(lèi)、智能分析、人工匹配等環(huán)節(jié),結(jié)合信息管理人員的經(jīng)驗(yàn),經(jīng)過(guò)價(jià)值過(guò)濾和人工篩選后得出用戶(hù)行為定義,從而進(jìn)行用戶(hù)行為判定,完成價(jià)值過(guò)濾和信息篩選過(guò)程。與此同時(shí),圖書(shū)館還采集用戶(hù)行為事件并將之存入大數(shù)據(jù)庫(kù),將用戶(hù)行為分析的結(jié)果與數(shù)據(jù)庫(kù)對(duì)比,進(jìn)行用戶(hù)行為匹配,最終得出用戶(hù)的閱讀行為和興趣點(diǎn),并據(jù)此進(jìn)行個(gè)性化推送服務(wù)。
清華大學(xué)圖書(shū)館在新浪微博注冊(cè)了名為“清華樂(lè)推”的微博,并使用了大數(shù)據(jù)的用戶(hù)智能分析技術(shù),通過(guò)對(duì)清華大學(xué)官方微博上的讀者咨詢(xún)、建議、投訴和表?yè)P(yáng)等方面數(shù)據(jù)的分析,篩選出重要的價(jià)值信息[6],并依據(jù)這些信息來(lái)提供相應(yīng)的定制服務(wù)、培訓(xùn)信息、圖書(shū)推送信息等。
4 結(jié)語(yǔ)
大數(shù)據(jù)是移動(dòng)信息時(shí)代用戶(hù)閱讀需求快速變化的產(chǎn)物,也是信息技術(shù)發(fā)展的必然趨勢(shì),大數(shù)據(jù)在圖書(shū)館的應(yīng)用有利于打破傳統(tǒng)圖書(shū)館在時(shí)間和地點(diǎn)方面的限制。大數(shù)據(jù)已經(jīng)成為保障圖書(shū)館信息系統(tǒng)和服務(wù)能力的重要因素,現(xiàn)代圖書(shū)館應(yīng)該充分利用大數(shù)據(jù)資源,準(zhǔn)確識(shí)別圖書(shū)館用戶(hù)的服務(wù)需求、閱讀行為、個(gè)性化特征,創(chuàng)新信息模式與個(gè)性化服務(wù)方法,不斷改善用戶(hù)的閱讀體驗(yàn),改善用戶(hù)關(guān)系,從而實(shí)現(xiàn)精準(zhǔn)化、個(gè)性化、智能化的圖書(shū)信息服務(wù)。
參考文獻(xiàn):
[1]胡越.圖書(shū)館服務(wù)的學(xué)科化與個(gè)性化[M].北京:首都師范大學(xué)出版社,2008:21.
[2]周虹,張蓓,竇天芳,等.清華大學(xué)圖書(shū)館OPAC書(shū)封服務(wù)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2008(8):84-87.
[3]施慧娟.可視化數(shù)據(jù)挖掘技術(shù)的研究與實(shí)現(xiàn)[D].上海:華東師范大學(xué)信息學(xué)院,2010.
[4]劉淑玲.網(wǎng)絡(luò)環(huán)境下高校圖書(shū)館的知識(shí)管理與知識(shí)服務(wù)[J].情報(bào)科學(xué),2010(4):523-526.
[5]韓晶星.面向知識(shí)社區(qū)的數(shù)字參考咨詢(xún)服務(wù)平臺(tái)構(gòu)建[J].情報(bào)雜志,2010(2):123-126.
[6]李靖.圖書(shū)館自助式服務(wù)的現(xiàn)狀與未來(lái)[J].上海高校圖書(shū)情報(bào)工作研究,2011(2): 6-8.
(編校:周雪芹)