王娟
【摘? 要】近年來,大數(shù)據(jù)的應(yīng)用對高校圖書館工作產(chǎn)生了巨大的影響。論文運(yùn)用調(diào)查法、文獻(xiàn)法等就大數(shù)據(jù)分析對圖書館的影響以及其在大學(xué)圖書館中的應(yīng)用進(jìn)行分析探究,以供參考。
【Abstract】In recent years, the application of big data has a huge impact on the work of university library. The paper uses survey method, literature method and other methods to analyze and explore the impact of big data analysis on library and its application in university library, for reference.
【關(guān)鍵詞】大數(shù)據(jù)分析;圖書館;應(yīng)用路徑
【Keywords】big data analysis; library; application path
【中圖分類號(hào)】G250.7;G258.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻(xiàn)標(biāo)志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章編號(hào)】1673-1069(2021)03-0188-02
1 引言
互聯(lián)網(wǎng)、計(jì)算機(jī)等現(xiàn)代化技術(shù)在一定程度上改變了高校圖書館讀者的閱讀方式與圖書館的用戶服務(wù)模式,高校圖書館數(shù)據(jù)開始逐漸呈現(xiàn)出多類型、高價(jià)值、快速處理以及海量激增等特征。在此情況下,傳統(tǒng)的數(shù)據(jù)處理方式已經(jīng)不再適應(yīng)當(dāng)前工作,高校圖書館必須引進(jìn)與應(yīng)用更為先進(jìn)的數(shù)據(jù)處理技術(shù)來提高數(shù)據(jù)利用率,提升圖書館服務(wù)水平。下文結(jié)合實(shí)際情況,就大數(shù)據(jù)分析在大學(xué)圖書館中的應(yīng)用問題作具體分析。
2 大數(shù)據(jù)分析的特點(diǎn)與作用
對于什么是大數(shù)據(jù),《社會(huì)消費(fèi)網(wǎng)絡(luò)營銷》中提出:(大數(shù)據(jù))包括企業(yè)信息化的用戶交易數(shù)據(jù),社會(huì)化媒體中用戶的行為數(shù)據(jù)和關(guān)系數(shù)據(jù),以及無線互聯(lián)網(wǎng)中的地理位置數(shù)據(jù)[1]。大數(shù)據(jù)的概念來自歐美國家,而對于大數(shù)據(jù)分析,我們可以將其理解為是一種數(shù)據(jù)工具。大數(shù)據(jù)分析包括數(shù)據(jù)收集與數(shù)據(jù)分析,通過收集與分析大量數(shù)據(jù),獲得信息不對稱的優(yōu)勢,并據(jù)此對事物發(fā)展趨勢作出預(yù)測。
通過簡單調(diào)查與研究可知,高校圖書館數(shù)據(jù)總量正在快速增長,且在相關(guān)技術(shù)等的影響下數(shù)據(jù)的結(jié)構(gòu)也更加復(fù)雜。數(shù)據(jù)結(jié)構(gòu)的變化與數(shù)量的增長使得圖書館處理數(shù)據(jù)的難度加大,若不借助先進(jìn)的技術(shù)手段,許多數(shù)據(jù)將可能被埋沒、遺失,無法發(fā)揮出作用,這無疑不利于圖書館服務(wù)水平的提高。鑒于此,高校應(yīng)當(dāng)將大數(shù)據(jù)分析應(yīng)用于圖書館建設(shè),借助有效的數(shù)據(jù)分析技術(shù)從海量數(shù)據(jù)以及復(fù)雜的數(shù)據(jù)環(huán)境中有效挖掘、獲取、理解大數(shù)據(jù)的價(jià)值,讓各項(xiàng)價(jià)值數(shù)據(jù)得到充分利用,讓圖書館的建設(shè)能力以及服務(wù)能力得到提升。
3 大數(shù)據(jù)分析在大學(xué)圖書館中的具體應(yīng)用
3.1 利用大數(shù)據(jù)分析構(gòu)建個(gè)性化集成服務(wù)系統(tǒng)
高校在開展圖書館建設(shè)以及推送個(gè)性化服務(wù)等工作時(shí),可以將大數(shù)據(jù)分析作為基礎(chǔ)構(gòu)建一個(gè)個(gè)性化的集成服務(wù)原型系統(tǒng),利用該系統(tǒng)來為讀者制定閱讀方案或者制定讀書推送計(jì)劃,讓圖書館的各項(xiàng)工作更具針對性與有效性。在構(gòu)建該系統(tǒng)時(shí),高校圖書館利用大數(shù)據(jù)分析技術(shù)對圖書館讀者的行為數(shù)據(jù)進(jìn)行挖掘與分析,通過對海量數(shù)據(jù)的分析掌握讀者的閱讀需求、喜好以及習(xí)慣等,在此基礎(chǔ)上為讀者提供個(gè)性化的推送、檢索以及講解服務(wù)。
3.2 基于大數(shù)據(jù)分析制定個(gè)性化服務(wù)策略
在大數(shù)據(jù)時(shí)代,高校圖書館可將大數(shù)據(jù)分析技術(shù)作為基礎(chǔ)為讀者制定個(gè)性化服務(wù)策略,該個(gè)性化服務(wù)策略包含交互性、能動(dòng)性、個(gè)性化、人性化、實(shí)時(shí)性這五大特征。圖書館可通過制定與使用以上策略來提升服務(wù)水平,讓圖書館讀者的多樣化閱讀需求與學(xué)習(xí)需求得到滿足。在數(shù)據(jù)挖掘與分析技術(shù)的支持下,高校圖書館可實(shí)現(xiàn)對讀者行為數(shù)據(jù)的實(shí)時(shí)收集與動(dòng)態(tài)分析,能實(shí)現(xiàn)對用戶行為數(shù)據(jù)的深入挖掘與安全儲(chǔ)存,能夠基于數(shù)據(jù)了解不同讀者的不同特性,從而讓圖書館的各項(xiàng)服務(wù)更具個(gè)性化、人性化。
高校圖書館在制定以及使用個(gè)性化服務(wù)策略時(shí),需利用大數(shù)據(jù)分析技術(shù)完成以下步驟:首先,獲取關(guān)聯(lián)數(shù)據(jù)。高校圖書館可借助大數(shù)據(jù)分析將各種異構(gòu)化的學(xué)科知識(shí)庫聯(lián)合起來,構(gòu)建起海量的語義網(wǎng)絡(luò)庫檢索平臺(tái),使用戶能便捷、高效地完成各項(xiàng)檢索,讓用戶部分需求得到滿足。其次,進(jìn)行信息挖掘分析。結(jié)合以往經(jīng)驗(yàn)可知,當(dāng)我們對某用戶的行為數(shù)據(jù)進(jìn)行頻繁且大量的采集時(shí),這些數(shù)據(jù)就會(huì)在數(shù)據(jù)庫中產(chǎn)生過擬合的狀態(tài),從而導(dǎo)致我們無法準(zhǔn)確分析出用戶的行為特征。因此,在使用大數(shù)據(jù)分析技術(shù)對高校圖書館用戶行為數(shù)據(jù)進(jìn)行收集時(shí),應(yīng)當(dāng)利用個(gè)性化的推薦模型對海量數(shù)據(jù)進(jìn)行篩選,利用這一模型篩選出有效數(shù)據(jù),從而使數(shù)據(jù)分析結(jié)果具備實(shí)際的參考價(jià)值。最后,推出用戶興趣。要想為圖書館用戶提供更加個(gè)性化與人性化的服務(wù),高校圖書館還需借助大數(shù)據(jù)分析技術(shù)來獲得用戶情感指標(biāo)。具體可通過分析用戶個(gè)人日志來明確用戶的隱性與顯性表達(dá),最終得到用戶興趣結(jié)果,使圖書館的各項(xiàng)服務(wù)更加科學(xué)合理。
3.3 結(jié)合大數(shù)據(jù)分析編制個(gè)性化服務(wù)方案
在大數(shù)據(jù)時(shí)代,高校圖書館可充分利用大數(shù)據(jù)分析技術(shù)來為讀者編制個(gè)性化的服務(wù)方案。例如,為讀者構(gòu)建用戶行為數(shù)據(jù)庫、用戶興趣與需求挖掘中心以及個(gè)性化服務(wù)平臺(tái)等。具體分析如下:
首先,高校圖書館可基于大數(shù)據(jù)分析技術(shù)為用戶構(gòu)建用戶基本信息數(shù)據(jù)庫以及服務(wù)日志數(shù)據(jù)庫,利用這兩大數(shù)據(jù)庫對用戶日常行為數(shù)據(jù)進(jìn)行管理與利用,并在平時(shí)借助用戶行為模型完成對數(shù)據(jù)庫的更新,讓圖書館的各項(xiàng)建設(shè)與服務(wù)工作擁有更多的參考信息。其次,高校圖書館可利用大數(shù)據(jù)分析技術(shù)對個(gè)人用戶的行為數(shù)據(jù)進(jìn)行統(tǒng)計(jì),對全體用戶的日志數(shù)據(jù)進(jìn)行挖掘與分析,利用大數(shù)據(jù)分析技術(shù)將有關(guān)聯(lián)的數(shù)據(jù)進(jìn)行提取整理獲得各種聚類結(jié)果。基于各種聚類結(jié)果就能對用戶群體的某項(xiàng)顯性或隱性特征有所把握。最后,在基于大數(shù)據(jù)分析初步掌握了用戶性質(zhì)與需求后,圖書館就能為用戶制定以及提供更加個(gè)性化與人性化的服務(wù)。為了進(jìn)一步優(yōu)化讀者閱讀體驗(yàn),提高讀者對圖書館服務(wù)的滿意度,高校圖書館還可在利用大數(shù)據(jù)分析結(jié)果的基礎(chǔ)上再參考圖書館原有的專利庫、書目庫、知識(shí)庫、論文庫等,將這些數(shù)據(jù)庫與用戶行為特征進(jìn)行匹配與結(jié)合,在此基礎(chǔ)上形成更具個(gè)性化與針對性的閱讀服務(wù)方案。
4 大數(shù)據(jù)分析在大學(xué)圖書館中應(yīng)用的策略
4.1 建設(shè)良好的物理環(huán)境
要想讓大數(shù)據(jù)分析技術(shù)在高校圖書館建設(shè)以及服務(wù)工作中充分發(fā)揮作用,高校就需要建設(shè)好相應(yīng)的物理環(huán)境,如構(gòu)建起高性能計(jì)算平臺(tái)等。目前,部分高校為大數(shù)據(jù)分析技術(shù)的運(yùn)作建設(shè)了Hadoop平臺(tái),該平臺(tái)功能相對豐富,能為數(shù)據(jù)挖掘、計(jì)算等提供支持。Hadoop平臺(tái)主要由兩個(gè)功能模塊組成:一是數(shù)據(jù)挖掘模塊;二是數(shù)據(jù)存儲(chǔ)模塊。在執(zhí)行數(shù)據(jù)挖掘任務(wù)時(shí)主要是通過Spark架構(gòu)以及Map/Reduce數(shù)據(jù)對目標(biāo)數(shù)據(jù)進(jìn)行挖掘。而在對數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí)主要是通過分布式文件系統(tǒng)進(jìn)行操作。
4.2 選擇與構(gòu)建數(shù)據(jù)挖掘框架
要想提高大數(shù)據(jù)分析的質(zhì)量以及效率,高校需要根據(jù)大數(shù)據(jù)分析的特征以及需求建設(shè)數(shù)據(jù)采集與挖掘框架。隨著科學(xué)技術(shù)的發(fā)展,當(dāng)前能夠支持大數(shù)據(jù)挖掘與分析的框架也相對較多,但Map/Reduce和Spark框架可以說是最為適合高校圖書館工作的框架。該框架功能豐富,不僅包含線上的數(shù)據(jù)采集與應(yīng)用模塊,而且還能為線下建模以及數(shù)據(jù)存儲(chǔ)工作的開展提供支持。具體來說,Map/Reduce和Spark框架線上部分的數(shù)據(jù)采集采用了HDFS和HBase等功能完成用戶行為數(shù)據(jù)的存儲(chǔ)和讀寫過程,使得數(shù)據(jù)采集過程非常靈活方便。而在線下進(jìn)行建模時(shí),Hadoop平臺(tái)的數(shù)據(jù)處理機(jī)制又能為建模活動(dòng)提供很大幫助,并且在建模結(jié)束后,可基于該平臺(tái)采用回歸算法、聚類算法以及分類算法等數(shù)據(jù)挖掘方法對數(shù)據(jù)的內(nèi)在含義以及隱藏價(jià)值進(jìn)行分析,結(jié)束初步挖掘后再使用更高精度的基礎(chǔ)算法獲得價(jià)值更高的信息,從而讓圖書館各項(xiàng)工作更容易開展。
4.3 科學(xué)選擇基礎(chǔ)算法
在高校基于大數(shù)據(jù)分析為用戶提供個(gè)性化服務(wù)時(shí),必須結(jié)合實(shí)際情況合理選擇基礎(chǔ)算法,以此保證最終的服務(wù)效果。當(dāng)前,可供選擇的基礎(chǔ)算法較多,為確保基礎(chǔ)算法選擇的科學(xué)性與合理性,高校圖書館應(yīng)綜合考慮以下因素:首先,基礎(chǔ)算法必須正確、準(zhǔn)確。在選擇基礎(chǔ)算法時(shí),相關(guān)人員需對用戶行為特征與用戶內(nèi)容特征之間的比例進(jìn)行分析,如果用戶行為特征的區(qū)分度較高,那么就可借助用戶行為特征的區(qū)分度完成推薦算法的計(jì)算;而當(dāng)用戶內(nèi)容特征的區(qū)分度較高時(shí),就可借助用戶內(nèi)容特征的區(qū)分度完成推薦算法計(jì)算。其次,算法要保證高效。當(dāng)前有許多個(gè)性化的推薦系統(tǒng)采用的是離線計(jì)算模式,這種模式下的計(jì)算流程是:先完成對大量用戶行為數(shù)據(jù)與內(nèi)容數(shù)據(jù)的采集,再將所有數(shù)據(jù)進(jìn)行一次性挖掘,最后在離線狀態(tài)下計(jì)算出結(jié)果。這種計(jì)算方法雖有一定的可行性,但也存有許多不足,如計(jì)算效率低。因此,建議高校圖書館可適當(dāng)改變算法,如采用增量挖掘的建模方法來提高計(jì)算效率與質(zhì)量。
5 結(jié)語
綜上所述,大數(shù)據(jù)分析能為高校圖書館的建設(shè)及服務(wù)等工作的開展帶來很大幫助。因此,在當(dāng)前背景下應(yīng)進(jìn)一步加強(qiáng)對大數(shù)據(jù)分析的研究以及推廣應(yīng)用,讓大數(shù)據(jù)分析的作用價(jià)值得到充分發(fā)揮。
【參考文獻(xiàn)】
【1】楊偉超,鄒瑜,徐萍,等.基于大數(shù)據(jù)的圖書館資源分析系統(tǒng)研究[J].信息與電腦(理論版),2020,32(23):219-221.