張怡華

摘要 互聯(lián)網(wǎng)科技在人們身邊無處不在,大數(shù)據(jù)已經(jīng)潛移默化的來到人們身邊。圖書館作為現(xiàn)代社會(huì)的有價(jià)值的信息系統(tǒng),通過大量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)可以幫助我們尋找隱藏在數(shù)據(jù)背后的世界。本文分析基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書館個(gè)性化服務(wù)研究,希望能為以后研究提供參考。
【關(guān)鍵詞】大數(shù)據(jù) 挖掘 決策 個(gè)性化服務(wù)
1 大數(shù)據(jù)時(shí)代圖書館面臨的挑戰(zhàn)和個(gè)性化需求
1.1 大數(shù)據(jù)時(shí)代服務(wù)平臺(tái)的系統(tǒng)結(jié)構(gòu)更加復(fù)雜和開放
1.1.1 服務(wù)架構(gòu)和應(yīng)用程序復(fù)雜度快速增長
目前的軟件體系結(jié)構(gòu)越來越難以應(yīng)對(duì)和處理日益增長的軟件復(fù)雜性,如何實(shí)現(xiàn)圖書館基礎(chǔ)設(shè)施硬件個(gè)性化需求是我們孜孜不倦的追求。隨著微服務(wù)架構(gòu)的興起,大規(guī)模整體式應(yīng)用程序向著分布式微服務(wù)架構(gòu)遷移,加大了系統(tǒng)結(jié)構(gòu)的復(fù)雜性。
1.1.2 網(wǎng)絡(luò)和大數(shù)據(jù)資源的開放性
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,可以利用網(wǎng)絡(luò)進(jìn)行傳播,實(shí)現(xiàn)資源的最大共享。但是有利必有其弊,大數(shù)據(jù)的開放性涉及數(shù)據(jù)安全和隱私保護(hù)。相比于傳統(tǒng)的數(shù)據(jù)資源形式,云計(jì)算、大數(shù)據(jù)、傳感技術(shù)具有開放性、復(fù)雜性、多樣性和海量性等特征。
1.1.3 以非結(jié)構(gòu)化數(shù)據(jù)為主體
非結(jié)構(gòu)化數(shù)據(jù)處理是大數(shù)據(jù)分析技術(shù)的難點(diǎn)和重點(diǎn)也逐漸得到客戶對(duì)其價(jià)值的認(rèn)可。過去那種有限內(nèi)容和結(jié)構(gòu)單一的數(shù)據(jù)庫已經(jīng)無法滿足客戶多樣化需求,尤其是在圖書館個(gè)性化服務(wù)更是以非結(jié)構(gòu)化數(shù)據(jù)為主體。
1.1.4 改變了傳統(tǒng)信息安全交付模式
大數(shù)據(jù)時(shí)代的到來,給圖書館的服務(wù)帶來了更大的挑戰(zhàn)和機(jī)遇,一方面是大數(shù)據(jù)帶來的個(gè)性化服務(wù),另一方面是大數(shù)據(jù)改變了圖書館在傳統(tǒng)IT情況下的信息安全交付模式。
1.2 圖書館大數(shù)據(jù)QOS(服務(wù)質(zhì)量)保障與用戶隱私保護(hù)沖突激
1.2.1 讀者個(gè)性化服務(wù)中數(shù)據(jù)被過度分析
如果對(duì)用戶數(shù)據(jù)存在過度的分析和使用,不僅僅不能幫助圖書館實(shí)現(xiàn)個(gè)性化服務(wù),反而會(huì)導(dǎo)致分析的結(jié)果失真。更有甚者,引起用戶隱私的泄露,帶來被控訴的官司。
1.2.2 黑客會(huì)最大限度地收集圖書館和讀者的個(gè)人信息
大數(shù)據(jù)環(huán)境下經(jīng)常出現(xiàn)圖書館用戶隱私泄露,如何有效保護(hù)讀者隱私權(quán),己成為加強(qiáng)圖書館與讀者之間信任感的重要武器。大數(shù)據(jù)時(shí)代,信息獲取渠道增多,給圖書館用戶的隱私保護(hù)帶來極大的風(fēng)險(xiǎn),進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)挖掘應(yīng)該在不暴露用戶個(gè)人隱私的前提下。
1.3 大數(shù)據(jù)挖掘與決策分析的圖書館個(gè)性化需求
1.3.1 輔助事前預(yù)測(cè)
我們應(yīng)該利用此項(xiàng)技術(shù)來對(duì)自身的數(shù)據(jù)進(jìn)行整理、組織、分析,為圖書館服務(wù)的模式、對(duì)未來發(fā)展趨勢(shì)提供分析與預(yù)測(cè)。尋找用戶的訴求,進(jìn)而改進(jìn)服務(wù)規(guī)模,提高服務(wù)質(zhì)量,達(dá)到圖書館對(duì)大眾的資源和服務(wù)的雙向滿足。
1.3.2 輔助事中感知
大數(shù)據(jù)的容量如此龐大,在海量數(shù)據(jù)中對(duì)有價(jià)值的數(shù)據(jù)進(jìn)行甄別與篩選,再對(duì)其進(jìn)行科學(xué)系統(tǒng)的挖掘,絕非易事,因此要提早作好各方面的準(zhǔn)備。比如天津圖書館每個(gè)周六都有講座活動(dòng),所以那一天來圖書館的讀者比較多。中文報(bào)紙閱覽室正對(duì)著報(bào)告廳,每一場(chǎng)報(bào)告結(jié)束,許多讀者還會(huì)直接走進(jìn)閱覽室。有的老讀者會(huì)直接向你反映這場(chǎng)報(bào)告會(huì)都講了什么、感受如何,打動(dòng)人心的地方在哪兒。這些讀者的反饋是圖書館講座服務(wù)的一面鏡子,這是圖書館人在工作中所作的小數(shù)據(jù)集合。
1.3.3 輔助事后反饋
在大數(shù)據(jù)中“沙里淘金”,需要事后實(shí)時(shí)反饋,事后做好相關(guān)文字記錄,跟蹤設(shè)備的記錄。大數(shù)據(jù)還能為圖書館構(gòu)建全新的知識(shí)服務(wù)引擎提供必要的技術(shù)支撐。并且在技術(shù)應(yīng)用于管理過程中還可以不斷反饋信息
2 高校圖書館大數(shù)據(jù)挖掘及決策分析體系的架構(gòu)和流程
2.1 高校圖書館的大數(shù)據(jù)挖掘及決策分析流程
2.1.1 多維度提取數(shù)據(jù)來源
從從各類業(yè)務(wù)和大數(shù)據(jù)存儲(chǔ)交換平臺(tái)內(nèi)提取數(shù)據(jù),或者從外部互聯(lián)網(wǎng)(直接裝載入爬蟲引擎)提取數(shù)據(jù)。
2.1.2 評(píng)估數(shù)據(jù)規(guī)模和樣例分析
高校圖書管理系統(tǒng),用綜合效益評(píng)價(jià)體系和評(píng)價(jià)方法,根據(jù)規(guī)模大小選擇合適的分布式并行計(jì)算應(yīng)用架構(gòu),也進(jìn)行樣例分析。
2.1.3 根據(jù)實(shí)際需求確定建模方式
讀者用戶監(jiān)控和分析、分類、預(yù)測(cè)及輔助決策需要用數(shù)學(xué)建模方法,我們需要一種全新的面向Agent的需求建模方式。
2.1.4 根據(jù)需求確定輸出方式和優(yōu)化
確定了各評(píng)價(jià)指標(biāo)的權(quán)重,運(yùn)用TOPSIS方法對(duì)直接輸出分析報(bào)告,確定一套科學(xué)的質(zhì)量評(píng)價(jià)指標(biāo)。
2.2 高校圖書館的大數(shù)據(jù)挖掘及決策分析的架構(gòu)
圖書館的大數(shù)據(jù)服務(wù)體系,其服務(wù)與運(yùn)行模式的核心是客戶,將圖書的搜尋、查找、借閱、管理等流程加以優(yōu)化,并有機(jī)的結(jié)合起來,利用云技術(shù)進(jìn)行分析、預(yù)測(cè)和智能的輔助服務(wù),建立具有特色的科學(xué)性很強(qiáng)的實(shí)用圖書管理模塊。大數(shù)據(jù)計(jì)算服務(wù)后,在大數(shù)據(jù)計(jì)算服務(wù)內(nèi)進(jìn)行一些數(shù)據(jù)計(jì)算和算法模型的訓(xùn)練。然后再將計(jì)算的結(jié)果導(dǎo)入ADS和云數(shù)據(jù)庫中,其中導(dǎo)入的ADS支持BI系統(tǒng),并且ADS能夠多值列查詢和毫秒級(jí)的實(shí)時(shí)響應(yīng),有利于生成BI報(bào)表;另一部分?jǐn)?shù)據(jù)存入云數(shù)據(jù)庫中,不僅降低了存儲(chǔ)成本,同時(shí)也提高了數(shù)據(jù)的安全性。
3 大數(shù)據(jù)挖掘及決策分析體系在高校圖書館個(gè)性化服務(wù)中的應(yīng)用
3.1 基于用戶行為模型的個(gè)性化服務(wù)方案
3.1.1 用戶行為本體數(shù)據(jù)庫構(gòu)建過程
如何構(gòu)建合適的用戶行為模型并基于海量的行為日志數(shù)據(jù)提供個(gè)性化服務(wù),其本質(zhì)是從異質(zhì)的市場(chǎng)中尋找用戶行為習(xí)慣及特點(diǎn)等諸多。構(gòu)建大數(shù)據(jù)的存儲(chǔ)、搜索、共享、分析和可視化等管理行為,科學(xué)構(gòu)建CRM大數(shù)據(jù)庫和管理信息系統(tǒng)。
3.1.2 用戶顯性興趣和隱性興趣本體提取過程
通過分析用戶的瀏覽方式和內(nèi)容,實(shí)時(shí)獲取用戶興趣信息,設(shè)計(jì)一種利用用戶日志庫提取用戶顯性興趣和隱性需求本體的個(gè)性化服務(wù)方案。高校圖書館大數(shù)據(jù)應(yīng)用模式框架抓取工具,提出數(shù)字圖書館個(gè)性化用戶興趣領(lǐng)域本體的動(dòng)態(tài)過程。
參考文獻(xiàn)
[1]孫琳,大數(shù)據(jù)時(shí)代圖書館服務(wù)體系創(chuàng)新研究[J].理論觀察,2013 (04).
[2]胡蓮香.走向大數(shù)據(jù)知識(shí)服務(wù):大數(shù)據(jù)時(shí)代圖書館服務(wù)模式創(chuàng)新[J],農(nóng)業(yè)圖書情報(bào)學(xué)刊,2014 (02).