張 穎 / 重慶師范大學(xué)涉外商貿(mào)學(xué)院
淺談圖書(shū)館如何簡(jiǎn)單應(yīng)用大數(shù)據(jù)特性
張 穎 / 重慶師范大學(xué)涉外商貿(mào)學(xué)院
隨著現(xiàn)代社會(huì)和科學(xué)技術(shù)的發(fā)展,以及大數(shù)據(jù)的概念出現(xiàn)以后,大數(shù)據(jù)已經(jīng)漸漸融入到我們生活中的各個(gè)領(lǐng)域,正改變著人們的生活方式。圖書(shū)館作為文獻(xiàn)信息中心,更應(yīng)該接受和適應(yīng)這種變化,并且利用大數(shù)據(jù)的特性進(jìn)行發(fā)展和改變,來(lái)突出圖書(shū)館的特點(diǎn)和職能。
圖書(shū)館;大數(shù)據(jù);特性;簡(jiǎn)單應(yīng)用
“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力,用來(lái)適應(yīng)海量的、高增長(zhǎng)率和多樣化的信息資產(chǎn)。對(duì)于大數(shù)據(jù)這個(gè)概念大家并不陌生。
大數(shù)據(jù)有四特性:
1.大量
2.高速
3.多樣性
4.低價(jià)值密度
隨著社會(huì)和科技的發(fā)展,大數(shù)據(jù)已經(jīng)融入到我們的生活中的各個(gè)領(lǐng)域。圖書(shū)館擔(dān)負(fù)著教學(xué)和科研服務(wù)的雙重任務(wù),是培養(yǎng)人才和開(kāi)展科學(xué)研究的重要基地,不僅要更好的融入當(dāng)今社會(huì)的大數(shù)據(jù)時(shí)代,更應(yīng)該更好的應(yīng)用大數(shù)據(jù)的特性為廣大讀者服務(wù)。
首先大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相比較,最明顯是特點(diǎn)就是在于大數(shù)據(jù)的信息量巨大。
現(xiàn)在的圖書(shū)館已經(jīng)不再是只用來(lái)存放紙質(zhì)載體圖書(shū)的建筑物,它還包括有電子資源以及各種不同形式、不同載體的信息和資源,圖書(shū)館的功能和內(nèi)容正在發(fā)生轉(zhuǎn)變。傳統(tǒng)紙質(zhì)圖書(shū)載體能容納的內(nèi)容相對(duì)于大數(shù)據(jù)大量的概念來(lái)說(shuō)已經(jīng)不值得一提。而隨著現(xiàn)代科技發(fā)展,出現(xiàn)的電子圖書(shū)的信息量也是不能與大數(shù)據(jù)相比的。
原來(lái)所說(shuō)的電子圖書(shū)和數(shù)字資源一般都指存儲(chǔ)于圖書(shū)館內(nèi)的本地?cái)?shù)據(jù)庫(kù)中存儲(chǔ)的資源。一般的電子圖書(shū)和數(shù)字資源具有容量遠(yuǎn)遠(yuǎn)大于傳統(tǒng)紙質(zhì)載體圖書(shū),并且具有使用和檢索都比紙質(zhì)載體圖書(shū)來(lái)的更為方便和快捷等優(yōu)勢(shì)。但在大數(shù)據(jù)環(huán)境下,使我們的這一概念發(fā)生了翻天覆地的變化。大數(shù)據(jù)的應(yīng)用方式,在理論上可使圖書(shū)館的容量無(wú)限擴(kuò)大。
大數(shù)據(jù)即將大量數(shù)據(jù)通過(guò)互聯(lián)網(wǎng)聚集到某個(gè)特定點(diǎn),也可以看成是把互聯(lián)網(wǎng)上的所有數(shù)據(jù)集中在某一個(gè)特定數(shù)據(jù)庫(kù)中,這個(gè)特定點(diǎn)或特定數(shù)據(jù)庫(kù)存在于互聯(lián)網(wǎng)中。事實(shí)上我們所說(shuō)的特定點(diǎn)或者特定數(shù)據(jù)庫(kù)只是把互聯(lián)網(wǎng)中各個(gè)不同的數(shù)據(jù)庫(kù)做成開(kāi)放性數(shù)據(jù)庫(kù),讓各個(gè)數(shù)據(jù)庫(kù)之間進(jìn)行相互通訊,而形成的一個(gè)整體數(shù)據(jù)庫(kù)。
因此,圖書(shū)館也可以鏈接并使用這一特定的整體的數(shù)據(jù)庫(kù)。通過(guò)此鏈接,不僅可以無(wú)限擴(kuò)大本館自身的館藏資源,還能使本館資源得到開(kāi)放,更加有效充分的利用館藏資源,并實(shí)現(xiàn)數(shù)據(jù)交流和資源共享。
大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)最大的區(qū)別在于大數(shù)據(jù)的高速特性,它對(duì)于數(shù)據(jù)處理的能力要求必須非常出色。
大數(shù)據(jù)在進(jìn)行數(shù)據(jù)處理的時(shí)候,既能對(duì)數(shù)據(jù)進(jìn)行流處理,也同時(shí)能具備對(duì)數(shù)據(jù)進(jìn)行批處理的能力。也就是說(shuō),大數(shù)據(jù)處理要求在連續(xù)不斷處理數(shù)據(jù)的同時(shí),能夠?qū)ν蝗缙鋪?lái)的批量數(shù)據(jù)進(jìn)行計(jì)算和處理。
大數(shù)據(jù)的高速運(yùn)行,要求數(shù)據(jù)有時(shí)效性。隨著時(shí)間推移,數(shù)據(jù)的價(jià)值會(huì)折舊,不同年齡階段的數(shù)據(jù)具有不同的價(jià)值,如期刊類(lèi),報(bào)紙類(lèi)。這就要求圖書(shū)館及時(shí)更新其館藏。好在大數(shù)據(jù)時(shí)代的資源和數(shù)據(jù)能夠互相連接,彌補(bǔ)了部分館藏和資源不能高速運(yùn)行更新的缺點(diǎn)。
從數(shù)據(jù)開(kāi)發(fā)來(lái)看,圖書(shū)館存儲(chǔ)了大量的數(shù)據(jù)和資源。當(dāng)這些數(shù)據(jù)和資源被聚集到一起時(shí),會(huì)形成數(shù)據(jù)和資源的“礦山”,那么“挖礦”的效率就要求非常高,大數(shù)據(jù)高速運(yùn)行就成了“挖礦”的優(yōu)勢(shì)。
在圖書(shū)檢索上,大數(shù)據(jù)的高速運(yùn)行查找能夠快速、精準(zhǔn)的定位每一本圖書(shū)的位置。對(duì)于不熟悉圖書(shū)分類(lèi)法的讀者來(lái)說(shuō),利用大數(shù)據(jù)進(jìn)行圖書(shū)資料的查找和檢索無(wú)疑是最方便快捷和準(zhǔn)確的。
大數(shù)據(jù)的數(shù)據(jù)來(lái)源的多樣性,這是傳統(tǒng)數(shù)據(jù)做不到的。
對(duì)于圖書(shū)館來(lái)說(shuō),產(chǎn)生數(shù)據(jù)的方式多種多樣,有日常的統(tǒng)計(jì)數(shù)據(jù)報(bào)表,有人工借還和自助借還數(shù)據(jù),有讀者檢索圖書(shū)產(chǎn)生的數(shù)據(jù),有使用網(wǎng)絡(luò)圖書(shū)館產(chǎn)生的點(diǎn)擊量、瀏覽量等多種數(shù)據(jù)來(lái)源。可以看出讀者自身也是數(shù)據(jù)的創(chuàng)造者。
在大數(shù)據(jù)環(huán)境下,圖書(shū)館通過(guò)記錄、收集并保存產(chǎn)生的一切數(shù)據(jù),待數(shù)據(jù)量達(dá)到一定規(guī)模的時(shí)候,通過(guò)對(duì)多樣數(shù)據(jù)的各種提煉和分析,了解讀者需求,更好的提供多樣化的資源和優(yōu)質(zhì)的服務(wù)。
通過(guò)分析讀者的閱讀需求等數(shù)據(jù),可幫助圖書(shū)館優(yōu)化自身的館藏結(jié)構(gòu),幫助圖書(shū)館紙質(zhì)圖書(shū)館藏的剔舊、電子資源的購(gòu)買(mǎi)和更新等工作更科學(xué)的進(jìn)行。
大數(shù)據(jù)的低價(jià)值密度是指數(shù)據(jù)的真實(shí)性。
大數(shù)據(jù)追求的是數(shù)據(jù)的高質(zhì)量,大數(shù)據(jù)的基本在于為決策提供幫助,因此大數(shù)據(jù)必須擁有絕對(duì)的真實(shí)性。
從來(lái)源上分析,傳統(tǒng)數(shù)據(jù)的來(lái)源是從宏觀上采集的。數(shù)據(jù)的采集有原則性,有規(guī)律,采集的對(duì)象有階段性有針對(duì)性,或者直接是進(jìn)行抽樣采集的。傳統(tǒng)數(shù)據(jù)的采集方式?jīng)Q定了傳統(tǒng)數(shù)據(jù)在真實(shí)性上會(huì)有所欠缺。
大數(shù)據(jù)的采集方法與傳統(tǒng)數(shù)據(jù)迥異。大數(shù)據(jù)的數(shù)據(jù)采集方式是從微觀采集,它進(jìn)行的是個(gè)體采集,每個(gè)個(gè)體都有自己?jiǎn)为?dú)的數(shù)據(jù)集合,也是產(chǎn)生數(shù)據(jù)的來(lái)源。大數(shù)據(jù)對(duì)于數(shù)據(jù)的采集是沒(méi)有標(biāo)準(zhǔn)的,它的采集方法源于對(duì)個(gè)體的行為與現(xiàn)象記錄。通過(guò)對(duì)大量真實(shí)數(shù)據(jù)進(jìn)行提煉、分析和總結(jié)出來(lái)的有用數(shù)據(jù),其真實(shí)性是毋庸置疑的。
圖書(shū)館應(yīng)用低價(jià)值密度這一特性,可以幫助圖書(shū)館對(duì)文獻(xiàn)進(jìn)行開(kāi)發(fā)。因?yàn)閳D書(shū)館所提供的文獻(xiàn)、資源、信息等必須具有權(quán)威性和真實(shí)性。以大數(shù)據(jù)為基礎(chǔ)的參考信息作為文獻(xiàn)開(kāi)發(fā)依據(jù)具備了真實(shí)性的原則。
大數(shù)據(jù)能真實(shí)的分析讀者使用圖書(shū)館的習(xí)慣和讀者的讀書(shū)習(xí)慣。通過(guò)記錄和分析讀者的閱讀傾向的數(shù)據(jù)和讀者使用館舍的數(shù)據(jù)等等,能真實(shí)分析出哪些是讀者使用的重點(diǎn)資源,哪些是讀者不常使用的次要資源。通過(guò)對(duì)讀者的閱讀傾向的數(shù)據(jù)進(jìn)行記錄和分析,可幫助圖書(shū)館加強(qiáng)對(duì)讀者重點(diǎn)使用的資源的建設(shè)。而對(duì)讀者使用館舍情況的記錄和分析,可以對(duì)圖書(shū)館館舍進(jìn)行科學(xué)的改造和布置,讓讀者使用圖書(shū)館更感舒適。
大數(shù)據(jù)真實(shí)的記錄和分析讀者閱讀和使用圖書(shū)館的各種數(shù)據(jù),可以引導(dǎo)讀者進(jìn)行閱讀。挑選讀者重點(diǎn)使用的資源設(shè)立專(zhuān)門(mén)的閱讀區(qū)域,可在設(shè)立的閱讀區(qū)內(nèi)進(jìn)行與重點(diǎn)資源的相關(guān)參考內(nèi)容的引導(dǎo)和推薦工作,方便讀者更好更有效的使用圖書(shū)館資源。
通過(guò)大數(shù)據(jù)對(duì)讀者數(shù)據(jù)的捕捉,圖書(shū)館能提供更優(yōu)質(zhì)的服務(wù)。建立數(shù)據(jù),統(tǒng)計(jì)數(shù)據(jù)和應(yīng)用數(shù)據(jù),可使圖書(shū)館更具有競(jìng)爭(zhēng)力。有大數(shù)據(jù)的真實(shí)為支撐的基礎(chǔ)上,圖書(shū)館在現(xiàn)有基礎(chǔ)上,能更好的優(yōu)化和深化服務(wù)。
大數(shù)據(jù)的四個(gè)特性,并不一定是獨(dú)立的,在很多方面,這四個(gè)特性都是融會(huì)貫通在一起的。應(yīng)用其特性并不是只會(huì)用到其中的一個(gè)特性。圖書(shū)館對(duì)大數(shù)據(jù)特性進(jìn)行合理的應(yīng)用,能更好的建設(shè)發(fā)展自身,適應(yīng)和滿足社會(huì)的需求。
[1]李恬.大數(shù)據(jù)理念與圖書(shū)館大數(shù)據(jù)[J].新世紀(jì)圖書(shū)館,2014,(6):24-27.
[2]韓翠峰.大數(shù)據(jù)帶給圖書(shū)館的影響與挑戰(zhàn)[J].圖書(shū)情報(bào),2012,(5)37-40.
[3]黃馥妃.大數(shù)據(jù)時(shí)代高校圖書(shū)館個(gè)性化服務(wù)研究[J].文化視野,2016.