李文娟
摘 要:2013年被媒體稱為“大數(shù)據(jù)元年”,它標(biāo)志著世界正在開啟一次重大的時(shí)代轉(zhuǎn)型。大數(shù)據(jù)時(shí)代的到來是信息現(xiàn)代化科學(xué)技術(shù)發(fā)展的必然結(jié)果,也是圖書館建設(shè)的發(fā)展趨勢(shì),大數(shù)據(jù)時(shí)代的到來更加提醒了我們要重視“數(shù)據(jù)”這個(gè)一直以來存在于我們身邊卻不受重視的因素?,F(xiàn)階段,現(xiàn)代化圖書館的建設(shè)也離不開大數(shù)據(jù)的輔助,信息技術(shù)快速發(fā)展的時(shí)代背景下,圖書館數(shù)據(jù)建設(shè)也漸漸被提上了日程。分析現(xiàn)階段大數(shù)據(jù)與圖書情報(bào)之間的關(guān)系,掌握大數(shù)據(jù)在圖書館建設(shè)中的發(fā)展趨勢(shì),對(duì)現(xiàn)代化圖書館的建設(shè)工作有著不可小覷的重要作用。
關(guān)鍵詞:大數(shù)據(jù);圖書館;信息化建設(shè)
我們正處在一個(gè)不斷產(chǎn)生“時(shí)代”的時(shí)代。2013年被媒體稱為“大數(shù)據(jù)元年”,它標(biāo)志著我們的生活和思維方式因大數(shù)據(jù)再次發(fā)生潛移默化的改變,世界正在開啟一次重大的時(shí)代轉(zhuǎn)型:一個(gè)大規(guī)模生產(chǎn)、分享及應(yīng)用數(shù)據(jù)的新時(shí)代。圖書館也總是隨著特定的社會(huì)環(huán)境、價(jià)值觀念、文化形態(tài)等多種因素的變化而變化。
一、大數(shù)據(jù)的概念
目前,學(xué)界對(duì)于大數(shù)據(jù)的概念尚未形成統(tǒng)一的說法。在國外學(xué)者舍恩伯格和庫克耶編寫的《大數(shù)據(jù)時(shí)代》一書內(nèi)認(rèn)為大數(shù)據(jù)不是使用隨機(jī)分析法,即抽樣調(diào)查,而是采用所有數(shù)據(jù)的方法。專業(yè)從事信息技術(shù)研究的 Gartner 公司將大數(shù)據(jù)定義為海量的信息資產(chǎn),這種信息要用新的處理模式才可有更強(qiáng)洞察力、決策力以及流程優(yōu)化能力的高增長率、多樣化的信息資產(chǎn)。筆者看來,大數(shù)據(jù)不只限于海量數(shù)據(jù)的涵義,其在內(nèi)容上應(yīng)超出海量數(shù)據(jù)。大數(shù)據(jù)除了巨量的數(shù)據(jù)以外,還包含了數(shù)據(jù)的時(shí)間以及速度,也就是數(shù)據(jù)流、結(jié)構(gòu)及非結(jié)構(gòu)化數(shù)據(jù)的處理效率。大數(shù)據(jù)一般用以形容巨量的結(jié)構(gòu)與非結(jié)構(gòu)化的數(shù)據(jù),比如聲音、圖像等,它的特點(diǎn)與數(shù)、結(jié)構(gòu)有關(guān),常常被稱作4V,即數(shù)據(jù)量巨大、處理速度很快、類型很多、價(jià)值潛力很大。大數(shù)據(jù)的研究包括大數(shù)據(jù)工程、大數(shù)據(jù)技術(shù)、大數(shù)據(jù)科學(xué)以及大數(shù)據(jù)應(yīng)用等幾個(gè)方面,而當(dāng)下涉及較多的是大數(shù)據(jù)的技術(shù)及應(yīng)用。在龐大的數(shù)據(jù)中,若可以快速又準(zhǔn)確地找到對(duì)人們有用的信息,如同開啟了智慧的大門。從這個(gè)角度上看,大數(shù)據(jù)(也可稱巨量資料)可以定義為所涉及的資料數(shù)量多到不能通過當(dāng)前的主流軟件在合理的時(shí)間內(nèi)選取、管理、處理并整理成可有助于企業(yè)經(jīng)營決策的資訊。
二、大數(shù)據(jù)環(huán)境下圖書館建設(shè)面臨的問題
在當(dāng)今以增長率高、多樣化和海量的信息資產(chǎn)為特點(diǎn)的大數(shù)據(jù)時(shí)代,傳統(tǒng)圖書館主要面臨來自以下幾個(gè)方面的挑戰(zhàn)。
(1)管理要更加科學(xué)
我國的圖書館管理長期以來一直和先進(jìn)國家的圖書館有較為明顯的差距,館藏的圖書資源不能夠得到最充分合理的利用,圖書館的自動(dòng)化水平不高,人性化的管理不夠完善,而且缺乏專業(yè)性。當(dāng)前大數(shù)據(jù)的迅猛發(fā)展必定會(huì)影響圖書館的管理,館藏信息資源的格式正在由書籍逐步向數(shù)碼資料的形式轉(zhuǎn)化,鑒于這種情況,探討分析傳統(tǒng)圖書館的發(fā)展趨勢(shì)以及管理理念就顯得非常有必要。
(2)資源要更加特色化
清華大學(xué)大數(shù)據(jù)中心的林輝教授曾經(jīng)說過,如今大數(shù)據(jù)時(shí)代如期而至,必將帶來文化的一場(chǎng)變革。隨著社會(huì)的發(fā)展進(jìn)步,對(duì)圖書館資源的需求逐步增加,傳統(tǒng)的圖書館怎樣在這樣的時(shí)代背景下克服已有難點(diǎn),用現(xiàn)有不多的經(jīng)費(fèi)設(shè)置特色館藏,以最大限度發(fā)揮圖書館的資源效益和價(jià)值,是傳統(tǒng)圖書館在大數(shù)據(jù)背景下必須面對(duì)的一個(gè)重大挑戰(zhàn)。有針對(duì)性的特色資源建設(shè)是提升圖書館效益與作用的必要手段,若是館藏的文獻(xiàn)隨處可見,不管在哪都能檢索到,那這樣的圖書館必定會(huì)失去吸引力。
三、圖書館如何利用大數(shù)據(jù)推動(dòng)圖書館建設(shè)
(1)成立新的數(shù)據(jù)管理部門
面對(duì)海量的數(shù)據(jù),數(shù)據(jù)種類不斷地增加.圖書館讀者上網(wǎng)產(chǎn)生的大量半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),其數(shù)據(jù)的類型、結(jié)構(gòu)、格式、形態(tài)、信息等都變得多種多樣,這樣數(shù)據(jù)就變得非得的復(fù)雜,圖書館要想對(duì)這些數(shù)據(jù)進(jìn)行利用,形成新的知識(shí)服務(wù)模式。就必須對(duì)其進(jìn)行重新存儲(chǔ)、采集、挖掘、分析、管理。因?yàn)闊o規(guī)則的數(shù)據(jù)只是一種信息來源,并不是可利用的知識(shí)或者是可檢索的信息。圖書館作為信息的中介機(jī)構(gòu).具有對(duì)數(shù)據(jù)進(jìn)行組織、加工整理,最終提供給讀者使用的職能。但圖書館現(xiàn)有的數(shù)據(jù)處理設(shè)備、技術(shù)人員都很難滿足大數(shù)據(jù)這個(gè)海量數(shù)據(jù)集的需要,大數(shù)據(jù)的組織、存儲(chǔ)、分析、應(yīng)用等都對(duì)圖書館提出新的問題和挑戰(zhàn)。因此,圖書館必須成立新的數(shù)據(jù)管理部門.購買具有進(jìn)行復(fù)雜數(shù)據(jù)處理能力的網(wǎng)絡(luò)硬件設(shè)施,擁有進(jìn)行大數(shù)據(jù)分析的技術(shù)熟練的工作人員負(fù)責(zé)數(shù)據(jù)管理,應(yīng)用智能化技術(shù)自動(dòng)地對(duì)復(fù)雜、高級(jí)的數(shù)據(jù)進(jìn)行收集、整理工作,建立良性的運(yùn)營機(jī)制,建立統(tǒng)一的數(shù)據(jù)獲取、管理、分析的機(jī)制,將大數(shù)據(jù)從數(shù)據(jù)提煉到知識(shí)資源,從而實(shí)現(xiàn)從數(shù)據(jù)管理到知識(shí)管理的升華。
(2)通過大數(shù)據(jù)分析可以為采訪工作提供依據(jù)
圖書館目前的數(shù)據(jù)庫記錄中一般都是只有查詢、統(tǒng)計(jì)等一些低端的功能,不能發(fā)現(xiàn)數(shù)據(jù)中的有價(jià)值信息,不能進(jìn)一步的對(duì)數(shù)據(jù)進(jìn)行深入的分析。圖書館可以依據(jù)讀者大量的借閱記錄,利用電腦檢索需求的信息記錄,深入分析圖書的利用率及用戶的訪問信息,探索其數(shù)據(jù)特征,發(fā)現(xiàn)不同讀者之間不同的借閱習(xí)慣,他們所感興趣的圖書及其對(duì)各類信息的需要程度.通過對(duì)大數(shù)據(jù)的分析.并以此作為采訪部門的訂書依據(jù),就能有針對(duì)性地依據(jù)讀者的興趣去采購書籍和電子資源,讓購買的資源極大限度地滿足讀者的需求。尤其對(duì)于一些經(jīng)費(fèi)緊張的高校館和中小型圖書館來說,既能保證圖書館文獻(xiàn)資源的合理性和科學(xué)性。又能滿足不同層次、不同學(xué)歷研究人員的需求,更能極大地提高圖書館文獻(xiàn)的利用率。解決了一直困擾圖書館界的一大問題。
在大數(shù)據(jù)時(shí)代下,我國圖書館在不斷改革創(chuàng)新,向著計(jì)算機(jī)與網(wǎng)絡(luò)結(jié)合的數(shù)字化方向發(fā)展,現(xiàn)在這個(gè)階段主要問題集中在如何加強(qiáng)圖書館建設(shè)方面。做好圖書館現(xiàn)代化建設(shè),實(shí)現(xiàn)數(shù)字化,不僅能夠滿足大眾的需求,同時(shí)也能夠使圖書館被最大限度地合理利用。大數(shù)據(jù)的應(yīng)用是一項(xiàng)難度很高的技術(shù),需要多個(gè)學(xué)科共同參與,圖書館作為知識(shí)服務(wù)中心,如何利用好圖書館資源,在技術(shù)方面不斷地完善,利用好大數(shù)據(jù)分析提升圖書館的競(jìng)爭(zhēng)力,將是圖書館界值得思考的一個(gè)大問題。
參考文獻(xiàn)
[1]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2012,(5).
[2]姜山,王剛.大數(shù)據(jù)對(duì)圖書館的啟示[J].圖書館工作與研究,2013,(4).
[3]楊海燕.大數(shù)據(jù)時(shí)代的圖書館服務(wù)淺析[J].圖書與情報(bào),2014,(4).