大數(shù)據(jù)生態(tài)系統(tǒng)在圖書(shū)館中的應(yīng)用分析

2017-12-29 08:34:34劉思詩(shī)

移動(dòng)信息 2017年1期

葉函章迪劉思詩(shī) 周盼

葉函章迪劉思詩(shī) 周盼

武漢東湖學(xué)院，湖北武漢 430000

近年來(lái)，隨著信息技術(shù)的不斷發(fā)展，圖書(shū)館的數(shù)據(jù)信息管理面臨著越來(lái)越多的挑戰(zhàn)。從現(xiàn)狀來(lái)看，大數(shù)據(jù)問(wèn)題日益成為制約圖書(shū)館進(jìn)一步發(fā)揮其功能的重要問(wèn)題。基于此，對(duì)大數(shù)據(jù)給圖書(shū)館帶來(lái)的挑戰(zhàn)進(jìn)行了分析，并對(duì)大數(shù)據(jù)生態(tài)系統(tǒng)在圖書(shū)館中的應(yīng)用進(jìn)行了探討。

大數(shù)據(jù)；生態(tài)系統(tǒng)；圖書(shū)館

隨著大數(shù)據(jù)在全球知識(shí)服務(wù)體系中的作用越來(lái)越凸顯，大數(shù)據(jù)問(wèn)題成為人類社會(huì)經(jīng)濟(jì)發(fā)展的瓶頸。要進(jìn)一步推動(dòng)人類社會(huì)經(jīng)濟(jì)的發(fā)展，就需要推動(dòng)大數(shù)據(jù)的發(fā)展，解決大數(shù)據(jù)問(wèn)題。在圖書(shū)館發(fā)揮其知識(shí)服務(wù)職能的過(guò)程中，隨著圖書(shū)館數(shù)字化進(jìn)程的加快，大數(shù)據(jù)問(wèn)題給圖書(shū)館帶來(lái)的壓力越來(lái)越大。面對(duì)大數(shù)據(jù)問(wèn)題，圖書(shū)館需要建立大數(shù)據(jù)生態(tài)系統(tǒng)，借助大數(shù)據(jù)生態(tài)系統(tǒng)，實(shí)現(xiàn)對(duì)大數(shù)據(jù)的有效管理，以此促進(jìn)圖書(shū)館職能的進(jìn)一步發(fā)揮。

1 大數(shù)據(jù)給圖書(shū)館帶來(lái)的挑戰(zhàn)

1.1 數(shù)據(jù)量的增多給圖書(shū)館現(xiàn)有的計(jì)算能力帶來(lái)挑戰(zhàn)

隨著圖書(shū)館數(shù)據(jù)量的不斷增長(zhǎng)，數(shù)據(jù)類型的不斷增多，對(duì)圖書(shū)館現(xiàn)有的技術(shù)能力、儲(chǔ)存能力帶來(lái)了挑戰(zhàn)。首先，在圖書(shū)館的儲(chǔ)存能力方面，圖書(shū)館的儲(chǔ)存設(shè)備總量是固定的，并且圖書(shū)館儲(chǔ)存設(shè)備以及儲(chǔ)存容量的增加速度，遠(yuǎn)落后于數(shù)據(jù)量的增加速度，這就會(huì)使得圖書(shū)館陷入儲(chǔ)存問(wèn)題的困境。隨著數(shù)據(jù)儲(chǔ)存復(fù)雜度的不斷增加以及數(shù)據(jù)類型的不斷增加，現(xiàn)有計(jì)算機(jī)的計(jì)算能力越來(lái)越無(wú)法滿足如此多與復(fù)雜的數(shù)據(jù)計(jì)算需求。其次，隨著物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等網(wǎng)絡(luò)信息交流的便捷程度不斷增加，圖書(shū)館的數(shù)據(jù)交換、讀取變得越來(lái)越頻繁，而數(shù)據(jù)的交換需要占用圖書(shū)館一定的儲(chǔ)存空間，并且大量的數(shù)據(jù)交換還需要有強(qiáng)大的計(jì)算能力作為支撐，這進(jìn)一步提高了對(duì)圖書(shū)館計(jì)算能力的要求[1]。此外，隨著數(shù)據(jù)量的不斷提升，數(shù)據(jù)的可信度越來(lái)越難以判別，這就對(duì)圖書(shū)館的數(shù)據(jù)分析技術(shù)以及數(shù)據(jù)檢索技術(shù)提出了更高的要求。并且，隨著高校圖書(shū)館職工作用的弱化，圖書(shū)館對(duì)計(jì)算機(jī)系統(tǒng)的依賴程度進(jìn)一步加深，這使得圖書(shū)館計(jì)算能力面臨的壓力越來(lái)越大。

1.2 給圖書(shū)館基礎(chǔ)設(shè)施帶來(lái)挑戰(zhàn)

數(shù)據(jù)量的飛速增長(zhǎng)，給圖書(shū)館的基礎(chǔ)設(shè)施帶來(lái)巨大的挑戰(zhàn)。在許多圖書(shū)館基礎(chǔ)設(shè)施的建設(shè)中，對(duì)軟硬件資源的建設(shè)從高端服務(wù)設(shè)施轉(zhuǎn)向了集群化服務(wù)，并且隨著數(shù)據(jù)儲(chǔ)存結(jié)構(gòu)的轉(zhuǎn)變，要求圖書(shū)館的硬件儲(chǔ)存設(shè)備以及軟件系統(tǒng)也需要有相應(yīng)的轉(zhuǎn)變，這就給圖書(shū)館現(xiàn)有的硬件儲(chǔ)存設(shè)備與軟件系統(tǒng)帶來(lái)較大的壓力。圖書(shū)館需要根據(jù)實(shí)際的數(shù)據(jù)儲(chǔ)存需要，建設(shè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施與數(shù)據(jù)儲(chǔ)存設(shè)施，通過(guò)分布式基礎(chǔ)設(shè)施的建設(shè)，建立更加高效與靈活的組網(wǎng)方式與信息儲(chǔ)存方式。大數(shù)據(jù)問(wèn)題給圖書(shū)館帶來(lái)的挑戰(zhàn)還包括人員方面的挑戰(zhàn)，大數(shù)據(jù)引起的數(shù)據(jù)儲(chǔ)存方式的變革，以及數(shù)據(jù)處理系統(tǒng)上的變革，要求圖書(shū)館管理員具備信息系統(tǒng)以及數(shù)據(jù)管理方面的專業(yè)知識(shí)，并且還要求圖書(shū)管理員具有更廣的知識(shí)面，以及更高的專業(yè)技能水平[2]。

2 大數(shù)據(jù)生態(tài)系統(tǒng)在圖書(shū)館中的應(yīng)用

2.1 大數(shù)據(jù)生態(tài)系統(tǒng)的應(yīng)用特點(diǎn)

圖書(shū)館的大數(shù)據(jù)生態(tài)系統(tǒng)具有高度的靈活性與可拓展性，可以儲(chǔ)存、讀取PB級(jí)的數(shù)據(jù)，可以更快速地進(jìn)行數(shù)據(jù)的儲(chǔ)存與讀取。在大數(shù)據(jù)生態(tài)系統(tǒng)中，采用的是云計(jì)算技術(shù)，可以快速地將大數(shù)據(jù)轉(zhuǎn)換為單一的數(shù)據(jù)，并將這一術(shù)數(shù)據(jù)作為大數(shù)據(jù)生態(tài)系統(tǒng)檢索的節(jié)點(diǎn)，同時(shí)依據(jù)這一數(shù)據(jù)節(jié)點(diǎn)，可以進(jìn)行數(shù)據(jù)的檢索與分析。利用大數(shù)據(jù)生態(tài)系統(tǒng)，可以解決傳統(tǒng)系統(tǒng)無(wú)法處理結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的問(wèn)題，實(shí)現(xiàn)圖書(shū)館儲(chǔ)存結(jié)構(gòu)的轉(zhuǎn)變以及讀取方式的轉(zhuǎn)變，從而增加圖書(shū)館數(shù)據(jù)儲(chǔ)存類型以及處理類型，拓展圖書(shū)館的數(shù)據(jù)處理與數(shù)據(jù)服務(wù)能力[3]。應(yīng)用在圖書(shū)館中的大數(shù)據(jù)生態(tài)系統(tǒng)，使得結(jié)構(gòu)數(shù)據(jù)與非結(jié)構(gòu)數(shù)據(jù)相結(jié)合，實(shí)現(xiàn)了新舊系統(tǒng)以及新舊數(shù)據(jù)的兼容，實(shí)現(xiàn)了結(jié)構(gòu)數(shù)據(jù)向非結(jié)構(gòu)數(shù)據(jù)的轉(zhuǎn)變。并且，大數(shù)據(jù)生態(tài)系統(tǒng)借助云計(jì)算，可以實(shí)現(xiàn)可視化數(shù)據(jù)查詢。在數(shù)據(jù)查詢中，不需要使用到本地終端，節(jié)省了圖書(shū)館的數(shù)據(jù)儲(chǔ)存空間。

2.2 大數(shù)據(jù)生態(tài)系統(tǒng)軟硬件結(jié)合的解決方案

2.2.1獲取階段

在圖書(shū)館應(yīng)用的大數(shù)據(jù)生態(tài)系統(tǒng)中，實(shí)現(xiàn)了圖書(shū)館軟硬件資源的結(jié)合，使得圖書(shū)館資源得到了更加高效的利用。在大數(shù)據(jù)生態(tài)系統(tǒng)獲取數(shù)據(jù)的階段，當(dāng)前常用的數(shù)據(jù)檢索方法為：從信息資源角度獲取數(shù)據(jù)。這一數(shù)據(jù)檢索方式與當(dāng)前大數(shù)據(jù)的檢索情況不符，在大數(shù)據(jù)生態(tài)系統(tǒng)中，是以用戶的需求進(jìn)行數(shù)據(jù)獲取操作，在數(shù)據(jù)獲取中，利用云計(jì)算進(jìn)行數(shù)據(jù)的檢索以及構(gòu)建操作[4]。大數(shù)據(jù)生態(tài)系統(tǒng)可以判斷用戶的數(shù)據(jù)需求，根據(jù)用戶的數(shù)據(jù)需求，自動(dòng)對(duì)數(shù)據(jù)進(jìn)行檢索。同時(shí)，在用戶檢索的過(guò)程中，大數(shù)據(jù)生態(tài)系統(tǒng)會(huì)自動(dòng)記錄用戶的信息獲取途徑以及用戶的信息獲取偏好，同時(shí)自助式的展開(kāi)數(shù)據(jù)的收集以及顯示操作，在數(shù)據(jù)獲取中，也會(huì)考慮到結(jié)構(gòu)數(shù)據(jù)與非結(jié)構(gòu)數(shù)據(jù)的檢索，并計(jì)算用戶獲取數(shù)據(jù)突發(fā)性與易變性的可能。

2.2.2儲(chǔ)存與組織階段

大數(shù)據(jù)生態(tài)系統(tǒng)采用了低成本集群儲(chǔ)存方式，儲(chǔ)存性能高，讀取速度快，并且可拓展，成本低，實(shí)現(xiàn)了關(guān)系型數(shù)據(jù)庫(kù)與云儲(chǔ)存方式的有機(jī)結(jié)合。在大數(shù)據(jù)生態(tài)系統(tǒng)采用的是MapReduce并行計(jì)算模型，實(shí)現(xiàn)對(duì)了非結(jié)構(gòu)新數(shù)據(jù)的處理，其最早適用于網(wǎng)絡(luò)數(shù)據(jù)處理。但是在大數(shù)據(jù)的處理過(guò)程中，MapReduce并行計(jì)算模型不需要對(duì)數(shù)據(jù)進(jìn)行抓取處理，在數(shù)據(jù)處理過(guò)程中，對(duì)非結(jié)構(gòu)性數(shù)據(jù)進(jìn)行移動(dòng)計(jì)算。大數(shù)據(jù)生態(tài)系統(tǒng)借助強(qiáng)大的數(shù)據(jù)處理能力，實(shí)現(xiàn)數(shù)據(jù)的橫向處理，數(shù)據(jù)處理效率相比于豎向處理有了極大的提高。

3 結(jié)語(yǔ)

隨著大數(shù)據(jù)時(shí)代的到來(lái)，圖書(shū)館現(xiàn)有軟硬件設(shè)施面臨著巨大的壓力，數(shù)據(jù)量的增多也給圖書(shū)館現(xiàn)有的計(jì)算能力帶來(lái)挑戰(zhàn)。而通過(guò)大數(shù)據(jù)生態(tài)系統(tǒng)在圖書(shū)館中的應(yīng)用，可以在很大程度上提升圖書(shū)館的數(shù)據(jù)服務(wù)效率，并且對(duì)傳統(tǒng)的知識(shí)服務(wù)模式也是一種創(chuàng)新。信息技術(shù)帶給我們的機(jī)會(huì)是轉(zhuǎn)瞬即逝的，我們需要站在更高的高度上，進(jìn)行大數(shù)據(jù)系統(tǒng)的研發(fā)，從而推動(dòng)人類社會(huì)經(jīng)濟(jì)的發(fā)展。

[1]劉健，張海濤，張連峰.圖書(shū)館知識(shí)生態(tài)系統(tǒng)的虛擬化封裝模型構(gòu)建及技術(shù)方法研究[J].情報(bào)科學(xué)，2015（2）：121-125.

[2]劉小鋒.大數(shù)據(jù)環(huán)境下圖書(shū)館跨邊界知識(shí)自組織促進(jìn)知識(shí)轉(zhuǎn)移方法[J].圖書(shū)館學(xué)研究，2014（13）：45-52.

[3]李艷，呂鵬，李瓏.基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書(shū)館個(gè)性化服務(wù)研究[J/OL].圖書(shū)情報(bào)知識(shí)，2016（2）：60-68.

[4]鐘靜.讀者購(gòu)借在館藏建設(shè)中的策略探討與制定——以“重慶圖書(shū)館大數(shù)據(jù)分析試驗(yàn)系統(tǒng)”子項(xiàng)目為例[J/OL].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊，2016（8）：18-21.

Big data analysis of application of ecological system in the

Library

College of Wuhan East Lake，Hubei Wuhan 430000

In recent years，with the continuous development of information technology，the library data information management is facing more and more challenges.From the point of view of the current situation， the problem of big data has become an important problem that restricts the further development of the library.This paper will analyze the challenges brought by the big data to the library，and discuss the application of the big data ecosystem in the library.

big data；ecosystem；library

G250.7

1009-6434（2017）01-0107-02