吳曉陽
(南陽醫(yī)學(xué)高等專科學(xué)校,河南 南陽 473000)
大數(shù)據(jù)作為一種抽象的概念,目前隨著時(shí)代的發(fā)展,大數(shù)據(jù)技術(shù)也越來越完善,以自身具有的體量大、處理速度快、價(jià)值高等特點(diǎn)來保障各種信息的有效篩選,為某一決策提供海量的信息。那么將大數(shù)據(jù)應(yīng)用在圖書館中,通過數(shù)據(jù)采集、信息處理、等多平臺(tái)進(jìn)行信息整合和篩選,有效的提高圖書館的工作效率,同時(shí)還能增加圖書館服務(wù)種類,此外還能借助大數(shù)據(jù)進(jìn)行圖書管理制度等的創(chuàng)新,以下對(duì)此做出具體分析。
大數(shù)據(jù)的基本特征主要包括以下幾點(diǎn):1.體量大,以普通計(jì)算機(jī)為例,其硬盤的容量通常都是TB量級(jí),有些特殊的行業(yè),因?qū)?shù)據(jù)的需求較大,數(shù)據(jù)量已達(dá)到EB量級(jí)。1EB=1024PB,1PB=1024TB。2.類型復(fù)雜,大數(shù)據(jù)中包含了大量的非結(jié)構(gòu)化數(shù)據(jù),并且隨著不斷的發(fā)展,數(shù)據(jù)信息類型逐漸增多,如今已趨向完善,例如音頻、圖片圖像等等,但由于數(shù)據(jù)類型較為復(fù)雜,因此必須要確保數(shù)據(jù)處理能力。3.處理速度較高,大數(shù)據(jù)不僅擁有強(qiáng)大的數(shù)據(jù)儲(chǔ)存空間,同時(shí)還擁有非常大的信息庫,因此他們的分析處理能力也非常高效,相比其他數(shù)據(jù)來說,大數(shù)據(jù)的處理速度更加高效。4.價(jià)值高,大數(shù)據(jù)中可以有效地搜索信息,同時(shí)還可以通過篩選,針對(duì)性地選出有價(jià)值信息,這對(duì)項(xiàng)目和管理來說有著非常重要的意義。具體來說,大數(shù)據(jù)的價(jià)值不能從單個(gè)角度來看,需要全面地進(jìn)行了解,也正是因?yàn)榇髷?shù)據(jù)所具備的這些特征,才能使其得到廣泛的應(yīng)用。那么以下則對(duì)此做出具體分析。
大數(shù)據(jù)時(shí)代的到來為多數(shù)企業(yè)迎來了發(fā)展機(jī)遇,同時(shí)對(duì)圖書館來說也是一個(gè)關(guān)鍵性的改變,那么在這一背景下多數(shù)圖書館也在積極做出改變,例如擯棄傳統(tǒng)的管理理念,并加入大數(shù)據(jù)等的信息化建設(shè),以此提高圖書館的整體發(fā)展,此外還需不斷的創(chuàng)新管理制度,增加館內(nèi)的圖書資源,最大程度的滿足用戶的多樣性需求。其次還需要在滿足用戶體驗(yàn)的同時(shí),對(duì)數(shù)字資源進(jìn)行整合,并根據(jù)大數(shù)據(jù)的特點(diǎn)來完成資源整合,以下對(duì)此做出列舉。
圖書館加入大數(shù)據(jù)時(shí),首先可借助大數(shù)據(jù)進(jìn)行資源整合,將所需數(shù)據(jù)錄入到相關(guān)平臺(tái)中,但由于內(nèi)容較多且較為復(fù)雜,這就需要對(duì)數(shù)據(jù)進(jìn)行有效的篩選,保留價(jià)值信息。因此,在采集過程中應(yīng)首先對(duì)采集數(shù)據(jù)進(jìn)行預(yù)處理,借助ETL工具完成這一環(huán)節(jié)的預(yù)處理工作,以此來保證大數(shù)據(jù)中獲取信息的有效性。在進(jìn)行預(yù)處理流程時(shí)可通過相關(guān)平臺(tái)進(jìn)行數(shù)據(jù)加載,并通過有關(guān)流程進(jìn)行數(shù)據(jù)篩選。從數(shù)據(jù)源中進(jìn)行數(shù)據(jù)抽取,再進(jìn)行轉(zhuǎn)換,最后將目標(biāo)數(shù)據(jù)存與平臺(tái)中。
圖書館數(shù)字資源進(jìn)行整合時(shí),可借助相關(guān)平臺(tái)進(jìn)行存儲(chǔ),例如Hadoop平臺(tái),擁有較大的數(shù)據(jù)存儲(chǔ)空間,使其在進(jìn)行存儲(chǔ)時(shí)大大降低存儲(chǔ)成本,可以有效的幫助圖書館數(shù)字資源進(jìn)行整合,而且Hadoop平臺(tái)擁有較低的延時(shí),并發(fā)高,同時(shí)還具有非常強(qiáng)大的查詢能力。此外,圖書館在進(jìn)行數(shù)據(jù)存儲(chǔ)時(shí),通過相關(guān)操作還可以實(shí)現(xiàn)分級(jí)存儲(chǔ),形成多級(jí)數(shù)據(jù)庫,并且數(shù)據(jù)庫之間不需要進(jìn)行關(guān)聯(lián)操作,只需要對(duì)數(shù)據(jù)進(jìn)行匯總和分布計(jì)算,就可以完成向主數(shù)據(jù)倉庫的數(shù)據(jù)輸出,這樣一來可以大大降低存儲(chǔ)壓力,還能提高數(shù)據(jù)質(zhì)量。
為了實(shí)現(xiàn)大數(shù)據(jù)處理這一目標(biāo),圖書館可借助大數(shù)據(jù)特點(diǎn)完成,對(duì)其進(jìn)行相關(guān)的數(shù)據(jù)處理,在根據(jù)用戶需求的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行分析和挖掘,此外,大數(shù)據(jù)處理需要較高的時(shí)效性,那么這在一定程度內(nèi)增加了處理難度,據(jù)此,可通過MapReduce編程模型對(duì)超過1TB的數(shù)據(jù)體量進(jìn)行運(yùn)算,最大程度的實(shí)現(xiàn)資源的優(yōu)化,使數(shù)據(jù)處理速度得到顯著提升。此外,該模型中Map即分解,有效的將計(jì)算任務(wù)進(jìn)行拆分,而Reduce即合并,同時(shí)還可以對(duì)Map的輸出結(jié)果進(jìn)行有效匯總。
大數(shù)據(jù)在圖書館的應(yīng)用中主要具有兩種優(yōu)勢(shì):借助大數(shù)據(jù)特點(diǎn)開展相關(guān)的業(yè)務(wù)和服務(wù)的創(chuàng)新。通過大數(shù)據(jù)進(jìn)行服務(wù)的創(chuàng)新工作以及服務(wù)內(nèi)容的制定。此外,通過大數(shù)據(jù)對(duì)圖書館的創(chuàng)新工作,還可以進(jìn)一步的使圖書館和多種數(shù)據(jù)進(jìn)行關(guān)聯(lián)融合,最大程度的滿足用戶的多樣化需求。在圖書館圖書資源的采購中,還可以通過多種資源數(shù)據(jù)的管理進(jìn)行分析,充分了解用戶對(duì)采購資源的需求,以此來分析出所購資源是否滿足用戶的實(shí)際需求。此外,還可以借助大數(shù)據(jù)推出個(gè)性化定制服務(wù),通過數(shù)據(jù)平臺(tái)的融合,實(shí)現(xiàn)用戶的深層次挖掘和分析,依此來有效的預(yù)測(cè)出每個(gè)用戶的行為目的,并按照預(yù)測(cè)結(jié)果來為用戶提供個(gè)性化的定制服務(wù)。與此同時(shí),圖書館還可以借助大數(shù)據(jù)中的可視化操作提供可視化服務(wù),具體來說是將數(shù)據(jù)分析結(jié)果直接展示給用戶,這里的數(shù)據(jù)是指各個(gè)領(lǐng)域的研究成果、研究進(jìn)展等,同時(shí)根據(jù)用戶的個(gè)人需求,提供個(gè)性化的可視化方案。除此之外,圖書館還可以和數(shù)字資源進(jìn)行融合,為客戶提供一站式的服務(wù),例如數(shù)據(jù)開發(fā)、數(shù)據(jù)分析、數(shù)據(jù)挖掘等。
以上對(duì)大數(shù)據(jù)技術(shù)下的圖書館運(yùn)用做出了分析,通過以上分析可知,大數(shù)據(jù)時(shí)代下的圖書館應(yīng)順應(yīng)時(shí)代的潮流發(fā)展,將圖書館的管理以及功能中加入信息化和數(shù)字化建設(shè),并在此過程中,加入大數(shù)據(jù)技術(shù),使其和圖書館的運(yùn)營(yíng)進(jìn)行有效整合,這樣以來不僅可以提高圖書館的管理水平,同時(shí)還能拓展圖書館的服務(wù)業(yè)務(wù),最大程度的滿足用戶的資源需求。因此這就需要,相關(guān)行業(yè)重視此方面的整合運(yùn)用,根據(jù)圖書館的特點(diǎn)加大相關(guān)技術(shù)的研究力度,促進(jìn)圖書館的良好發(fā)展,使其更好的服務(wù)于人民。