馮園園
(鐵嶺師范高等專科學校圖書館,遼寧鐵嶺112000)
大數據思維下圖書館數字資源建設與利用研究
馮園園
(鐵嶺師范高等專科學校圖書館,遼寧鐵嶺112000)
對大數據和大數據思維進行了闡述,分析了大數據時代圖書館數字館藏資源建設面臨的挑戰,指出圖書館存在同質化建設、缺乏完善的資金投入結構、缺乏特色數字資源服務等問題。研究了大數據思維下圖書館數字資源的建設方法,以及基于大數據思維的圖書館數字資源的合理利用。
大數據思維圖書館館藏資源建設利用
物聯網、移動通訊技術的快速發展,為網絡用戶獲取發布數據信息提供了便利,而無處不在的智能化終端的應用,也在每時每刻產生大量數據。根據全球互聯網數據中心的監測,非結構化網絡數據正以每年不低于55%的速度增加,標志著我們已經進入大數據時代。數據是圖書館開展各項服務的基礎,在提供信息和資源服務的過程中,圖書館也在不斷產生各類數據。大數據時代顛覆了人們的思維和學習方式,改變了以往以小數據為核心解決問題的典型模式,變為通過對海量數據對應關系的深入分析,迅速提取有價值信息的思維模式。大數據思維的應用,以感性技術和多源異構數據的挖掘分析,激發人們對生活、學習方式的重新認識,也提升了數字化資源利用的準確性和便捷性。目前圖書館已有的資源多為歷史文獻、科研資料等,屬于結構化、靜態的信息,缺少對網絡資源、用戶行為信息以及非正式數字出版物的搜集與收錄,導致圖書館在數字館藏資源建設方面的缺失。面對大數據時代的嚴峻挑戰,圖書館應利用大數據思維,對館藏資源建設工作進行重新定位,突破思維慣性構建數字資源建設方案,提升數字資源建設效率,進一步完善館藏數據信息。
1.1大數據時代
大數據是在信息技術發展過程中,為解決信息環境下難以管理的異構數據問題,而提出的一種數據處理技術。大數據具有規模龐大、增長變化快、容量大等特征,屬于經過處理具有較高決策力和優化能力的信息資產。大數據技術的核心在于,通過對海量常規軟件無法管理數據的專業性分析,可以提升處理后數據的價值。2011年美國麥肯錫公司首次應用“大數據”一詞,指代超出傳統意義度量的,包括非結構性、結構性和半結構性的數據[1]。美國政府于2012年頒布《大數據研究和發展倡議》,計劃在生物醫學、生態環境等領域投入至少兩億美元,為大數據研究提供保障。從某種程度上來看,大數據屬于前沿技術,能夠從各種類型的數據中獲得有用信息,并且具有極大的應用價值。大數據是互聯網高速發展的產物,隨著數字信息的爆炸式增長,大數據的種類與形式也在不斷擴展。
1.2大數據思維的概念
大數據時代改變了人們對生活、對世界的理解方式,顛覆了傳統的思維觀念,一切都可以用數據進行描繪和觀察。大數據技術引發的思維變革,對傳統思維模式產生了巨大沖擊,更加注重對碎片化信息的整合利用,注重對數據信息的視覺化處理和動態預測。小數據屬于簡單科學,大數據屬于復雜科學,小數據與大數據之間存在對應關系,因此可以將大數據思維看做復雜性思維。大數據思維通過對異構多源數據價值的挖掘分析,發現未知數據的內在規律,能夠引發人們對生活、工作方式的深入認知。大數據思維包含人們對數據資源的深入挖掘,對數據創新模式的不斷總結,以及對大數據應用的理論性指導,旨在激發大數據的利用潛能。
1.3大數據思維的特點
大數據思維闡釋了大數據技術的內在邏輯,具有開放性、動態性、關聯性等特征。所有大數據都是對外開放的,實現了數據的個人獨有到全民共享。對于大數據的研究可以不帶任何預設,而是依據科學的方法和流程進行分析。大數據本身是由不同類型的數據、數據集構成的,打破了基于小數據的因果思維模式。在對數據信息進行挖掘時,不僅需要關注不同數據之間的關聯,也需要關注不同數據集之間的間接、復雜的對應關系[2]。大數據是動態變化的,通過先進技術隨時在線采集系統數據,并且迅速處理分析,可以大致了解系統的動態演化過程。大數據思維融合了統計學的思維觀念,通過對看似雜亂的總體數據的研究,能夠發現數據背后隱含的規律。
大數據技術改變了圖書館的服務環境,要求圖書館提供支持數據驅動的服務模式,適應用戶的動態信息獲取需求,也給圖書館數字資源建設帶來新的挑戰。
2.1缺乏完善的資金投入結構
我國圖書館在資源建設方面主要依靠政府撥款,部分依靠社會資金投入,籌措資金的渠道相對單一。大數據時代圖書館的數字資源建設,尤其是對海量異構分布信息的挖掘、篩選和利用,需要利用先進技術與設備,與傳統方式相比運維成本更高[3]。雖然數字資源的獲取更為便利,但是由于涉及到知識版權的鑒定與使用,并且流程相對繁瑣,也需要耗費大量資金。同時政府資金投入無法滿足大數據環境下的資源建設需求,即便是專項大額撥款,也只能滿足圖書館購置軟硬件設備的需求,在數字資源開發與持續利用方面的資金依然短缺。加上很多數據庫資源并非免費獲取的,價格也在持續上漲,導致圖書館無法保障數字資源的完整性,也影響到數字資源建設質量。
2.2缺乏特色數字資源服務
由于很多圖書館將結構化數字資源的搜集整理作為重點,缺少對非結構化數據的挖掘和存儲,導致圖書館存儲的資源類型千篇一律,缺乏深度與廣度,無法滿足用戶對個性化資源的需求。很多圖書館都是基于網絡開放獲取資源,為用戶提供信息檢索、組織與推送服務,極少利用移動通訊網絡、云計算等拓展服務領域,在數字資源采集整合方面缺乏創新意識,整體服務水平偏低。部分圖書館在數字館藏資源建設方面,將已有資源的數字化作為重點,缺少與其他圖書館或信息機構的交流共享,缺乏對海量數據進行綜合處理的能力,與個性化、多元化服務需求相差甚遠。
2.3數字資源同質化現象嚴重
大數據環境下很多圖書館的數字資源迅速增多,雖然在一定程度上擴展了館藏規模,但是由于圖書館缺乏科學的數字資源組織方法,導致建設中存在標準不一、重復建設等問題。在數字資源建設方面,很多圖書館采用購買成熟數據庫、館藏資源數字化和自建數據庫的方式,滿足用戶對數據信息的需求。而部分商家為謀求利益對數字資源進行任意買賣,導致很多數據庫的數據存在交叉重疊[4]。不僅影響到圖書館的資源建設效率,也導致數字資源的極大浪費。同時圖書館數字資源建設存在結構不合理等問題,缺乏對用戶行為信息的敏銳感知,缺乏科學的數據資源建設決策,重視對結構化數據的整合,而忽視了對非機構化數據的采集和長期存儲,很難適應大數據時代的需求變化。
大數據思維的應用有助于發現混雜數據存在的相互關系,挖掘海量數據中隱含的規律,為圖書館數字資源建設提供新思路。圖書館可以通過加強基礎設施建設,注重特色館藏資源建設,以及建設公共媒體數字資源庫的方式,強化大數據環境下的數字資源建設。
3.1加強圖書館基礎設施建設
互聯網技術的廣泛應用,使得在線信息檢索工具得到普及,改變了人們的信息獲取方式,更多的用戶傾向于瀏覽、獲取數字化資源。但是目前我國圖書館依然以印刷型資源為主,對于數字資源的采集、存儲力度并不大。大數據環境下圖書館應該轉變資源建設模式,通過基礎設施建設,改善數字館藏資源建設環境,為海量復雜數據的處理和利用創造條件。同時面對大數據環境下異構分布的數字資源,要求圖書館員了解圖情學、信息技術等綜合知識,具備信息檢索、數據挖掘、數據組織等能力,掌握與數字資源建設相關工具的使用方法。圖書館在引進先進技術與設備的基礎上,應該為圖書館員提供培訓學習機會,鼓勵圖書館員參與到科研活動、實踐探索中,或者采用參觀學習、知識講座與學術交流的方式,提升圖書館員的整體素養,為圖書館數字資源的高效管理提供保障。
3.2注重特色館藏資源建設
圖書館結合館藏實際與社會經濟發展狀況,加強特色數字館藏資源建設,能夠充分體現自身資源特色,改變圖書館領域“全而不精”的狀態。圖書館以特色館藏資源建設提供特色服務,可以在館際合作中凸顯優勢,也是提升圖書館競爭力的根本所在[5]。利用大數據技術對已有資源進行深入分析,發現本館具有獨特風格的文獻資源,通過對這些文獻資源的數字化處理,構建具有特色的圖書館數字資源體系。在依照計劃進行數字資源建設的同時,圖書館應該將主要精力放在重點學科文獻建設上,合理配置不同學科數字資源的比例,利用大數據技術多方收集具有代表性的文獻資料,如工具書、論著、科研手稿等,保障特色文獻資源的完整性和系統性。
3.3建設公共媒體數字資源庫
面對大數據環境下眾多公共媒體海量異構分布的數據,圖書館可以構建覆蓋眾多信息媒介的大數據服務系統,通過對復雜數據的整合處理,為用戶提供便捷、高效的數據信息服務。圖書館公共媒體數字資源庫的建設,首先應該結合圖書館日常運維情況,充分了解用戶對館藏資源建設需求,總結不同層次用戶對數字資源的利用情況,建立能夠處理海量數據且符合需求的資源庫系統。圖書館數字資源庫的建設,應該具有靈活性和兼容性,能夠對結構化和非機構化數據進行統一管理,并且可以滿足個性化服務需求。在建設階段圖書館應該做好用戶調研工作,以用戶、數據資源、管理者為主體,綜合多方需求設計具有個性化模式的系統[6]。基于大數據環境下數據庫管理的全生命周期,對系統建設的各個環節進行細致分析,具體建設流程如圖1所示。在資源獲取階段,利用大數據技術從公共媒體平臺、開放數據庫中獲取滿足用戶需求的數據資源。然后對數據資源進行過濾和整合,在對數據關聯、現象與過程等進行分析的基礎上,遵循一定的準則進行數據重構,最后對數據資源進行實時分析,使之轉化為可用的知識。

圖1 圖書館公共媒體數字資源庫建設流程
大數據思維突破了數據類型與時空限制,能夠通過數字資源整合實現信息共享,進一步提高數字資源的利用價值。圖書館可以利用大數據思維成立圖書館聯盟,提升數據安全監控能力,并在深入挖掘的基礎上開發全新的服務模式。
4.1提升數據安全監控能力
互聯網為我們提供了一個自由展現才華的空間,也是龐大的數據資源庫,但是由于信息的開放式傳播,使得數據安全問題變得尤為突出。圖書館基于大數據思維的數據資源庫建設,應該嚴格遵循國家制定的相關數據安全法規,加強對數字資源的安全監控,保障數字資源利用和共享的安全性。同時圖書館應該制定統一的數字資源利用標準,設計數據資源庫安全管理機制,以操作性強、詳細的管理規范,減少圖書館數字資源利用中存在的分歧,維持圖書館數據的穩定運行。定期對圖書館數字館藏資源進行安全檢查,保障圖書館數字資源的利用有章可循,減少圖書館數字資源組織建設中存在的安全漏洞[7]。數字資源屬于規模龐大的信息寶庫,通過對數字資源進行挖掘分析,可以幫助用戶了解學科發展方向,為科學決策提供參考。圖書館在利用大數據技術進行數據挖掘的同時,也需要提高圖書館員的數字資源安全意識。通過圖書館員數據安全培訓,使其具備數據安全管理的大局觀,在維護圖書館數字資源安全的基礎上,促進數字館藏資源建設的良性發展。
4.2實現館藏資源的聯合開發
通過對我國圖書館領域的發展狀況進行綜合分析,發現圖書館總體發展缺乏均衡性,在智能化、數字化建設方面差距較大。要想實現信息共享工程的目標,需要由技術實力雄厚的圖書館給予其他圖書館技術支持,以技術資源的聯合管理,促進不同圖書館之間的協調發展。大數據技術吸引圖書館的一個顯著特點,就是可以實現資源共建共享。多個圖書館通過引進現代化技術,以網絡協議的方式實現館際合作,不僅可以幫助圖書館收集完整的數字出版物,也可以更好地滿足用戶需求。要想真正實現數字資源共享,最大限度利用館藏數字資源,各圖書館應以聯盟的形式走資源聯合開發道路[8]。應該注意的是,圖書館文獻資源的格式標準,是保障數字資源建設的質量基礎。協作圖書館必須制定統一的數據規范,并且建立數字館藏資源聯合開發系統(見圖2)。該系統包括數字館藏資源聯合開發業務子系統、數字館藏資源聯合管理子系統以及數字館藏資源標準化子系統等,也包括其他業務子系統。每個子系統分為多個部分,共同承擔圖書館聯盟開展的數字館藏聯合開發任務。

圖2 圖書館數字館藏資源聯合開發系統框架
4.3開發全新的圖書館服務模式
大數據時代,館藏資源規模已經不再是評價一個圖書館競爭實力的主要標準,用戶更加關注圖書館的數據組織分析能力與知識服務水平。圖書館服務中對隱含知識的分析與轉化能力,成為衡量其服務質量的重要指標。在這樣的環境下,要求圖書館利用大數據思維,積極開發網絡資源與非正式出版物中隱含的資源,通過對數據信息的高效處理轉化,創新圖書館服務模式。一方面,圖書館可以利用多元化的公共媒體數據庫,從中獲取有價值的數據信息,結合用戶需求提供知識咨詢服務。由于知識咨詢服務要求大量優質數據提供支撐,并且涉及多個學科領域,單純從圖書館專業數據庫中獲取信息,已經無法滿足用戶對數據信息的個性化需求。而不同類型的公共媒體數據庫,如微博、人人網等,其中蘊含大量灰色文獻資源,借助大數據技術對系統數據進行持續跟蹤和深入挖掘,可為用戶提供非正式渠道獲取的隱含信息,具有可靠性和準確性。大數據時代數據已經變成一種資產,誰能夠迅速獲取并掌握更多數據,就能夠獲得發展的先機。圖書館決策也逐漸由結合實踐經驗,向基于數據分析與經驗相結合的方向發展。通過對用戶行為數據進行深入分析,能夠科學預測圖書館領域的發展動向,輔助圖書館做出正確的決策。大數據時代的數據分析日益朝著縱深化、多維化、實時化方向轉變,要求圖書館提升對大規模數據信息的掌控能力,利用大數據思維分析當前,以更好地適應大數據時代的要求存在的問題,并且及時進行調整和創新。
大數據時代掀起了廣泛的科學技術革命,顛覆了人們的生活、學習和工作方式,也以先進的數據存儲、采集和處理技術促進了大數據思維的推廣。大數據環境下圖書館改變了傳統的館藏資源建設模式,在采集整合紙質資源的基礎上,提升了數字館藏資源開發和利用力度,并朝著數字化、網絡化方向發展。大數據思維在圖書館資源整合、效益評估中均有應用,為數字資源的組織利用提供了技術支持。圖書館應該利用大數據思維對館藏資源進行綜合評估,全面掌握用戶信息行為及其動態變化,并對館藏資源建設效益進行客觀分析,進而不斷提升圖書館資源建設水平。
[1]張馨允.智慧圖書館背景下的館藏資源建設探究[J].蘭臺世界,2016(1):58-60.
[2]劉慧.圖書館館藏資源建設評估研究[J].農業圖書情報學刊,2015(2):26-31.
[3]楊一凡.館藏資源建設與讀者素質教育淺析[J].科技信息,2012(17):208-209.
[4]張佳麗.大數據時代少數民族地區高校圖書館館員核心能力研究[J].農業圖書情報學刊,2015(4):205-208.
[5]譚榮.大數據時代高校圖書館信息服務的創新[J].新媒體研究,2015(13):57-58.
[6]李鴻.大數據背景下高校圖書館的用戶需求與信息服務[J].中國科技信息,2014(21):79-80.
[7]王楠.大數據時代高校圖書館特色信息資源整合研究——以地方信息資源為例[J].科技資訊,2014(21):253.
[8]曾祥文,王華.大數據時代高校圖書館信息化建設探討[J].科技創新導報,2013(35):202.
馮園園女,1980年生。碩士,館員。研究方向:圖書館信息自動化。
G253
(2016-07-04;責編:徐向東。)