李嬌等
摘 要:隨著大數據時代迅速來臨,給社會文化與各行各業都帶來了巨大變革,圖書館同樣不例外。就大數據來說,圖書館界先后進行了一系列學術研究以及實踐,但圖書館事業當中大數據的運用仍然存在著許多問題,這些問題的存在對圖書館正常發展及運營造成了嚴重影響,因此優化其應用程序尤其關鍵。
關鍵詞:大數據時代;圖書館;發展
基金項目:重慶市高等教育教學改革研究項目(133023,1203036)。
1.前言
隨著大數據時代的到來,對圖書館的建設和服務等工作產生了很大的影響。比如,出現了圖書館的大數據存儲能力不夠、容易泄露讀者的保密數據及其閱讀隱私等問題。當前,為保證圖書館順應時代發展的需求,及時做好相應的應對措施,實現大數據在圖書館管理中的可用性,已成為圖書館準確、高效地滿足讀者閱讀需求,優化服務模式的關鍵。因此,圖書館應科學的進行大數據的采集、分析及判定和決策,以實現大數據的可控性、有效性和經濟性。
2.對圖書館運用大數據的主要問題
2.1 圖書館的大數據運行技術及基礎設施條件不夠
圖書館數據具有資源總量大、增長迅速快的特點,其種類以及數量隨著信息時代的到來逐超越紙質版的學術資源,將成為圖書館的重要館藏部分,也是數字圖書館日后可依據的重要資產。因此,出現了圖書館的大數據運行技術及基礎設施條件不夠的問題。當前,將新興的大數據技術合理的運用于數字化的圖書館,構建出大數據圖書館所需的基礎設施條件,已是大數據時代背景下圖書館進行建設的一項重要挑戰。一方面,信息時代,讀者產生的數據信息中會存在很多半結構化和非結構化的信息數據,致使信息數據的結構類型和格式形態等都更加復雜。因此,極速增長的數據量給圖書館的存儲能力帶來了很大的挑戰,當前現有的圖書館的整體性的知識服務結構并不完善,其數據處理技術很難實現大數據的應用需求。另一方面,大數據種類的復雜化給圖書館的常規分析帶來了很大的挑戰,這就要求必須突破對大量異構數據的處理和分析不足的問題。當前,大數據時代產生的數據總量及類型的急劇變化使圖書館的基礎設施承受著很大的壓力,由于受到成本的制約,現階段的大部分圖書館難以在短時間內在技術、基礎設施的建設等方面滿足建設大數據圖書館的實際要求[1]。
2.2 大數據的不確定性對圖書館管理提出了新的挑戰
大數據存在一定的不確定性,這種不確定性特征會致使網絡數據很難被建模及有效學習,從而難以發揮其有效利用的價值。數據本身存在的不確定性、并不完全準確的原始數據、對數據采集的處理力度以及應用需求等因素致使數據在不同的維度和尺度方面均出現了不確定性;大數據的模型也具有不確定性,由于數據自身具有的不確定性會要求數據的處理方式應該不同于傳統的數據處理方法,這就要求圖書館在大數據的管理方面應該提出相應的新模型并把握好模型的表達能力,最終致使新選擇的大數據模型也具有了一定程度的不確定性;大數據的學習具有不確定性,數據模型一般情況下都需要學習模型參數,但是通常情況下很難找到模型的最優解。因此,大部分學習問題都只是采用一個近似但并不確定的方法找出一個相對而言可用的解。在大數據時代的要求下,傳統的近似學習方法則需要面對時效和規模的雙重挑戰,這樣一來,便要求圖書館要盡量提高技術性管理水平來應對大數據學習中的不確定性[2]。
2.3 大數據為圖書館數據帶來安全隱患的問題
在大數據信息時代,使用信息的安全和讀者的閱讀隱私問題已經成為當前建設大數據圖書館的一大挑戰。開放數據和共享數據是進行大數據模式的核心精神,現階段的各組織機構包括圖書館都開始公開、共享出各自領域的信息數據,在很大程度上消除了以往的“數據孤島和數據割據”的狀態,逐漸實現了共建圖書館數據以及數據價值最大化發展。但是,隨著而來的信息安全問題也從傳統的計算機網絡的保密性管理、可控性管理逐漸轉變為難于預見信息安全隱患和信息管理出現不可控的困境。隨著近年來大數據的不斷整合和大數據技術門檻的日益降低,導致圖書館大數據中所包含的大量的涉及用戶隱私的商業情報,甚至是部分涉及國家安全的信息都成了難以保護的重要對象。由此,致使大數據背景下的圖書館數據的安全隱患問題日益嚴重化[3]。
3.圖書館應對大數據時代影響的有效對策
3.1 開發圖書館的大數據運行技術,使圖書館滿足運行大數據的條件
在大數據背景下,只有開發圖書館的大數據運行技術,才能使圖書館滿足運行大數據的條件。當前,圖書館建設的當務之急應該是樹立大數據的發展戰略,做好管理的頂層設計,科學推動圖書館完成大數據的轉型。圖書館應該基于全局戰略及局部戰略的角度,根據自身實際條件對建立大數據的戰略角色進行定位,并緊密結合圖書館所在區域的主要服務對象的館藏特點等因素,建立起分級、分類的具體性實施策略,積極探索大數據的業務、服務、技術等模型。圖書館穩定發展的主要競爭力是其占有數據信息的規模活性和對數據的分析、挖掘、運用能力,當前,傳統方法的數據定量分析已難以滿足大數據的分析需求。圖書館可以采用統計學及模式識別等各種技術,從圖書館大量的數據中提取出信息中所潛在的各種價值信息。同時,圖書館應該成立適用的數據管理部門來專門負責信息數據的采集、收儲和利用工作,通過館內各部門間的協調工作,使圖書館滿足運行大數據的條件。
3.2 圖書館應構建科學的大數據存儲系統
圖書館大數據存儲系統需要具有存儲架構科學、存儲容量大、存儲區域網絡化等,這些特性直接關系著圖書館的大數據管理效率和管理質量。因此,為順應大數據時代的要求,構建科學的大數據存儲系統,圖書館應該做好以下幾個方面的工作:(1)關注大數據系統結構的科學合理性,存儲數據應該嚴格按照數據信息的類型、應用需求和安全保障等對信息文件進行分塊存儲。 (2)采用認證用戶身份及設置訪問權限的管理模式,控制用戶對大數據存儲平臺的數據訪問。 (3)圖書館大數據存儲系統應該具備比較強的數據容錯力,以保證數據存儲的可用性。(4)應根據圖書館的未來管理方向和服務數據量的增長情況,建設存儲系統時應該保證系統可實現通過增加數據信息的節點數量或數據塊的服務器數量,便可以自由進行數據存儲能力的擴展。
3.3 確保圖書館大數據的可控性和可靠性
為確保圖書館大數據的可控性和可靠性,圖書館在進行數據采集時,通常希望可以最大范圍地對數據進行采集和分析。這就需要圖書館運用科學的大數據采集方法進行數據的采集,以保證采集數據的精確性、價值密度和數據間的因果關系等。因此,為了保證圖書館大數據的準確性、高效性和可用性,圖書館應做好以下幾個方面的工作:(1)圖書館應該根據運營服務和系統管理的實際需求,建立大數據的質量評估標準以及可用性的保障體系。通過利用評估系統科學的對大數據的數據信息的可用性以及數據間的關系進行評估,然后通過評估結果進而實時反饋,并采取相應的對策,進而保證圖書館大數據平臺的科學性、經濟性和可控性。(2)在對大數據進行采集、存儲、管理和應用的過程中,圖書館應確保數據信息具有廣泛的數據視角、長期性的原始格式存儲類型、可快速的實現數據自身價值并為用戶提供服務等。(3)圖書館應該根據數據價值的發掘程度及其未來的可用性,對高價值的數據進行長期性的安全存儲及查詢優化,保證高價值的大數據安全、穩定及未來可用。
3.4 強化圖書館數據的安全建設與管理
一直以來,保護國家情報安全和用戶的個人圖書情報都是圖書館的重要責任。但是,在大數據時代的背景下,大數據進行開放數據和共享數據致使國家情報安全和用戶的個人圖書情報出現了很大的安全問題,這一問題制約著圖書館進入大數據時代的速度。 面對這一問題,圖書館應該做好以下幾個方面的工作,以切實保護用戶的數據安全:(1)圖書館需要研發或者引進實現大數據條件下保護用戶隱私的安全技術,以有效防止惡意入侵盜取和破壞數據的不法行為發生。同時規范數據的開放流程及接口,以保障圖書館的數據資源的科學有序的開放、安全使用。(2)圖書館是數據的守衛者,圖書館工作人員必須要提高自身的專業素養及職業道德水平,切實保護用戶的個人數據信息安全,嚴格控制好信息的傳播和開放范圍,同時做好國家情報機密的保護工作,維護國家的信息安全性 。(3)政府應該研究并出臺保護大數據安全的相關法律法規,通過立法的手段保護圖書館大數據的安全性。只有制定法律嚴厲的懲罰數據入侵者和數據破壞者,對其造成的危害后果追究相應的刑事責任,才能從根本上避免圖書館大數據安全問題的發生。
3.5 構建結構化及經濟化的圖書館大數據平臺
科學的構建結構化及經濟化的圖書館大數據平臺,圖書館應該做好如下工作:一方面圖書館在建設大數據平臺時,應該堅持“統一標準、開放兼容”的基本原則,以有效減少建設平臺系統的成本,并合理降低軟件系統對硬件設備技術指標的參數要求。另一方面,進行大數據的存儲、管理分析和應用建設,應該堅持“開源平臺、保證軟件可擴展及可移植”的重要原則,以確保系統方便操作、管理。此外,大數據平臺應該通過對服務資源進行動態調配和擴展等模式,在保證實現數據存儲、管理、分析過程中的最高收益的基礎上,有效降低運營成本的投入。同時,大數據平臺的性能設計應該滿足圖書館的全周期管理、多類型數據、多功能使用以及全天候的連續性的綜合性服務需求。
3.6 保證圖書館大數據的即時性和可用性
在大數據時代的背景下,圖書館的用戶服務和讀者的閱讀活動所產生的數據具有了流動性和實時性的特點。這些隨時產生的信息數據,對圖書館的用戶服務模式以及服務質量都具有動態調控和即時判定的重要作用。一方面,圖書館應該通過獲取的各種實時信息,對圖書館服務平臺的系統性能以及服務質量等情況進行提前的預警,并進行實時監測和動態跟蹤,最后做出相應決策,以全面提高圖書館服務的智能化和自動化水平。另一方面,圖書館應該通過對收集起來的讀者閱讀模式、閱讀內容、讀者資料以及讀者的群關系等基本信息進行合理分析,以準確的掌握用戶的服務模式以及讀者的閱讀需求方向等,進而為圖書館的服務模式轉型提供大數據的決策支持。此外,圖書館可通過挖掘所收集的數據信息,全面掌握讀者群的具體閱讀興趣和所需求的一些服務模式和內容,進而為提高圖書館對讀者的推送式的服務質量[4]。
4 結束語
綜上所述,正確面對和解決大數據時代給圖書館帶來的影響,可以使圖書館與時俱進的發展。隨著大數據時代的到來和快速發展,大數據給圖書館帶來了各種問題,在短時間內嚴重影響了圖書館的正常運營。圖書館是進行整個社會的信息服務中心,其穩定發展肩負著對社會的責任。因此,圖書館應積極利用先進的科學技術進行改革,同時,做好風險的管理工作,進而將挑戰轉變為發展的機遇,最終促進圖書館的可持續發展。
參考文獻
[1]許玲.大數據時代圖書館面臨的挑戰與對策思考[J].中共福建省委黨校學報,2014,01(05):118.
[2]劉瓊.大數據環境下圖書館面臨的影響與挑戰[J].理論觀 察,2013,01(08):113.
[3]馬曉亭.大數據時代圖書館數據可用性:價值、挑戰和保障[J].圖書館理論與實踐,2014,01(10):6.
[4]馬曉亭.大數據時代圖書館數據長期可用性保障研究[J].現代情報,2013,33(12):64.
作者簡介
李嬌(1981-),女,江蘇南通,博士,館員,研究方向為圖書館管理及相關技術,材料科學與工程。