李妍
摘 ? 要:現代化信息科學技術的發展使得社會各行各業都發生了翻天覆地的變化,隨著信息傳播渠道的拓展和傳播效率的提高,傳統圖書館必須盡快變革,為廣大用戶提供創新型服務,以適應人們需求的變化。大數據時代為圖書館發展同時帶來了機遇和挑戰。本文將從大數據時代下圖書館發展面臨的主要問題入手,提出異構化數據集成的有效方案,并探討服務轉型的有效途徑。
關鍵詞:大數據 ?數字圖書館 ?異構數據集成 ?服務轉型
中圖分類號:G250.76 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2020)02(b)-0245-02
云計算、數據挖掘等大數據時代下涌現出的新技術為IT行業帶來了新的發展內容,數據應用已經成為各行業發展的主流方向。對于我國傳統圖書館而言,為了避免逐步被邊緣化,應積極引入大數據技術,探求全新的管理模式和信息服務途徑。其中異構數據的整合是圖書館改革過程中面臨的一項主要問題,有必要進行深入的研究。
1 ?大數據時代下圖書館發展面臨的重要問題分析
大數據具有規模大、內容廣、形式復雜等特征,除了結構化數據外,還包括大量的非結構和半結構化數據。就目前來看,我國圖書館對大數據技術的挖掘利用仍舊處于初級階段,引發了一系列的難題。
1.1 大數據網絡環境適應問題
大數據有異于傳統數據的特征使得傳統的數據處理方式已經不再適用,規模龐大且多樣化的數據已經超出了現有IT架構和基礎設施的承載能力,換而言之,大量數據的應用價值并未被充分挖掘出來,導致這種現象的深層原因主要有三點:分別是人才瓶頸、技術障礙以及基礎設施缺陷,這三方面問題的存在使得我國圖書館難以快速適應當前的大數據網絡環境,無法對數據進行快速有效的轉換和處理,現有的基礎設施只能對結構化數據進行處理應用,無法應對非結構化數據。
1.2 文獻資源整合難度高
大數據作為一個全新的領域,所帶來的影響十分深遠,即使到目前位置,大數據的真正應用比例仍舊不高,這是因為許多數據資源并不是簡單匯聚而成的,因此并不具備真正的知識源。在大數據時代下,我國圖書館的館藏資源雖然一直處于增長之中,但是其中大部分都處于被擱置的狀態,不僅為資源管理帶來了巨大的挑戰,對用戶檢索也提出了更高的要求。現在圖書館要解決的一個關鍵問題就是如何按照讀者的習慣和需求,快速為其提供全面有用的信息,形成以用戶為核心的服務模式,實現對數據信息的最大化應用。
1.3 數字圖書館異構數據集成問題
和傳統圖書館相比,大數據時代下的圖書館所面臨的數據更加多樣化,且大部分都是非結構化數據,這對圖書館和數據處理能力、存儲技術應用、服務方式均提出了全新的要求,而大部分圖書館的關系型數據庫和機制難以快速的適應這種變化,因此異構數據的集成是現代數字圖書館構建必須解決的問題。
1.4 用戶流失問題
在現代化信息技術的支持下,人們獲取信息的渠道變得更加廣泛,獲取信息的方式也更加多樣化,書本閱讀不再是信息獲取最主要的方式,電子閱讀逐漸興趣,智能手機、平板電腦和互聯網使得人們獲取信息變得更加方便快捷,海量的數據共享和搜索引擎技術鏈接了幾乎所有信息的索引服務。在這樣的情況下,圖書館所具有的優勢逐漸消失,大量用戶流失。為了應對這種情況,很多圖書館都在積極尋求變革。而在大數據模式下,想要為讀者提供個性化服務,就需要對讀者閱讀需求、行為、習慣進行追蹤和分析,這無疑會帶來一定的隱私問題。
2 ?大數據時代下數字圖書館異構數據集成方案
在大數據時代下,圖書館數據集成面對的是大規模的非結構化數據,因此傳統的數據處理、存儲和數據庫技術都已經不具備適用性,如何對異構數據進行有效集成是現階段圖書館需要解決的一項關鍵性問題。對此,人們開發出了很多異構數據機構方法,本文主要介紹的是一類基于Web Service解決元數據異構的方法,利用Mediator/Wrapper異構數據集成模型將源于不同數據源的一些數據信息副本,按照統一的視圖要求,對數據信息進行預處理和轉換,形成統一的模式,最后將轉換完成的數據信息存儲在數據倉庫之中。該數據倉庫可以支持用戶直接進行檢索。一個需要注意的問題是,基于該模型構建系統存在數據信息重復存儲的情況,且數據信息的更新頻率也相對較慢,可能會對系統的使用性能產生影響。
參照Mediator/Wrapper異構數據集成模型所構建的基于Web Service數字圖書館異構數據集成體系結構共包括三層結構,分別是應用層、中間層和資源層。其中在應用層中置入了面向用戶的可操作應用界面,用戶可以通過該界面瀏覽和獲取底層所集成的數據源。用戶的檢索行為面向的是底層所有的數據庫,不同的數據源所返回的相關數據信息通過系統處理后,以統一的形式顯示在用戶的應用界面上。
中間層可以對系統應用層所發出的各類請求命令進行接收,之后通過請求處理系統對該命令進行分解和分析,轉化為相應的功能子命令,將功能子命令包裝成SOPA信息,最后借助Web Service傳送到包裝器中完成信息檢索程序。在結果信息處理系統中,可以接收來自不同子數據源反饋的XML格式的數據信息片段,對其進行整理合并后傳送到應用界面。在上述過程中,請求處理系統對請求命令的處理會嚴格遵照映射關系中所設定的規則,而所涉及到的映射關系,主要是對XML元數據相應的標準加以規定,同時也對XML全局元數據和局部元數據之間的映射規則進行了規定。
資源層在系統結構體系中所發揮的主要作用是存儲數據信息,并為不同的數據源提供統一的對外接口,其中設置的包裝器組件可以對不同的異構數據進行包裝。包裝器屬于不同數據源的包裝層,它可以對數據源中的數據和數據模式進行包裝,基于一定的映射規則將中間語言功能命令轉化為可以被某一種數據源模式所辨識的物理指令,同時將底層數據源中的一些數據信息格式轉變為XML。
3 ?大數據時代下數字圖書館異構數據集成作用于服務轉型
在當前社會背景下,手機、平板電腦等移動終端的出現使得人們的閱讀方式發生了巨大的轉變,圖書館若是囿于傳統的服務模式必然會被時代所淘汰。現階段我國很多圖書館對異構數據進行集成的目的就是為了推動服務模式的轉變,實現服務項目的創新和服務水平的提升。結合實踐來看,大數據時代下數字圖書館服務轉型的方向主要集中在以下幾個方面。
3.1 為用戶提供個性化信息推送服務
在互聯網環境下,“個人門戶”的概念不斷普及,用戶可以從互聯網入口網站獲取個性化的服務,各類具有價值的數據信息將被集成到統一的信息管理平臺上,直接面向用戶。目前,國外很多數字圖書館都已經建立了自己的門戶,借鑒國外經驗,我國圖書館也在探索門戶建立的道路,如北京師范大學圖書館Metalib+SFX統一檢索型數字圖書館門戶。通過個人門戶平臺的建設,圖書館可以將各類富含價值的信息快速聚合起來,直接為用戶提供個性化信息推送服務,有效適應讀者的閱讀習慣,滿足其閱讀需求。例如,根據讀者的訪問習慣,直接將其頻繁訪問網站的信息推送過去,或是根據讀者的借書記錄,為其推薦相近或是同類書籍信息。此外,讀者還可以快速獲取自己關注書目的借還情況。
3.2 通過信息專員為讀者提供知識服務
在大數據時代下,圖書館的服務模式也應做出調整轉變,信息專員是圖書館針用戶需求對學科館員服務內容進行調整后形成的崗位,為用戶提供“嵌入式”的知識服務,實現服務內容和需求的完美契合。在實際工作中,信息專員的工作內容有四項:其一,協助或參與用戶數據信息定制、管理等工作。其二,協同用戶開展深度項目,如文獻檢索、數字門戶建立、用戶專用研究間建立等。其三,文獻書評,參與到文獻研究的信息檢索、調整評價文獻、數據摘錄等,最終形成可檢索的數據庫。其四,為項目組成員創建一個引文管理數據庫。在項目實踐中,信息專員可以為科研團隊提供全方位的信息服務。
3.3 文獻傳遞和快遞服務
文獻傳遞是現階段圖書館為用戶提供的常規服務項目,即圖書館向其最終用戶提供文獻的一個完整過程,包括明確的表述和發出請求以及對文獻的物理和電子提供過程的過程。在大數據時代下,人們獲取信息的方式逐漸向“終極化”發展,現有的電子文獻不可能滿足所有人的需求。基于此,圖書館可以參考物流快速衍生文獻傳遞服務,將文獻直接送到用戶的手中。
3.4 “紙云”融合的閱讀推廣服務
雖然于都紙質圖書的人越來越少,但紙質閱讀的個性化深度閱讀需求依然存在,結合調查數據來看,大部分老年人更喜歡紙質閱讀,但整體上來看,電子閱讀是大勢所趨。基于此,圖書館可以開發“紙云”融合的閱讀模式,具體內容如下:首先,基于圖書館自動化系統定期開展新書和經典書目的推薦、數字資源宣傳培訓等推廣活動。其次,利用網絡平臺開展閱讀比賽、書評等活動,為讀者提供一個開放、共享的閱讀環境。
4 ?結語
綜上所述,在大數據時代下,圖書館必須積極尋求變革,探索數據信息資源高效利用之路,對異構數據進行集成,推動服務模式的轉型,拓展服務項目,提高服務水平,更好的滿足廣大讀者用戶的個性化需求,為自身持續發展奠定基礎。
參考文獻
[1] 晁亞男.大數據環境下數字圖書館服務情境建構的新內涵與新方式[J].圖書館學研究,2017(24):32-36,24.
[2] 王薈.大數據時代數字圖書館面臨的機遇和挑戰[J].漢字文化,2018(14):105,107.
[3] 程結晶.大數據時代圖書館服務創新的內容及其策略研究[J].情報理論與實踐,2016,39(3):57-62.
[4] 王彤.大數據時代下的圖書館跨界服務信息安全技術問題及對策[J].圖書館理論與實踐,2016(6):99-103.
[5] 劉佳美,程結晶.大數據下數字圖書館熱點研究——基于關鍵詞的因子降維分析方式[J].農業圖書情報學刊,2017,29(4):76-80.
[6] 王戰平,馮揚文,朱宸良.大數據時代數字資源整合方法研究:模型設計和實驗分析——以物流行業為例[J].現代情報,2019,39(9):92-100.
[7] 張瑜.大數據環境下圖書館公共媒體數據庫建設與利用研究[D].遼寧師范大學,2014.