劉亞莉
關鍵詞:大數據環境;數字圖書館;信息服務資源;整合存儲
摘要:為了應對數據量不斷增大的多類型信息資源,圖書館采用了資源整合與存儲技術。文章闡述了大數據環境下圖書館信息服務資源整合存儲的意義,提出了圖書館大數據資源整合的存儲策略,并在此基礎上設計了數字圖書館信息資源云存儲系統。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2017)11-0090-02
隨著新興的物聯網技術、云計算技術以及社交軟件的快速發展,衍生數據的增長速度驚人,網絡中充斥著海量數據,這些都預示著大數據時代的來臨。人們的生產生活已經離不開數字化信息,而在海量數據中篩選出有效數據的相關技術已經成為專家學者重點關注的問題[1]。值得注意的是,作為傳統圖書信息資源提供者的圖書館也應該與時俱進,嘗試獲取更為準確和有效的數據信息。顯然,圖書館應該依靠海量圖書資源平臺,將大數據處理技術與數字圖書館服務理念進行緊密結合,積極探究數據的獲取、整理以及存儲等技術,為用戶提供更加有效和人性化的服務。
1大數據環境下圖書館信息服務資源整合存儲的意義
1.1為資源共享提供技術保障
在整合和管理館藏資源后,圖書館方面還需要借助先進的信息處理技術維護和存儲圖書文獻資源,尤其是非常稀缺的光盤制品和微縮文獻制品等。由于采用的存儲技術具有運行穩定性高、存儲技術成熟、存儲壽命長、存儲應用面廣以及存儲密度大等優勢[2],所以筆者嘗試將RSS技術、標簽技術以及Web2.0技術等應用在圖書館存儲工作中,從而幫助圖書館實現用戶信息推送服務、用戶個性化定制服務、擴大檢索服務、新書發送服務以及相關信息鏈接服務等[3]。正是由于上述服務提供的技術支持,才能為圖書館與用戶之間的互動交流提供有利環境,才能讓用戶有更多機會參與到信息交流過程中來,并根據個人的信息需求獲取相應的信息資源服務。
1.2便于文獻資源的提供和利用
需要說明的是,很多歷史文獻資源極其珍貴,尤其是原稿只有一份時,不可能滿足用戶的閱讀需求,而且相互傳遞閱讀也不可能實現。然而,一本一千多頁的16K的書籍,經過數字化處理之后就可以利用六張微縮平片進行存儲,而且這些平片可以直接進行傳送閱讀。當然,關于音像制品、微縮制品以及光盤的管理和存儲技術就顯得十分重要,如果沒有有效的管理和存儲技術,就會對資源管理和共享產生不利的影響。
2圖書館大數據信息服務資源整合存儲系統設計
2.1系統總體架構
總體來講,基于數字圖書館的云存儲資源模型主要包括應用服務部分、平臺服務部分以及基礎設施部分等,這些都參照層次進行分類[4]。其中,應用服務部分主要提供具體的系統功能,平臺服務部分主要提供系統監控功能、用戶管理功能以及為應用服務部分提供專門接口等。形象地說,基于數字圖書館的云存儲資源模型就是一種云端類型的網絡,該網絡可以提供高并發的網絡計算服務以及網絡功能服務等,該模型可以利用分布式技術和虛擬化技術擴展Web網絡服務器、應用服務器、存儲服務器以及數據庫服務器等,還可以在不同區域的數字圖書館之間提供多種檢索、計算以及存儲服務等。具體的區域數字圖書館資源云存儲模型圖見圖1。
基礎設施服務層(即IaaS層)是區域數字圖書館云存儲模型的基礎部分,支撐著整個模型框架的運作,其利用虛擬化技術將硬件資源和相應管理功能進行有機結合。該服務層包括兩個方面的功能:一是利用網絡硬件設備、存儲設備以及主機進行虛擬化、抽象化以及分布式處理,將數字圖書館的各種硬件設備整合在一起,共同封裝為基于云存儲的基礎服務設施,用戶只需將其當成一個整體即可,當然也無須知道是哪部分設備提供服務,只要發布調用設備命令就可以獲取到所需的硬件和軟件資源。二是借助虛擬化技術以及抽象化技術,基礎設施服務層為用戶提供備份管理、計算服務管理、數據存儲管理以及負載管理等服務。
平臺服務層(即PaaS層)是區域數字圖書館云存儲模型的中間部分,又稱為云中間件,其將系統的復用性軟件和通用性軟件進行整合,從而實現為區域數字圖書館提供PaaS層服務。該服務層主要提供以下幾個方面的功能:一是提供系統信息管理接口功能,如提供課題管理、專題管理、資源管理以及簡報管理等功能。二是提供平臺核心服務接口功能,如提供行為分析和統計功能、任務調度功能、資源整合功能以及檢索功能等[5]。三是提供信息發布接口服務,如提供用戶定制、發布信息檢索、系統資源導航以及資源專題發布功能等。四是提供信息規劃接口功能,如提供信息資源規劃以及資源體系規劃等功能。五是系統信息資源加工接口功能,如提供信息生產的分析和統計功能以及信息內容編發功能等。六是提供資源庫的發布接口功能。
應用服務層(即SaaS層)是區域數字圖書館云存儲模型高層部分,可以為區域數字圖書館提供所需的服務和應用軟件支持。借助應用服務層提供的軟件功能,區域數字圖書館可以根據用戶具體需求,將系統功能以租用的方式提供給用戶或其他組織。具體來講,系統提供的服務功能主要包括RSS信息服務、信息訂閱推送服務、系統信息檢索服務、個性化用戶信息服務、系統公共信息服務、企業競爭監管服務、用戶參考和咨詢服務、技術評估服務以及高新技術查新服務等。
用戶權限使用計費模塊主要提供用戶管理、系統計費、用戶權限確認以及系統支付等功能。系統管理以及業務支持模塊主要提供系統管理以及業務支持的相關功能,從而保證整個系統能夠正常運行。客戶端模塊是整個數字圖書館的最高層,不僅為用戶提供登錄功能,而且還可以直接與服務器進行交互,該模塊不再局限于個人計算機,只要是能夠訪問云端的終端設備都可以登錄客戶端。
2.2云存儲模型結構分析
云存儲模塊是一種集合了客戶端、服務器、存儲設備、應用軟件、接入網以及訪問接口等模塊功能的綜合型系統,已經不是一個功能單一的存儲設備。顯然,存儲功能是整個云存儲模型的核心功能,并且借助應用軟件對外提供數據存儲服務以及用戶使用功能等。云存儲模型的具體結構示意圖見圖2。endprint
云存儲系統模型主要有四層結構:第一層為存儲層,即云存儲的底層。需要注意的是,云存儲設備的結點分布廣泛且數量巨大,而結點之間可以借助互聯網、光纖網絡以及廣域網進行連接。在存儲設備中還會配備存儲的統一管理設備,可以實現針對存儲設備的虛擬化管理。傳輸層還能實現冗余管理、硬件設備維護以及運行狀態監管等功能。第二層為基礎管理層,該層為云存儲模型的核心部分,也是系統功能實現最為復雜的部分。基礎管理層可以利用分布式技術、集群技術以及網絡計算技術等實現各個存儲設備之間的數據交互,從而實現將多個存儲設備進行集合并統一提供數據服務,還能夠保證數據交互的速度更快、性能更好以及穩定性更強。此外,CDN類型的內容分發系統以及數據加密技術還能夠保證系統數據的完整性和安全型,以及私密數據不能被無權限的用戶訪問,與此同時,還可以利用數據備份功能、數據容災功能保障存儲數據的安全,以防存儲數據的損壞和丟失。第三層為應用程序接口層,該層為云存儲模型中最為靈活和多變的部分。云存儲提供商可以根據不同用戶的應用需求,開發出不同的用戶服務接口,從而提供不同的服務,如可以提供遠程數據備份、視頻監控、網絡硬盤存儲、視頻點播以及IPTV平臺等功能。第四層為訪問層,該層是用戶與云存儲模型之間的鏈接部分。該層能夠利用公用應用接口,保證有權限的用戶可以登錄云存儲系統,從而實現云存儲系統的相應功能。由于云存儲提供商的應用目的和單位性質不盡相同,所以其提供的訪問類型以及訪問方式差別也較大。
3結語
資源共享模式是大數據時代圖書館發展的必然趨勢,同時也是現階段發展的唯一途徑。借助資源整合技術,圖書館不僅可以實現信息資源的規模化處理,還可以實現本館與其他圖書館在同一平臺上用戶和資源的統一管理,從而最大限度地實現資源共享的目的。而存儲功能就是借助先進技術,將文獻資源按照一定的次序進行管理和存儲處理,讓相同或相似的文獻資源緊密關聯,這也是基于文獻資源的存儲處理的核心所在。
參考文獻:
[1]溫浩宇,李京京.大數據時代的數字圖書館異構數據集成研究[J].圖書館雜志,2012(9):138-141.
[2]吳珺,謝樹泉,工春枝.基于語義的隧聯網數據整合方法[J].智能系統學報,2014(6):209-213.
[3]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數據”[J].圖書館雜志,2012(11):63-71.
[4]張文彥,武瑞原,于潔.大數據時代的圖書館初探[J].圖書與情報,2012(6):15-21.
[5]韓翠峰.大數據帶給圖書館的影響與挑戰[J].圖書與情報,2012(5):37-40.
(編校:崔萌)endprint