999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據的圖書館異構數據整合機制研究

2015-12-14 10:45:38馬曉亭
現代情報 2015年8期
關鍵詞:大數據圖書館

馬曉亭

〔摘要〕數據整合對提高圖書館的數據處理與共享能力,進而提升數據有效性、可用性和優化決策等能力有重要意義。本文提出了一種基于大數據的圖書館異構數據整合機制,該機制可提高圖書館大數據的利用效率,并有助于實現圖書館的信息資源整合。

〔關鍵詞〕大數據;圖書館;異構數據;整合機制

DOI:10.3969/j.issn.1008-0821.2015.08.010

〔中圖分類號〕G25076〔文獻標識碼〕A〔文章編號〕1008-0821(2015)08-0047-04

大數據時代已經到來。圖書館通過對所采集的海量數據進行存儲和分析,實現了對讀者閱讀行為、情緒、習慣和服務需求的精確測量,制定出符合讀者服務需求、興趣和閱讀習慣的服務策略、產品,能夠為讀者提供基于大數據的個性化閱讀服務。目前,圖書館數據環境已具備海量(Volume)、多樣(Variety)、快速處理(Velocity)、高價值(Value)的大數據4V特征。隨著數據總量和數據結構復雜度的快速增長,如何通過數據整合來消除圖書館大數據資源不同來源、不同結構和不同定義格式等異構性,提高數據的價值密度、可用性、可控性、共享性和使用經濟性,已經成為圖書館應重點關注的問題。

1圖書館大數據整合的需求與挑戰

11大數據整合可有效弱化圖書館IT系統的多樣性

首先,隨著物聯網、云計算、移動互聯網、傳感器和多媒體閱讀終端等技術的發展,圖書館數據中心的管理系統、服務系統和用戶閱讀終端設備,呈現出多平臺架構、多接口類型、多數據模式和多標準規范的特點,導致信息系統之間相互獨立和信息孤島呈現多維度特性。同時,大數據資源存在過度冗余存儲和數據不一致現象,使數據難以訪問、查詢、處理和分析,不能滿足圖書館大數據閱讀服務的分析和決策需求。其次,眾多的圖書館用戶服務系統分別構建于不同的時期,系統的結構模式、技術標準和管理方法差異性大。且不同系統之間存在集成度低、互聯性差、運行平臺不統一和信息管理分散的特點,嚴重影響了大數據的完整性、精確性、可用性和實時性。第三,圖書館復雜、多樣的管理與服務系統,大幅增加了大數據資源的采集、存儲、挖掘、整合、分析和決策應用難度。

12大數據整合是圖書館提高云服務效率的保證

通過自建私有云或租賃云服務商服務的方式,為讀者提供安全、高效、經濟、快捷的云閱讀服務,已成為圖書館云服務平臺構建的主要模式。

云計算環境下,圖書館通過和云服務商簽署云服務租賃協議的方式,由云服務商借助網絡以按需、易擴展的模式,為圖書館提供所需的云計算服務,圖書館根據服務的內容、質量和云資源使用量支付相應的費用。隨著云計算技術在圖書館管理與服務應用中的深入,云服務成本在圖書館運營總成本占據的比例將不斷上升。因此,如何通過數據整合有效降低大數據資源的數據總量和提高大數據價值密度,已成為關系如何降低圖書館云計算服務總成本和提升云服務收益率的關鍵。其次,在減少大數據存儲冗余度和數據總量的前提下,圖書館還可通過數據整合來增強大數據的關聯性和因果性,以此降低大數據分析過程對云計算平臺性能、云資源和應用實時性的需求。第三,大數據整合也是將云計算技術與讀者需求相整合,將圖書館大數據資源變成大服務資源的重要途徑。

13數據整合是圖書館大數據分析與決策可靠的保證伴隨大數據技術的發展,圖書館對讀者閱讀行為、閱讀模式、社會關系和閱讀活動反饋信息的采集將更加廣泛與深入,將導致大數據的來源和類型復雜化,數據總量也呈現級數激增和價值密度大幅下降的趨勢。同時,大數據的分析過程也會對圖書館技術人員的水平和數據處理平臺性能提出更高要求。因此,如何通過對大數據資源的清洗、集成和整合,不斷增強圖書館大數據資源的價值密度、可用性、可控性和應用經濟性,已成為提升圖書館大數據平臺運營效率和降低平臺運行成本的關鍵。其次,對大數據資源的有效整合,也是關系圖書館完全挖掘、開發大數據價值,精確識別讀者服務需求、個性化特征、閱讀習慣,準確定位讀者大數據服務場景,以及優化配置圖書館大數據服務系統資源的重要因素。第三,圖書館大數據資源具有海量、多源、異構和多類型的特點,而大數據整合過程是降低數據復雜度、消除數據異構性、提取數據價值和發現數據關聯的有效途徑。

14數據整合可消除大數據的分布異構性

為了分擔用戶服務負載和保證讀者閱讀活動的效率、質量、時效性,圖書館通常會根據讀者群分布狀況,在世界不同地域建設若干個子數據中心,依據地理位置就近的原則為讀者提供大數據閱讀服務。在讀者大數據資源的采集中,位于不同地理位置的子數據中心在對大數據的采集、處理、分析和決策中,會由于數據具有較強的地域性面導致大數據的價值、應用效率下降。因此,如何實現位于世界不同地理位置的子數據中心數據資源的整合,是圖書館增強大數據應用整體效率和提升服務總體質量的關鍵。此外,圖書館大數據資源的分布異構性,也是導致數據多樣性、非結構化、數據孤島和數據采集質量等問題突出的根源,而數據整合正是有效解決這些問題的可靠方法和途徑。第三,在長期的圖書館建設與用戶服務過程中,圖書館自身積累、存儲了海量的元數據資源。由于歷史和現實等原因,不同的圖書館子數據中心在元數據的采集、處理、存儲和應用過程中,通常會采用各自不同的元數據標準和軟硬件平臺,會導致元數據在大數據應用過程中存在語義上的異構和互操作性差等問題。

15數據整合是提高大數據閱讀服務質量的保證

大數據時代,圖書館通過監控服務器、網關、嵌入式傳感器、RFID(Radio Frequency Identification,射頻識別)芯片、視頻采集設備和閱讀終端等設備,采集與讀者閱讀活動相關的信息和數據。這些大數據資源主要由文本、圖片、視頻等結構化和非結構化數據組成,并以每年40%的速度增長,是圖書館大數據決策和讀者個性化服務的主要依據[3]。endprint

大數據時代,隨著科技的發展和讀者閱讀需求的提高,圖書館之間的服務競爭已由傳統IT環境下依賴數據中心基礎設施性能、人力資源、數字與紙質圖書資源消耗,轉變為依靠大數據制定圖書館差異化服務戰略,為讀者提供個性化服務的綜合能力競爭。因此,對大數據資源的有效整合,是圖書館減少服務業務質量波動、提升讀者滿意度和增強市場競爭力的保障。此外,服務即時性也是關系讀者閱讀愉悅感的一個重要因素。圖書館可通過對大數據的高效整合,提升大數據分析的實時性和決策即時性,為讀者提供安全、實時、經濟和交互的個性化推送服務。

2圖書館大數據資源整合方案與策略

21圖書館大數據資源整合方案

本文設計的圖書館大數據整合方案如圖1所示。該方案主要由大數據資源層、數據過濾與解析層、數據整合層和數據整合系統反饋控制層等4個功能層組成。大數據資源層主要由圖書館在讀者服務過程中采集的CRM(客戶關系管理)數據、服務系統運營與配置數據、讀者服務過程采集數據和主數據庫組成。這些大數據資源依據數據的采集來源、數據的類型、數據使用途徑和方法、數據訪問頻率等特點,分別存儲在大數據存儲平臺的客戶關系管理數據庫、系統管理數據庫、服務監控數據庫和主數據庫等邏輯數據庫中,為圖書館大數據應用提供數據存儲與管理服務。數據過濾與解析層位于大數據資源層的上層,負責完成對圖書館大數據庫資源的提取、數據類型與正規性檢查、數據的清洗、數據的解析和準備等工作,主要目的為過濾大數據資源層數據的噪音和規范數據類型,不斷提高大數據資源的價值密度和可用性[4]。數據整合層是將臨時數據庫中已進行預清洗與過濾的數據,通過數據源的讀取、數據轉換規則的解析和系統加載,將已轉換的數據寫入主數據庫的3個步驟,才能最終完成圖書館大數據資源的整合。大數據整合系統反饋控制層,通過對大數據分析與決策過程大數據應用有效性的評估,并借助數據整合系統的反饋控制,完成對數據整合層的反饋控制、資源調度和系統優圖1圖書館大數據整合方案設計圖

化,不斷增強數據整合層的運行效率、數據整合可用性和整合過程的可控性。此外,圖書館還應對大數據整合全程實施監控和管理,及時發現、調整、修改和完善數據整合過程中存在的問題與突發事件,保證大數據整合過程安全、高效、經濟、便捷。

22圖書館大數據資源的整合管理策略

221實現數據在采集終端的過濾與整合

圖書館對用戶服務過程和讀者閱讀活動數據的采集,主要是由傳感器、視頻監控器、服務器監控系統、服務器日志采集系統和閱讀終端設備數據采集器等完成,該類設備具有設備類型復雜、數量龐大、數據采集即時和海量、數據傳輸網絡負載壓力大的特點。因此,如何在大數據采集終端完成對所采集數據資源的過濾與整合,是圖書館減少終端采集數據傳輸數量,降低數據沖突和減輕網絡擁塞,提高大數據分析與決策效率、可用性的關鍵。因此,圖書館可對所采集的海量原始數據進行終端過濾、處理和數據整合,去除其中的冗余信息并過濾數據噪音,僅將價值高、可控性強的數據傳輸至大數據庫存儲,實現降低數據源數據采集總量、提升數據價值密度、增強數據可用性和提高數據決策實時性的目標。

222實現圖書館不同業務平臺數據的整合

圖書館管理與用戶服務系統是由讀者管理、用戶服務與應用管理、服務系統配置與運營管理、CRM管理等多個具備獨立功能的子系統組成,系統之間相互獨立且關聯性不強,易導致數據在系統之間流動性差和產生數據孤島現象。因此,圖書館應加強對不同業務平臺系統數據的整合和價值提取。

首先,圖書館在對不同業務平臺數據的整合中,應堅持整合系統支持Oracle、DB2、SQLServer、MySQL、Informix等多數據源類型數據,并且整合系統的程序接口也應支持javaApi、Hibernate數據源和WebService、 SOA等標準的數據,不斷提高數據整合系統對不同業務平臺數據的兼容性[5]。其次,應提升數據整合系統對不同數據平臺數據之間的關聯性挖掘、發現能力,可通過異構系統之間數據的關聯而發現、創造新的數據價值。第三,圖書館不同業務平臺數據具有海量、多結構類型、數據庫存儲結構固定、不易于直接分析和決策的特點。因此,應將數據的ETL(Extract-Transform-Load,數據從來源端經過萃取、轉置和加載至目的端的過程)過程融入不同業務平臺數據的整合中去。應將從不同數據平臺抽取出的數據經過ETL過程,最終按照預先定義好的數據倉庫模型將數據加載到數據倉庫中去,最終提高多平臺數據整合后的可分析、使用和決策特性。

223重點關注與第三方大數據平臺數據的整合

大數據時代,讀者個性化服務由圖書館、云服務提供商、移動通信運營商和相關政府機構等多部門協作提供。圖書館只有實現對多部門數據的全面、高效整合,才能二次發現、提升圖書館大數據資源的價值,才能更加精準地發現讀者需求,才能有效提高圖書館讀者服務綜合收益率。例如,圖書館通過對移動運營商數據的整合與分析,可準確預測出讀者在未來時間的移動路徑和閱讀需求、模式,精確評估出圖書館在未來時段的服務負載和數據網絡傳輸負荷,可有針對性地制定出服務資源調度和數據傳輸網絡管理策略,確保在未來時段不會因為讀者需求的快速增長,而導致系統服務資源、網絡傳輸效率、用戶QOS(服務質量)和讀者閱讀活動滿意度等指標大幅下降[6]。其次,圖書館應在保證政府數據安全、可用的前提下,加強與政府公共大數據資源的開放、共享和整合力度,進一步提高圖書館大數據庫資源的完整性、可用性和價值量,為圖書館建設和用戶服務提供宏觀層面上的大數據服務支持。第三,在圖書館大數據資源與第三方數據整合中,存在著各部門業務結構相對獨立、數據所有權歸屬、數據接口復雜和數據交換頻繁的問題。因此,圖書館與第三方的數據整合,不僅要滿足當前各方數據庫特性、數據端口標準、大數據應用與決策的需求,還應從長遠發展考慮,重點加強多方大數據集成的系統架構、數據整合能力和所采用整合技術等方面的建設。endprint

224實現大數據的安全、高效整合

圖書館大數據整合過程的安全管理,是關系讀者個人隱私保護、圖書館管理與服務數據安全、第三方共享大數據資源可用和政府公共數據可控的重要保證。首先,圖書館應依據國家相關法律制定安全的大數據存儲與整合策略,在堅持數據完全整合和數據價值二次挖掘、發現的前提下,保護好讀者隱私和讀者大數據閱讀服務安全。此外,不能因為多方大數據資源的完全整合,而影響第三方服務商、政府等部門大數據資源的開放性、可用性和可控性。其次,圖書館應加強對大數據整合IT基礎架構系統的安全建設與管理。同時,應依據大數據整合生命周期發展規律,做好大數據平臺設備的安全管理和數據存儲工作,嚴格控制大數據整合風險,確保不會因數據整合而影響圖書館業務的連續性和可持續發展性[7]。第三,圖書館大數據整合應重點做好數據整合與數據集中存儲、整合系統的可擴展與易維護、整合過程的安全與可靠性、整合過程的經濟性與成本可控性管理等4個方面的工作,保證大數據整合過程安全、高效、經濟和便捷。

3結語

對大數據資源的過濾和整合,是圖書館對大數據資源價值進行二次挖掘、發現和創造的重要方式,也是圖書館增強大數據資源價值密度、提高決策科學性和提升讀者閱讀滿意度的重要途徑。在大數據資源的整合中,圖書館應采取數據層面的整合、信息層面的整合、知識層面的整合三步走原則,堅持統一數據庫、統一整合程序、統一IT基礎設施資源、統一數據傳輸網絡平臺、統一技術管理人員的做法,努力降低大數據的整合成本、IT基礎設施硬件管理與使用成本、數據整合過程復雜度,才能保證圖書館大數據整合過程安全、高效、實時和經濟,才能提高大數據資源的價值總量、密度、可用性和可控性,才能為讀者大數據閱讀服務提供可靠的大數據決策支持。

參考文獻

王元卓,靳小龍,程學旗.網絡大數據:現狀與展望[J].計算機學報,2013,36(6):1125-1138.

姜山,王剛.大數據對圖書館的啟示[J].圖書館工作與研究,2013,(4):52-54,79.

[3]康健,左憲章,唐力偉,等.無線傳感器網絡數據融合技術.計算機科學,2010,37(4):31-35.

[4]史久根,張加廣.基于壓縮感知的無線傳感器網絡數據融合算法[J].計算機系統應用,2014,23(10):178-182.

[5]張杰,胡一兵,李亮,等.多傳感器數據融合技術應用研究[J].測試技術學報,2013,27(6):490-495.

[6]歐石燕,胡珊,張帥.本體與關聯數據驅動的圖書館信息資源語義整合方法及其測評[J].圖書情報工作,2014,58(2):5-13.

[7]吳,謝樹泉,王春枝.基于語義的隧聯網數據整合方法[J].智能系統學報,2014,9(6):209-213.

(本文責任編輯:馬卓)endprint

猜你喜歡
大數據圖書館
圖書館
文苑(2019年20期)2019-11-16 08:52:12
時間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
圖書館里的是是非非
去圖書館
主站蜘蛛池模板: 亚洲国产日韩在线成人蜜芽| 免费无遮挡AV| yy6080理论大片一级久久| 毛片在线播放a| 99一级毛片| 久久青草精品一区二区三区| 久久久久国色AV免费观看性色| 亚洲AⅤ无码国产精品| 91亚瑟视频| 久久成人国产精品免费软件 | 丁香六月综合网| 国产在线精品人成导航| 国产成人午夜福利免费无码r| 国产午夜福利在线小视频| 国产精品一区不卡| 青青青伊人色综合久久| 国产在线欧美| 日韩欧美国产成人| 992tv国产人成在线观看| 亚洲精品欧美重口| 操国产美女| 亚洲中文字幕97久久精品少妇| 特级精品毛片免费观看| 久久国产拍爱| 在线国产三级| 大学生久久香蕉国产线观看| 日韩在线影院| 亚洲男人在线| 国产视频 第一页| 欧美福利在线| 日韩在线中文| 福利在线不卡| 国产精品xxx| 欧美日韩一区二区在线免费观看| 亚洲成在线观看| 国产美女91视频| 国产亚洲精品自在线| 亚洲无限乱码| a级毛片网| 午夜天堂视频| 91色在线观看| 美女国内精品自产拍在线播放| 亚洲欧洲日韩综合| 亚洲AV无码乱码在线观看裸奔| 久久久久国产一级毛片高清板| 国产日韩欧美精品区性色| 97国产在线观看| 99精品在线看| 国产资源免费观看| 亚洲V日韩V无码一区二区| 在线视频精品一区| 欧美日韩理论| 国产在线98福利播放视频免费| 极品av一区二区| 精品伊人久久久久7777人| 91麻豆国产视频| 欧美成人h精品网站| 在线免费看片a| 丁香婷婷综合激情| 91精品专区国产盗摄| 99这里只有精品免费视频| 亚洲青涩在线| 亚洲无线视频| 色丁丁毛片在线观看| 91网址在线播放| 黄色网址免费在线| 亚洲色图欧美激情| 久久综合成人| 久久婷婷六月| 日韩欧美91| 欧美一道本| 欧美精品色视频| 国产亚洲男人的天堂在线观看| 亚洲熟女偷拍| 亚洲第一天堂无码专区| 在线精品亚洲国产| 国模私拍一区二区| 999精品色在线观看| 免费国产好深啊好涨好硬视频| 青青草国产免费国产| 国产真实自在自线免费精品| 国产在线日本|