999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代數字化圖書館建設探究

2015-02-13 02:43:05中國科學院武漢文獻情報中心武漢430071湖北省科學圖書館武漢430071
圖書館理論與實踐 2015年1期
關鍵詞:大數據

●李 艷,李 瓏(1.中國科學院武漢文獻情報中心,武漢 430071;2.湖北省科學圖書館,武漢 430071)

大數據時代數字化圖書館建設探究

●李艷1,2,李瓏1,2
(1.中國科學院武漢文獻情報中心,武漢430071;2.湖北省科學圖書館,武漢430071)

[關鍵詞]大數據;數字化圖書館;資源整合;資源開放

[摘要]對大數據時代數字化圖書館的特點、現狀與不足進行分析,重點探討下一代數字化圖書館建設的核心技術和管理系統發展趨勢,最后對圖書館中資源整合及資源開放問題進行了剖析和思考。

1 大數據時代數字化圖書館的特點及不足

1.1大數據概述

大數據是結構化、半結構化和非結構化數據的集合。大數據的概念最早由麥肯錫公司發布的《大數據:創新、競爭和生產力的下一個前沿領域》報告[1]提出。大數據并非是對數據量大小的描述,而是基于對龐大、多樣的數據種類中快速抽取數據信息的闡述。[2]大數據的特性可用“V+C”的模型進行概括:①多樣化(Variety),包含以事務為代表的結構化數據,以網頁html、xml為代表的半結構化數據,以語音、視頻為代表的非結構化數據,類型呈現出多樣性;②海量性(Volume),數據基數(TB級)大且增量快(GB級);③快速性(Velocity),數據增長快,處理也要快,一部分數據具有時效性;④靈活性(Vitality),數據更新快,需要靈活的分析數據和構建處理模型;⑤準確性(Veracity),基于目標數據進行準備的分析及挖掘;⑥復雜性(Complexity),基于大數據上述的5V特性,對大數據的分析和處理難度和復雜度不斷增加,對目標數據的抽取,產生新的業務模式。

傳統的數字化圖書館數據構成主要以結構化和半結構化數據為主。

伴隨著圖書館用戶日益增強的“個性化”需求,以辦公文檔、文本、圖片、XML、HTML、報表、圖像和音頻/視頻信息等作為主要傳播介質的非結構化數據在數字化圖書館數據資源中的比例逐漸增大。據2011年IDC企業外部存儲市場季度跟蹤報告顯示,預

計到2020年全球數據將達到35ZB,這個數據是2010數據的29倍之多。[2]其中,90%以上均是半結構化和非結構化數據。作為國內圖書館中規模、信息量最大的中國國家圖書館,僅視頻等非結構數據存儲量就將達到800~900TB左右。[3,4]目前,數字化圖書館的發展將與大數據緊密掛鉤,多樣的信息數據類型和龐大的數據增長趨勢將給下一代數字化圖書館的建設帶來更多的挑戰與思考。

1.2數字化圖書館的建設現狀及存在的不足

1.2.1建設現狀

現階段我國數字化圖書館的建設成果較過去有了很大的進步。在如下方面表現出更多的優勢:首先,伴隨著web2.0時代用戶需求的轉變和圖書館應用資源的豐富,數字化圖書館構建出基于資源共享的公共服務平臺,并能夠集館藏、資源、服務與人于一體,為用戶定制個性化的需求,實現用戶個性信息的實時推送;其次,數字化圖書館為構建嵌入式學科服務、地區/區域特色一體化體系提供了保障,為用戶的知識咨詢[5]提供了平臺;再次,作為一種基礎公共服務平臺,為數據資源的數字化,多媒體信息的轉儲、檢索等多種應用資源的整合和信息的推廣、資源的合理布局與共享提供了基礎。

1.2.2存在的不足

(1)自身建設發展的不足(內因)。①缺乏對海量數據的深加工處理與管理服務。②數字資源的深層次開發亟待提升。對現有數據的實時采集、分析、挖掘、組織、存儲以及新業務模式的開發做得不夠。③對非結構化數據的持久化處理和決策數據的提煉與歸類待提升。④利用大數據分析、預測和智能輔助決策技術構建知識服務體系和風險評估模型方面技術差距待提升。⑤大數據中不同類別、屬性、顆粒度、重要度的數據,結合低碳環保的政策,在實現備份、存儲、傳輸、復原等方面,構建數據中心的實施技術有待提升。⑥對大數據的安全保護、加密保護、知識產權保護有待提升。

(2)外部因素的制約和影響(外因)。①帶寬資源不足。帶寬是NetApp對大數據定義的三大要素之一。高帶寬指的是高速處理關鍵數據,以支持快速有效的消化和處理大型數據,是用戶數據通信的基礎條件。[2,6]國家信息中心發布的《沖出迷霧:中國信息社會測評報告(2013)》顯示,2012年中國信息社會指數(ISI)達到0.4391,比2010年提高了17%;盡管我國寬帶普及率大大提升,但網速仍然明顯落后于全球平均水平。[7]帶寬資源的不足阻礙了數字化圖書館的應用和發展。②“數據孤島”的存在。館與館、系統與系統內的信息關聯,同類系統間形成“數據孤島”,一定程度上影響了資源的共享和利用,阻礙了數字化圖書館的建設與發展。③對非結構化的靜態與動態數據的價值分析不夠,人力、物力等發展張力的投入回報方面的認識不夠。[8]

2 下一代數字化圖書館的建設和發展思考

下一代數字化圖書館的建設與發展將承載計算機技術和網絡技術的大躍進步伐,依托云平臺、智能算法(智能數據挖掘和知識發現)、無線傳感等新技術,實現真正意義上的“數字化”。下一代數字化圖書館建設的重心將圍繞下一代網絡、智能服務[9]和大數據幾個重要方面,對核心技術、管理系統、資源整合和資源開放方面提出更高的要求。

2.1下一代數字化圖書館核心技術的發展

2.1.1平臺架構

下一代數字化圖書館的平臺將依賴于面向服務的體系架構(Service Oriented Architecture, SOA)和云平臺架構。[10]SOA架構最大的特點在于可以對離散耦合的系統、組件實現互連,完成分布式的部署、組合及使用。SOA架構將作為一種跨組件、跨平臺的架構標準,為下一代數字化圖書館多系統之間的跨平臺、互操作,甚至是大數據間的分布式共享提供基礎。同時,在SOA框架下,工作任務和個性化的業務流之間可以靈活的組合、拆分或耦合,實現信息資源或服務的合理化配置,上述條件為下一代數字化圖書館的系統模塊的整合、調整以及平滑擴展,甚至是不同顆粒度介質間的無縫銜接提供了必要的保障。云平臺是云計算和云服務的技術基礎,云計算和云服務將是下一代圖書館系統應用的基石。云平臺的典型架構是三層架構,即硬件-操作系統-軟件接口。

云計算和云服務為應用虛擬化、桌面虛擬化、移動虛擬化、服務器虛擬化、存儲虛擬化、網絡虛擬化等技術在下一代數字化圖書館中高性能的管理和調度資源起到了巨大的作用。[11,12]虛擬化突破了傳統物理機的局限性,能夠使CPU、內存、磁盤、I/O等硬件變成動態管理的“資源池”,所有的底層硬件資源能夠根據需要合理化的調度甚至實現系統的“漂移”;云架構中間層通過類Cisco的數據中心虛擬化的vPC技術,將資源中心和網絡中心分開管理。同時,將多臺設備利用VRRP技術虛擬為一個網關地址(即可以認為虛擬為一臺設備),一方面利于保證數據中心域

的安全和穩定,另一方面利于網絡域實現跨設備的端口聚合并增加了鏈路帶寬。下一代數字化圖書館的建設目標將實現“單一配置結構適合所有客戶的多承租人架構”。[13]基于云架構的數字化圖書館平臺的最大優點在于:在云架構頂層構建大型分布式的資源、服務共享的數字化圖書館網絡,對其資源和服務進行整合,并形成“云管理、云調度”的自適應新型服務體系。本地數字化圖書館一方面可以通過大云平臺提供各類服務;另一方面,可以主動利用大云平臺資源和服務來補充本地數字化的不足。SOA為各類系統提供標準的API接口,借助其標準實現分布式圖書館之間各種服務的動態管理和分配,實現館際透明地協作和服務獲取,更好地支持多館間的合作和資源共建,達到真正意義上的資源、服務的“趨公平共享化”。

2.1.2下一代數字化圖書館管理系統的發展

下一代數字化圖書館的管理重心將定位于以主動的知識發現和智能啟發滿足用戶需求來實現服務價值。管理的目標將是實現統一且規范的數據標準、數據管理和整合服務。[13]發展的方向主要包括以下10個方面。

(1)用戶的啟發式檢索。啟發式檢索需要對用戶關注的信息、用戶的研究方向和興趣愛好進行知識發現與智能分析,確定上述數據中有效、新穎、潛在有用的個性化數據,將用戶經常關注的“低層數據”轉化為高層知識,給出先驗的判斷后進行合理的信息推送,實現用戶的無感知檢索。

(2)多種復合系統資源高度集成與整合。原本數字化圖書館中的數據體系就龐大且結構多樣,將復合系統資源通過SOA進行集成,縮小系統間的無縫化管理,實現結構化、半結構化和非結構化數據的合理整合將顯得尤為重要。

(3)大數據的關聯支持。大數據中很大一類非結構化數據本身無關聯性。在做數據分析和處理時存在較多困難。利用分布式數據庫進行語義的流式推理,通過語義鏈接,支持資源描述框架(resource description framework, RDF)數據的處理,為大數據的術語和屬性進行資源命名、建模,實現詞表映射,同時進行規范控制,通過發布或復用領域本體,為各類實體建立起本體聯系,進而大數據實現關聯支持。[14]

(4)云架構管理。云架構是下一代數字化圖書館發展的基礎框架和核心技術,合理且健壯的云架構設計將成為圖書館管理系統發展的關鍵條件。

(5)多種資源發現系統的交互操作。下一代圖書館的各類資源系統需要基于SOA框架開發,提供統一開放的API和標準協議,才能實現系統間的無縫集成和漫游管理。

(6)資源描述和檢索(resource description and access, RDA)標準。RDA將支持圖書館編目記錄與其他元數據領域所創建的編目記錄之間的整合,使得圖書館記錄能以新的方式被利用。[15]

(7)智能終端的移動App應用。移動終端的普及為下一代數字化圖書館的發展帶來了契機。電子資源和數字化圖書館服務可以全面移植到終端上,除了原有的借閱、查詢等功能外,移動終端更是增加諸如應用拍照、二維碼掃描、手機支付、推送提醒和短信通知等豐富的用戶體驗功能,為數字化圖書館的普及提供更多便利。

(8)IPv6或v4/v6雙棧網絡的應用。IPv6地址多,且具有較好的流媒體傳輸支持、組播功能、QoS (Quality of Service)和較高的安全性。IPv6或v4/v6雙棧網絡的應用,在節省公共帶寬的同時,也為數字化圖書館的應用推廣起到推波助瀾的作用。

(9)智能的信息推送和用戶互動體驗。下一代數字化圖書館的服務將不再是被動的服務模式,而是通過主動的智能啟發來滿足用戶需求。圖書館既是一種知識庫,也是用戶互動的平臺,它能夠根據用戶的研究方向、興趣愛好等信息推送相關的信息資源。

(10)大容量數據的安全存儲。下一代數字化圖書館的數據將以每月TB的速度增長,光存儲將逐漸成為數字化圖書館的數據存儲介質。其主要特點表現在:首先,光存儲對數據存儲本身而言具備離線存儲功能,與現代硬盤相比數據量更加穩定,不易遭到破壞與攻擊;其次,與下一代數字化圖書館的部署大數據戰略能夠完美的整合。[4]

2.2下一代數字化圖書館中資源整合和資源開放的思考

伴隨高校和社會電子資源公共基礎服務平臺的發展和開放,校際與校際之間、校際和社會電子資源公共服務平臺之間可以構筑LinL(即LAN in LAN,每個高校或社會電子資源平臺原本是一個獨立的局域網,LAN)。一方面,將多個LAN打通,形成多單元互聯,逐步構建基于市與市網的LinL,基于省與省網的LinL,可以實現將局部資源整合到大型局域網(Big LAN, BLAN)中。這種模式的推廣和應用,能夠全面的將發達地區、發展中地區和落后地區的電子資源進行全局整合及分布式共享,讓電子資源得以合理化的利用;并且基于區域特點的特色電子資源能夠更好的

得以傳播和推廣。另一方面,在LinL的框架模式下,可以有效地降低電子化資源建設及維護成本。在BLAN中部分關鍵節點,可以考慮構建域網緩存節點(iCache),實現數據的智能緩存共享與分發,這種方式將有效減少BLAN出口帶寬的消耗,實現電子資源服務器間的負載均衡。同時,滿足用戶與iCache服務器間的分布式通信及資源請求。更進一步說,通過新型的知識服務引擎和知識發現技術,智能地實現將與用戶的研究方向、興趣愛好等信息相近的電子資源進行無感知推送和一站式導航服務,并結合新一代的統一通信平臺技術,為實現新型的知識服務社區實體和豐富的用戶體驗提供了基礎。同時,下一代數字化圖書館將從現有的IPv4或IPv4/v6雙棧網絡逐步向IPv6架構發展,構建基于IPv6網絡的數字化圖書館平臺,大幅提高系統資源到用戶層間的數據吞吐,使電子資源的分布式管理優勢更加明顯,尤其是非結構化數據資源(例如:Web網中的流媒體數據、圖片、異構腳本等)將具有性能更優的傳輸效果和更高的安全性。

大數據作為圖書館電子資源的數據基礎,合理的采集、分析、挖掘、重組過程,將會為后期的智能語義分析、資源聚合、啟發式檢索,甚至是用戶的無感知信息服務提供必要的保障。構建健壯、跨平臺、安全、互動的數字化圖書館系統將成為“云圖書館”建設和發展的重點內容。

[參考文獻]

[1]Big data:The next frontier for innovation,competition,andproductivity[EB/OL].[2014-05-17].http//www. mckinsey.com/Insights/MGI/Research/Technology_and_Inn ovation/Big_data_The_next_frontier_for_innovation.

[2]韓翠峰.大數據帶給圖書館的影響與挑戰[J].圖書與情報,2012(5):37-40.

[3]于洪波.大容量存儲技術和目前面臨的問題[EB/OL].[2012-11-28].http://news.chinabyte. com/211/12477711.shtml.

[4]于洪波.大數據時代下的數字圖書館[EB/OL]. [2012-12-21].http://info.chinabyte.com/203/12493 703.shtml.

[5]王天泥.知識咨詢:大數據時代圖書館的知識服務增長點[J].圖書與情報,2013(2):74-77.

[6]NetApp.Big data solutions for government[EB/OL]. [2012-12-21].http://economy.gmw.cn/201309/04/content_8791595.htm.

[7]我國網速仍落后于全球平均水平[EB/OL].[2013-09-04]. http://www.netapp.com/us/solutions/industry/gov ernment/bigdata.html.

[8]樊偉紅,等.圖書館需要怎樣的“大數據”[J].圖書館雜志, 2012, 31(11):63-68,77.

[9]周杰,等.下一代數字圖書館的發展思考[J].圖書情報工作, 2013, 57(8):35-39.

[10]殷紅,劉偉.新一代圖書館服務系統:功能評價與愿景展望[J].中國圖書館學報, 2013,39 (5):26-33.

[11]陳臣.云計算環境下數字圖書館高性能虛擬化資源管理與調度策略[J].圖書館理論與實踐, 2013(7): 82-85.

[12]陳臣.基于云計算的數字圖書館虛擬化平臺的可信管理策略研究[J].圖書館理論與實踐, 2013, (8):82-85.

[13]包凌,趙以安.國外下一代圖書館自動化系統的實踐與發展趨勢研究[J].圖書館學研究, 2013(9):59-65.

[14]劉煒,等.大數據與關聯數據:正在到來的數據技術革命[J].現代圖書情報技術, 2013, 232 (4):2-9.

[15]Resource description and access:the cataloguing standard for the 21st century[EB/OL].[2014-03-10].http://www.bengu.cn/homepage/library/rda_broch ure_v4_chinese.htm.

[收稿日期]2014-06-09 [責任編輯]李海燕

[作者簡介]李艷(1982-),女,碩士研究生,中國科學院武漢文獻情報中心館員,研究方向:科技檢索與查新;李瓏(1965-),女,湖北省科學圖書館副研究員,研究方向:科技檢索與查新。

[文章編號]1005-8214(2015)01-0081-04

[文獻標志碼]A

[中圖分類號]G250.76

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 欧美日韩亚洲国产主播第一区| 国产精品亚洲综合久久小说| a级毛片一区二区免费视频| 免费黄色国产视频| 一本大道AV人久久综合| 98精品全国免费观看视频| 人妻出轨无码中文一区二区| 国产在线麻豆波多野结衣| 国产理论精品| 91成人免费观看| 亚洲天堂777| 亚洲最新在线| 亚洲h视频在线| 久久久久人妻一区精品| 人妻熟妇日韩AV在线播放| 国产精品久久久久无码网站| 久久99热66这里只有精品一| 日韩不卡免费视频| 青青热久免费精品视频6| 精品国产欧美精品v| 99久久亚洲综合精品TS| 综合色区亚洲熟妇在线| 国产亚洲高清在线精品99| 91无码人妻精品一区二区蜜桃| 国产亚洲日韩av在线| 白浆免费视频国产精品视频 | 久草热视频在线| 日韩欧美网址| 国产福利影院在线观看| 特级aaaaaaaaa毛片免费视频 | 亚洲AV无码乱码在线观看裸奔 | 国产成人精品日本亚洲77美色| 自慰网址在线观看| 天堂网亚洲综合在线| 久久6免费视频| 尤物亚洲最大AV无码网站| 91福利免费| 国产美女精品人人做人人爽| 国产精品视频观看裸模| 亚洲中文字幕国产av| 手机精品视频在线观看免费| 九九线精品视频在线观看| 国产亚洲美日韩AV中文字幕无码成人 | 青青国产成人免费精品视频| 亚洲一区二区成人| 国产精品蜜臀| 国产美女在线免费观看| 国产精品综合色区在线观看| 国产成人凹凸视频在线| 国产成人乱码一区二区三区在线| 久久久久九九精品影院| 欧美不卡视频一区发布| 三上悠亚在线精品二区| 欧美第二区| 永久免费无码成人网站| 欧美v在线| 亚洲国产看片基地久久1024| 国产毛片片精品天天看视频| 97影院午夜在线观看视频| 久久综合AV免费观看| 亚洲国产成人久久77| 日本人真淫视频一区二区三区 | 中文字幕66页| 国产高潮流白浆视频| 中文字幕乱码中文乱码51精品| 亚洲色图欧美激情| 亚洲国产中文欧美在线人成大黄瓜| 人妻精品全国免费视频| 日本高清成本人视频一区| 中文字幕啪啪| 日韩a级毛片| 91福利在线观看视频| 亚洲成年人网| 九色视频线上播放| 精品国产免费观看| 亚洲Av综合日韩精品久久久| 成人午夜视频在线| 亚洲视频无码| 国产三级a| 亚洲无码A视频在线| 色偷偷av男人的天堂不卡| 欧美性猛交一区二区三区|