999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

云環境下館際協同數據挖掘研究*

2016-08-26 07:24:41維田瑞雪
圖書館學刊 2016年7期
關鍵詞:數據挖掘圖書館資源

唐 維田瑞雪

(1.遼寧大學圖書館;2.遼寧大學歷史學院,遼寧 沈陽 110036)

云環境下館際協同數據挖掘研究*

唐維1田瑞雪2

(1.遼寧大學圖書館;2.遼寧大學歷史學院,遼寧 沈陽 110036)

[摘要]云計算、大數據環境下,圖書館間的協同發展已不滿足基于館藏資源的基礎業務合作,正主動尋求在知識化、智能化、個性化等方面服務的拓展。鑒于云計算環境下圖書館大數據的采集、存儲、處理等優勢和現有館際間協同數據挖掘應用研究的現狀,分析了館際聯盟內在業務數據、用戶行為數據、科研數據等方面協同數據挖掘的發展趨勢,并提出館際間協同數據挖掘的體系架構,以期提升館際聯盟的核心競爭力。

[關鍵詞]云計算數據挖掘大數據館際聯盟

1 引言

隨著資源建設和服務創新的愈演愈烈,云計算、大數據等新興技術早已經從理念引進深入到圖書館領域的實際應用。而用戶日益增長的多元化需求、業務數據的快速增長等因素促使著圖書館界努力突破傳統管理與服務的模式局限,由館藏為核心的業務管理模式升級為以用戶為核心的決策與服務。越來越多的圖書館意識到繁雜數據中所蘊含的知識將成為未來發展的核心資產,開始注重業務數據的整理與分析,在數據資源利用方面尋求聯盟化的合作化發展路徑,逐漸有更多的應用服務通過館際間合作方式來實現。同時,云計算技術的成熟應用也為館際聯盟內部數據資源的共享與協作帶來新的合作契機,云計算環境下如何充分運用數據挖掘技術開展服務和管理創新,將是大數據時代下館際聯盟所面臨的嶄新課題。

云計算技術的普及運用、大數據分析技術與工具的成熟共同為圖書館的智能化發展提供了新的方法和思路。由于云計算環境從本質上是通過動態可伸縮的虛擬化資源池提供存儲和計算服務的一種互聯網絡環境,所以云環境下館際間進行協同數據挖掘的優勢在于:①云計算環境是采用數據冗余的方式來對數據進行管理和分析服務,有利于整合管理館際聯盟內部分布式、異構性的復雜數據;②云計算環境相對于傳統IT環境具有更高的可用性,有利于館際間數據的高效流通和實時分析,進而達到精準把握用戶需求的效果;③云計算技術與數據挖掘技術的融合運用可為圖書館服務的個性化、虛擬化和智能化提供良好的技術支持,有利于提高館際間的協同服務深度和廣度;④云計算平臺的搭建可有效降低館際聯盟投入的經費成本和能耗,有利于實現成本可控、技術可控的目標,擁有更好的經濟性。

2 國內外相關研究和實踐

國外圖書館界首先對基于云計算的數據挖掘工作進行了拓展性的探索,并將云環境下的數據挖掘應用視為一種網絡IT資源的服務模式。學者R.Roussean[1]和S.Corral[2]等提出,圖書館可以也應當在數據管理、數據挖掘、知識發現等大數據相關領域承擔責任并發揮作用,致力于對數據挖掘算法的改善、數據挖掘的體系架構和解決方案等方面進行研究實踐。

早在2009年OCLC(聯機計算機圖書館中心)就在原始的Worldcat上應用云計算技術實施數字圖書館,開始推出WorldCat Discovery[3]服務——全新的基于云環境的應用程序,集成其所有成員圖書館的數字館藏供用戶檢索,并與美國國會圖書館、康奈爾大學圖書館等7所知名圖書館展開基于用戶身份信息的關聯數據方面的合作,探討關聯數據對圖書館業務流程的影響,研究基于用戶需求和興趣的圖書推薦系統[4]。哈弗大學圖書館的各個分館統一在開發利用書目大數據的基礎上聯合研發新型應用性產品,包括云計算支持下的數據共享、用戶數據分析、書目推薦等實踐[5]。美國加州的Hiptype公司利用數據挖掘技術來分析電子書用戶的閱讀喜好,構建了一種知識服務社區的Web智能分析引擎[6]。

國內圖書館界基于云計算的數據挖掘應用研究也正方興未艾。同OCLC的做法類似,CALIS(中國高等教育文獻保障系統)也采取了聯合高等學校圖書館資源來構建云計算體系的運行模式,倡導透明的館際協作與服務獲取,支持各館用戶的聚合參與,構建館際間緊密協作的社會化網絡,實現館際聯盟內資源的共建與共享。上海地區圖書館聯合體建設中,利用數據可視化方法展現圖書館聯合體的大數據資源,藉此進行智慧型數據創新服務實踐,并幫助圖書館洞察運營情況和未來發展趨勢[7]。清華大學圖書館門戶在“水木搜索”上綜合運用多種來源數據,從數據集成和挖掘數據價值等方面進行了嘗試,從元數據倉儲中提取關鍵詞走向,分析作者與合作者的關系,建立以人為中心的知識關聯網絡[8]。

綜上,國內外圖書館界對于云計算和數據挖掘的應用研究均取得了一定進展,但對云計算環境下館際間數據挖掘的發展趨勢、體系架構方面的研究尚未系統。

3 館際間數據協同挖掘趨勢分析

云計算、大數據、互聯網等技術成為圖書館界最近10年發展的重要驅動力量。現今環境下,基于互動性、共享性、開放性的新媒體圖書館協同服務模式將徹底轉變用戶獲取知識和利用資源的方式,各圖書館面對資源優勢被弱化的現實,努力從傳統知識服務向數據發現、數據挖掘方向轉型。而館際間的合作也不僅局限于館藏資源,快速增長的業務數據、用戶行為數據、科研數據等都將為圖書館間協同合作提供有利契機。圖書館界也正努力尋找新的突破點,由單體館的數據分析轉向跨館際的聯盟體系下的協同數據挖掘,以把握大數據帶來的發展機遇,越來越多的業務將依托于館際間的協同數據挖掘分析來實現。

3.1基于業務數據的挖掘趨勢

圖書館的業務數據涵蓋了各類資源的采訪、編目、典藏、流通、傳遞、咨詢、管理等數據,這些繁雜的業務數據中所蘊藏的規律在理論上可反映出一個圖書館自身的業務流程和管理決策方面的特征。例如,通過對各類資源采訪、典藏數據的挖掘分析,可獲知當前圖書館在資源建設過程中的側重方向;通過對各類資源流通等數據的挖掘分析,可評價當前各類資源的利用效率;通過對傳遞、咨詢等數據的挖掘分析,可了解圖書館當前亟需補充的資源;通過各類資源的管理數據,可明確各圖書館當前的工作重點和發展規劃。

圖書館際間進行協同業務數據挖掘,顯著的優勢是能夠集合更豐富、更全面的業務數據,并節約各圖書館的IT資源投入成本。所獲得的知識,不僅可以優化、指導各圖書館的資源建設和業務工作,還能夠展示各圖書館的業務特色,為各圖書館的統籌規劃和發展決策提供數據依據。

3.2基于用戶行為數據的挖掘趨勢

圖書館的用戶行為數據通常包括借閱歷史數據、檢索瀏覽數據、資源下載數據、評論與反饋數據等。隨著互聯網和新媒體技術的發展,各圖書館所擁有的用戶同時持續地生產、消費和傳播著海量且多樣化的異構數據。如能及時有效地跟蹤、分析和洞察用戶行為數據中所蘊藏的知識,即可把握用戶的借閱規律、研究興趣,精準定位用戶個性化需求,有針對性地提升用戶體驗。

云計算環境下用戶行為數據的極大豐富以及大數據處理技術的成熟發展,以用戶為中心的個性化服務不斷推進,基于各圖書館間用戶行為數據的統籌分析挖掘,使得向用戶推送富有個性化的借閱推薦或相似資源成為可能,用戶不僅可以享受“淘寶式”的閱讀體驗,還能夠實時發現自身潛在的知識需求。例如,基于用戶借閱行為特征可以進行用戶群體的聚類分析,為具有不同需求的用戶群體提供差異化服務;通過對具有類似閱讀興趣或偏好的用戶推送相似用戶信息,擴展用戶的興趣圈和學習圈;甚至構建“資源-用戶”或“用戶-資源”數據挖掘模型,從用戶角度為其推薦最適合的資源,同時也從資源利用的角度為其尋找可能的用戶,使各圖書館的資源得到最充分的利用。

3.3基于科研數據的挖掘趨勢

伴隨著科學研究和學術交流環境的變化,更多的科研活動需要通過相互間協作來完成,并且國際化合作逐漸成為當前科學研究的主要發展趨勢。圖書館歷來都是海量科研數據的擁有者和保存者,針對論文數據、專利數據、科學數據等的挖掘協作,既可迎合科研用戶個人分析評價的外在需求,也成為各圖書館為決策機構提供科學參考的自身發展需求。國內外的圖書館在此趨勢下已經進行了一些有益嘗試。比如由康奈爾大學圖書館聯合美國7所大學圖書館協作建設的全美科學家網絡(VIVO web[9]),從各機構的管理系統中挖掘課程設置、學術出版、基金項目、實驗與研究條件等科研信息,并利用科學地圖(Map of Science)、合作者網絡(Co-Author Network)等欄目為用戶創造了在線交流和創建更新個人簡歷等便利條件,為科學家的合作研究提供支持。國內的清華大學圖書館已率先基于大數據環境開展科研數據挖掘的創新實踐,通過“微數據”挖掘,精確分析個人科研數據,圍繞學者建立知識關聯網絡數據庫——清華大學學者庫[10]。

4 云環境下館際協同數據挖掘體系架構

云環境下館際聯盟內數據增長迅速、類型復雜多樣,非結構化數據大量涌現,傳統的圖書館自動化管理系統在數據存儲方式和處理技術方面難以滿足大數據處理和應用的需求。為了使館際聯盟內的協同數據挖掘成為可能,筆者基于云計算環境角度提出館際間協同數據挖掘體系架構,如圖1所示。

4.1基礎設施層

基礎設施層是將各種物理資源接入到網絡,利用虛擬化技術,實現物理資源的互聯和共享,不僅需要整合數據挖掘服務所需的計算資源,并且還應提供具有可靠安全、低成本、易擴展等優勢的分布式云存儲。

圖1 云環境下館際間協同數據挖掘體系架構

4.2數據處理層

鑒于云環境下圖書館間數據協同處理過程的復雜程度,同時對于數據處理的時效性要求,利用分布式計算編程開發框架進行大數據處理成為最佳選擇。例如,可運用MapReduce編程技術將傳統的數據查詢、數據管理及數據分析等任務進行分布式處理,可以將數據處理任務調配到最優的處理節點,并能在不同處理節點之間靈活地調度處理任務以及參與處理的數據,同時擁有較強的并行處理能力,實現計算資源和存儲資源配置的最優化,能有效提高館際間數據處理速度。

4.3數據分析層

有效解決館際間大數據存儲和處理問題之后,獲取海量數據中隱藏的知識是大數據處理、分析和服務的終極目標。面對館際間實時、動態和非結構化等特征的大規模數據,云計算的彈性擴展優勢成為大數據分析的理想環境。而Hadoop是目前較為成熟的大數據處理及分析平臺,被定位成一個能夠對海量數據進行分布式存儲與計算的軟件框架,可應對關聯數據、Web瀏覽數據、社交網絡數據等結構或非結構化數據的分析處理,借助Hadoop平臺及相應的數據挖掘算法模型可實現圖書館際間大規模的結構或非結構化的數據挖掘分析。

4.4應用服務層

應用服務層通常包括應用接口和應用服務兩部分功能。應用接口負責面向用戶的認證、管理、任務提交以及任務結果的返回等服務。應用服務為不同的訪問介質提供了不同的訪問接口,使用戶可以通過門戶網站、移動終端或其他專用終端等,訪問和利用云數據挖掘服務。

5 結語

云計算環境下,館際聯盟內的合作內容已不再滿足基于館藏資源的基礎業務,正主動尋求在知識化、智能化、個性化等方面服務功能的拓展協作。筆者鑒于現有館際間協同數據挖掘應用研究的現狀和云計算環境下圖書館大數據的采集、存儲、處理等優勢,分析了館際聯盟內協同數據挖掘的主要發展趨勢,提出館際間協同數據挖掘的體系結構,以加強館際聯盟內業務數據、用戶行為數據、科研數據等方面挖掘協作,積極創新館際聯盟的協同發展模式,從而提升館際聯盟的核心競爭力。

參考文獻:

[1]Roussean R.A view on big data and its relation to informetrics[J].chinese Journal of Library and Information Science,2012(3):12-26.

[2]Corral S.Roles and responsibilities:Libraries,librarians and data[M]//Pryorg.Managing Research Data.London:Facet Publishing,2012.

[3]OCLC WorldCat? Discovery Services support[EB/OL].[2016-02-14].http://www.oclc.org/support/services/discovery.en.html.

[4]OCLC to launch linked data linked data pilot with seven leading libraries[EB/OL].[2016-01-20].http:// www.oclc.org/en-US/news/realeases/2015/201526dublin. html.

[5]曾建勛,魏來.大數據時代的情報學變革[J].情報學報,2015(1):37-44.

[6]Digital Book World.New start-up aims to be google analytics for e-books[EB/OL].[2014-05-20].http://www.digitalbookworld.com/2012/new-start-up-aims-to-begoogle-analytics-for-e-books/.

[7]徐強,楊佳.閱讀大數據——圖書館聯合體的創新型數據服務探索[J].圖書館理論與實踐.2015(5):1-25.

[8]鄧景康.大數據環境下清華大學圖書館的實踐[N].中國新聞出版報,2013-08-29:5.

[9]VIVOWEB[EB/OL].http://vivoweb.org/,2016-02-10.

[10]清華大學學者庫[EB/OL].http://rid.lib.tsinghua.edu. cn/,2016-02-09.

唐維男,1981年生。碩士,副研究館員。研究方向:數字圖書館云計算。

田瑞雪女,1981年生。碩士,館員。研究方向:圖書館管理。

[分類號]G250.7

收稿日期:(2016-04-20;責編:徐向東。)

*本文系2016年度遼寧經濟社會發展立項課題“基于數據挖掘技術的圖書館管理系統功能改善研究”(編號:20161s1ktzitsg-03);2015年度遼寧省社會科學規劃基金重點項目“云計算環境下高校數字圖書館聯盟發展戰略研究”(編號:L15ATQ001);2014年度遼寧省社會科學規劃基金青年項目“虛擬化技術在圖書館自動化管理中的應用研究”(編號:L14CTQ006);2015年度遼寧省圖書情報工作委員會基金項目“網絡環境下館際間協同服務研究”(編號:L2015002)成果。

猜你喜歡
數據挖掘圖書館資源
基礎教育資源展示
探討人工智能與數據挖掘發展趨勢
一樣的資源,不一樣的收獲
資源回收
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
飛躍圖書館
一種基于Hadoop的大數據挖掘云服務及應用
圖書館里的是是非非
主站蜘蛛池模板: 麻豆精品在线视频| 国产一线在线| 无码中文AⅤ在线观看| 亚洲精品国产日韩无码AV永久免费网 | 亚洲第一香蕉视频| 成人综合久久综合| 国产成人高清精品免费软件| 美女内射视频WWW网站午夜| 亚洲va在线∨a天堂va欧美va| 热伊人99re久久精品最新地| 国产在线高清一级毛片| 美女内射视频WWW网站午夜 | 久久久国产精品无码专区| 韩日无码在线不卡| 中文国产成人精品久久| 九色在线观看视频| 日韩在线1| 久久国产精品影院| 亚洲水蜜桃久久综合网站| aa级毛片毛片免费观看久| 久久人午夜亚洲精品无码区| 国产精品三级av及在线观看| 国产在线自揄拍揄视频网站| 国产人人射| 婷婷五月在线| 亚洲男人天堂2020| 欧美翘臀一区二区三区| 国产一级视频久久| 国产无码性爱一区二区三区| 亚洲一级毛片在线观| 五月丁香伊人啪啪手机免费观看| 亚洲高清日韩heyzo| 精品无码一区二区在线观看| 欧美激情,国产精品| 亚洲国产高清精品线久久| 成人韩免费网站| 无码精品福利一区二区三区| 大香网伊人久久综合网2020| 日韩午夜片| 免费全部高H视频无码无遮掩| 丰满人妻中出白浆| 日本久久网站| 手机在线免费不卡一区二| 亚洲中文精品久久久久久不卡| 精品亚洲国产成人AV| 亚洲黄色激情网站| 91视频首页| 欧美精品色视频| 色综合综合网| 亚洲欧美一区二区三区图片| 伊人无码视屏| 久久永久免费人妻精品| 亚洲a级毛片| 亚洲视频免费播放| 国产精品人莉莉成在线播放| 久久精品国产精品一区二区| 国产日韩欧美在线播放| 亚洲天堂成人在线观看| 91亚洲视频下载| 久久亚洲欧美综合| 亚洲精品在线影院| 国产精品熟女亚洲AV麻豆| 华人在线亚洲欧美精品| 日本成人不卡视频| a毛片在线播放| 国产精品精品视频| 国产激情第一页| 欧美日韩亚洲国产| 国产va免费精品| 国产在线一区二区视频| 国产色图在线观看| 毛片一级在线| 91精品国产一区自在线拍| 欧美亚洲一区二区三区在线| 一本大道东京热无码av| 亚洲一级毛片免费观看| 伊人久久久久久久| 一本大道东京热无码av | 思思热精品在线8| 青草国产在线视频| 无码又爽又刺激的高潮视频| 岛国精品一区免费视频在线观看 |