999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

圖書館行業大數據建設研究

2016-03-17 16:47:33張寧李雪
科技與創新 2016年5期
關鍵詞:大數據圖書館

張寧+李雪

摘 要:主要研究了圖書館行業大數據建設的內容。根據國內外大數據商業應用實例,從需求、數據、標準、共享和環境建設等方面闡述了大數據技術是如何在圖書館行業落地的,并最終確立了圖書館大數據建設的內容,包括確定需求和業務場景、建設數據中心、制訂行業標準、搭建共享平臺、構建圖書館大數據生態圈五方面。

關鍵詞:圖書館;大數據;共享平臺;大數據生態圈

中圖分類號:G250.7 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2016.05.001

隨著云計算技術、數據存儲和分析等技術的不斷進步和發展,大數據產業的內在價值日益凸顯。人們開始越來越多地依賴數據進行決策分析,并對數據進行再加工,以不斷發掘數據的內在價值,大數據已從傳統意義上的概念逐步發展成為一種產業,成為各國學者研究的熱點。本文以此為背景,通過研究、分析國內外相關商業應用案例,并結合圖書館實際,研究圖書館行業大數據建設的內容,希望能為圖書館大數據建設提供一定的參考和借鑒。

1 國內外研究現狀

目前,各國對大數據產業十分重視,紛紛開展大數據研究。其中,美國作為大數據的發源地和創新引領者,一直走在世界的最前端。2012-03-29,美國頒布了《大數據研究和發展計劃》,標志著美國成為第一個將大數據上升到國家戰略并制訂行動計劃的國家。2013-06,日本公布了《面向2020年的ICT綜合戰略》,全面闡述了在2013—2020年期間以發展開放公共數據和大數據為核心的新IT國家戰略,提出將日本建設成為具有世界最高水準的廣泛運用信息產業技術的國家。加拿大計劃以寬帶建設和數據中心建設為支撐,為大數據的發展提供前提條件。英國力推數據公開,為商業、研究機構所用,并支持大數據在醫療、農業、商業和學術研究等領域的發展。法國則以新興企業、軟件制造商、工程師、信息系統設計師等為目標,以一系列投資計劃來促進大數據技術的發展。此外,德國、西班牙、俄羅斯、韓國、澳大利亞、新加坡和印度等國家也紛紛從寬帶網絡、智慧城市、基礎設施、數據中心等方面布局大數據產業,希望搶占大數據領域的技術制高點。

我國大數據布局開始于2012年,包括“十二五國家政務信息化建設工程規劃”、國家發改委和中科院“基礎研究大數據服務平臺應用示范”項目、廣東啟動大數據戰略推動政府轉型、北京探索政府公布大數據供社會開發和上海大數據研發三年行動計劃等。此外,在技術層面上,國內大數據的關注重點為“信息集成”,即利用一個集成的、可縮放的、可擴展和安全的信息基礎設施來推動大數據的應用實踐。在商業上,各商業帝國也開始紛紛打造自己的大數據“戰場”。比如,Google在海量數據存儲方面提出了分布式計算的方式,實現了海量數據的存儲和管理。Yahoo將大量資源投入到Hadoop的研究中,以推動Hadoop的發展。阿里巴巴以大量商業數據為基礎進行統計、分析和挖掘,形成規范的實體明細數據和指標數據,對外提供數據服務,并獲得了較好的利潤。其中,具有代表性的為阿里巴巴的“數據魔方”。在圖書館行業,美國哈佛大學圖書館已將“大數據”服務引入圖書館并付諸實踐,將圖書館大數據向讀者公布,其中包含1 200多萬種資料,有書目數據、地圖、手稿、音/視頻等,并在美國數字公共圖書館中提供下載服務。

2 圖書館行業大數據建設的必要性

據2014年中國電子技術標準化研究院出版的《大數據標準化白皮書》顯示,目前我國的大數據應用主要集中在涉及社會管理和公共服務領域的政府部門,其中,關注度位列前三的分別為“智慧城市”“政務”和“公共服務”。但是,隨著數字圖書館建設的不斷深入,“智慧圖書館”應運而生。一方面,圖書館擁有的數字資源和數據呈爆炸式增長。以國家圖書館為例,截至2014年年底,數字資源總量達到1 024.45 TB,數字資源長期保存量達到897.86 TB,數字資源服務量達到734.52 TB。除此以外,全館幾十個應用系統每天產生的結構化、非結構化數據也已達到GB級,比如用戶行為數據、資源數據和系統日志等,為圖書館大數據建設提供了數據基礎。另一方面,為讀者提供個性化服務也是圖書館的現代化需求之一。

3 圖書館大數據建設

本文以國家圖書館數字圖書館建設為背景,在研究現代商業應用成功案例的基礎上,將部分先進理念引入圖書館行業,分別從確定需求、建設數據、制訂標準、搭建共享平臺和構建大數據生態圈五個方面,闡述圖書館大數據建設的內容,為大數據技術在圖書館行業落地提供一定的參考。

3.1 確定需求和業務場景

在大數據環境下,數據的有效價值率是很低的,有用數據或核心數據占有的比例很小,過多地收集數據會導致核心數據被埋沒在大量的無用數據或死數據中。因此,前期業務數據的收集并不是盲目的、無邊界的,而是需要我們明確自身的業務需求,從業務驅動的角度選擇最主要、最基礎且需要解決或產生的業務場景,并根據這些需求和場景選取所需要的數據,收集與之相關的數據作為大數據的數據基礎。

對于圖書館來說,基本業務需求就是讀者服務和資源建設兩個方面。無論現代技術如何發展,發展到何種程度,這兩個方面始終是圖書館業務的核心。只有牢牢抓住這兩個核心,才能抓住圖書館的核心業務。因此,圖書館大數據的建設首先需要收集與讀者服務和資源建設相關的數據。與之相關的數據包括讀者屬性數據、行為數據、資源屬性和資源數據等。此外,還需要提供對內和對外兩種業務場景,對內為圖書館行業的管理決策提供科學依據;對外主要為讀者提供個性化、精細化服務,以及為機構用戶提供增值數據服務。

3.2 收集整理數據,建設數據中心

在大數據環境下,需要對收集到的海量數據進行有效的管理和篩選,構建數據應用平臺,即建設數據中心。對于圖書館來說,需要處理的數據不僅包括讀者屬性、讀者行為、服務政策、資源屬性、資源內容、資源管理方式等數據,還包括圖書館業務規劃,資源采購情況,服務政策,國家文化走向,當地的社會、交通管理和經濟發展水平等其他外部數據。要想做好數據的收集整理和數據中心的建設,以下幾方面的工作不容忽視。

3.2.1 人才培養

隨著大數據時代的到來,圖書館傳統的工作方式、管理辦法和工作內容都會發生變化,數據服務模式的比例將會增加,原有圖書館的服務模式也將會由單一的圖書服務模式逐步演變為圖書服務和數據服務并存的模式。圖書館除了需要擁有一批精通傳統業務的圖書館員外,還需要培養一批掌握數據收集、數據分析、數據管理、數據服務和數據研究的人才,將數據的收集整理、分析建模、存儲管理、應用服務和研究創新貫穿起來,形成一條完整的主線。這是圖書館大數據建設成敗的關鍵所在。

3.2.2 數據估值

在大數據時代,數據是具有價值的,充當“生產原材料”的角色,任何企業或組織在收集原材料時,都會對其進行估值,數據也不例外。從數據的角度來看,數據估值就是從不同的角度、不同的維度思考數據的價值。只有明確了數據的價值,才能做到數據的有效收集、整理和篩選,否則收集到的數據中就會存在大量低價值或無價值的數據,從而無法篩選出我們需要的核心數據。

數字圖書館發展到今天,已經積累了不少結構化和非結構化數據,以國家圖書館為代表,數字資源總量已經達到1 024.45 TB。此外,數字圖書館工程所涉及到的幾十個系統每天產生的數據增量也以GB來計。這些數據增量的數據輸入標準、數據格式、數據類型、表現形式和存儲結構千差萬別、形式各異。在現有技術條件下,完全收集、整理和處理這些數據是一件幾乎不可能完成的事情,因此,必須要制訂圖書館數據價值評估標準,對數據價值進行量化評判和評估,按照數據的重要性排序和分類,并建立數據價值信息庫。這樣,不僅有利于收集核心數據,還有利于了解數據價值分布情況,便于數據的后續收集、保存和使用。

3.2.3 數據分類

在面對大量碎片化數據時,如果沒有對收集的數據進行科學、有效的分類、存放和管理,就會出現放進去時很輕松,但等到要找出來時就會浪費大量時間,甚至可能找不到的情況。因此,在收集數據時,需要對收集的數據進行合理分類。筆者認為,可以按照存儲層次、業務歸屬、隱私安全和數據價值等進行劃分。

3.2.3.1 按照存儲層次劃分

從數據的存儲角度出發,數據可以分為基礎數據、中間數據和應用數據三種。其中,基礎數據即為原始數據,僅存儲收集到的最基礎、最原始的數據,不作任何加工和統計匯總,作為其他數據的基礎;中間數據是由基礎數據發展而來,在基礎數據的基礎上進行加工,包括統計分析、分類匯總等,形成數據倉庫;應用數據則是針對具體業務問題,經過一系列的數據分析和數據挖掘得來的數據。

3.2.3.2 按照業務歸屬劃分

按照業務歸屬劃分時,需按照不同的業務主體分門別類地歸納。對于圖書館行業來說,業務數據可以分為讀者數據、資源數據、借閱類數據、行為數據和資源管理數據等。

3.2.3.3 按照隱私安全劃分

按照隱私安全劃分,圖書館數據可以分為隱私數據和非隱私數據。其中,隱私數據包括個人級別的隱私數據、資源級別的隱私數據和行為級別的隱私數據。個人級別的隱私數據是指涉及到讀者個人隱私信息的數據,包括讀者個人的姓名、住址、工作單位、身份證號、用戶名和密碼等;資源級別的隱私數據是指資源的保密性元數據,包括圖書、音像資源的保密性要求,可公開級別等信息;行為級別的隱私數據是指個人在圖書館借閱行為中產生的不宜對大眾公開、或公開后可能會對個人造成不良影響的數據,包括個人的借閱記錄、逾期記錄等數據。

3.2.3.4 按照數據價值劃分

數據是有價的,且每種數據的價值不同。人們在使用數據時,總希望優先使用高價值數據,忽略或放棄無價值數據,因此,在數據估值的基礎上,需對數據價值分類。其中,按照表現形式來分,可以分為顯性價值和隱性價值;按照作用方式來分,可以分為直接價值和間接價值;按照時間范圍來分,可以分為短期價值和長期價值;按照空間范圍來分,可以分為局部價值和整體價值。

3.2.4 數據培養

對數據進行培養即為阿里巴巴大數據中所提到的“養數據”戰略,也就是改變過去傳統的對已有數據單純的、“被動式”的收集行為,開展從無到有的“生產”或“尋找”數據的 “主動式”行為,這是基于業務的深入理解和更高層次決策的需要,也是數據收集的更高層次。數據的收集不應該僅僅考慮有什么數據就收集什么數據,而是要決定收集哪些數據,從解決問題的角度出發,在實際研究中了解需要哪些數據,缺少哪些數據,哪些數據的精度還不符合我們的要求,從而主動地去收集、補充和生產這些數據,實現從數據化運營向運營數據的轉變。

3.3 制訂圖書館行業大數據建設標準

目前,大數據技術相關標準的制訂還處于起步階段。就圖書館行業來說,需要盡快制訂圖書館行業大數據標準體系,分別從基礎框架、數據格式、數據價值、工作流程和使用方式等方面制訂相關行業標準,并作為行業引領規范,這對圖書館行業內部數據交換和共享具有極大的促進作用。

3.4 搭建大數據共享平臺

我國研究大數據的著名學者、電子科技大學的周濤教授曾有一個重要觀點,“進行據收集無外乎兩個方面,一方面是自己用——用其他數據來提高自己手上數據的精準度,為我所用;另一方面就是給別人用——把自己的數據貢獻給他人使用,提高他人的數據精準度。”

圖書館行業不同于其他行業,各級圖書館、各地圖書館以合作為主,資源共享、聯盟合作是各圖書館關系的主線,文獻傳遞、館際互借也早已深入人心。在大數據時代,建設圖書館行業大數據共享平臺,就是以建立大數據共建共享機制為基礎,采用直接提供數據集和開放數據接口兩種方式,聯合各級圖書館、各地圖書館共同參與大數據共享平臺建設。這樣,不僅能夠促進圖書館行業大數據的合作共建、成果共享,還能夠加快大數據產業在圖書館行業的價值轉化。

3.5 構建圖書館大數據生態圈

所謂“生態圈”,其實是借助了生態學的概念。圖書館大數據生態圈是指在圖書館行業環境下所有與大數據產業相關的個體總和,包括圖書館的整個行業環境以及在此環境下的大數據涉及的各個層面,比如數據源層、數據存儲層、數據分析層、應用層、支撐保障體系等。在整個生態系統中,圖書館的優勢和核心為數據源層,關鍵為數據分析層。因此,在構建圖書館大數據生態圈時,我們需要在把握優勢層和核心層的基礎上,開放其他層,并走聯合合作的道路,將各個層面上的行業、企業和用戶吸納并連接起來,共同打造圖書館系生態圈。

4 總結

大數據已經成為信息產業界的研究熱點,是未來新技術產業發展的趨勢之一。圖書館行業的發展,尤其是隨著數字圖書館的不斷深入,大數據建設是必不可少的。但是,圖書館行業大數據建設也絕非易事,它需要我們從自身業務出發,整體規劃、合理布局,從確定需求、建設數據、制訂標準、搭建共享平臺和構建大數據生態圈幾方面入手。只有這樣,才能走出一條傳統圖書館與現代技術相結合的道路,才能將大數據技術真正長久地應用于圖書館行業,為圖書館的現代化建設服務。

參考文獻

[1]李紀舟,蘇曉娟,葉蕾.大數據技術及其國外發展情況[J].電信技術研究,2013(2).

[2]宋榮華,李宗富.部分國家大數據發展對我國的啟示[J].科技情報開發與經濟,2014,24(22).

[3]鄒捷.大數據技術發展研究綜述[J].科技風,2014,7(14).

[4]陳新明.淘寶網數據平臺數據倉庫建設[D].大連:大連理工大學,2013.

[5]程蓮娟.美國推進大數據的應用實踐及其有益借鑒——基于圖書館視角的分析[J].情報資料工作,2013(5).

[6]張新娜.大數據時代智慧圖書館建設路徑分析[J].圖書館研究,2014(1).

[7]蘇蓉.基于大數據的數字圖書館信息服務研究[D].武漢:華中師范大學,2014.

〔編輯:劉曉芳〕

猜你喜歡
大數據圖書館
圖書館
文苑(2019年20期)2019-11-16 08:52:12
時間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
圖書館里的是是非非
去圖書館
主站蜘蛛池模板: 国产精品jizz在线观看软件| 亚洲另类色| 在线看片国产| 亚洲天堂网2014| 国产在线专区| 国产交换配偶在线视频| 一本久道久久综合多人| 久久久久亚洲av成人网人人软件| a级毛片免费在线观看| 日韩区欧美区| A级毛片无码久久精品免费| 免费看a级毛片| 国产18在线| 一区二区三区四区精品视频| 人妻一本久道久久综合久久鬼色| 成人午夜免费观看| 亚洲第一综合天堂另类专| 亚洲经典在线中文字幕 | 亚洲乱码视频| 国产福利微拍精品一区二区| 国内嫩模私拍精品视频| 香蕉蕉亚亚洲aav综合| 波多野吉衣一区二区三区av| 欧洲高清无码在线| 激情影院内射美女| 最新日本中文字幕| 亚洲天堂视频在线播放| 亚洲永久精品ww47国产| 强奷白丝美女在线观看| 麻豆AV网站免费进入| 91在线日韩在线播放| 2021国产v亚洲v天堂无码| 免费看黄片一区二区三区| 超碰色了色| 中文无码毛片又爽又刺激| 日韩在线视频网| 一区二区三区国产| 91欧美在线| 麻豆国产在线观看一区二区| 欧美日韩成人在线观看| 日韩无码视频网站| 亚洲av片在线免费观看| 全部无卡免费的毛片在线看| 天天做天天爱天天爽综合区| 亚洲视频黄| 99久久国产综合精品2020| 精品国产自在现线看久久| 亚洲中文字幕久久精品无码一区| 波多野结衣一区二区三区四区视频 | 亚洲精品无码日韩国产不卡| 好紧太爽了视频免费无码| 97精品国产高清久久久久蜜芽 | 91美女视频在线| 亚洲国产成人在线| 亚洲无码高清免费视频亚洲| 欧美激情视频一区| 高清久久精品亚洲日韩Av| 欧美激情视频二区三区| 国产精品深爱在线| 重口调教一区二区视频| 五月天久久婷婷| 亚洲欧洲综合| 日韩人妻少妇一区二区| 国产成人a毛片在线| 91成人免费观看| 国产精品久久久精品三级| 91偷拍一区| 毛片a级毛片免费观看免下载| 国产精品漂亮美女在线观看| 久久国产成人精品国产成人亚洲| 99久久亚洲精品影院| 三上悠亚在线精品二区| 九色最新网址| 国产黄色免费看| 福利视频99| 久久9966精品国产免费| 成人福利在线看| 91欧美在线| 天天色天天综合| 亚洲高清日韩heyzo| 国产丝袜无码精品| 欧类av怡春院|