羅 靜
(貴州省圖書館, 貴州 貴陽 550004)
大數據背景下的資源建設與服務分析
——以貴州省公共圖書館數字資源建設和服務為例
羅 靜
(貴州省圖書館, 貴州 貴陽 550004)
從大數據與公共圖書館資源建設的關系入手,通過對貴州省公共圖書館數字資源建設與服務的統計與分析,為貴州省公共圖書館今后的資源建設提出合理建議。
大數據; 貴州;數字圖書館
在人類步入大數據時代的今天,在呈爆炸性增長的信息數據環境下,通過大數據分析、云計算、數據挖掘等技術手段進行專業化處理,原本看起來分散的、難以收集和使用的數據被廣泛地利用起來,伴隨著各行各業的不斷創新,大數據為人類創造了更多的價值。大數據的發展對圖書館信息化、數字化建設也產生了重要影響。圖書館作為信息儲存的重要機構,擁有海量的數字資源,是公眾獲取信息的主要場所,為公眾提供了豐富、便捷的信息服務。同時,大數據環境下圖書館的數字資源建設與服務,也面臨著更多的機遇和挑戰,及時調整自己的服務定位與資源建設策略,將更好地提升公共圖書館在大數據時代中的社會價值。
(一)大數據相關概念和內涵
大數據(big data)用IT行業俗語描述為巨量數據集合。2011年,全球知名的管理咨詢公司麥肯錫所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。[1]
大數據技術的主要含義不是在于掌握龐大的數據和信息,而是在于對大量數據進行高性能的分析和處理,通過專業化操作,從而實現知識的提取和利用,并能提供知識的服務。比如:可以分析企業用戶行為習慣進行產品推送、對成千上萬的路線和車輛數據進行分析規劃出實時交通路線、預測市場發展趨勢等等。大數據技術的價值在于應用,其核心能力是發現規律和預測未來。[2]
(二)大數據發展與圖書館資源建設關系
大數據推動圖書館數字資源信息的網絡化共享、集中化整合、協作化開發和高效化利用。特別是進入21 世紀以來,圖書館海量的數字資源日益成為主要的知識資源載體,以數字資源為基礎的復合圖書館已逐漸成為圖書館服務與管理的主要形態。網絡條件下,讀者對信息的需求呈現復雜性和多樣化,圖書館讀者已經擴展到館外用戶,能否充分利用現有的數字資源、讀者數據、閱讀信息、電子文獻點擊率等各類數據建立元數據集合,對讀者閱讀行為習慣進行大數據分析與數據挖掘,為更多的用戶提供個性化、專業化和智能化的便捷服務,已經成為衡量圖書館價值的重要指標。
大數據時代,圖書館資源建設工作不能僅僅依靠采編或者資源部門,還需要與數據專業部門和專業技術人員配合,制定相關的數字資源收集、整理、保存、挖掘、保密規范等制度,同時需要依靠大數據、云計算、移動通信、物聯網等先進的數據處理技術,將經驗模式逐漸轉化為通過建立模型、數據分析進行輔助決策的科學模式。[3]
(一)基礎設施建設
貴州省、市級公共圖書館除銅仁市圖書館新館正在建設中之外,其余市級圖書館都已完成服務器、存儲、網絡等硬件設備的配置,2012年-2014年,貴州省圖書館、貴陽市圖書館、畢節市圖書館、黔南州圖書館、遵義市圖書館、黔西南州圖書館均已實現與國家圖書館的vpn虛擬網鏈接,2014年貴州省圖書館完成了與國家圖書館的專網連接,通過虛擬網可以共享國家圖書館40余個數字資源庫,市級館還可以共享省館近10個數字資源庫,彌補了市級圖書館在數字資源建設的不足。2013年起省館與各級市館相繼部署了“元數據加工系統”、“唯一標識符系統”、“統一用戶認證系統”、“政府公開信息整合服務” 等一系列軟件系統平臺,逐步對全省的數字資源建設進行元數據標識、標引,對讀者信息進行整合。此外,全省建成各級“文化信息資源共享工程”服務點19377個,覆蓋省、市、縣、鄉(鎮)、村五級服務網絡基本形成。
國家對文化事業的重視和投入力度的加大,為貴州省公共圖書館初步實現數字資源共享奠定了堅實的基礎。但同時我們也應該看到,通過虛擬網和專網還是存在只能在各館局域網內共享的局限,由于各館讀者管理系統不同,讀者信息整合進展緩慢,大數據背景下,還需依靠數據整合、挖掘與分析技術,實現廣域網內資源的共建共享。
(二)數字資源建設
1.根據2015年12月統計數據,表1匯總了全省各級公共圖書館自建特色數字資源庫和商購數字資源的內容與數量。

表1 全省公共圖書館數字資源列表
注:帶“*”表示重復建設。
2.征集與聯建資源
2010年開始,貴州省圖書館與國家圖書館在數字資源征集與聯建方面進行了廣泛的合作和共享,建成了《貴州少數民族風情史料片之苗族篇》《德江儺戲視頻專題片》《侗族大歌視頻專題片》《錦雞舞視頻專題片》《苗族蠟染視頻專題片》《貴州少數民族風情史料片之侗族篇》和《貴州少數民族風情史料片之布依族篇》等專題數據庫。 2012年開始,省館、貴陽市、遵義市、畢節市和黔東南州圖書館參與國家資源聯合建設項目,已完成“元數據庫”1萬條、“唯一標識符注冊與維護數據庫”1萬條、“政府公開信息整合服務平臺”17.5萬條、“地方文獻數字化”39.5萬頁,“網事典藏”網站200個 及“圖書館公開課”60講等資源建設任務。
3.共享資源
包括國家圖書館古籍、電子圖書、電子期刊、老照片、國家統計數據庫、中國/世界進口商名錄數據庫、Emerald回溯期刊數據庫、美國國會文獻集、EAI美國早期印刷品、珍稀原始典藏檔案合集等近40余個中外文數字資源庫,讓貴州公眾足不出戶就能免費訪問國家數字圖書館豐富的資源。
4.國家館推送資源
數字圖書館推廣工程為各級圖書館推送4TB數字資源(全部鏡像在本地)包括了5000冊電子圖書、200種電子期刊、6000集精品視頻、3.2萬張圖片資源、26萬條政府公開信息等,涵蓋傳統文化經典、少兒視頻、文津經典誦讀、國圖公開課、非物質文化遺產、老照片、政府公開信息等多種精品數字資源。
不難看出,近幾年依托文化部開展實施的數字圖書館推廣工程、文化信息資源共享工程和公共電子閱覽室三大公共數字文化惠民工程,貴州省公共圖書館在基礎設施建設、數字資源內容和數量建設等方面有了長足的發展。但是自建館藏特色數字資源相對貧乏,各館自建的數字資源集中在地方志、民族文獻等地方文獻方面,內容單一、數據量小、建庫質量不高。外購商業數字資源重復建設情況未能避免。全省與國家館聯合建設的政府公開信息以及網事典藏等數字資源只是分散的單個數據集,沒有統一平臺進行數據檢索、提取和發布。大數據環境下,對于如何發揮數字資源的整體優勢,實現我省資源的共建共享和高效、便捷的信息化服務,還任重而道遠。
(一)貴州數字圖書館的建立
除了傳統的圖書館資源服務外,2009年,為了向貴州省公眾提供數字資源區域性整合服務,貴州省圖書館開通了貴州數字圖書館,作為一家全省范圍免費開放的數字圖書館,貴州數字圖書館采用“IP+賬號”的方式向全省公民提供數字資源免費服務,實現了每一位公民在貴州省任何能上網的地方,登錄貴州數字圖書館的門戶網站,都能免費獲得數字資源的查詢、瀏覽、下載、原文傳遞和知識導航等服務。目前主要是將省館商購的數字資源圖書、期刊、報紙、論文、視聽等專題數字資源進行組織、分類與整合,通過貴州數字圖書館門戶網站,實現基于元數據的一站式檢索和用戶目標明確的單一數據庫檢索。全省各級公共圖書館作為分館加入,多途徑實現資源的瀏覽、傳遞以及全文下載。
截止到2016年6月,貴州數字圖書館的累計訪問量近1億5千萬人次,年均訪問量2000多萬人次。電子期刊和論文平均每年下載量為250萬頁,文獻傳遞量平均每年1000萬頁,電子圖書下載量平均每年6萬頁。目前,注冊用戶達120多萬人。
(二)移動圖書館建設
各類數字網絡的發展、移動數字閱讀和通信終端設備的普及改變了人們的閱讀習慣。2011年起,貴州省圖書館以移動無線通信網絡為支撐,以圖書館集成管理系統平臺和基于元數據的信息資源整合為基礎,以適應移動終端一站式信息搜索應用為核心,以云共享服務為保障,先后推出了掌上貴圖、省圖書館微信平臺、電子借閱機等新媒體服務。2014年,貴陽市圖書館、遵義市圖書館、黔南州圖書館、畢節市圖書館也先后加入數字圖書館推廣工程移動閱讀分站,為公眾提供隨時隨地的移動數字服務。
雖然貴州數字圖書館和移動圖書館的開通為公眾獲取圖書館的數字資源提供了更為便捷的通道,擴展了貴州省數字資源的服務渠道,但是全省各市級公共圖書館自建和外購的數字資源未能在貴州數字圖書館上實現整合,服務模式還是僅限于查詢、瀏覽、下載、原文傳遞和知識導航等傳統網絡服務,未能對讀者數據、閱讀習慣、使用率等進行大數據分析,在個性化、專業化服務及主動推送服務等方面較為欠缺。
大數據環境下圖書館數字資源的建設已逐漸取代了圖書館傳統服務與文本資源,從對貴州省公共圖書館數字資源建設現狀的分析中,可以感受到數字資源對圖書館發展影響深遠。然而,另一方面,我們也意識到,目前圖書館在數字資源建設上還存在許多問題。因此,關于對數字資源建設策略的研究已成為公共圖書館面臨的一項重要課題。
譯 文 :We willcontinue to strengthen the Party’s ability to purify itself,and forever maintain its close ties with the people.
(一)建立區域聯盟開展專題特色數字資源建設
對于自建特色庫,首先應對全省統籌規劃,可由省館牽頭成立技術協會或者行業委員會進行協調組織,依靠國家項目資金完成建設??h、市、省逐級上報登記,由技術委員會在邏輯層面進行查重和篩選。以地方文獻數據庫建設為例,畢節市、遵義市、安順市等市級館分別組織市內各級縣館完成本區域地方文獻的收集、上報、掃描、加工、標引和元數據著錄等初始工作,技術委員會匯總數據,在省館構建的特色數據庫平臺上,結合相關的行業詞表、分類體系以及屬性、規則、語義等基礎知識庫,實現對上報數據資源內容(主要是元數據內容)的智能化分析、索引、解析和關聯聚合,完成專題數據的篩選和重組。其次,是對特色庫中的數據進行專題組織,劃分出欄目、專題和路徑。通過搜索引擎、分析引擎、規則引擎等實現數據統計與用戶行為分析,為個性化的專題聚合與推送奠定基礎。最后在專題數據的發布上還應為用戶提供靈活多樣的知識發現、獲取和利用服務。例如:除了基本的全文檢索和分類導航外,還應包括專業化的主題匯聚、關聯延伸、利用統計分析和熱點信息推薦以及個性化的知識訂閱推送等服務。
(二)實現商業數字資源的共建共享
對于商業數字資源,可以考慮全省公共圖書館進行聯合采購的方式,以最少的經費獲取最多的資源來實現共享。在貴州,數字資源已經有了較為成熟的服務平臺——貴州數字圖書館,如果進行聯合購買,可以實現有限經費的最大化效益。例如:cnki數據全庫,如果購買全省范圍使用,其價格任何一個圖書館都難以承受,但是如果省館購買科技期刊、貴陽市館購買博碩論文、畢節市館購買標準全文,最后在貴州數字圖書館進行整合和發布,這樣不僅有效避免重復建設,實現資源的共建共享,還能豐富資源數量和內容,將結余資金用于進行大數據分析、挖掘和云計算等深層次開發上,為用戶提供更加優質的服務。
(三)搭建全省統一的專題信息服務平臺
針對目前各館在建的“政府公開信息”“網事典藏”和“地方文獻”等分散數據庫集,建立全省統一的信息服務平臺,以政府公開信息數據庫為例,設計貴州省公共圖書館政府公開信息整合服務平臺統一門戶,以各級圖書館所采集的政府機關門戶網站的互聯網信息資源為對象,構建集互聯網信息資源采集、加工、存儲、歸檔、組織、發布與利用為一體的政府公開信息整合服務平臺。以貴州省圖書館為中心結點,面向全省各級公共圖書館實現本地部署,通過系統間的分級調控、智能調度、權限管控等方式,構建互聯互通、統一檢索、分級揭示的政府公開信息整合服務體系。隨著大數據技術的發展,甚至還可以將整合后的政府公開信息平臺、網事典藏服務平臺和地方文獻專題庫等進行二次整合,建立統一加工、組織和發布的綜合性系統平臺,滿足不同類型、不同格式、不同內容的數字資源的發布和展示,多途徑為全省公眾提供方便、快捷的開放式信息服務。
利用統一門戶將公共圖書館的信息和內容無縫連接起來提供給廣大公眾,并根據各類用戶自行定制的風格提供個性化內容。如今,人們通過分享、評價等方式獲得越來越多的信息資源,公共圖書館讀者管理系統各不相同,需要開放所有系統的接口較難實現,但是利用大數據技術進行讀者信息元數據抓取,建立讀者元數據庫則是一個可行的辦法。再通過元數據去分析讀者的年齡、愛好、檢索習慣等信息,發現有價值的數據間關系,從而了解不同讀者在各個時期的個性化需求,對其興趣進行預測,并向其定期推送所需數據。[4]同時,大數據環境下,數據發布可以建立面向計算機、手機、數字電視等各種終端用戶的個性化和多樣化服務推送。
(五)建立圖書館信息化人才隊伍
大數據環境下不僅要求圖書館員具備相應的學科知識,還應有一支具備資源組織、挖掘整理、大數據分析和專題發布等信息化綜合型人才隊伍,將數據快速地轉化為知識和信息傳達給用戶。近幾年,國家非常重視對新技術人才的培養,在圖書館行業專業培訓中比重逐年加大,貴州省公共圖書館還可以考慮“走出去、請進來”的方式培養各館的專業人才,通過到國家圖書館、各省圖書館等掛職的方式和邀請專業技術人員下掛的方式,提升本館業務人員綜合技能,以滿足大數據環境下圖書館數字資源建設對人才的高度需求。
[1] 百度百科.大數據[EB/OL].(2016-05-21) http://baike.baidu.com/item/大數據/1356941.
[2]王曄煊,楊艷君.大數據背景下高校圖書館的資源建設[J]. 鞍山師范學院學報,2013,15(6) : 101.
[3]范華.大數據時代的圖書館資源建設工作[J].四川圖書館學報,2015(4).
[4]付麗娟.大數據時代下高校圖書館數字資源建設研究[J].內蒙古科技與經濟,2015(9).
責任編輯 劉曉華
Analysis on Resource Construction and Service Under the Background of the Big Data——Taking Digital Resource Construction and Service of Public Libraries in Guizhou Province as an Example
LUO Jing
(Guizhou Provincial Library, Guiyang 550004, Guizhou, China)
According to statistics and analysis of digital resource construction and service for public libraries in Guizhou province, this paper aims to propose some reasonable suggestions for the future resource construction of public libraries in Guizhou based on relationship between big data and resource construction of public libraries.
big data; Guizhou; digital library
2016-08-09
羅 靜(1976-),女,湖南邵陽人,貴州省圖書館副研究館員。主要研究方向:數字化圖書館建設。
G250.74
A
1673-6133(2016)05-0069-04