關鍵詞:圖書館;跨地域;大數據;應用
摘要:文章論述了圖書館如何依托現有資源優勢及組織聯盟,在跨地域交流中打破機制性障礙,通過大數據共建共享渠道,產生可觀的學術價值和經濟效益。
中圖分類號:G252.8文獻標識碼:A文章編號:1003-1588(2014)12-0129-03
收稿日期:2014-10-09
作者簡介:楊曉東(1979-),漯河職業技術學院圖書館館員。全國各類圖書館,近年來在OA理論(Open Access)的指引下,信息資源共享的需求越來越大。圖書館讀者群和信息資源存在海量性、流動性、互補性和交叉性。圖書館行政體制、所屬范疇、地域限制存在重復建設、偏安一隅的情況,造成各圖書館大量的資源損失和浪費。繼“圖書館聯盟”和“云計算”之后,大數據成為圖書館學界研究的熱點。圖書館依托現有資源優勢及組織聯盟,在跨地域交流中打破壁壘及機制性障礙,通過大數據共建共享渠道,產生可觀的學術價值和經濟效益,具有重要的現實意義。
1大數據的概念及特點
大數據指的是無法使用傳統流程、工具處理或分析的信息。有關專家認為,其表現形式是超出常規衡量尺度、處理范圍與模式,引導用戶采用非傳統處理方法的數據集。其運行模式是:對于存儲在各地域各類型的服務器中的海量信息,首先由用戶發出查詢、搜索請求,然后各地服務器之間進行信息交換和處理,最后把查詢、搜索結果反饋給用戶。
對大數據的特點,筆者總結為VHHTC:多樣性(Variousness)、大容量(High-capacity)、高速度(High-speed)、時效性(Timeliness)和復雜性(Complexity)。即通過數據庫解決長期存儲的數據,割棄常規數據處理,轉而使用新策略對異結構數據重新安排接入,實現即時應用所需數據。
2圖書館跨地域應用大數據的基礎
2.1網絡應用現狀使信息量呈爆炸式增長
截至2014年5月16日,中國3億網民使用虛擬專用網絡(VPN)服務。截至2013年12月,我國網民規模達6.18億,全年共計新增網民5,358萬人。互聯網普及率為45.8%,較2012年底提升3.7個百分點。移動設備如智能手機、平板電腦等為信息需求者提供了新的獲取途徑,最終吸引跨地域的人與人之間產生更多的交互,使得數據急速增加。越來越強大的技術和日益龐大的網民隊伍,為數字圖書館提供了信息傳輸途徑和服務渠道。
2.2云計算、社交網絡及RFID等新技術的發展,為圖書館海量信息提供了數據來源
云計算強大的數據處理能力,為大數據的誕生和發展提供了技術基礎。以微博、微信等為代表的社交網絡Web2.0特質體現了開放性、獨特性、互動性、共享性。因此高科技的發展使跨地域圖書館進入大數據時代成為可能。
3圖書館在地域交流中面臨的困惑
3.1圖書館信息資源共享理念問題
我國圖書館信息資源共享理念相對落后。圖書館信息資源共享程度比較低。在圖書館雖然可以免費獲取一定量的電子數據資源,但是這些免費下載權服務對象范圍過于狹小,且只能局限于內部網絡,很難跨地域實現資源共享,更遑論面向社會不特定公眾服務。數字圖書館建設存在的問題是——更多突出個人英雄主義,而非重視各類圖書館聯合起來搞集體行軍。
3.2圖書館自身角色認知的問題
部分地區的圖書館對自己的定位評價較低,例如“學校教輔單位”“藏書樓”“借還書的地兒”等。著名圖書館學家阮岡納贊(印度)提出,作為有機的圖書館,必須要把自己置身于社會這一大環境之下。他的圖書館學五定律非常有名:“……圖書館是一個生長著的有機體(A library is a growing organism)。”今天公眾對圖書館的認知仍停留在“物理層面的圖書館”上,許多圖書館沒有用發展的眼光,使公眾對圖書館的認知上升到“數據化信息資源中心”上。筆者呼吁圖書館應該敢于挑起大梁,放眼所服務地域之外,拓展服務功能,將大數據作為研究和工作基礎,從數據匯集、信息剝離、知識服務、智慧支持等方面進行服務。
3.3圖書館海量信息梳理問題
信息技術的發展激發了數字資源的增長。圖書館海量數據在網頁數量上可以體現。截至2013年年底,中國境內的網頁數量約為1,500億個,相比2012年增長22%左右。文獻出版渠道更是層出不窮。目前,我國數字雜志、電子書行業運行發展形勢良好,電子書行業正逐步向產業化、規模化方向發展,數字雜志、電子書行業運行需求市場不斷擴大。面對海量信息,信息樞紐專家——圖書館又該做些什么?以清華大學圖書館信息檢索平臺Web of Science為例。通過該平臺用戶可檢索關于自然科學、社會科學、人文學科的文獻信息,包括國際期刊、免費開放資源、圖書、專利、會議錄、網絡資源等,可以同時對多個數據庫(包括專業數據庫、多學科綜合數據庫及“中國科學引文數據庫”)進行單庫或跨庫檢索,可以使用分析工具,可以利用書目信息管理軟件建立個人文獻數據庫。雖然指出了“如需在校外使用,請通過校外訪問控制系統,或通過Shibboleth訪問”,但怎樣實現跨地域組織、梳理和抽取海量信息,仍然是尚未開發的盲區。
3.4網絡結構設計及建模形式的問題
傳統的數據運行模式是:用戶直接向服務器發出查詢、搜索請求,由這個服務器直接反饋給用戶。各地域服務器彼此看來是“又聾又啞”的。而筆者分析大數據運行模式,可總結為:用戶發出查詢、搜索請求——各地服務器之間進行信息交換和處理——把查詢、搜索結果反饋給用戶。聯合起來的各地域服務器可以說是真正成為一個整體了。因此網絡結構重新架構成為當前緊迫的任務。
大數據建模形式與傳統業務應用中產生的建模形式迥異。大數據內容服務數據是非結構化(Unstructured)的,含有比較隨意的信息。由于內容服務數據將應用于特定的網絡模板或數據庫調用中,因此越來越多的內容采用半結構化(Semi-structured)的數據形式。endprint
楊曉東:圖書館在跨地域交流中的大數據應用楊曉東:圖書館在跨地域交流中的大數據應用3.5不可預測事物的問題
預測是大數據的核心功能。但大數據只能利用過去的數據預測未知。大數據無法回歸原點。當觸摸不到既往時,大數據就是“無米之炊”了。大數據遇到預測不可預知的事物、缺少發展苗頭的事物就停頓下來。雖然過去看似可以掌握,但是以大數據為標尺的預測決策也難以精確。數據是依照用戶的思維慣性和價值理念而被架構出來。因此數據的誕生,先天附帶人的主觀性。用戶所掌握的大數據分析結果,其價值形成走過了從構建到解讀的全通道。大數據難以成為用戶決策的精準標尺。
3.6用戶隱私泄露的問題
跨地域利用大數據要分析用戶信息。分析流程是收集、分析、傳輸。圖書館在傳輸用戶信息時可能會遭遇法律問題。比如數據泄露,會為權利人帶來損失,使個人用戶的隱私權受到損害。
3.7數據所有權易丟失的問題
大數據時代,數據分析工具主要由專業的數據商和系統商開發。圖書館購買軟硬件時容易被其限定權利。系統商和數據商在提出大數據設計方案時如配備兼容性差的軟硬件設備,那么圖書館就很容易被特定數據商和系統商綁定。
3.8大數據的結果缺乏因果關系的問題
大數據的研究方法只能統計某事物發生的頻率和相關性,不能得出因果關系。相連關系數據的增多,反而可能步步將用戶引入岔路上。大數據僅僅解決當前問題,而對于圖書館宏觀戰略等問題難以著手,因此大數據的投入面臨著商業風險。如果投入與產出不成正比,就是沒有達到預期目的。
4圖書館在跨地域交流中的大數據應用對策
4.1跨地域交流的圖書館各主體應建立學科門戶服務集成模式
筆者認為未來圖書館的信息服務方向是“跨地域學科化服務”。研究焦點是架構學科模塊服務集成模式。對于具體學科范圍,對數據資源進行規范性描述,進行梳理后再面向跨地域用戶提供檢索及導航等增值服務。包括:①主題信息模塊。對信息資源描述、檢索,發揮信息資源的官方性、真實性、連續性等優勢。②專業信息模塊。作出多學科信息模塊之間的再檢索、再選擇及再描述,為用戶提供集合各種專業信息資源的服務。③母子信息模塊。以信息模塊整體為母體系,整合多個分布子模塊,幫助用戶通過統一的信息模塊體系組織信息資源的檢索和應用。④開放信息模塊。實現學科信息門戶資源與服務的集合,根據用戶的個性化需求提供信息門戶定制服務,按照業務標準對信息服務進行統一安排。
4.2開展信息推送服務
信息推送是通過契約與標準,接受用戶的請求,將所需信息資源主動傳遞到客戶端。信息推送服務是以網絡技術為基礎的新穎服務模式。首先由用戶將其個人信息與需求輸入特定系統中,然后信息推送軟件抽取出資源,經過加工整理傳遞到用戶端。通過信息推送服務,用戶只需輸入單次信息請求,即可通過多種途徑持續高效地接收高質量的信息資源。
4.3引進信息營銷理念
在圖書館信息服務中引入營銷理念,是進入大數據時代圖書館的創新嘗試與變革。圖書館的世外桃源形象將被徹底改變。信息服務營銷使得圖書館信息服務有了強大的發展動力。對信息資源及信息服務進行分析調研,利用促銷、分銷手段進行科學經營,在實現信息服務與用戶價值交換的過程中滿足用戶的信息需求。信息資源的實際使用價值大大提高,實現大數據時代的雙贏。筆者認為大數據時代圖書館的信息服務會升級,特別是信息營銷理念會被普遍接受。比如在網上進行信息服務營銷;把初級營銷、高級營銷、互動營銷等緊密連接,形成一套完整的信息服務營銷體系,利用各種營銷策略促進圖書館信息服務水平的不斷提升,并向著品牌化的方向發展。
4.4堅守資源建設生命線
圖書館應用大數據,很容易造成“大數據是萬能的”這樣的印象。大數據僅僅是一項獲取信息的工具,而面對占有資源與索取資源這兩個選擇,我們肯定首選前者。資源建設是圖書館的生命線。只有占有資源,圖書館才能有底氣,有生命力。尤其是特色資源建設代表著圖書館在業內的學術地位,在學科建設過程中占有超級資源也就擁有了學科的制高點。科技在變,但圖書館收集、整理、珍藏和利用人類智慧的功能不會改變。
4.5加強不同地域圖書館之間的合作
我國不同地域的圖書館存在嚴重的地域差異和兩極分化的現象,加強圖書館之間的合作可以取得優勢互補的效果,可以提升圖書館的綜合競爭力。高校圖書館的數字資源建設及數字信息服務水平比較高,中小學圖書館、縣級公共圖書館可請求高校圖書館對其進行指導,例如有關數字資源的共享、信息咨詢等。該工程需要政府支持和引導。我們可以借鑒和學習美國政府于2012年啟動的“大數據研究發展計劃”。其計劃目的是研究發展大數據的采集、組織、分析、決策工具及技術。
4.6完善學科館員制度
學科館員的職責是組織、分類整理、編排、升級所收集到的信息資源,對跨地域客戶提供人性化、專業化的定制服務。學科館員對應用網絡檢索工具熟稔于心,能夠高質量開展檢索,運用高效的檢索技能對跨地域客戶的檢索問題進行回答。學科館員建設的力度和學科館員專業水平、服務態度的優劣,代表了圖書館的整體管理水平,也代表著圖書館個性化服務的水平。
5結語
信息社會大數據時代已經到來,大數據作為目前圖書館學界最新的研究領域之一,吸引了眾多學者關注和研究。圖書館在未來的工作中,應積極倡導以大數據為導向,通過樹立先進理念,不斷掌握新技術,更好地為讀者用戶服務。
參考文獻:
[1]嚴浪.大數據在圖書館的應用與對策[J].圖書館學刊,2014(5):54.
[2]CNNIC第33次調查報告:網民規模[EB/OL].[2014-01-16].http://tech.sina.com.cn/i/2014-01-16/10499101841.shtml.
[3](印)阮岡納贊.圖書館學五定律[M].北京:書目文獻出版社, 1988.
[4]舒忠梅,屈瓊斐.大數據時代高校信息管理與決策機制研究[J].華南理工大學學報(社會科學版),2013(6):97.
[5]苗松,盧章平,王正興.我國移動圖書館熱的冷思考[J].圖書館建設,2013(4):13-16.
[6]The White House.Big Data Across the Federal Government[EB/OL].[2012-08-10].http://www.whitehouse.gov/sites/default/files/micro-sites/ostp/big_data_fact_sheet.pdf.
(編校:周雪芹)endprint