●胡文靜,沙勇忠,郭 瑋(蘭州大學圖書館,蘭州730000)
?
“大數據”時代圖書館生態系統的解構與重構
●胡文靜,沙勇忠,郭瑋(蘭州大學圖書館,蘭州730000)
[關鍵詞]大數據;圖書館;生態系統
[摘要]在闡釋“大數據”和圖書館生態系統內涵的基礎上,從建筑、資源、技術、管理、用戶、服務、耗散7個方面重新審視了大數據時代圖書館生態系統,為圖書館構建適應大數據背景、可持續發展的良好生態系統提出了導向性策略。
2007年,計算機圖靈獎得主吉姆·格雷(Jim Grey)在美國國家研究理事會計算機科學和遠程通訊委員會(NRC-CSTB)的演講報告中提出了科學研究“第四范式”即以數據密集型計算為基礎的科學研究范式。[1]2008年9月,《科學》(Science)雜志發表文章“Big Data:Science in the Petabyte Era”,提出“大數據”(Big Data)一詞,隨之得到了廣泛的傳播。[2]2011年5月,易安信(EMC)舉辦了主題為“云計算相遇大數據”的會議,“大數據”概念正式誕生;6月,國際數據公司(IDC)編制的年度數字宇宙研究報告“Extracting Value from Chaos”(從混沌中提取價值)發布,奠定了大數據概念的理論基礎。同年,麥肯錫研究院在“Big data:The next frontier for innovation,competition,andproductivity”(大數據:創新、競爭和生產率的下一個前沿)的報告中提出“大數據”時代已經到來。[3]
大數據是一個抽象的概念,各個領域的專家學者由于關注點的不同,對大數據有著不同的定義。美國英領出版公司(O'Reilly Media)的市場研究總監馬格拉斯(Magoulas)對大數據的定義作出了得到廣泛認可的概括性描述:當數據的規模和性能要求成為數據管理分析系統的重要設計和決定因素時,這樣的數據就被稱為“大數據”。[3]在此定義中,除數據規模外,數據查詢與分析的復雜程度也是界定大數據要考慮的因素。在麥肯錫的定義中,“大數據”是指大小超出了典型數據庫軟件的采集、存儲、管理與分析能力的數據集。該定義指出,符合大數據標準的數據集大小是變化的,會隨著時間推移、技術進步而增長,不同部門符合大數據標準的數據集大小會存在差別,范圍從TB到PB不等。[4]IDC從計算機技術角度將大數據定義為對新一代的技術和架構體系的描述,通過高速采集、發現或分析,提取各種各樣的大量數據的經濟價值。Velocity(生成快速)、Variety(模態繁多)、Volume(體量浩大)和Value(價值巨大但密度很低)即4個V是大數據的主要特點,這一觀點得到了廣泛的認同。[5]
生態系統(Ecosystem)概念是由英國植物群落學家Tansley于1935年首次提出,用于強調各種不同事物間的聯系。之后,生態的概念被廣泛應用于經濟、文化、教育等領域。在圖書館領域,Donley (1957)提出圖書館是一個有機生態系統,其發展受到文化、經濟、地理因素及數字化技術等因素的影響。[6]我國對圖書館生態系統的研究起步于90年代初,1993年侯曉軍提出了圖書館系統是一個生態系統,該系統是圖書館生態學的研究對象。圖書館系統與其各組成部分以及圖書館系統各組成部分之間的關系,圖書館外部環境與圖書館系統之間的相互關系是圖書館生態學的主要研究內容。[7]
運用專業知識對數據進行加工、處理、保管、傳遞,對人類知識和信息進行組織、整理,促進其交流和利用是數字環境下圖書館職業實踐活動宗旨,[8]從行業定位角度與數據具有天然和緊密的聯系。通過選擇和構建良好的生態系統,使圖書館系統的各個方面與大數據環境下的需求相適應,是圖書館提高核心競爭力,獲取持續競爭優勢的重要途徑,也是圖書館克服服務內容、服務模式上的局限性,獲得創新突破的關鍵。
胡唐明從系統平衡的角度把圖書館生態系統分為基石、元素、驅動力、交互四個邏輯范式,并細分為建筑、資源、技術、管理、用戶與服務、耗散六個維度。[9]本文將用戶生態與服務生態分開討論,從七個維度對大數據背景下的圖書館生態系統進行再審視。
2.1建筑生態
(1)全面的感知空間。與物理性空間不同,數字空間的本質是流動的。信息可以以位的形式任意穿梭于物理空間中,然后再以文字、影像、聲音等各種可感知的媒體重新構成一個整體。[10]麻省理工學院的媒體實驗室(Media Lab)提出了“互動空間”的概念,互動空間在模擬真實空間的基礎上,將人的行為考慮進去,人的行為將會在虛擬空間中引起某種變化,這種變化又會反映到現實空間中。[10]大數據時代,隨著無線傳感器技術在圖書館建筑中的廣泛使用,構建了一個全面的感知空間。圖書館可通過對用戶需求信息的收集、分析重組位信息,實現個性化的信息獲取和傳遞,完成高質量的交流。
(2)泛在的信息空間。從1999年美國北卡羅萊納大學圖書館負責人DonladBeagle提出信息空間(IC)概念以來,信息空間理念在國內外很多圖書館設計中得到了實踐。[11]此概念從各種角度強調了物理空間的信息功能,在大數據時代這個概念將得到進一步的延伸。實體環境與數字環境界限模糊,物理空間與信息空間共生,是大數據時代圖書館建筑生態的一大特征。無線網絡的覆蓋與社交網絡的普及在網絡層面推動了這一趨勢發展;多媒體技術的發展、大數據分析工具的使用、專業化信息服務團隊的建設在技術層面支撐了這種融合;跨越物理空間界限的智能信息推送、移動圖書館、實時互動交流等新應用則是泛在的信息空間在應用層的表現。
2.2資源生態
(1)資源類型的多樣化。大數據時代,用戶信息資源與圖書、文獻、多媒體資源一樣,成為圖書館資源的重要組成部分。數據分析人員可利用數據挖掘技術對用戶數據進行分析處理以獲得潛在的用戶行為特征,以此為依據為用戶提供個性化的信息服務。圖書館可獲得的用戶信息資源包括用戶基本信息、流通歷史數據、信息咨詢記錄、Web日志數據等。[12]
(2)資源的內部整合與外部共享。發現系統為數據量激增的圖書館內部資源整合帶來了解決方案。通過對資源的整合與分析,可實現精準搜索、展示知識關聯、立體引文分析、揭示學術趨勢等新功能。組織邊界的模糊化使圖書館可獲得的資源跨越了物理界限,數據的開放與共享為大數據時代的圖書館帶來了更廣泛的資源來源。開放獲取(OA)與行業聯盟是圖書館行業實現資源共享的兩種模式。有數據表明,截止2014年4月,在世界范圍內的開放獲取機構知識庫數量已達到2620個。[13]行業聯盟模式也在世界范圍內得到了普及,最具代表性的為美國的OCLC、中國的NSTL。
2.3技術生態
2012年,美國國家醫學圖書館在奧巴馬政府的支持下成為國家“大數據研究和發展計劃”重要組成部分,要求其提高從大量數據中訪問、組織、收集發現信息的技術水平及提供大數據歸檔、保存、傳播和其他數據服務的能力。[14]根據大數據的處理流程,在數據獲取階段,RFID射頻數據、傳感器數據、移動互聯網數據及社交網絡交互數據將會成為大數據時代圖書館的主要信息來源。在數據存儲與組織階段,關系型數據庫與云存儲方式的有機結合將成為最佳方案。大數據組織可以充分利用Hadoop的數據組織機制提供系統的容錯性、擴展性和靈活性,解決大數據處理的橫向擴展問題;利用關系數據庫實現數據的查詢和存儲機制,解決性能問題。[15]在分析階段,實時數據分析與離線數據分析并存,一方面滿足用戶的實時體驗,一方面通過大數據分析平臺實現深度挖掘與精細服務,最終將大數據轉換成可操作、可視化的知識以支持各類用戶的決策。
2.4管理生態
大數據時代,組織內部呈現出工作更加協同、績效更加透明、彈性工作網絡的廣泛使用等特征;[16]同時,組織外部環境變得復雜,組織與外部環境的聯系也越來越緊密,組織將更多注意力轉移到尋求外部效率的提升和挖掘,組織與組織之間的無邊界化與虛擬化趨勢也日益明顯。人在組織中的所有關系可通過深度挖掘數據展示出來,用可視化的方式來清晰呈現,用可量化的方式來進行評價。組織內外環境的變化與技術的進步使大數據環境下的管理是有多種選擇方案也有備份措施的可控行為,其風險程度也將大大降低。[16]在管理體制上實現從碎片化到網絡化的轉變;在管理方法上主張用數據說話;在管理模式上執行動態實時管理;在管理方式上遵循基于數據的決策。
2.5用戶生態
用戶行為可計算,是大數據時代圖書館用戶生態的主要特征。2009年2月《Science》提出社會計算科學(Computational social Science)概念,指出人們已經能夠收集和分析大規模的人類行為數據并從中發現個人和群體行為的模式。[17]大數據時代,用戶行為計算的特點主要有以下4個方面。[18](1)數據的豐富性和自主性。用戶行為數據包含了用戶的行為習慣、需求、偏好、情感因素等,這些數據無需引導用戶參與調查,可直接獲得。(2)減少研究的“未知”視角。傳統用戶行為分析有一定的局限性,在調查設計時會忽略自己的“未知”,大數據背景下則容易挖掘用戶行為的隱含模式。(3)數據實時化。大數據背景下可實時采集、分析用戶的行為數據,第一時間確認理解用戶的反饋。(4)數據低投入。大數據背景下用戶行為分析較省時省力,是一項低投入高回報的項目。圖書館可從用戶的黏性(訪問頻率、訪問間隔時間)、活躍度(平均停留時長、平均訪問網頁數)、產出(借閱量/下載量、借閱/下載類型)等角度入手,對用戶行為進行分析:①用戶分類,利用分類技術將用戶歸屬為一個特定的類;②用戶特征分析,找出各類用戶的行為特點;③關聯分析,發現用戶行為之間關聯規則;④預測分析,通過建模預測用戶行為。
2.6服務生態
大數據時代的圖書館服務是基于知識發現的智慧服務。智慧服務是依托智慧的專業館員和優質、多元的信息資源,在互聯、智能技術驅動下,提供主動靈活、無處不在、形式多樣的能有效支持用戶知識應用和知識創新的服務。其核心是在為用戶提供經過提煉加工而成的知識產品的同時,還致力于培育用戶駕馭知識、運用知識和創新知識的能力,幫助用戶從“有知識的人”成長為“有智慧的人”。[19]從服務理念的角度,數據理念將得到進一步深入。一是信息技術要前傾,充分利用現有信息技術打造數據環境,利用數據探索用戶需求,用信息技術引領服務,使服務更有針對性;二是數據分析要前移,從數據中來,到服務中去,把服務前移到用戶來到前,制定好服務的流程與服務措施。從服務模式的角度,求解服務模式將得到廣泛的應用,用戶不再需要參與到具體的數據處理活動中,只需等待數據服務者提供解決方案。求解模式解決的問題通常是常規數據應用不能解決、需要以大數據做支撐通過特定地分析處理來解決的問題。[20]
2.7耗散生態
耗散生態指圖書館的外部生態,與內部生態的聯系主要體現在交互上。在橫向聯合方面,網絡化使大數據環境下行業內部各合作伙伴之間的數據傳遞和信息共享更加頻繁,虛擬圖書館、行業聯盟等合作模式使圖書生態系統的開放程度更高。在縱向整合方面,產業鏈上下游行業之間的知識溢出、技術創新呈現出相互學習、相互促進的局面。數據生產者、服務提供者、用戶將以數據為紐帶更加緊密的聯系起來,實現分工協作、互利共生,從而實現供應鏈向價值鏈,進而向多方共贏生態圈的轉變。圖書館生態系統正是通過這樣一種與外界的交流機制,完成了大數據環境下系統平衡—不平衡—平衡的過程,得到了進化。
3.1打造適應大數據環境的基礎設施
大數據環境下的圖書館生態系統必須構建良好的數據處理和知識共享環境,暢通生態系統的數據交流渠道。一方面,要提高處理數據的效率,建設高效的網絡覆蓋、傳感器網絡數據存儲和處理系統、云計算平臺等硬件系統;另一方面,要運用科學的軟件系統獲取、處理、挖掘數據,進行決策支持;此外,還要結合實際應用開辟新媒體渠道、協同工作平臺等數據交流與共享的渠道。
3.2構建有效的用戶關系管理系統
以用戶為導向是當今圖書館的服務發展方向,而圖書館生態系統中最不確定的因素是用戶需求。構建有效的用戶關系管理系統,對用戶的信息進行全面的分析和處理,預測用戶實時的、動態的、個性化的需求是大數據時代圖書館提升服務質量的關鍵。適應大數據要求的用戶關系管理系統應該具有如下特征:[21](1)能夠對結構化、半結構化以及非結構化數據進行處理,提供全面、豐富的個性化用戶信息并擁有海量的存儲能力;(2)能提前預判用戶實時變化的需求,通過持續跟蹤、監控用戶的狀態和行為,有效弱化需求變動的影響;(3)綜合應用數據庫、數據倉庫、數據挖掘、圖形用戶界面等先進技術,向服務人員提供操作簡單、功能強大的數據處理功能。
3.3以“數據”為核心資源的服務創新
(1)服務產品創新。引入新的或顯著改善的服務,包括在服務技術特性、構成要素等方面的顯著改進。在大數據時代,服務創新更多體現在利用數據挖掘技術推進新服務的提供,用戶分類服務與用戶定制服務成主流的服務模式。
(2)服務方式創新。一是服務界面要簡潔,服務流程要簡化。后臺數據做加法,前臺呈現做減法,在傳統服務上以用戶自助服務替代繁瑣的人工服務。二是提高服務效率,實現從微觀精確到宏觀呈現的轉變。數據量非常少,就必須極精確地、高質量地來處理以及呈現它們。擁有了大數據,可適當忽略微觀層面上的精確度,不再需要花大量時間追求通過精確的數據來尋找結果,只要掌握大體的發展方向即可,這樣會讓用戶在宏觀層面擁有更好的洞察力。
(3)服務營銷創新。大數據時代的圖書館營銷創新更多體現在用戶細分、精準信息推送、差別定價等方面。一方面,借助社交媒體保障與顧客的長期溝通,建立穩定用戶群體,獲取用戶個性化需求;另一方面根據龐雜的用戶數據,按照橫縱多維方式對用戶群體準確分析,并且準確傳達用戶所需信息,確保實現精準營銷。
3.4培育適應大數據環境的圖書館文化
大數據時代的圖書館變革是一個牽一發而動全身的復雜過程,同時需要生態系統內所有成員參與數據的管理和控制,這就需要培育重視數據處理與應用、適應大數據環境的圖書館文化。
(1)重塑觀念。穩定持久的慣性文化理念是大數據變革的絆腳石,建立一種數據導向型的文化是大數據時代圖書館變革取得良好效果的先決條件。這些觀念包括:協同的工作理念、客觀的評價標準、創新的意識形態、開放共享共贏的發展戰略。
(2)制度保障。重點構建數據安全保障制度,尤其是個人隱私的保護制度,同時也包括數據獲取、存儲制度,數據傳播、共享制度等。在數據公開或共享時,嚴格遵循用戶信息有效保護原則、數據對等交換原則、信息價值可衡量原則,保證所有涉及到用戶信息的使用必須建立在用戶主動、自愿和授權的基礎上并保證用戶的隱私信息絕對安全;數據分享后要完成回流、增值、再沉淀的過程,使得分享和交換的雙方共同受益;在數據合作前一定要制定客觀的價值評估體系,確保合作公平和公正。
(3)人才培養。麥肯錫公司預測美國到2018年需要深度數據分析人才44~49萬人,缺口14~19萬人。[22]在中國,理解與應用大數據的創新人才更是稀缺資源。重視館員培訓,培養深入了解圖書館業務運作細節、具備數據勘探等統計應用知識、熟悉數據分析工具操作的大數據人才隊伍,是圖書館在大數據時代可持續發展的關鍵。
大數據是一種資源、一種技術、一種工具、一種環境、更是一種趨勢。[23]一方面基于大數據的創新或變革浪潮勢不可擋,為圖書館的發展帶來了新的機遇;另一方面價值與風險并存是大數據的兩面性,對圖書館的各方面帶來新的挑戰。洞悉大數據時代圖書館生態系統的變化,對圖書館應勢而變,不斷創新具有啟發性和導向性作用,而如何將生態系統的構建策略轉變為行之有效的具體措施是當前和今后需要繼續思考和解決的問題。
[參考文獻]
[1]周曉英.數據密集型科學研究范式的興起與情報學的應對[J].情報資料工作,2012(2):5.
[2]Nature.Big data:Science in the Petabyte Era[EB/OL]. [2012-11-04].http://www.nature.com/nature/journal/v455/n7209/edsumm/e080904-01.html.
[3]Big data:The nextfrontier for innovation,competition, and productivity[EB/OL].[2011-05-27].http://www.mckinsey.com/insights/businesstechnology/bigdatathenextfrontierforinnovation.
[4]Manyika J,etal.Bigdata:The nextfrontier for innovation,competition,and productivity[R].McKinsey Globalinstitute,2011:1-137.
[5]Gantz J,Reinsel D.Extracting value from chaos[R]. IDCiView,2011:1-12.
[6]Donley J,Albert M.Library Ecology and Electronics [J].American Documentation,1957,8(4):300-305.
[7]黨洪莉.我國圖書館生態學研究綜述[J].情報探索,2009(8):39.
[8]于良芝.圖書館學導論[M].北京:科學出版社,2003:17.
[9]胡唐明,等.基于系統平衡的圖書館生態指標體系構建[J].情報雜志,2009,28(8):89-90.
[10]李曉鋒.信息技術影響下的建筑空間嬗變與再詮釋[D].武漢:華中科技大學,2005:53-54.
[11]于麗鳳.國外大學圖書館信息共享空間理論研究與實踐[J].圖書與情報,2008(3):31.
[12]王偉.基于數據挖掘的圖書館用戶行為分析與偏好研究[J].情報科學,2012,30(3):393.
[13]知識庫和社會化媒體融合現狀與策略[EB/OL]. [2014-07-21].http://media.people.com.cn/n/2014/0710/c14677-25266028.html.
[14]張興旺.圖書館大數據體系構建的學術環境和戰略思考[J].情報資料工作,2013(2):14.
[15]郭自寬,等.大數據生態系統在圖書館中的應用[J].情報資料工作,2013(2):25-27.
[16]徐敏亞,等.大數據對組織變革的影響[J].企業管理,2013(9):106-107.
[17]Lazer D,etal.Computational social science[J].Science,2009,323(5915):721-723.
[18]大數據與市場研究[EB/OL].[2013-06-12]. http://www.emarketing.net.cn/magazine/adetail.jsp?aid= 2380.
[19]許春漫,陳廉芳.高校圖書館智慧服務模式下智慧館員隊伍的建設[J].情報資料工作,2014 (1):87-88.
[20]文峰.對幾種典型數據服務模式的對比分析[J].科技信息,2013(25):105.
[21]資武成.“大數據”時代企業生態系統的演化與建構[J].社會科學,2013(12):56.
[22]2014中國大數據發展分析報告[EB/OL].[2014-11-13].http://www.ciotimes.com/bi/bzjgd/96563_3. html.
[23]任廣見.基于“大數據”的商業模式創新及啟示[J].現代商貿工業,2013(20):172.
[責任編輯]邵晉蓉
[收稿日期]2014-11-27
[作者簡介]胡文靜(1983-),女,碩士,蘭州大學圖書館館員,研究方向:圖書館組織文化,信息計量;沙勇忠(1968-),男,博士,蘭州大學管理學院教授、博士生導師,蘭州大學圖書館館長,研究方向:信息資源管理、網絡信息計量;郭瑋(1983-),女,碩士,館員,研究方向:信息素養教育,圖書館服務創新。
[文章編號]1005-8214(2015)09-0001-04
[文獻標志碼]A
[中圖分類號]G250.15