吳曉靜
關鍵詞:大數據;高校圖書館;服務轉型
摘要:文章根據大數據背景下,美國高校圖書館嘗試服務轉型,并以雪城大學、斯坦福大學為例,雪城大學應用大數據技術收集社交媒體信息,預測2016年總統大選;斯坦福大學參與社會互聯網信息與電子郵件保存、整合與管理的實踐,體現了在大數據時代美國高校圖書館服務的轉型新趨勢,為國內高校圖書館的服務創新及轉型發展提供了經驗。
中圖分類號:G250.74文獻標識碼:A文章編號:1003-1588(2016)07-0122-03
隨著信息技術的快速發展,現實物質世界不斷被數據化,當物質世界完成數據化的構建及解讀,人類即邁入智能時代[1]。大數據時代催生了新的知識需求模式及管理模式,對圖書館行業產生了深刻影響。一方面,圖書館界加快了基于互聯網、大數據技術的融合轉型,開始運用互聯網思維變革、創新服務,在合作、支持、外向發展的思維指導下,圖書館員開始日益關注如何更加有效地與研究人員開展合作,如何滿足教師及社會大眾的多元需求。另一方面,圖書館開始充分依托大數據技術,推動數字資源整合,提供深度服務。其服務模式包括:①通過館藏資料的數字化和網絡化加大館藏資源的揭示力度,提供一站式服務,通過異構數字資源的融合、聚類和重組使資源從數據層的揭示與展現轉向信息層、知識層的深度服務。②加強用戶數據分析,實現個性服務。如:通過大數據分析精準預測單個用戶信息需求模式及行為模式,推送服務。③參與互聯網信息的采集、保存和服務。如:整理社交媒體信息,幫助社區理解主要的數據和信息資源,并利用數據構建智能社區[2]。近日,美國圖書館協會主席薩莉·菲爾德曼在接受《高等教育紀事報》采訪時以雪城大學圖書館的STACK(堆棧)項目等為例,展示了美國大學圖書館在大數據利用方面的示范作用[3]。對國外大數據創新服務實踐經驗的研究能夠為國內圖書館的服務轉型提供參考和借鑒。
1 美國高校圖書館大數據服務實證研究
1.1 雪城大學圖書館STACK項目
大數據產業鏈與數據的生命周期密切相關,數據從產生、整合、處理、智能分析,最后與創新服務的結合應用,構成了大數據完整的產業鏈,而完整的大數據技術堆棧則相當于涵蓋數據生命周期的大數據平臺。通常的數據堆棧包括:①作為堆棧底層和基礎的數據層。②發生數據準備、數據處理、數據轉換和數據整合的整合層。③存儲數據、對數據進行可視化、分析數據的分析層。④使用數據(包括歷史數據、外部數據和實時數據)、業務規則和機器學習來進行預測及獲取大數據價值的預測及規范分析層。從底部數據存儲、操作、轉換、基本分析發展到高級分析的預測,是大數據技術應用發展的必然[4]。在數據堆棧技術的應用上,美國雪城大學iSchool走在了圖書館界的前列。
STACK項目是雪城大學iSchool新開設BITS Lab(Behavior,Information,Technology and Society行為、信息、技術、社會實驗室)的第一個項目。作為雪城大學iSchool跨學科數字政治項目的分支,STACK項目具體運作如下:①開發STACK軟件與Twitter、Facebook數據流、搜索工具的應用程序接口。②圍繞36位競選州長,展開大數據采集,這些信息包括在Twitter中被推送、加標簽、關注、談論的相關信息,在Facebook中被發布、喜歡、分享、追隨的頻次以及在Instragram、YouTube上的相關照片、視頻等。③以Python格式語言將這些非結構化、半結構化數據存儲在MongoDB NoSQL數據庫中。④分析選民對各候選人的談論及態度,各候選人的選舉策略及選舉圈內的信息傳遞、轉移模式等。在開始運行的數周內,STACK項目就已經收集了超過70萬條推特信息及大量臉書評論信息,每周項目組均會就大數據調研結果編寫基本的定性分析報告,預測大選發展趨勢及可能出現的新信息、新選情。在大選結束后,項目組還將圍繞數據基礎管理、大規模數據集處理、情感分析總結出一套協調化、多管齊下的大數據分析方案[5-6]。
1.2 斯坦福大學圖書館ePADD項目
ePADD項目是斯坦福大學圖書館聯合伊利諾伊大學香檳分校、哈佛大學、加利福尼亞大學圖書館及紐約城市圖書館委員會,通過合作開發支持電子郵件檔案檢索、采集、處理、評估、傳遞的開源軟件,參與互聯網信息的整合與管理,促進統一性國家數字平臺的形成,這也是IMLS國家數字平臺項目二階段的子項目之一。2014年,斯坦福大學圖書館正式啟動ePADD項目,一階段的任務包括:針對資助者、檔案工作者及研究人員所面臨的電子郵件訪問、管理等日常問題開發ePADD工具,利用自然語言處理、自動元數據處理及其他批處理技術,形成基于工作流的電子郵件檔案管理,提升電子郵件中隱藏性文化遺產資源的能見度及可獲取性。二階段的任務包括:①發展ePADD評估、處理、搜索、傳遞關鍵功能模塊,形成支持電子郵件存取的生態處理與工作流程系統,促進跨館藏、跨機構的電子郵件發現與檢索及對公眾的可見性。②創建培育融合ePADD用戶、開發者及充滿活力的持久型社區,促進在ePADD使用基礎上,整個社區的廣泛參與與充分合作[7]。ePADD項目是斯坦福大學圖書館以外向發展思維為指導,在充分合作基礎上,參與互聯網檔案管理、挖掘電子郵件大數據價值的有益嘗試。
2 美國高校圖書館基于大數據的服務轉型啟示
2.1 關注社區,以數據技術為驅動,助力圖書館轉型
信息技術迅速發展的大數據環境,無論是在資源建設、空間設計,還是在服務模式上,美國高校圖書館都在經歷著轉型,關注社區及以數據技術和資源為驅動,是其轉型期的重要表現之一。
2.1.1 關注社區。圖書館關注重點正經歷由資源向人和社區的轉變,如何將服務有效嵌入用戶的工作、學習和科研實踐中及如何促進用戶對內容創建、制造等創新活動的參與,逐漸成為高校圖書館研究的重點。
2.1.2 以數據技術和資源為驅動。圖書館的服務不再圍繞資源和技術展開,而是以技術和資源為手段,通過發揮技術和資源的最大化效應,滿足用戶需求,輔助用戶參與學習、創造活動,推動社區的學習和科研進程。資源數字化、服務網絡化及管理知識化將是大數據時代圖書館的主要特點及轉型升級的方向和目標,國內高校圖書館以大數據技術和大數據資源為驅動的服務轉型應做好如下規劃:①加快館藏資源的數字化、網絡化進程,利用元數據、數據關聯技術打通數據,實施基于業務流程、揭示信息服務和發現并支持流程管理及數據統一管理的平臺架構,建立統一、開源的數據倉儲平臺,推動數字資源的開放存取與反復、活化使用。②將大數據分析技術應用至用戶需求分析、圖書館空間設計、服務設計的多個領域。③積極參與互聯網信息大數據的保存、管理、分析及應用,在實現自身對社區參與、融合的同時,推動社會全面信息資源生態管理系統的構建。
2.2 外向發展,參與網絡數據管理,挖掘大數據價值
在大數據技術的創新利用方面,高校圖書館應在科學規劃、明確功能性定位的基礎上,善于引勢、借勢和造勢,為圖書館外向型發展拓展更大空間,同時創新體制、統籌協調,逐步實現從底部數據存儲、操作、轉換、基本分析發展到高級分析,以及預測技術應用路徑等方面提升大數據服務的整體效能,充分挖掘大數據價值。需要強調的是,無論是對館藏使用數據的分析,還是參與社交媒體、網絡實時數據的分析,圖書館應把握以下原則:①堅持長期的數據積累。從長期的趨勢分析、挖掘中發現新的價值和元素。②聯系的觀點。以用戶信息需求分析為例,其影響因素不僅包括用戶年齡層次、文化背景、學科背景等顯性因素,還應包含其他一些實時性、特殊性的隱性因素,如用戶從事科研項目所需要的交叉學科知識或用戶從事其他特定活動所需要的新信息,這些都需要圖書館員潛心挖掘。③跨學科合作。信息、技術、用戶行為三種因素相互影響、交叉作用的復雜性必須以跨學科的知識與視角為支撐。④注重數據分析結果的轉化和應用,即數據分析結果源于實踐,最為重要的是能夠利用其指導實踐,決策服務,最終形成行之有效的解決方案。
2.3 關注教學,以素養提升為目標,促進個性化學習
2015年,新媒體聯盟地平線報告指出高等教育的發展趨勢及挑戰中,與圖書館大數據服務相關的內容包括:提升師生的數字素養,開展復雜思維教學及個性化學習。數字素養是大數據環境下對信息素養概念的延續和擴展,其包括數據敏感性、數據分析處理能力、利用數據開展決策能力及對數據的批判性判斷等多個范疇;個性化學習是指在測量、收集、分析和報告關于學習者及其學習情景的數據基礎上,針對個體學生特定的學習經驗、需要、興趣、愿望或文化背景設計教育項目、教學方法及學習支持策略等;復雜思維教學主要涉及的內容包括利用數據解決問題的能力、利用可視化工具呈現內容的能力、演講與溝通能力、計算思維、設計思維、批判性思維、工程思維和系統思維等[8]。由此可見,數字素養與個性化學習及復雜思維教學密不可分。
2.4 融入社區,以數據服務為切入點,推進社區智能化
社區是圖書館資源和服務的擴展,是圖書館尋求多元合作的伙伴、創新服務模式和服務內容、提升投資回報率的核心平臺。高校圖書館應秉承開放、包容的態度,以數據服務為切入點,加快推進社區的智能化進程。首先,智能化社區建立在社區的數據化描述基礎上,物質、行為、需求等各類要素的數據化描述將促進社會生產力的迅速提升;圖書館應向社區大力宣傳數據的重要性,幫助人們樹立數據意識,培育數據素養,懂得如何利用數據創新價值。其次,智能化社區提倡數字化資源的共建共享,任何人都可能提供數據,個人的“人生數據流”交匯集合形成蘊含巨大價值的“社區數據流”“世界數據流”。圖書館應在推動用戶的學習、內容創建及制造活動中,強化對用戶知識創新、創造過程及成果的數據化描述,將圖書館機構知識庫擴展為社區機構知識庫,形成開放統一的社區知識平臺。最后,社區數據價值的產生依賴于數據的充分流通、深度關聯及有效管理。圖書館應積極推動社區數據的開放存取,協助建立數據關聯及數據新秩序,實施有效的知識化管理,促進數據的多向傳播及反復利用,充分挖掘、釋放數據價值[9]。
3 結語
大數據背景下國內高校圖書館在充分關注學術社區教學、科研需求的基礎上,以數據技術為驅動,以數據素養提升為目標,充分挖掘學習大數據、研究大數據價值,在為高校創建個性化學習環境的同時,參與網絡數據管理,助力圖書館外向發展,推動公民社區建設的智能化。
參考文獻:
[1] 信息化時代或將過去智能化數據化構建趨于零的世界[EB/OL].[2015-09-07].http://tech.ifeng.com/internet/detail_2013_05/18/25450299_0.shtml.
[2] 李雪.數字圖書館迎大數據時代:將整合資源提供深度服務[EB/OL].[2015-09-07].http://culture.people.com.cn/n/2014/1105/c172318-25981395.html.
[3] 孫夢曦.大數據促美國大學圖書館轉型[EB/OL].[2015-09-06].http://sscp.cssn.cn/xkpd/xszx/gn/201511/t20151130_2718282.html.
[4] 2014年是“大數據堆?!蹦陠??[EB/OL].[2015-09-06].http://www.bithink.cn/info/html/78/n-6078.html.
[5] CampaignDataCollection and Analysis is First Project in iSchools New BITS Lab[EB/OL].[2015-12-06].http://news.syr.edu/campaign-data-collection-and-analysis-is-first-project-in-ischools-new-bits-lab-39419/.
[6] Syracuse iSchool Social Media Tool Used to Track Elections[EB/OL].[2015-12-06]. http://lj.libraryjournal.com/2015/11/digital-resources/syracuse-ischool-social-media-tool-used-to-track-elections/.
[7] Stanford University Libraries-Email:Process,Appraise,Discover,Deliver-ePADD Phase[EB/OL].[2015-12-25].https://www.imls.gov/sites/default/files/proposal_narritive_lg-70-15-0242_leland_stanford_junior_university.pdf.
[8] 新媒體聯盟地平線報告:2015高等教育版[EB/OL].[2016-02-25].http://www.edu.cn/xxh/spkt/xcsl/201511/t20151126_1342445.shtml.
[9] 吳建中.讓圖書館促進城市生命體的新陳代謝[EB/OL].[2015-12-30].http://www.libnet.sh.cn/sla/list2.aspx?dbID=15212.
(編校:馬懷云)