李 鵬
(山東大學洪家樓校區圖書館,山東 濟南 250100)
當前,互聯網、傳感網、物聯網、云計算等信息技術迅猛發展,數據以指數級增長,人類進入了大數據時代。所謂大數據,指數據海量膨脹并擴大到難以用一般技術進行分析處理的數據集合[1]。大數據廣泛存在于互聯網、移動網絡、社交網絡、云計算、傳感網等,它具有體量巨大、類型繁多、價值密度低、更新速度快等特點,而從這些繁雜多樣的數據中快速獲得有價值信息的能力,即為大數據技術[2]。維克托在《大數據時代》一書中認為,世界的本質是數據的,它通過數據計量的形式改變了人們理解世界的方式,是人們獲得新的認識、創造新的價值的源泉。大數據開啟了一次重大的時代轉型,通過對大數據的獲取及利用,人類得以深入地探索現實世界的規律[3]。大數據作為一種新的生產要素,對其挖掘及利用已廣泛影響到各個學術領域及行業。
在大數據時代的信息環境下,信息以泛在化、智能化、移動化、虛擬化的形式發展,作為信息服務機構的圖書館也應隨之適應及改變。自大數據概念提出以來,相關圖書館與大數據的討論蓬勃興起,但縱觀這些研究,多是對技術方法及工具進行論述,從技術解析的角度討論如何在圖書館中運用大數據技術,如數據體系的構建、知識模型的概念及特征等。筆者擬從管理與服務的角度來說明在大數據環境下圖書館工作的應對及改變。
大數據最主要的特征為體量龐大,圖書館自從建立之初即具有文獻信息儲存的職能,在數據收集及保存上也一直處于信息服務的領先地位。在傳統館藏累積的基礎上,圖書館還有包括電子圖書、電子期刊、數據庫、音視頻資源、網絡資源在內的海量數字資源,同時隨著移動網絡、云計算、傳感網、語義網、社交網絡等新技術的發展,也擴大了圖書館數據收集領域,使數據量呈指數級上升。在一定程度上信息技術的發展使圖書館具備了大數據的特征,已突破了傳統圖書館的發展局限。
在大數據時代,因為數據的控制與處理更加容易及快速,人們對知識信息的獲取將更多來自于數據相互關系的梳理與精確分析之上。當傳統的專家直覺判斷被精確的數據分析所代替,同時專業數據公司在信息產業中的份額擴大,這將迫使圖書館調整其服務與管理上的傳統理念,以適應信息環境的變化。
大數據環境下,圖書館的發展趨勢是通過嚴謹的數據管理、富有洞見的數據分析,為用戶提供智能、泛在、協同的智慧服務。圖書館應創新服務模式,改變傳統的平面信息服務觀念,將結構化數據、半結構化數據、非結構化數據納入信息考察范疇,從宏觀、立體的角度分析梳理,為用戶提供高質量信息資源,并持續不斷地跟蹤用戶,向其推送所需信息,以此來提升信息服務能力。同時,在行政管理上圖書館也應發生改變,大數據技術在圖書館內廣泛應用,必將形成新的分工與合作,催生新的工作職責及服務部門,一些傳統的工作內容將發生改變或被摒棄,如同圖書館聯機編目使大部分圖書館出現了編目業務外包一樣,大數據技術也將會對圖書館的工作產生重大影響。
大數據技術引領信息服務向縱深發展,圖書館應及時做出反應,接受挑戰,在變化中求創新,在創新中求發展,關注相關技術和應用,不斷完善部門建設及服務職能,采取對應措施,提升圖書館管理與服務水平。
每一次重大的技術革命都給圖書館的信息服務帶來了深遠影響,但相比于理論的探討,在實踐應用上,圖書館對于新技術的反應并不積極[4],這就需要圖書館引導用戶重視新技術帶來的價值,激發他們利用新技術獲得便捷信息服務的熱情。大數據環境下,圖書館有機會在更廣域更深層次收集及使用全面完整的數據,并通過多維度、深層次的智能分析,給用戶提供敏捷化、專業化甚至是前瞻性的嵌入服務。而大數據技術所帶來的信息獲取內容及形式的變革,需要圖書館進行廣泛的宣傳及引導,使用戶及時接受新理念新思維,并形成對新服務的期待,進而有力地促進大數據技術在圖書館中的應用。
大數據的獲取、組織、分析及決策利用都離不開館員的廣泛參與,在缺乏數據技能支撐的前提下談論圖書館的數據服務將如觀賞鏡中花般虛幻。美國研究圖書館協會也提出,研究數據管理將是下一代圖書館員的能力之一[5]。培養館員的數據科學素養、專業技能,引進數據挖掘、數據分析、數據管理等方面的人才,是大數據技術在圖書館應用得以實現的基本條件。
首先應培養館員的大數據思維,即對冗雜的數據能夠從宏觀的角度實現跨學科的知識跳躍,領先一步發現新機遇新知識;其次是加強對大數據分析工具的熟練運用,大數據技術突出優勢是提供決策服務,館員應能利用分析工具在海量數據中實現知識的橫向擴展及數據多維度、深層次分析,提取有效信息,為用戶提供智能化決策服務;再次,圖書館應引進數據科學家,通過這些集計算機、統計分析、商業智能和信息管理等優勢于一身的新型人才[6],來保證圖書館信息服務的持續創新,同時帶動館員的成長;最后,建立館員評估機制,信息技術的高速發展也促使圖書館工作內容及職責的不斷變革與創新,要求館員的業務素養與時俱進,評估機制的建立及推行,將對館員的專業技能、服務質量進行標準化、規范化管理,有助于圖書館大數據技術人才、服務人才的培養。
大數據技術的應用,信息提供途徑的多樣化,專業數據公司的出現,這些都使得信息服務再次分工,促使圖書館的信息服務內容發生變化,如文獻采集范圍擴大、采集方式發生變革等。
2.3.1 大數據信息的采集及科學管理
2.3.1.1 通過多方途徑,進行大數據的采集及共享
信息服務的提供是在數據存儲及整合的基礎上進行的,數據的采集是圖書館基本工作職能之一。隨著信息技術的發展,大量的原生數字資源每時每刻都在產生,每個用戶、每臺終端都在產生信息。據IDC(國際數據公司)統計,2011年全球所產生的數據總量是1.8ZB(1021)。各類數字資源呈爆炸式增長,尤其是非結構化數據(圖片、聲音、視頻、地理位置信息等)已經成為信息資源的主體,目前非結構化數據已占數據總量的80%以上[7]。面對海量的數據信息,圖書館不能也無需收集所有的數據,但應加強對這些文獻數據以外的數字資源的采集處理。
大數據時代,圖書館的數據信息采集范圍除了傳統的紙質文本、數字資源外,還要擴大到對傳感網、社交網絡、移動互聯網等用戶與資源交互信息的收集;應重視對本地數據的收集,通過多方協作,與政府部門、院系、研究機構、國際數據信息管理組織建立密切聯系,共享科學研究型、民生服務型、經濟社會型等形式的數據資源;同時專業數據公司的出現,也使圖書館通過有針對性地購買數據,降低了開發成本,提高了資源利用效率。
2.3.1.2 建立數據管理部門,加強對大數據的科學管理
大數據內容龐雜,類型多樣,只有通過有效的組織管理,才能提供高質量的信息服務,對大數據的管理應是有序的、動態的、可持續發展的。因此,圖書館應建立數據管理部門,制定統一的數據管理標準,以便于形成長效機制,對數據進行科學管理及利用,規范其選擇、儲存、組織及開發流程。
數據的選擇要求根據館藏發展規劃,依據用戶需求及數據的價值,由具有圖情專業背景的人員承擔[6],數據的儲存可以通過關系型數據庫、SQL、云存儲等技術將數據關聯整合,形成數據網,但需要注意的是數據是動態的,有其生命周期,在有效期內要及時進行信息整合、分析,提供給用戶,同時也要對過期信息數據及時剔除,以節省存儲空間。數據的組織及開發是通過大數據分析工具對數據進行集成、關聯、計算,提供知識智能服務、信息可視化服務、個性化學科服務等。
2.3.1.3 最后,加強數據安全管理
在大數據環境下,通過對用戶數據的采集、儲存及深度分析,很容易了解用戶的行為及喜好、科研信息乃至商業機密,甚而能通過一些關聯數據進一步預測事物未來的發展趨勢。因此在對數據進行共享及利用的同時,要注意隱私及安全的考量,尊重與保護他人的知識產權,對于保密及不適宜公開的數據要按照級別提供目次管理。尤其是圖書館在采集用戶館藏信息利用數據時,一定要樹立良好的職業形象,完善安全機制,解除用戶對個人隱私的顧慮,使數據的采集及利用在合理合法中進行。
2.3.2 新型知識服務引擎——一站式檢索服務的建立
大數據環境下,數據信息海量出現,但許多數據僅僅是簡單聚集在一起,并沒有形成知識源供讀者使用。2011年麥肯錫全球研究所發布了《大數據:創新、競爭和提高生產率的下一個新領域》調查報告[8],指出雖然全球數據量在不斷增長,但仍有87.5%的數據未得到真正利用。這就造成了信息出現與利用的不對等,一方面有大量的數據可以提供信息服務,一方面用戶卻沉溺在信息海洋中,難以快速有效地尋找到所需信息。
作為信息查詢、檢索機構的圖書館,其檢索服務應適應信息環境的變化,幫助用戶從龐雜的數據中進行宏觀把握,快速、簡單地找到所有關聯信息以輔助決策。這就要求圖書館在數據檢索上應改變數據來源庫單一的形式,而向整合搜索、移動搜索、智能搜索和個性化搜索發展,在搜索手段的設計及實踐中,應以用戶需求為中心,在符合用戶查詢習慣的同時,對圖書館資源進行整合,包括館藏信息、電子資源、網絡資源等,通過對這些數據源的定位和連接,實現數據的采集、傳輸和匯聚,形成中心知識庫[5],建立新型知識服務引擎——一站式數據檢索。目前在一些高校已經開展了這種搜索服務,例如北京大學圖書館的“未名學術搜索”、山東大學圖書館的“讀秀”“超星發現”等,其“一站式檢索框”可以檢索到圖書館館藏的所有圖書、期刊、多媒體音視頻文件、學位論文、會議論文、電子書、電子期刊論文、訂購的數據庫資源、網絡報紙、網頁信息、社交網站資源等,并能通過鏈接直接獲取全文或得到如何獲取全文的最佳和最便捷的信息途徑。
2.3.3 以用戶需求為導向,提供個性化、前瞻性的嵌入服務
以用戶為中心是圖書館基本的工作理念,但此種服務多為被動形式,即用戶提出需求,圖書館據此來提供服務。在大數據時代,數據核心是預測,是在海量數據的基礎上,利用產生數據判斷自身算法和參數選擇的有效性,并實時進行調整,有效地對事物進行預測判斷[3]。圖書館可以通過對用戶借閱歷史、查詢書目日志、電子資源檢索日志、本地科研數據的發現、跟蹤及收集等,融入大數據深度分析及智能輔助決策,精確區分目標用戶群,構建出其未來所需的信息內容,并進行主動聯系、推介,提供個性化的嵌入式智能服務。這種服務類似于美國的零售商“塔吉特”對于顧客懷孕的預測,其根據顧客消費記錄,找到相關聯的數據信息,準確預測預產期,在孕期的每個階段給客戶寄送相應優惠券,提高其商業經濟利益。圖書館也可以通過大數據的這種可量化的特性,提供科研跟蹤服務、精準服務、知識關聯服務、前瞻性知識服務等,改進用戶體驗,提高服務質量,來培養用戶對圖書館信息服務的忠誠度。
當前,人們接觸的信息量龐大且途徑多樣,更新速度快,圖書館要想有效把握用戶的興趣點及需求,以達到信息服務精確推送及提供的目的,必須適應信息環境的變化,將大數據技術帶入宣傳推廣服務中來,實行多元化營銷,提升和擴大圖書館在信息服務中的作用及影響。
2.4.1 明確目標用戶群
利用數據分析其查詢信息的行為,來明確定位用戶所需信息服務及潛在心理需求,對宣傳創意進行實時優化,確定信息加工推介內容,使其合理匹配用戶需求。
2.4.2 重視媒體宣傳功能
大數據的應用拓展了媒體對于用戶了解的廣度、深度及關聯度,融合了媒體與用戶的關系,媒體的價值在于不僅能為用戶提供所需信息內容,還能過濾無用信息,為篩選出的目標用戶量身打造相應的信息咨詢和展現方式,讓用戶在所有信息服務形式的接觸點上選擇最符合自己意愿的方式進行溝通。
2.4.3 關注互聯網及移動網的數字營銷
掌握用戶網絡行為入口的大數據,挖掘和洞察用戶信息搜索、瀏覽等網絡交互行為,尋找與其信息共鳴點,都將有利于數字營銷的有效推行,達到信息品牌傳播和效果轉化的目的。
2.4.4 關注和融入社交網站、互動媒體
當前社交網站及互動媒體蓬勃發展,截至2011年12月,騰訊即時通信服務活躍賬戶數達到7.210億,“QQ空間”活躍賬戶數達到5.521億[9],微博、微信等社交互動媒體也成為普通民眾信息生活中的重要組成部分,圖書館應積極加入此類社交網絡與媒體,擴大圖書館的受眾范圍,通過即時交互信息,迅速了解用戶需求,推送相應信息服務,提升圖書館信息服務在個人文化生活中的作用及影響。
大數據時代的到來,為圖書館及用戶都展開了美好的愿景。圖書館可以根據數據分析實時掌握科研前沿的實時動態,為學科服務的推送提供精確有效的決策支持,可以為用戶提供更加及時有效的個性化服務;而用戶則可用簡單、省時的方式,便捷地獲取有決策效應的信息服務。圖書館為保障在大數據時代的信息服務中心地位,應積極加強大數據技術應用,培養人才隊伍適應未來信息服務的需要,保障信息提供的價值貢獻,通過創新服務,科學管理,提高信息服務競爭力。
[1]什么是大數據[EB/OL].http://www.guokr.com/question/457 983/,2014-04-09.
[2]百度百科:大數據.http://baike.baidu.com/view/6954399.htm,2014-04-06.
[3]維克多·邁爾·舍恩伯格,肯尼思·庫克耶著,周濤譯.大數據時代[M].杭州:浙江人民出版社,2012.
[4]http://www.oclc.org/content/dam/oclc/reports/2010perceptions/2010perceptions_all.pdf.
[5]朱靜薇,李紅艷.大數據時代下圖書館的挑戰及其應對策略[J].現代情報,2013(3):9-13.
[6]鐘輝新.大數據時代信息服務的發展走向及高校圖書館應對措施[A].風雨50載 薪火永相傳——廣東圖書館學會2013年學術年會暨學會成立五十周年紀念系列活動獲獎論文集[C].2013.
[7]趙繼海.大數據時代圖書館面臨的挑戰機遇及對策[EB/OL].[2014-04-15].http://www.doc88.com/p-7939929481049.html.
[8]麥肯錫.大數據:創新、競爭和提高生產率的下一個新領域.pdfhttp://ishare.iask.sina.com.cn/f/24165120.html,2014-04-17.
[9]7.21億:騰訊QQ活躍用戶數[EB/OL].[2014-04-15].http://www.ebrun.com/20120314/42361.shtml.