劉 荻
南陽醫學高等??茖W校圖書館
“大數據”是信息科技領域繼web.2.0 和云計算之后又一令人矚目的熱點。本文介紹了大數據的概念和基本特點,指出了圖書館利用大數據技術的必要性,并探討了圖書館應對“大數據”時代的具體措施。
隨著信息技術的快速發展,數據的組成結構、存在形式等越來越復雜,數據量快速增加,社會已步入了“大數據時代”。“大數據”成為信息科技領域繼web.2.0 和云計算之后又一令人矚目的熱點。最早提出“大數據”概念的是全球知名咨詢公司麥肯錫,它指出“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來?!贝髷祿r代的到來.意味著我們進入到了一個以密集型數據的相關挖掘、分析、處理來推動社會創新發展的時代。各大IT 公司、研究機構、學術界等相關機構對于大數據開展了大量的研究。但是至今為止,大數據并沒有一個統一的定義,但是,對大數據基本有這樣的共識:那就是在數量巨大的數據中快速獲取有用的信息。
大數據有以下幾個特點。
1.數據規模大。大數據一般指的是10TB 規模以上數據量。當今世界,是一個巨大的網絡世界。數不清的電腦、移動設備、社交平臺、在線交易每時每刻都在產生大量數據。大數據的影響已擴展到各行各業。多個用戶把多個數據集集中在一起,數據級別也就發生了變化,從TB 級別上升到PB 級別。
2.數據類型多。大數據背景下,數據已不僅僅是單一的文本形式,數據類型繁多,且多數為半結構化和非結構化數據,包括了網絡日志、微博、視頻、音頻、圖片、郵件等。
3.數據處理速度快。傳統的數據挖掘技術已無法適應海量的數據環境,只有實時分析,快速處理,才能快速制定合適的應對策略。
4.數據價值密度低。大量的數據信息里,有價值的信息并不多,有很多是垃圾信息,這就需要對數據進行挖掘分析。
近年來,隨著信息技術的發展,數字圖書館已成為各個高校圖書館的重點建設項目,到目前為止,已基本完成了數字化建設任務。圖書館現在擁有大量的數字化資源,專業數據庫、電子書、各種教學音頻、視頻、考試題庫等組成了圖書館的大數據。同時,學生使用數據庫的檢索記錄、瀏覽歷史等個人信息也構成了大數據的一部分。隨著智能手機、高速網絡的進一步使用,現有數據量還會呈現快速增長的趨勢。身處大數據時代,圖書館要積極行動起來,進一步完善信息服務體系,利用好大數據分析技術,提高為讀者服務的能力。圖書館可以將通過手機、電腦等各種設備收集到的讀者個人信息、搜索歷史進行收集整理,從中獲取有價值的信息,分析出讀者的閱讀偏好與關注熱點,為開展跟蹤服務、個性化服務打下良好的基礎,從而提高圖書館在信息時代的競爭力與影響力。
大數據時代,圖書館的競爭力不僅體現在館藏資源、服務質量上,還體現在擁有的數據量以及對巨大數據的挖掘與分析能力上。圖書館要緊跟時代的發展步伐,改變傳統的服務方式,提高基于云服務平臺的大數據采集分析能力,保證圖書館大數據環境的科學性、可操作性、可控性,建立符合讀者需求、快速有效的新型服務模式。只有這樣,圖書館才能掌握發展的主動權,不至于在新的技術浪潮中落伍。
大數據時代背景下,培養一支懂技術、會管理的專業人才隊伍是提升服務能力的重要保證。專業館員不僅要掌握必備的信息檢索、信息分析、信息組織等基本素質,還要掌握大數據環境下的數據挖掘與分析的知識與技能。面對這種挑戰,館員要改變思想觀念,樹立主動服務的理念,熟悉各種網絡工具檢索功能,努力掌握數據挖掘與分析技術,通過數據處理技術對信息資源進行整理分析,發現隱藏在數據背后的讀者需求,從而制定出準確有效的個性化服務方案,為讀者提供深層次的信息服務。圖書館也要要重視館員的業務學習與培訓,努力提高館員的專業技術素質。
隨著網絡的普及,圖書館已不是獲取資源的唯一途徑,讀者可以通過其他途徑來獲取所需資源。因此,在信息技術日益發達的今天,如何將將豐富的信息資源傳遞給讀者,將讀者吸引到圖書館來,避免讀者流失,是圖書館工作重心所在。大數據技術的成熟,為圖書館開展個性化服務開辟了新的道路。圖書館可以通過收集匯總讀者的個人信息、瀏覽歷史等用戶數據,對讀者的閱讀需求與閱讀行為進行深度分析,根據分析結果,對圖書館的服務目的、內容、方法做出科學合理的安排,從而開展跟蹤服務、推送式個服務,提高信息服務的質量與內涵。同時,還可以利用論壇、微博、微信、電子郵箱等多種信息傳送渠道,為讀者提供優質服務,提高讀者的滿意度。
開展大數據評估工作是保證圖書館大數據工作開展的有力保證。只用進行有效的評估,才能更好地發揮大數據在讀者服務模式變革、服務模式技術保障等方面的積極作用。評估的重點要放在圖書館的大數據能力上,如:數據采集、數據過濾、快速處理、科學決策等方面,要及時發現在工作中出現的不足,并及時提出解決的方案。另外,還要評估圖書館在大數據環境中服務系統的安全性和穩定性,保證圖書館數據類型和應用過程符合網絡安全規范。信息技術的發展,使圖書館服務系統的安全防御難度不斷增加。要利用大數據平臺等先進技術手段,加強圖書館服務系統的安全性,為用戶提供高質量的服務。
為了開展個性化服務,圖書館大數據包括大量讀者信息、搜素歷史、地理位置等非結構性信息。這一方面促進了個性化服務的深度,但另一方面,也帶來了讀者個人隱私泄露的問題。圖書館應加大對讀者隱私權的保護力度,制定詳細的管理員閱讀權限和數據保密、數據傳輸制度。管理員在采集讀者數據時,要嚴格工作流程,科學合理的對讀者數據進行分析。同時,也要做好網絡安全工作,杜絕非法用戶入侵,利用大數據采集和分析讀者數據,導致讀者隱私外泄。
由于大數據是一項前沿技術,實際操作需要有多學科知識作基礎,因此,圖書館開展大數據工作有一定的技術難度。
微軟的一位工程師Chistian Huitem a指出,人類要做到從大數據集中熟練提取真正的知識.還需再經歷十年以上的時間。現在大數據存在的主要問題在于可靠性、易用性和成本等方面。圖書館采取措施培訓專業人才,及時關注大數據發展動向,及時開展探索性實踐,以提升大數據技術水平。