關鍵詞:大數據;圖書館;知識服務
摘要:文章分析了大數據的內涵特征、對圖書館的價值,并從增加、嵌入、應用等幾個方面論述大數據對圖書館的積極意義。
中圖分類號:G252文獻標識碼:A文章編號:1003-1588(2015)04-0117-03
收稿日期:2015-03-12
作者簡介:李英(1971—), 江蘇第二師范學院圖書館館員。1大數據概述及內涵
1.1大數據概述
大數據的理念,要追溯到1980年,著名未來學家阿爾文·托夫勒在其《第三次浪潮》一書中提到的“大數據”一詞。但直到2011年,全球知名咨詢公司麥肯錫提出“大數據時代已經到來了”,大數據才迅速成為政府及信息科技等行業關注的熱點。圖書館歷來是信息新技術、新理念應用的前沿,“大數據”亦不例外。美國等發達國家圖書館已經率先將“大數據”的服務引入到了圖書館中,并進行了實踐。然而,關于“大數據”的概念,目前學術界還沒有達成一個統一的認識。綜合已有的學術研究,可以從三個方面理解這一概念的含義:①大數據是信息資產,他需要新的處理模式才具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。②大數據還是一個技術概念,是指從各種各樣類型的數據中,快速獲得有價值信息的能力。目前,大數據技術主要涵蓋的領域有:數據采集、數據存取、數據處理、統計分析、數據挖掘、模型預測、結果呈現等。③大數據是指一種思維,認為公開的數據一旦處理得當就能為人們急需解決的問題提供答案。
1.2大數據的內涵特征
1.2.1 “大”。 “大” 不僅是指數據規模的海量,更在于他是全面數據、完整數據和綜合數據。 “大數據”屬于多維數據,對調查對象的全方位全部信息進行了記錄,有空間維度上的多角度、多層次信息的交叉復現;還有時間維度上的與人或社會有機體的活動相關聯的信息的持續呈現。因而,大數據能夠更真實地還原客觀世界。
1.2.2“數”。 “數”是指數字化內容。數據是客觀存在的,但是只有經過“數字化”處理的數據才有可能被計算機系統計算、分析、追蹤、量化處理。大數據的數據來自多種數據源,是一種綜合數據,數據類型繁多,囊括了傳統的結構化數據(如數值型、數字型)和新型的海量的半結構、非結構化數據(如文本、音頻、視頻、傳感數據、訪問日志、網絡檢索歷史記錄、Email、社交媒體、圖片)。
1.2.3“據”。 “據”是指證據。大數據蘊藏大量前瞻性的預見信息,能為預測提供重要依據,價值巨大。尋找大數據價值需要人們擁有全新的大數據思維,具有大數據意識,相信數據會說話。在大數據技術輔助下,開展以數據為基礎的理性的實證分析,挖掘數據背后所隱藏的有價值信息,由此去做一些判斷、策劃、預測,使得人類社會朝著 “智能化”“智慧化” 方向發展。
2大數據給圖書館服務帶來的發展機遇
2.1大數據給圖書館帶來豐富的信息源
大數據時代,萬物皆可測量,全世界數據每分每秒都有產生,數據量達到海量,數據來源分布十分廣泛,如有關業務流程的社會大數據、個人大數據、科學大數據等。這些數據與科學政治社會經濟軍事等人類社會生活息息相關。開發和利用這些數據會給人類的生活帶來更多便利,對人類社會進步有著重要的意義。這些數據獲取大多是免費的。對圖書館而言,收集和存儲這些數據,不僅可以豐富圖書館館藏信息資源,為社會提供大數據源和創造信息價值;還可以利用數據中富含的用戶信息行為數據了解用戶需求,指導圖書館信息資源建設和創新信息服務、擴大信息服務范圍和提高信息服務質量。
2.2大數據技術提升了圖書館服務能力
在大數據時代,圖書館傳統的數據庫服務平臺和傳統的IT架構技術無法滿足大數據的數據管理、數據應用及數據服務的需求。同時,隨著用戶素質的提高,圖書館傳統的信息服務已不能滿足用戶需求了,用戶要求圖書館提供更多的知識服務。
大數據技術給圖書館知識服務帶來服務平臺的升級,不僅提供了數據獲取、存儲、傳遞的新模式,而且還提供了信息分析挖掘的新手段,對數字資源進行深層次開發,建立新型知識服務引擎。新型知識服務引擎包括資源及學術搜索引擎、資源及服務推薦引擎、知識服務社區實體(包括用戶及資源)行為智能分析引擎、用戶知識需求預測引擎及多維度信息資源獲取、組織、分析及決策引擎等。
2.3大數據思維帶來了圖書館可持續發展
圖書館作為信息中心,在數據占有方面,具有得天獨厚的優勢。擁有豐富的數據庫資源、期刊報紙及讀者個人信息 、讀者瀏覽歷史,日常工作中也積累了大量與社會經濟生活息息相關的數據。然而一些數據一旦完成了最基本的用途后,數據也會被認為已沒有用處而丟掉。從大數據的角度看來,那些沉睡的數據、丟掉的數據有著無比巨大的價值,能產生驚人的效用。比如,來自于讀者數據庫的瀏覽檢索歷史,一個檢索命令完成之后,檢索詞就沒用了。然而讀者瀏覽歷史能夠反映讀者的興趣和關注點,具有十分重要的商業價值。如“京東出版”的首部圖書《大衛·貝克漢姆》,就是京東出版通過對讀者瀏覽史大數據進行挖掘,反向操作,為特定消費群體“私人定制”相關圖書。隨著大數據的理念深入人心,圖書館人認識到了數據是圖書館戰略資源,得數據者得天下,并學著從數據中學習洞察事物發展規律,預測未來。現在,圖書館人一方面加強了對各類數據的收集;另一方面積極深入開展大數據的開發和利用,為數據供應商、出版社和企業等不同群體提供信息資源增值服務,尋求產業聯盟,開展與數據供應商、出版社和企業等跨界合作,充實與拓展圖書館自身業務基礎,提高個性化服務實力,實現圖書館的可持續發展。
李英:基于大數據的圖書館服務新發展研究李英:基于大數據的圖書館服務新發展研究3基于大數據的圖書館服務新發展
3.1增加半結構和非結構數據資源的收藏,擴大圖書館可調用的數字資源
圖書館是人類文明記憶的裝置,擔負著保護人類文明職責,大數據是人類文明的重要體現,是科學研究的基本信息資源。收集大數據是圖書館的重要職責,大數據也是開展知識服務的基礎。目前,圖書館數據庫以收藏結構化數據為主,半結構化或者非結構化數據所占比重非常低,而半結構和非結構化數據恰恰是圖書館為用戶開展細節服務不可或缺的。一些圖書館開始了探索半結構化或者非結構化數據的收藏道路,如美國國會圖書館的“美國記憶”項目,收集整理了照片、手稿、海報、樂譜、地圖、錄音、動態圖像等記載美國歷史文化的特藏。在中國CALIS已啟動科學數據項目,中國科技信息研究所啟動了科技報告項目,國家圖書館則啟動了國家記憶項目。這些項目為圖書館迎接大數據挑戰積累經驗,提供借鑒。 大數據環境下,隨著大數據產業化發展,對一般圖書館而言,不可能也沒有必要收集所有的數據。圖書館只許采集兩類本地數據,一類是資源性數據。比如科研研究數據,這是本單位科研人員在長期的科研活動中積累的科學數據,是本單位寶貴的數據財富,圖書館有義務采集這方面的數據。另一類是在圖書館產生新的大數據:RFID射頻數據、傳感器數據、社交網絡交互數據、移動互聯數據,收集這些包含用戶行為的數據為圖書館的精準個性化服務提供參考。
3.2嵌入科研過程,提供知識數據信息服務
大數據推動下,科學研究進入了一個嶄新的階段。計算機圖靈獎得主Jim G ray提出科學研究的第四范式——以協同化、網絡化與數據驅動為其主要特征數據密集型科學研究,科學研究的本質是數據的整理和分析。這對科學研究人員的信息能力提出了更高的要求,要求科研人員擁有更強的數字化交互式的信息管理能力、海量數據實時的分析挖掘能力、科學數據融匯和多學科協同的信息資源共享能力。然而科研人員研究由于其對信息的發現和分析能力的欠缺,直接導致在數據的挖掘和信息的管理方面面臨著挑戰。信息的整理和分析是圖書館專業的信息工作者基本職能和強項。圖書館作為為科研服務的重要力量,為迎合科學研究不斷變化的新需求,圖書館專業信息工作者應根據科研人員的需要,將信息服務嵌入科學研究工作的數據生命周期中,從其課題選定到結束的整個過程,為科學研究人員提供評價與預測性信息推送、方案規劃信息參考咨詢、過程管理與信息重構、專題信息關聯性管理等服務,促使科研人員的知識發現和知識創造。
3.3應用大數據技術,實現精準化的個性化服務
個性化信息服務一直是圖書館服務追求的目標和發展方向,也是圖書館可持續發展的重要保證。在泛在知識環境下,圖書館不再是讀者獲取信息的唯一中介,如果讀者無法從圖書館獲得滿意的服務就會轉向其他信息組織或機構,讀者大量的流失將導致圖書館被邊緣化的危險,圖書館只有開展精準化的個性化信息服務,為用戶提供滿意的、可增值的信息服務,才能夠提高用戶對圖書館的忠誠度和滿意度,留住用戶。
通過對大量的用戶信息行為產生的數據挖掘,清晰把握用戶的信息需求、意愿及知識應用能力,對用戶的信息需求以及信息行為偏好進行預測,為讀者提供跟蹤服務、知識關聯服務、先覺性服務,提高用戶體驗,實現架構以讀者個性化服務為核心的信息服務體系。未來,圖書館將進入超個人化時代,為每一位讀者提供一個幫助讀者更好地了解自己、更好地做出選擇的最完備的學習科研生活信息環境, 支持讀者追求夢想和分享知識等方面的個體信息需求。同時用戶也可以根據自身的需求定制信息、場地、設備和服務;圖書館專業館員針對用戶的個性和特點、需求變化,主動為用戶推送他們可能需要的重要資源和服務。
4結語
圖書館服務是其價值體現的核心,大數據時代的到來給圖書館的發展注入了新的理念、新的技術和豐富的數據資源,圖書館人只有提高大數據理念的認知與認同,提高應用大數據技術技能,才能把大數據的思想和理念付之行動,才能更好地為用戶服務。
參考文獻:
[1]韋曉凱.大數據時代高校圖書館工作思考[J].河北科技圖苑,2014(1):54-56.
[2]維克爾·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代[M].浙江:浙江人民出版社,2013:107.
[3]喻國明.大數據的價值及分析技術的關鍵[J].新聞與寫作,2014(4): 1.
[4][7]樊偉紅等.圖書館需要怎樣的“大數據”[J].圖書館雜志,2012(11) :63-68.
[5][6]陳傳夫、錢 鷗、代鈺珠.大數據時代的數字圖書館建設研究[J].圖書情報工作,2014(4):40-44.
[8]楊海亞.提供公共智慧服務:大數據時代圖書館服務模式創新[J].新世紀圖書館,2014(3):10-14.
[9]鄧仲華、李立睿、陸穎雋.大數據環境下嵌入科研過程的信息服務模式研究[J].圖書與情報,2014(1):30-34.
(編校:馬懷云)