胡芳 張慧

摘 要:大數據的概念自從誕生以來就因其獨具特色的前瞻性和實用性引起了各行各業的廣泛關注。屬于公共服務領域的圖書館,也不可避免的受到了大數據帶來的沖擊。圖書館因其始終以用戶為中心的特性,其發展自始自終都要圍繞著提高圖書館用戶滿意度。而面對大數據時代,圖書館也需要調整提高用戶滿意度的思路,合理規劃運用本身具有的大數據資源,提升核心的競爭力。本文在探討了大數據、一般用戶滿意度和圖書館用戶滿意度的基礎之上,分析了傳統方法的不足,提出了運用大數據提升圖書館用戶滿意度的方案,以期為更好地服務圖書館用戶做出相應貢獻。
關鍵字:大數據;圖書館;用戶滿意度
1 引言
隨著計算機的極速發展、存儲器性能的提升,還有物聯網、移動互聯網、傳感器等新科技的發展,數據增長的數度已經逐漸超出人們可以接受的范圍,而且這一速度還在不斷增長。這些大量的半結構化和非結構化的數據是人類活動的最真實記錄。最早提出“大數據”概念的是全球著名咨詢公司麥肯錫,其發布的《大數據:創新、競爭和生產力的下一個前沿領域》,首次提出了“大數據”,并指出“數據已經滲透到每一個行業和業務職能領域,逐漸成為重要的生產因素;而人們對于大數據的運用將預示著新一波生產率增長和消費者盈余浪潮的到來。”[1]毫無疑問,通過合理的技術去挖掘、識別、分析大數據,可以找到很多通過常規數據技術難以發現的財富。大數據分析已經在很多商業領域得到應用,本文站在圖書館用戶的視角上分析如何利用大數據分析提升圖書館用戶滿意度。
圖書館用戶滿意度是指用戶對圖書館提供服務的滿意程度,是用戶在接受圖書館一次或者多次服務后的內心評價和主觀感受,是其預期效果和實際所接受服務效果的比較[2]。當前對提升圖書館用戶滿意度的方法大多是通過發放問卷調查,建立相關模型,運用統計學和計量學的知識進行分析,最后通過定性和定量的方法來采取相應的措施提高滿意度。但由于收集數據方法的局限性和理論模型本身就存在的缺陷,分析得出的結論和采取的措施未必都有效。圖書館歷來都是信息收集和管理的重要場所,長時間運營以來積累了大量的結構化數據、半結構化數據以及非結構化數據。通過對這些數據的管理和運用,圖書館可以建立其智能分析、輔助決策系統,準確、及時獲取用戶的數據,為圖書館更好的了解用戶、分析用戶提高用戶滿意度提供支持,提高圖書館的核心競爭力。
圖書館日益增長的數據,這本身就是一種資源,若不對其進行開采,那就是一種浪費。隨著大數據處理技術的逐漸成熟,圖書館也具備了運用大數據來提高用戶滿意度的可行性。因此本文研究的目標,就是利用大數據帶來的機遇,借助數據倉庫、數據挖掘、商務智能、專家系統、人工智能等現代信息技術手段,提出一個能夠改善圖書館用戶服務、提升圖書用戶滿意度的解決方案。
2 文獻綜述
2.1 大數據
“大數據”(big data)是IT領域在“云計算”、“Web 2.0”、“移動互聯網”等之后,近兩年最流行的詞匯。根據著名咨詢公司IDC統計[3],2013年全球被創建和復制到數據總量為1.8ZB(10的21次方),Facebook每天有約1000萬張的照片更新和30億次的點擊率;Twitter每天有超過4億條Tweet發送;Google通過大規模集群和MapReduce,每月要處理超過400PB的數據;淘寶會員超過3.7億,在線商品超過8.8億,每天交易數千萬筆,產生月20TB的數據。同時,隨著傳感器和物聯網的蓬勃發展,數據正在億前所未有的數度不斷的累積和增長。近幾年,《Nature》和《Science》等國際頂級學術期刊相繼出版專刊來專門探討對大數據的研究。2008年《Nature》推出了專刊“Big Data”,從互聯網技術、網絡經濟學、超級計算、環境科學、生物醫學等多個方面介紹了海量數據帶來的挑戰。《Science》與2011年推出了專刊“Dealing with Data”,主要圍繞著科學研究中大數據的問題展開討論,說明大數據對于科學研究的重要性。更加值得關注的是,2012年3月,奧巴馬政府發布了“大數據研究和發展倡議”[4],計劃在科學研究、環境、生物醫學等領域利用大數據技術進行突破。奧巴馬政府的這一計劃被認為美國政府繼“信息高速公路(Information Highway)”計劃之后在信息科學領域的又一重大舉措。與此同時,包括IBM、Oracle、HP、Microsoft等IT行業巨頭都紛紛加入到大數據行列中,通過收購與大數據相關的軟硬件技術公司,來實現大數據軟硬件一體化技術整合,力求在新的信息競爭環境中處于更加主動的地位,獲取更有利的競爭優勢。
面對各行各業海量的數據,首先要面對的問題就是如何對這些結構化、半結構化甚至被結構化的數據進行有效的組織和管理。長時間以來,人們研究的對象都是結構化數據,如目前占據絕對主流的關系數據庫,因而人們總希望在數據生成是就按照特有的結構和模式對數據進行整理。而對于非結構化甚至半結構化的處理,則是在慢慢發展。海量的電子政務數據、移動終端數據、網站日志、社交網絡數據、來自物聯網傳感器的數據、企業和公共部門長期積累的數據等都是大數據的主要來源,將這些數據互惠共享、融會分析將會產生巨大的經濟和社會效益。而目前大數據最顯著最直接的應用就是市場營銷和信息公共服務,如對企業或公共服務部門積累的數據進行利用、挖掘則可以從更多的角度了解用戶,從而針對存在的問題制定出相應的解決方案,提升用戶對企業或服務部門的滿意度。
2.2 圖書館用戶滿意度
圖書館因用戶存在,服務是圖書館永恒的工作主題。雖然隨著信息技術的發展,信息環境和信息用戶的需求都在迅速改變,使得圖書館在職能定位、服務范圍、服務手段和服務內容等方面都發生了很大的變化,但圖書館的使命從來沒有發生過改變,無論是最基本的文獻提供服務還是迅速發展的參考咨詢等新服務,都是為了更好的滿足圖書館用戶的需求,是用戶能夠最大限度的利用圖書館資源,發揮圖書館應有的價值。因此,探索提高服務質量、提升服務效果的措施便是圖書館工作的重點。根據之前對一般用戶滿意度的定義“用戶對用戶接受產品或服務的實際感受值與其期望值的比較程度”,圖書館用戶滿意度也可認為是:圖書館用戶在接受圖書館服務和使用圖書館設施的過程總的感受值與其期望值的比較程度,定量測量圖書館用戶滿意度的水平。
從文獻中,我們可以發現大多數對圖書館用戶滿意度的研究,其收集數據的方式仍然是以發放調查問卷為主,輔助以其他的調查方法,如電子郵件調查、受理投訴、電話訪問等方法。雖然問卷調查的科學性毋庸置疑,但其局限性也很明顯:被訪問者會受到很多外界的影響,而這些影響是幾乎不可能避免的。并且由于受到成本和時間的限制,其發放問卷的數量和抽樣選擇被訪者會受到制約。同時,采用問卷調查收集數據的方法已經存在學術界多年,筆者認為應該嘗試新的方法。另外,用戶滿意度,即用戶要求被滿足的程度,這種高低大小不取決于企業,而是取決于用戶的心理。用戶滿意度是一種主觀感知、自我體驗和情感判斷,這種“似是而非”的模糊情況,廣泛存在。同時,可能由于用戶的個人因素,如社會因素、消費因素、外部環境因素等,導致用戶對圖書館服務的感覺隨時都會發生變化。最后,用戶滿意度僅僅是用戶過去心理狀態的反應,而非當前,這意味著,用戶滿意度存在著滯后的特點。這意味著最后得出的結論可能不能正確的為決策提供幫助。
綜上所述,在當前的大數據時代,圖書館應該利用好這個機遇,充分利用圖書館本身就是一個信息收集和利用的場所的天然優勢,通過先進的數據分析技術從圖書館的大數據中提取有益的知識。大數據技術可以幫助圖書館獲得準確、及時的用戶數據,有助于管理者及時了解圖書館最新知識服務的趨勢并作出決策、調整服務方向,提高用戶的滿意度,提高圖書館的核心競爭力。同時,借鑒大數據在其他行業如互聯網行業、金融行業等已經成功或者正在進行中的案例,結合合理的大數據處理技術,開辟出一條針對圖書館用戶滿意度提升研究的新道路。
3 理論方案
從整體上看,當前對于圖書館用戶滿意度的應用研究主要還是將用戶滿意度作為中間變量,分析其與其他變量之間的關系,從而得出相應的結論來支持決策。而隨著大數據概念的日益深入人心以及相關技術的迅猛發展,使得對圖書館用戶滿意度的提升有了新的方法。建立圖書館用戶滿意度的因素分析模型和對用戶滿意度進行大數據挖掘分析相比,前者是利用統計計量工具對用戶滿意度進行因素分析,是相對靜態的分析,分析模式是固定的;而后者則是通過分析來發現與用戶滿意度相關的、圖書館關心的模式,多進行的分析也是動態的、不規則的。因此也可以將利用大數據提升圖書館用戶滿意度看成是圖書館用戶滿意度模型分析的更深一層次的研究。
利用大數據提升圖書館用戶滿意度,其數據收集方式自然和以前靠發放問卷來收集數據不同,其來源主要有[5]:用戶借閱流通數據、館藏數目數據和電子數據、RFID(無線射頻識別)數據、社交網絡交互數據、移動互聯數據以及各種傳感器數據等。當然,傳統提升圖書館用戶滿意度的數據,如受理投訴、問卷調查等同樣可以加以利用。
隨著Hadoop開源框架及其相關技術的興起和完善,使得從技術的角度上來看,圖書館利用大數據進行用戶滿意度的提升研究成為了可能。一般來說,利用大數據提升圖書館用戶滿意度主要從以下幾個方面入手[5]:
(1)進行用戶流失分析,應對圖書館用戶減少的尷尬局面。圖書館借助大數據數據對用戶需求的數據進行分析,不僅可以了解用戶的信息行為、需求意愿以及知識運用能力,還可以深度挖掘用戶在交互型知識服務中潛在的需求,從而針對性的展開服務吸引用戶。
(2)建立智能、靈活的社會網絡知識服務。圖書館通過分析各種數據,從中發現有用的知識和關系,完善新的知識服務方式。
(3)建立知識服務導航機制。考慮用戶知識需求預測、多維數據資源的組織和分析、用戶行為智能分析、學術資源搜索以及推薦服務等。
3.1 方案和框架
隨著信息技術的發展,圖書館累積的數據越來越多。這些數據背后隱藏著虛度重要的信息,圖書館自然希望利用這些進行更高層次的分析。關系數據庫系統可以高效的數顯數據的錄入、修改、統計、查詢等,但在以非結構化為主的大數據面前,無法發現數據中存在的關系和規則,導致了“數據豐富而知識匱乏”的現象。而我們提出的利用大數據提升圖書館用戶滿意度的方案,則可以很好的解決這一問題。
3.1.1 擬定方案
隨著數據量的飛速增長,大數據管理全生命周期過程包括大數據的獲取、存儲、組織、分析和決策五個階段[6]。傳統的數據分析計算策略是將數據移動到數據分析工具中進行計算,但這對于大數據而言,顯然成本太高,于是便需要一種新的大數據解決方案。隨著Hadoop開源框架及其相關技術的興起和完善,為解決傳統大數據處理方式所面臨的難題打開了局面。Hadoop的兩項關鍵服務[6]:采用Hadoop文不是文件系統的可靠大數據存儲服務以及基于MapReduce變成模型的高性能并行大數據處理服務能夠提供對結構化、非結構化數據快速、可靠的分析,并且可以整合傳統的數據,從而是圖書館可以根據已有的信息和問題制定知識服務組合方式。在新的技術工具的支持下,運用數據挖掘的方法,對圖書館的大數據進行處理。數據挖掘使用的是基于發現的方法,運用模式匹配和其他算法決定數據之間的聯系,從數據中發現模式,致力于知識的自動發現。其一般有四種方法[7]:
(1)概念描述。是數據挖掘最基本的形式,是產生數據的特征化和比較描述。
(2)關聯分析[8]。從大量數據中個項集之間的引入重視的相互關聯和相互聯系。通過關聯分析來分析圖書館用戶滿意度,可以發現用戶滿意度和未知主題之間的關系,這種關系很多時候都具有很高的價值,可用于輔助決策。
(3)分類預測。分類預測技術通常包括神經網絡、貝葉斯分類、判定樹歸納等。運用在用戶滿意度上可以對用戶進行分類,如高用戶滿意度的用戶、低滿意度的用戶等;也可以在一定條件下進行用戶滿意度的預測,由于數據的及時處理,其對于決策能夠提供很大的支持。
(4)聚類分析。聚類和分類不同,聚類要劃分的類型是未知的,也就是說更容易發現新的知識,在同一個類中的個體具有很高的相似度。對于圖書館用戶滿意度的分析,聚類分析可以在對用戶針對用戶滿意度進行分類的模式未知的情況下,對用戶進行聚類分析。
3.1.2 實施框架
從大數據管理生命周期角度來看,大數據綜合運用分為五個階段:獲取階段、存儲階段、組織階段、分析階段和決策階段[6]。據此,在運用大數據提升圖書館用戶滿意度時,我們制定的框架如下:
4 總結
大數據繼“云計算”、“物聯網”、“Web 2.0”、“移動互聯網”等之后,成為科技界、金融界甚至政府部門的熱門話題。雖然其定義尚不清晰,但由于其獨具的前瞻性和實用性已經被運用在一些領域,尤其是IT界和市場營銷界。大數據帶來的全新的知識體系和服務模式,對圖書館不可避免的造成了沖擊。對以用戶為中心的圖書館來說,若仍然保持過去的服務和工作方式,無論對用戶而言還是對圖書館自身的發展而言,都沒有好處。抓住大數據帶來的機遇,從大量復雜的數據中分析、挖掘潛在的價值,從全新的角度研究用戶滿意度提升的新方法,從而有針對性的開展知識服務,制定圖書館發展戰略將會是未來圖書館發展的方向。
參考文獻
[1]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169
[2]武海東.基于結構方程模型的圖書館讀者滿意度實證研究[D].重慶:重慶大學,2009:7-9
[3]栗蔚,魏凱.大數據的技術、應用和價值變革[J].電信網技術,2013,7(7):6-10
[4]徐子沛. 大數據—正在到來的數據革命[M].桂林:廣西師范大學出版社,2012:128-132
[5]容春琳.公共圖書館應用大數據的策略研究[J].圖書館建設,2013,7:91-95
[6]郭自寬,張興旺,麥范金.大數據生態系統在圖書館中的應用[J].情報資料工作,2013,2:23-28
[7]趙嘉凌.數據挖掘在數字圖書館中的應用研究[J].計算機網絡,2005,10:44-45
[8]林海青,樓向英,夏翠娟.圖書館關聯數據:機會與挑戰[J].中國圖書館學報,2012,38(1):58-67