陳 臣(蘭州商學院信息中心 蘭州 730020)
基于小數據的圖書館個性化服務QOS保證研究
陳 臣
(蘭州商學院信息中心 蘭州 730020)
〔摘 要〕為了解決圖書館個性化服務質量保證的相關問題,提出一種基于小數據的圖書館個性化服務模式。該模式實現了圖書館的精準營銷,保證CRM系統以客戶為中心,可為圖書館的個性化服務服務質量(QOS)保證提供有力支撐。
〔關鍵詞〕小數據 圖書館 個性化服務 QOS
伴隨云計算技術、移動互聯網技術和物聯網技術在圖書館讀者服務中的廣泛應用,圖書館的讀者特征數據、用戶服務數據和系統管理數據呈現級數遞增,圖書館界已進入大數據時代。
大數據具有Volume(海量)、Velocity(高速度)、Variety(多樣性)和Value(低價值)的4V特性,導致基于大數據支持的圖書館讀者個性化智慧服務,存在著決策成本高、應用算法與預測模型復雜、分析與決策實時性差、系統資源使用效率低等問題,因此,大數據決策已不適合讀者個性化閱讀活動安全、智慧、即時和便捷的需求。[1]小數據決策是指圖書館以讀者個體為中心,進行的全天候、全方位讀者數據采集、存儲、處理、分析和決策的活動,可為圖書館準確發現讀者需求和科學制定個性化智慧服務模式提供可靠的數據決策支持。如何將讀者個性化閱讀服務需求和小數據決策優勢相結合,是圖書館提升讀者個性化服務水平和讀者閱讀滿意度應關注的重要問題。[2]
2.1 小數據概念的產生與特點
“小數據”的概念由美國康奈爾大學計算機科學教授德波哈爾·艾斯汀提出,她的小數據價值發現來源于對其年邁父親生活、行為的細微觀察。艾斯汀的父親于2013年去世了,她發現父親去世前幾個月的數字社會脈動信號發生了異常——這位90歲的老人不再發送電子郵件,去超市購物的次數逐漸減少,到住所附近散步的距離也越來越短。然而,這些細微的異常卻沒能在醫生的心電圖檢查中顯示出來,心電圖檢查結果顯示老人身體健康。這啟發艾斯汀開始研究小數據,從病人日常生活的小數據中尋找異常之處,并把它當作一種新的醫學證據運用到病人的治療中,這些小數據可為病人診斷和治療決策提供直接的科學依據。[3]
從數據的定義、結構、特點和作用對象分析,小數據和大數據具有較大的區別。世界領先的麥肯錫咨詢公司對大數據的定義是:“大數據是指大小超出了傳統數據庫軟件工具的抓取、存儲、管理和分析能力的數據群”。與大數據相比,小數據并不僅僅指數據總量小,而是指以讀者為中心而進行的數據采集、處理、存儲、分析、判斷和決策等活動。圖書館能夠依據小數據決策發現讀者需求,小數據可為圖書館讀者個性化智慧服務和服務模式變革提供可靠的數據支持,是圖書館QOS和讀者滿意度的必要保障。其次,小數據分析在分析的對象、方法和側重點上與大數據不同,小數據是以讀者為中心而開展的深度數據分析,具有持續、不間斷和個性化的特點。而大數據主要涉及圖書館建設、運營和服務模式變革的宏觀全局,具有全面、復雜和價值發現難度大的特點。第三,與大數據決策相比,小數據具有數據采集高效、可控、易處理和易操作的特點,能夠在較低數據決策成本投入的前提下,為圖書館提供高價值、實時、易組織和可視化的數據決策服務,具有較高的數據決策投資收益率。
2.2 圖書館小數據的內容與小數據決策價值
2.2.1 圖書館小數據的內容
在圖書館的管理、運營和服務活動中,小數據是指圖書館通過視頻采集設備、傳感器網絡、可穿戴式設備、服務器與網絡監控器等設備,采集的與讀者相關的閱讀行為與歷史記錄、閱讀社會關系、在論壇與博客發表的評論、讀者個體移動路徑、個體地理位置、閱讀終端訪問記錄和配置等數據信息。圖書館小數據是與讀者相關的個人數據,具有數據價值高、決策成本低、可控性強和實時決策服務的優點。但同時也存在數據類型復雜、結構性差、分析難度大和讀者隱私易受侵犯的問題。[4]這些小數據可為圖書館精確發現讀者閱讀需求、用戶服務模式科學變革、QOS保障和讀者個性化服務質量保證提供可靠的數據決策支持。
2.2.2 小數據決策與大數據決策的區別
在圖書館數據決策中,小數據是以讀者為唯一的數據采集、分析和決策對象,而進行的全方位、全天候數據價值深度挖掘和利用活動,是大數據宏觀全面分析、決策的必要補充。同時,小數據系統也是讀者個人數據與外界大數據系統唯一的數據交換、傳輸接口,小數據決策系統可以將分析結果直接傳輸給大數據決策系統,以此提高大數據決策的科學性和可用性。其次,與大數據應用環境和決策模式相比,小數據具有數據總量有限、價值密度高、可控性強和決策效率高的優點,傳統的大數據思維、決策模式已不適應小數據決策的需求。第三,小數據信號通常隱匿在海量的大數據信號中,可能會被當作隨機、不規范和高誤差的噪音信號而過濾,會導致圖書館數據決策的科學性和可用性大幅下降。[5]此外,大數據更加注重全數據的觀念。只有通過對大數據的標準化定義,才能實現大數據的大規模采集、批量化處理和海量數據概率統計。而小數據更加注重讀者數據的個性化特征挖掘,通過對讀者小數據全天候、全方位和精確的挖掘與分析,來發現讀者小數據的相關價值和數據之間的因果聯系。
2.2.3 大數據決策無法滿足個性化服務讀者隱私安全保護的需求
大數據時代,圖書館會通過視頻監控系統、網絡監控設備、傳感器網絡系統、讀者個人資料的爬蟲采集系統,全方位、不間斷地采集讀者相關個人信息、社會關系和行為數據,這些小數據信息混雜在大數據中間,讀者無法了解、掌握和控制這些小數據使用的對象、方式和程度,因此,讀者個人隱私易遭受非法踐踏和侵犯。
其次,大數據時代讀者沒有獲取可穿戴閱讀設備的完全控制權限,圖書館無法在保障QOS的前提下完全保護讀者隱私安全,讀者閱讀行為數據可能會在用戶不知情的情況下被過度采集和使用。同時,依據大數據制定的讀者個性化服務決策,可能會因為侵犯讀者隱私而導致用戶閱讀可信度和愉悅感的下降。第三,大數據具有海量、多類型、存儲分散和數據總量級數遞增的特點,圖書館無法對其進行有效的生命周期全程管理,也難以對其采集、存儲、分析和決策過程開展有效的安全評估與審計。因此,如何有效利用小數據總量有限、高價值和易監控的特點,將小數據的采集權、存儲權、訪問控制權和使用權交付讀者管理,是保護讀者隱私安全和增強小數據可用性的有效途徑。[6]
2.2.4 小數據可為讀者個性化智慧服務提供可靠決策支持
圖書館大數據資源具有海量、復雜、快速處理和低價值密度的特點。為了增強大數據處理效率和數據決策實時性,圖書館通常會按照地理位置和讀者群數量劃分,在不同的服務區域均衡部署若干個云數據中心,以此提升大數據傳輸、存儲、備份、處理、分析和決策的效率。但是,隨著圖書館大數據總量、數據結構復雜度和數據決策質量需求的快速增長,傳統的僅靠增強數據中心IT設備性能來提升大數據處理能力的方式,已遠遠不能滿足圖書館大數據決策的需求。因此,圖書館必須依靠小數據總量可控、高價值和數據處理高效率的優勢,才能提升數據決策效率和有效降低數據決策的成本。其次,大數據具有海量、異質性、低價值密度、高數據噪音和實時性差的缺點,圖書館難以從海量、低價值密度的大數據中快速挖掘數據價值,無法為圖書館管理、決策層和普通館員提供安全、可靠和實時的大數據決策服務,而傳統依靠直覺、經驗和不可靠數據進行的服務創新與決策,將最終影響決策的科學性和讀者個性化服務的QOS保證。第三,基于小數據的支持,圖書館可以實時發現讀者的閱讀需求和閱讀模式變化,實現讀者個性化服務從直覺和經驗驅動的主觀經驗決策,向小數據驅動的客觀科學數據決策轉變。
3.1 增強小數據的價值屬性和決策可用性
統計學家納特·西爾弗在《信號與噪聲》中寫到:“專業預測人員可以通過基于數據的定量分析,很好地摒除我們預測中的主觀偏見。然而,無論你采用什么方法,定量、定性等手段,都會遭遇一個巨大的問題,就是如何區分信號和噪音。”因此,噪音信號是導致小數據信息過載、價值密度降低和數據可用性下降的重要因素。[7]為了降低小數據的數據總量和噪音干擾,圖書館必須確保讀者可穿戴設備、視頻監控設備、閱讀終端管理設備和傳感器網絡采集等設備,在讀者小數據的采集、處理、存儲和應用中,堅持統一數據標準、統一處理系統、統一訪問接口和統一分析平臺的原則,不斷增強小數據的可用性和可控性。其次,小數據的結構完整性和生命周期可用性,是關系圖書館小數據決策科學性的主要因素。圖書館不能單純依靠小數據作出個性化服務的決策,還應與讀者的閱讀心理、閱讀場景和閱讀社會關系相結合,基于小數據的支持,重點加強對讀者閱讀需求和閱讀心理驅動的發現、挖掘,提高圖書館對讀者的閱讀需求和服務模式變革的感知力。第三,圖書館小數據具有數據量龐大、數據來源多、結構復雜和數據粗糙的特點。圖書館只有通過對來自不同采集源、不同部門、不同系統數據的整合,才能發現小數據中蘊涵的新價值屬性,才能實現“ 1+1大于2”的數據增量。
3.2 用小數據去匹配讀者個人需求
大數據決策是從大數據中挖掘事物的客觀規律和相互關系,而小數據決策則是從小數據中發現讀者個體的閱讀需求和閱讀模式變化趨勢,因此,圖書館可從大數據中得到規律,而用小數據去發現和匹配讀者個體。
在傳統的讀者閱讀服務中,讀者群閱讀需求變化和閱讀環境變化是圖書館服務模式變革應重點關注的兩個方面。圖書館基于大數據的讀者個性化服務決策中,往往依據服務過程中整個讀者群普遍存在的閱讀需求、閱讀方式、閱讀環境特征和IT服務系統性能,制定可保證大多數讀者QOS需求的服務策略,具有服務投資收益和讀者個性化滿意度低的缺點。而基于讀者實時小數據決策的服務模式,將服務決策理念從“對癥下藥”轉變為“對人下藥”,通過實時的數據采集、分析、處理,可及時掌握讀者個性化閱讀需求、閱讀模式和閱讀環境的變化,并依據小數據決策制定動態和自適應反饋控制的服務策略,具有較高的服務系統資源利用率、服務投資收益率和讀者閱讀滿意度。《大數據時代》作者維克托·邁爾-舍恩伯格說:“由大數據帶來對人的重新認識,不是在阿波羅神廟,而是在小世界網絡中認識你自己。”[8]因此,讀者是圖書館小數據決策的核心和重點。圖書館通過小數據可將圖書館、讀者、服務模式和服務市場關聯為一個整體,會更加專注于對讀者和讀者需求的準確、及時識別與理解,并在恰當的時間、地點和閱讀模式條件下,為讀者精確投放個性化閱讀服務保障,建立一個讀者與圖書館服務共存的緊密關系。
3.3 可為讀者個性化智慧服務提供小數據決策支持
圖書館小數據具有數據總量有限、價值密度高、個性化特征強和處理實時的優點,因此,小數據決策比大數據決策有更高的個性化針對性、動態可調控性和服務經濟性。利用小數據高速處理和實時決策的優勢,圖書館可在特定的時間及時掌握不同讀者的閱讀需求和模式,并通過商業智能(BI)系統智能化預測模型對小數據的實時分析結果,為不同讀者制定精準的智能、自動化營銷策略,在基于小數據的個性化服務中構建一個圖書館服務品牌和讀者閱讀互惠、共存的關系。其次,在傳統的圖書館服務廣告推送中,通常采取將廣告內容無選擇地向絕大多數目標讀者投放的方式,導致廣告精確度低和造成對讀者閱讀的干擾。基于小數據的決策支持,圖書館通過對讀者的個體位置、移動路徑、閱讀喜好與習慣、歷史閱讀記錄、論壇與博客發表的觀點、檢索與查詢記錄、閱讀社會關系等小數據的分析,可以準確預測、判斷讀者在未來某一時刻的閱讀需求和閱讀模式,并在恰當的時間、地點以最優方式,為讀者提供精準的閱讀廣告和個性化閱讀服務。第三,隨著科技的發展,應用程序(App)已成為關系讀者閱讀模式智慧化、多樣化和服務決策科學性的重要因素。基于小數據決策服務的支持,圖書館可對APP的讀者群個體特征、閱讀內容、閱讀習慣與行為、閱讀興趣等預先設定規則,通過讀者閱讀服務訂閱、讀者群互動、閱讀行為與習慣等條件觸發,保證用戶個性化服務的精準、實時和動態推送。第四,基于小數據的決策支持,圖書館可在“以讀者為中心”服務理念指導下,加強個性化服務中的風險審計與管控、質量精細化管理、服務模式創新和個體需求QOS保證等,確保圖書館讀者個性化服務具有較高的投資收益率和讀者滿意度。[9]
3.4 利用小數據決策有效保護讀者的隱私安全
圖書館大數據采集具有全天候、大范圍、深層次和不間斷的特點。此外,大數據的處理、整合、二次價值挖掘、分析和決策過程,是以精確發現讀者需求、服務模式變革趨勢、市場競爭環境變化和讀者閱讀方式轉變為其最終目標。但過度的大數據價值挖掘、數據整合和決策分析,可能會導致讀者隱私泄露或被侵犯。因此,必須構建安全、高效、精確和可控的小數據決策系統,在保護讀者隱私的前提下提高圖書館數據決策的科學性。[10]
首先,小數據系統的構建應堅持統一系統、統一平臺、統一管理和統一決策的原則,確保小數據的采集、過濾、傳輸、處理、分析和決策過程與大數據系統相互獨立。當大數據系統決策需要小數據支持時,小數據系統僅將處理、分析和判別后的結果通過數據接口傳輸至大數據系統,為大數據系統決策提供判斷依據,而不允許大數據系統對小數據資源進行完全控制權限的訪問、下載、修改、刪除和存儲等操作。其次,圖書館應將小數據的管理權限交付讀者,由讀者決定圖書館對自身相關小數據采集、分析、共享、決策的內容、方向、途徑和程度,并允許讀者對自身隱私數據進行使用范圍的限定、授權和永久刪除,或通過指令自動關閉小數據系統,中斷小數據采集與監控系統對自身行為數據的采集。[11]第三,讀者小數據具有極高的價值屬性,對圖書館個性化服務和第三方運營商服務有著重要的意義,會成為商家監控、采集、交換和共享的目標。因此,圖書館應通過對大數據系統的讀者隱私數據開展監控、加密、刪除和匿名化處理等活動,及時將發現的讀者隱私小數據傳輸至小數據系統存儲,嚴禁與第三方服務商進行讀者隱私數據的無限制交換和共享。
3.5 增強讀者群價值屬性和提高圖書館客戶關系管理CRM)效率
讀者、館員、服務資源和服務產品是圖書館開展個性化服務的四個基本要素。如何基于圖書館服務資源總量和服務模式實際,通過對小數據的科學分析來準確發現讀者的閱讀需求,并在讀者、館員、服務資源和服務產品之間構建一種科學、高效的關聯性,是圖書館增強讀者群價值屬性和提高CRM效率的必要保證。
圖書館小數據是以讀者為中心的數據集合。通過對小數據的采集、分析、判斷和決策,圖書館可以更加準確地發現、識別和理解讀者,并在精確的時間、地點為讀者提供高價值的個性化服務,在讀者、圖書館員和服務之間實現基于小數據的動態關系管理和決策反饋控制。其次,由二八定律可得出20%的高端讀者可為圖書館帶來80%的服務收益,而80%的普通讀者只為圖書館帶來20%的服務收益。因此,只有快速、準確地發現高價值讀者,依據讀者的閱讀收益率將用戶劃分為不同等級,并將服務資源大比例的投入到高端讀者的服務中,以及潛在高價值客戶的培養中,才能確保讀者群整體有較高的閱讀忠誠度和滿意度。[12]第三,差異化服務創新是圖書館提高個性化服務質量和讀者閱讀滿意度的前提。圖書館基于對讀者個體特征、閱讀行為、讀者服務、閱讀社會關系等小數據的分析,可以精確地判斷出為不同讀者提供的產品與服務是否最優,是否比其它圖書館服務有更強的競爭力,是否會有更高的服務投資收益。同時,小數據決策也可作為大數據決策的必要補充和完善,為圖書館服務系統管理、服務模式變革、服務市場競爭和讀者群CRM提供可靠的決策支持。
目前,讀者個性化服務需求的精準預測、服務資源的科學分配、服務QOS的有效保障和讀者個性化閱讀活動的滿意度,已成為關系圖書館服務模式有效變革和服務市場競爭力發展的重要因素。在圖書館基于大數據的分析、決策中,存在著大數據決策復雜、數據應用成本高、決策時效性差和讀者個性化保障水平低的問題,不能滿足讀者服務精準、實時、經濟和個性化定制的需求,而小數據決策則是有效滿足讀者閱讀需求發展、提升讀者服務質量和降低服務成本的有效途徑,是圖書館大數據決策的必要補充和完善。
因此,圖書館必須將讀者個性化服務需求發現和用戶服務能力提升放在小數據決策的中心位置,重點加強小數據決策的精細化管理和讀者閱讀服務的個性差異化保障,確保小數據采集、傳輸、存儲、處理、分析、決策的過程安全、高效、經濟和可控,才能有效提升小數據決策的科學性、精確性和可預見性,才能為讀者提供安全、高效、經濟和便捷的小數據個性化智慧閱讀服務。[13]
(來稿時間:2015年5月)
參考文獻:
1.馬曉亭.大數據時代圖書館數據可用性:價值、挑戰和保障.圖書館理論與實踐,2014(10):5-8
2.(英)維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革.盛楊燕, 周濤, 譯.杭州:浙江人民出版社, 2012
3.李勇等.基于小數據的在線用戶興趣長程演化研究.計算機研究與發展, 2015, 52(4):779-788
4.劉曉英,文庭孝.大數據時代的數字資源融合研究.圖書館, 2015(2):58-61
5.熊文龍,李瑞婻.基于科學數據管理的圖書館數據服務研究.圖書情報工作, 2014, 58(22):48-53
6.漆晨曦.立足小數據基礎的電信企業大數據分析應用發展策略.電信科學, 2014(10):15-20
7.彭華杰.大數據時代圖書館讀者的隱私危機與隱私保護.圖書館工作與研究, 2014(12):56-59
8.朱夏等.云計算環境下基于協同過濾的個性化推薦機制.計算機研究與發展, 2014, 51(10):2255-2269
9.馬曉亭.基于用戶服務價值的圖書館大數據價值分析與服務質量保證研究.圖書館, 2014(5):95-98
10.許碧文.論大數據時代圖書館服務的發展與創新.圖書館理論與實踐,2014(12):19-20, 34
11.王艷等.網絡用戶行為的隱私保護數據挖掘方法. 計算機工程與應用, 2012, 48(13):138-143
12.馬曉亭.大數據時代圖書館客戶關系管理研究.圖書館工作與研究, 2014(6):49-52
13.孟小峰, 李勇, 祝建華.社會計算:大數據時代的機遇與挑戰.計算機研究與發展,2013, 50(12):2483-2491
〔Key words 〕Small data Library Personalized services Quality of service
〔分類號〕G250.76
〔作者簡介〕陳臣(1974-),男,陜西西安人,碩士,蘭州商學院信息中心副教授,研究方向:大數據、數字圖書館建設。
Research on QOS Guarantee for Personalized Services of Library Based on Small Data
Chen Chen
( Information Center, Lanzhou university of Finance and Economics )
In order to deal with the QOS guarantee for personalized services of library, in this paper, a library personalized service model based on small date is presented. The model can guarantee precision marketing of library, guarantee CRM implements among the customer, and can give a strong support for QOS guarantee of library.
〔Abstract 〕