王昊
(遼寧省圖書館,遼寧 沈陽 110015)
?
基于小數(shù)據(jù)的圖書館個性化服務研究
王昊
(遼寧省圖書館,遼寧 沈陽 110015)
[摘要]在現(xiàn)階段,大數(shù)據(jù)研究正在對各行各業(yè)在企業(yè)管理決策、組織和業(yè)務流程優(yōu)化起著重大作用,提出了將小數(shù)據(jù)應用于圖書館管理決策中,構建個性化服務體系,并對基于小數(shù)據(jù)的圖書館個性化服務策略進行了深入地探討。
[關鍵詞]大數(shù)據(jù)個性化服務小數(shù)據(jù)應用
在互聯(lián)網(wǎng)技術高速發(fā)展和智能終端廣泛普及的今天,行為數(shù)據(jù)、生活數(shù)據(jù)、金融數(shù)據(jù)以前所未有的速度迅速積累,基于這個生態(tài)鏈條孕育而生的大數(shù)據(jù)(Big Data)研究正在對各行各業(yè)在企業(yè)管理決策、組織和業(yè)務流程優(yōu)化起著越來越重要的作用。
在我們看到大數(shù)據(jù)應用價值的同時,應該注意到大數(shù)據(jù)開發(fā)、保存和分析需要耗費大量的資源和巨大的成本,以及面臨大數(shù)據(jù)結構復雜、存儲成本高、數(shù)據(jù)處理龐大、隱私外泄和信息安全威脅等實際問題[1]。從而,小數(shù)據(jù)(small data)的研究應運而生,小數(shù)據(jù)是以個人為中心的全方位數(shù)據(jù),它是基于個體的數(shù)字化信息的一類新興數(shù)據(jù),若將小數(shù)據(jù)的研究應用于圖書館,并以單個讀者作為研究對象,對讀者借閱等行為數(shù)據(jù)的采集和其他維度數(shù)據(jù)的分析和挖掘,對圖書館智慧化服務實現(xiàn)互聯(lián)、高效、便捷管理將產(chǎn)生重要的推動作用。
1.1小數(shù)據(jù)及其特征
美國康佘奈爾大學Estrin教授于NIPS2013(智能信息處理國際)會議上,做了一篇題為《Small,n=me,Data》的報告。她提出使用者在使用移動設備過程中會產(chǎn)生了大量用戶行為數(shù)據(jù),通過對這些廣泛并具有個性化的行為數(shù)據(jù)分析可以從中提取出反映個體行為的個體數(shù)據(jù),為總結個體行為模式規(guī)律提供了可能。將這些具有某些特定范圍內(nèi)的用戶行為數(shù)據(jù)稱之為大數(shù)據(jù)時代的“小數(shù)據(jù)”[2]。其具有以下特征:
1.1.1小數(shù)據(jù)以個體為中心,在特定事務中具有很強的針對性。小數(shù)據(jù)是對個體的行為信息和動機信息通過不間斷持續(xù)地收集而產(chǎn)生的,這些信息受個體多層維度的影響,包括社會關系、民族信仰、家族背景、教育程度、社會地位、行為習慣、性格特點、個人喜好、財務狀況等等。通過對行為數(shù)據(jù)的捕捉、采集、分析和應用,可以實現(xiàn)以個人為主體的數(shù)據(jù)系統(tǒng)的建設和實施,并為差異化服務與行為指引提供了決策依據(jù)。
1.1.2低成本,高收益。相比于大數(shù)據(jù)而言,小數(shù)據(jù)無需更廣維度的數(shù)據(jù)總量,但針對特定事務場景的數(shù)據(jù)描述并未隨之下降。由此產(chǎn)生的小數(shù)據(jù)應用即在信息采集系統(tǒng)和資源的低成本配置下,亦可實現(xiàn)較深入的數(shù)據(jù)采集層次,在數(shù)據(jù)處理過程中也無需為了滿足復雜的優(yōu)化算法和數(shù)據(jù)部署邏輯而投入過多的硬件及高額的研發(fā)費用,因此越來越多的組織及個人都開始嘗試使用小數(shù)據(jù)分析進行管理提升和服務升級。
1.1.3安全性更高,可避免隱私性數(shù)據(jù)泄露。小數(shù)據(jù)分析是對用戶基本信息和生活行為信息的分析,對內(nèi)是個人數(shù)據(jù)的多維集合,對外是個人數(shù)據(jù)的整體表現(xiàn)。任何對外展示的數(shù)據(jù),都須通過預先設定的授權手續(xù)方可將分析結果輸出,絕不會涉及到個人的行為信息和基本信息的信息安全問題??梢赃@么說,小數(shù)據(jù)有效地保護了用戶信息安全,杜絕了大數(shù)據(jù)對個人信息進行無止境地監(jiān)測和采集。從而避免了隱私性數(shù)據(jù)泄露的可能。
1.1.4小數(shù)據(jù)與大數(shù)據(jù)互為映射、相得益彰。近年來,隨著大數(shù)據(jù)應用的迅速發(fā)展,與之相伴出現(xiàn)了一些應用弊端和伴生問題,為了能夠規(guī)避這些弊端并解決這些問題,小數(shù)據(jù)的應用才應運而生。從規(guī)模上看小數(shù)據(jù)的數(shù)據(jù)體量遠遠小于大數(shù)據(jù),但并非是大數(shù)據(jù)的縮微處理,更多的是對大數(shù)據(jù)信息的專項延伸與補充,二者互為映射,相得益彰。另外,二者在諸多屬性上也是對稱的,比如小數(shù)據(jù)的價值密度更高,但受數(shù)據(jù)噪音的影響較大,易被忽視。而大數(shù)據(jù)則反之。
1.2小數(shù)據(jù)應用現(xiàn)狀
小數(shù)據(jù)主要以個體作為研究主體,通過對某方面深入準確的挖掘,它是大數(shù)據(jù)的某個側面維度。事實上,對于個人而言,這個所謂的側面完全有可能是特定個體的全面。目前,小數(shù)據(jù)被廣泛應用于數(shù)字醫(yī)療、運動檢測、環(huán)境監(jiān)測等行業(yè)和領域。
Emily Waltz曾在IEEE Spectrum的撰文指出,目前佩戴在運動員身上的生物傳感器,正在使運動員的訓練方式發(fā)生著改變。這些裝有傳感器的裝備,可以實時提供運動員的生理機能參數(shù),可讓運動員更有韌性,可穿戴裝備能更有針對性地幫助運動員提高成績并避免身體受傷。傳感器每秒能夠產(chǎn)生100個感知數(shù)據(jù)。通過無線連接傳導到個人量化分析軟件中,對運動特征和特定位置進行分析監(jiān)控,專家系統(tǒng)中的算法,可以剖析出運動員在運動過程中做對了什么、做錯了什么,基于此信息,教練員可以給出更加具有針對性的訓練。
還有,醫(yī)療單位利用電子病歷系統(tǒng)記錄的患者的癥狀、接受的檢查、醫(yī)生的診斷及處方、患者的治療、后期護理等多種就診信息,及對并發(fā)癥等發(fā)生規(guī)律進行總結歸納,進行相關的診療處理,提升了醫(yī)生對患者病情的了解程度,提高了治愈效率,降低了醫(yī)患糾紛等優(yōu)點;通過對該患者病例、生活習慣的分析,再對于該疾病的易發(fā)人群進行有效預防,減少發(fā)病機率。快速有效的治療方法,通過例證加以傳播,為科研和教學提供了豐富的材料[3]。
2.1基于小數(shù)據(jù)特點提供服務
圖書館小數(shù)據(jù)應用以讀者為中心,由圖書館數(shù)據(jù)分析人員對讀者在館期間發(fā)生的行為數(shù)據(jù)進行采集、挖掘、分析等工作。小數(shù)據(jù)關注于讀者個性化閱讀和服務方式的重構,對讀者群或單個讀者進行研究,分析其以往閱讀行為、個性化需求的數(shù)據(jù),從而得出讀者未來閱讀需求內(nèi)容且優(yōu)化圖書館個性化服務體系。
2.2小數(shù)據(jù)有利于過濾數(shù)據(jù)“噪聲”
在基于數(shù)據(jù)的分析與預測活動中,能否有效過濾數(shù)據(jù)“噪聲”,關系到數(shù)據(jù)分析的準確性與指引決策的科學性。在圖書館內(nèi)通過加設傳感器網(wǎng)絡、服務器監(jiān)測設備、個人移動終端和可穿戴設備等數(shù)據(jù)監(jiān)測記錄設備,對讀者閱讀頻率、閱讀習慣、社會背景與交往等讀者個體小數(shù)據(jù)資料進行采集,這些小數(shù)據(jù)具有信息量分散、價值密度低、噪聲影響大的特點。因此,如何通過有效過濾噪聲來提高數(shù)據(jù)價值的密度,是關系圖書館小數(shù)據(jù)應用是否可行的重要問題。圖書館小數(shù)據(jù)具有數(shù)據(jù)采集對象有限、結構簡單等特點,因此,工作人員更易于處理數(shù)據(jù)的采集及分析出現(xiàn)的各種問題,避免數(shù)據(jù)”噪聲”與價值信息被同時采集,匯總在一起。通過人工整理的方式降低了數(shù)據(jù)“噪聲”的不良影響,從而可以將數(shù)據(jù)“噪聲”快速剔除,提取出有價值的讀者小數(shù)據(jù)信息。
2.3小數(shù)據(jù)可以提高數(shù)據(jù)質(zhì)量
在數(shù)據(jù)決策中,數(shù)據(jù)的體量是重要的,但絕不是衡量數(shù)據(jù)價值的唯一標準。數(shù)據(jù)的獲取途徑、價值準確性、信息的完整性和數(shù)據(jù)采集有效性,是影響所采決策數(shù)據(jù)質(zhì)量的關鍵要素。圖書館進行的小數(shù)據(jù)提取是針對讀者信息開展的信息采集、數(shù)據(jù)系統(tǒng)分析和分析結果采集決策的系統(tǒng)性操作,通過這些操作才能保證為讀者提供個性化閱讀服務。小數(shù)據(jù)在圖書館中的應用從新的視角取代原有僵化的信息采集途徑,采用新的信息分析和管理決策的模式,為讀者提供更具針對性、指向性的服務。另外,圖書館小數(shù)據(jù)不同維度之間具有較高的關聯(lián)性和融合性。因此,基于該小數(shù)據(jù)基礎構建的圖書館個性化服務模型,相比原有的服務模式服務針對性更強,可利用率更高。同時,基于圖書館小數(shù)據(jù)集匯總的數(shù)據(jù)倉庫將使多維的數(shù)據(jù)信息更加統(tǒng)一、準確,有利于圖書館獲取高效信息,在對讀者閱讀行為加以記錄的前提下,構建圖書館小數(shù)據(jù)的“歸因模型”,以實現(xiàn)對讀者閱讀行為過程科學的因果解釋和推論。
2.4小數(shù)據(jù)具有高安全性
小數(shù)據(jù)較大數(shù)據(jù)而言對讀者個人隱私可有效地進行保護,隨著無線設備、移動終端和智能傳感器技術的高速發(fā)展,圖書館完全可以使用該類技術對讀者閱讀行為、閱讀習慣、閱讀方向和個人信息進行可持續(xù)、全面地數(shù)據(jù)采集。這些行為數(shù)據(jù)在指引管理人員為讀者提供差異化服務和科學決策的條件下,也使讀者的生活行為被監(jiān)測,導致隱私泄露和侵權的風險。
2.5小數(shù)據(jù)應用系統(tǒng)對硬件設備和系統(tǒng)資源要求較低
小數(shù)據(jù)以讀者行為數(shù)據(jù)為采集核心、可用于讀者個性化服務和指引科學決策的高價值信息。與大數(shù)據(jù)相比,二者在數(shù)據(jù)處理、分析決策過程中,對硬件的運算性能、算法的優(yōu)化設計、數(shù)據(jù)體量的要求有著很大的區(qū)別。
3.1小數(shù)據(jù)在電子文獻選購的應用
對于圖書館來說,電子文獻的選購是一項需要科學配置的工作。選購的電子文獻可謂是種類繁多,其中包括國內(nèi)的、國外的,不同學科的、不同層次的、不同價位的,要將這些因素與本圖書館學科設置、閱讀喜好層次、接受能力等情況相結合來取舍決定。首先,決策者必須要清楚本單位借閱人群狀況。一個電子文獻不管多有名,應用多廣泛,如果不適合本單位讀者群就不是一個好的選購對象。例如,圖書館對于醫(yī)學博士論文庫的采購往往都是要斟酌再三的,因為除了少數(shù)幾個??茖W術(如醫(yī)學)外,多數(shù)??频膶W術很難達到這一高度,如果購買勢必會造成曲高和寡、無人問津的局面。再如,讀者群如果外語水平尚未達到可無障礙地閱讀外國文獻的水平,那就不能大量采購外文電子文獻。其次,還要考慮選購的電子文獻的相似性和重復性。另外,還可以根據(jù)瀏覽的讀者人次數(shù)、人員類型和時間,來判斷一種電子文獻的應用前景和讀者接受的程度,最終決定是否購買。不合理的選購一方面會導致資源浪費,另一方面又會使合適的電子文獻因缺乏資金而失去未被選擇的機會。以上這些都要通過對小數(shù)據(jù)的精心分析才可能有最終正確的選擇[4]。
3.2小數(shù)據(jù)在讀者群體分析中的應用
圖書館工作中看似毫無計劃性的安排,如果要想安排得當其背后基于對小數(shù)據(jù)的分析必不可少。如每個圖書館基本上都有在固定時間閉館的規(guī)定,往往是根據(jù)連續(xù)幾個月中讀者到館人次最少一天的數(shù)據(jù)統(tǒng)計來分析得出的,這樣既可使圖書館進行了休養(yǎng)生息又將閉館給讀者群帶來的影響降至最小。再如,智能系統(tǒng)為圖書館工作采集到了全面的實時數(shù)據(jù),其中,閘機系統(tǒng)對于進入圖書館的讀者進行了實時跟蹤,我們可以從這些人員的屬性,包括單位、專業(yè),甚至性別來進行分析,從而得出我們需要的結論并加以應用。另外,還可以通過查看圖書館自身館藏資源來判斷相關服務是否科學。利用這些小數(shù)據(jù)加以分析有利于圖書館工作很好地開展,既兼顧了讀者利益,也使圖書館工作安排提高了效率,這些應用都是小數(shù)據(jù)統(tǒng)計的一種主動選擇。
3.3小數(shù)據(jù)在信息服務中的應用
信息檢索部門的服務很多時候?qū)儆谛?shù)據(jù)的服務內(nèi)容,為個別讀者提供具有針對性的個性化服務,通常為被動形式的服務。有需求的讀者會提出檢索范圍、主題等服務要求,信息檢索部門的工作人員會根據(jù)這些信息,提供檢索、查詢、推送等服務。因為這種小數(shù)據(jù)服務產(chǎn)生于個性化的需求,因此信息檢索部門結構往往體現(xiàn)于多樣化,以滿足更多讀者個性化借閱的需求。工作人員將通過OPAC系統(tǒng)進行圖書薦購,向讀者推薦自己認為有閱讀價值的書籍;一些圖書館會將讀者所選書目訂單作為圖書采購的一部分;如果書商在本地,甚至還可以邀請部分讀者隨同采購;此外,通過對讀者借閱情況的小數(shù)據(jù)分析,以確認圖書采購中是不是忽略了某些專業(yè)圖書,或者遺漏了某些讀者群的需求。這些措施的采用將會更大限度地發(fā)揮讀者的閱讀興趣。重視小數(shù)據(jù)的反饋,體現(xiàn)了對個體讀者的尊重,求同存異,讓任何一個有閱讀愛好的讀者均可在圖書館找到屬于他的那本書。
小數(shù)據(jù)作為大數(shù)據(jù)時代的重要組成部分,將以更加簡單、更有針對性、更易操作實施等特點,通過對讀者知識需求變化的分析為圖書館的建設發(fā)展帶來了依據(jù),也對圖書館管理和業(yè)務研究指出了新的方向,對圖書館服務提升起到指向性作用。小數(shù)據(jù)精準挖掘數(shù)據(jù)資源,為圖書館決策提供滿足個性化需求且高質(zhì)量的小數(shù)據(jù),深層次分離讀者信息及服務方向,確保圖書館服務更具價值,降低圖書館管理成本,并根據(jù)個性化需求及時調(diào)整圖書館發(fā)展格局??梢哉f,小數(shù)據(jù)的應用將為圖書館的發(fā)展帶來了一個大的機遇。
參考文獻:
[1]王碧琴,等.數(shù)字圖書館用戶信息隱私的安全威脅分析[J].圖書館學研究,2015(10):34-36.
[2]孫紅蕾,鄭建明.小數(shù)據(jù)思維驅(qū)動下的數(shù)字文化治理路徑探析[J].圖書館學研究,2015(18):39-43.
[3]張小光.支持醫(yī)療過程管理的電子病歷系統(tǒng)研發(fā)及有意義應用研究[D].浙江:浙江大學,2012:43-45.
[4]陳臣,馬曉亭.基于小數(shù)據(jù)的圖書館個性化推送服務與服務質(zhì)量保證研究[J].情報理論與實踐,2015(38).
王昊女,1979年生。研究生學歷,碩士,館員。
[分類號]G252
收稿日期:(2016-03-27;責編:徐向東。)