張 陽
(武漢紡織大學 圖書館,湖北 武漢 430200)
近年來,以大數據和智能技術為驅動的智慧圖書館研究如火如荼,其研究也從概念轉向實踐,實踐方向也從簡單的“自助設備”服務轉向能夠智能感知讀者需求,而為讀者提供精準、個性服務的“智慧型”圖書館。
在大數據時代融入生活方方面面的大背景下,圖書館傳統服務已經無法滿足用戶讀者對于信息的需求,基于讀者小數據的“智慧圖書館+”精準服務研究,是以讀者個體為中心,全方位地將讀者日常行為中各個小數據集互聯互通互應用,形成讀者用戶獨一無二的數據集,形成用戶畫像和定義標簽,分析用戶需求模型從而提供精準、個性的服務,“智慧圖書館+”小數據在下一代智慧圖書館服務研究中可以起到很重要的作用[1]。
最早關于小數據的概念是廣為流傳的美國康奈爾大學教授德波哈爾·艾斯汀的故事,他由其父親去世前幾個月行為的變化,分析和評估其個體化特征,啟發了他分析病人特性化的小數據,從而應用到醫療中[2]。德波哈爾·艾斯汀教授對小數據概念的定義為小數據是“全部有關于‘我’的數據”“個體用戶的小數據是其日常行為活動的全部表征”,他指出“從個體用戶數據中提取出的具有個性化特征的數據將有效地揭示個體用戶行為模式規律”[3]。
依據小數據的概念可以延伸出讀者小數據的概念,即讀者小數據是以讀者為中心,基于讀者個體的數據,是用以表征讀者日常行為的,可以揭示讀者的行為模式規律,從而了解讀者日常需求,為讀者提供精準、個性化服務。
讀者小數據是與讀者有緊密聯系數據的綜合,涵蓋多個維度,涉及讀者方方面面,借助小數據圖書館能夠更加深入和精準地分析個體讀者的需求,對讀者相關數據進行有效的精細化區分和研究,同時小數據也能為決策提供必要的信息支撐[4]。
同時也可以看到,利用從大數據中延伸出來的小數據思維應用到智慧圖書館建設,正好與“回歸讀者”“以讀者為中心”“讀者至上”等的服務理念相契合,圖書館服務回歸到以讀者個體為中心,精準給予服務,所以圖書館應用小數據將是一個有益的方向。
小數據來源于大數據,是大數據概念下的一種延伸,其特點是面向個體。小數據主要來自個體的行為實踐,對圖書館來說即讀者用戶的基礎數據和行為數據,是一個具有特定的且可以準確定義個體的數據,同時可以量化展現讀者特性。圖書館可以利用讀者用戶在學習生活中使用智能設備、互聯網各類應用時收集個人各類行為數據,再經過數據整合、分析,可視化展示個體,一方面給予個人自我決策,另一方面供圖書館為讀者個體提供精準、個性服務[5]。
高校讀者有著與公共讀者不一樣的特點。首先,行為產生的地理位置比較集中,主要是校園內部。其次,行為產生的目的是知識學習、科學研究、文化素養,也涵蓋社交、娛樂和各類興趣愛好。其特點是作為圖書館大數據的補充和延伸,在聚合、分類、數據集建立過程中傾向以讀者個體行為偏好數據的感知、搜集與分析,運算處理結果具有極強的針對性,其采集過程需要精細化、個性化、全方位采集數據。
2015年3月,李克強總理在十二屆全國人大三次會議上作政府工作報告,首次提出“互聯網+”行動計劃。2020年政府工作報告,李克強總理強調全面推進“互聯網+”,打造數字經濟新優勢。“互聯網+”一般指互聯網+各個傳統行業,是利用互聯網手段和思維推動傳統行業跨界開放變革融合。其重要保障是數據互聯互通互應用,所以這個“+”也可以理解為數據的融合。
智慧圖書館經過圖書館界長時間的追捧,對其定義有比較全面的共識,其定義從智能計算上看,是傳統圖書館+互聯網技術+智能設備;從服務上看,是智能感知+智慧化服務。
從“互聯網+”數據互聯互通互應用的角度來看,“智慧圖書館+”是以人工智能等新興技術和智慧管理為手段,對圖書館資源進行整合和優化,使各類小數據互聯互通互應用,從而推動“智慧圖書館+”有機生長,為讀者用戶提供精準、個性化的服務。
高校讀者小數據以服務高校讀者為首要目的,高校讀者最主要即為學生和教工,其行為目的主要是學習、科研、學術交流、校園活動等,所以其根本是立足校園內來采集數據,同時作為高校圖書館可以很好地利用和聯合學校各類信息系統,采集讀者校內行為數據。因此高校讀者小數據首先按照類別可分為個人數據和行為數據,其中行為數據依據產生的地理位置又可分為校內行為數據和校外行為數據。
2.2.1 個人數據
個人數據涵蓋讀者個人基本屬性,例如姓名、性別、年齡、出生時間等,同時也涵蓋學號、讀者號、學院、年級、專業、研究方向、所屬學科類別,對于教工讀者還涵蓋工號、學歷、學位、職稱、人才層次等,以及可以延伸到個人的偏好數據。其數據來源主要是學校信息中心數據及一卡通的基礎數據、學生信息管理系統、人事信息管理系統等。
2.2.2 校內外行為數據
高校讀者用戶按使用范圍可分為校內行為數據和校外行為數據。校內行為數據即在校園范圍內的學習生活等行為所產生的數據,從行為目的可以分為學習、科研、社交等,其來源主要是圖書管理系統、教務系統、科研系統等。校外行為數據主要是通過互聯網和人工智能設備所采集到的個人向校外延伸的行為數據。
高校讀者小數據的采集主要立足校內,延伸校外。其數據產生于校內行為,其類別主要分為圖書館數據、學習數據、科研數據、社交數據、延伸數據,其數據有交叉項也有獨立項,數據主要來源于高校智慧校園內的各類系統。
(1)圖書館數據:數據主要涵蓋圖書借閱情況、訪問圖書館網站、使用移動圖書館、進出館時間和次數、預約座位、在館時間、閱讀偏好、閱讀時長、文獻閱讀下載、文獻傳遞、科技查新等。其數據來源主要為圖書管理系統、移動圖書館、圖書館網站、微信公眾號、預約系統、門禁閘機系統、在線閱讀系統、電子資源平臺統計系統等。
(2)學習數據:數據主要涵蓋課堂學習、在線學習、培訓講座、參與學習活動、教學服務咨詢、上課簽到情況、選修課程偏好、學習興趣愛好等。其數據來源主要為圖書館信息管理系統,學生信息管理系統,教學信息管理系統等。
(3)科研數據:數據主要涵蓋發表論文及被引情況、課題研究、查新查重、獎勵情況、文獻傳遞、數據資源利用、科研咨詢服務、借閱情況、閱讀情況等。其數據主要來源為電子資源平臺統計系統、科研信息管理系統等。
(4)社交數據:數據主要涵蓋參加學術會議、學習交流、課外活動、成果展示、訪問社交網站等。
(5)延伸數據:涵蓋以上各類由校外行為產生的數據,同時也涵蓋個人興趣愛好等。其數據主要涵蓋各類網頁、知乎、豆瓣、百度文庫、微信、微博、小紅書等。
“智慧圖書館+”下采集高校讀者小數據總量大、來源多,導致讀者小數據價值密度降低,所以對于小數據的處理尤為關鍵。在對高校讀者個人信息和校內外行為數據采集后,要使數據互聯互通互應用。在數據統一標準處理后,分類分析,去除重復不用數據,挖掘有用數據,利用關聯算法揭示數據所展示的內容并聚合到圖書館,找出共性數據和個性數據,形成“智慧圖書館+”下的數據中心,為下一步利用小數據做好基礎和規范性工作[6]。
對讀者小數據整理完成后,要對數據中心數據進行關聯、挖掘、分析、利用,再次細化讀者用戶數據庫。全面展示讀者個性偏好和行為,展示讀者用戶特征,不斷完善用戶畫像,從基本信息形成初步用戶畫像,層層疊加校內外行為數據,動態刻畫,不斷立體,使得用戶畫像更為準確清晰,所以全流量數據是用戶畫像真實可靠的必要基礎[7]。在構建用戶畫像的同時,不斷定義標簽,對讀者標簽進行分類整理,建立個體用戶和群體用戶標簽體系。
圖書館通過對讀者小數據全方位采集,建立數據中心,分析挖掘數據完成用戶畫像,同時構建用戶和群體用戶標簽,全面了解用戶需求。對讀者用戶的行為需求行為動態分析,對需求模型不斷精細化,實現為讀者用戶提供個性、精準化服務的目的。建立統一標準的讀者用戶需求模型,以此來連接用戶小數據管理與利用的諸多環節,形成聯動服務效果。用戶需求模型要力求做到以標準的格式集成數據,使得小數據互聯互通互應用的時候有統一標準,在建立需求模型時分析其數據之間的邏輯性,從價值層面來處理小數據并建立用戶需求模型。
圖書館應該做好小數據的價值挖掘工作,促進數據庫的不斷完善和更新,確保用戶需求與個性化推送內容的精準匹配。通過建立完備的精準服務推薦系統,利用讀者小數據的整合可以幫助圖書館實現面向讀者個體的精準、個性推送服務。圖書館在推送的同時,應當重視讀者反饋,整合用戶反饋意見,動態調整推送服務,不斷完善精準服務體系,實現個性、定制化推送。同時,也要不斷動態完善用戶畫像,使得用戶標簽更為細化和規范,用戶模型不斷完善,動態適應讀者需求,使得在基于“智慧圖書館+”下的讀者小數據服務精準推送。
在以高校讀者小數據為中心的思維下,智慧圖書館為讀者用戶提供的精準、個性化服務可以得到質的提升,讀者用戶得到屬于自己的個性服務體驗。高校讀者小數據的采集應該以互聯互通互應用為基礎,全方位采集個性數據,以高校讀者小數據為中心的 “智慧圖書館+”精準服務研究可以與智慧圖書館、大數據、用戶畫像等有機結合,其研究出發點以個體讀者為基礎,自下而上地利用數據。將更多的小數據個體特性進行數據的全面融合,對用戶畫像后進行可視化分析,找到其數據背后的模型和規律,同樣可以聚合成圖書館的大數據集,供智慧圖書館建設、業務調整、讀者精準和個性服務提供決策依據。