
摘 要:隨著智能化精準服務技術的涌現(xiàn),高校圖書館開始探索精準化學科服務的可行性。文章在分析大數(shù)據(jù)、小數(shù)據(jù)概念內(nèi)涵基礎上,確定數(shù)據(jù)技術應用于精準化學科服務的定位,構建學科服務數(shù)據(jù)系統(tǒng)架構,解析其功能特點,并圍繞高校圖書館學科服務數(shù)據(jù)系統(tǒng)建設實施的影響因素和保障對策展開探討,以期依靠專業(yè)精準服務技術提升高校學科服務能力,滿足用戶個性化需求。
關鍵詞:數(shù)據(jù)技術驅動;學科服務;精準化;高校圖書館
中圖分類號:G250.7;G258.6 文獻標識碼:A
Research on Precision Subject Services in University Libraries Driven by Data Technology
Abstract With the emergence of intelligent precision service technology, university libraries are exploring the feasibility of providing precision subject services. This paper analyzes the concept of big data and small data, determines the positioning of data technology for precision subject services, constructs a data system architecture for subject services, and analyzes its functional characteristics. Furthermore, it discusses the factors and measures affecting the implementation of the application system for subject service data in university libraries. The goal is to rely on professional precision service technology to improve the ability of university subject services, and meet the personalized needs of users.
Key words data-technology-driven; subject service; precision; university library
1 引言
隨著大數(shù)據(jù)、云計算、人工智能及精準化技術的快速發(fā)展與普及,高校圖書館提出了精準化學科服務思路。高校圖書館精準化學科服務并不是一種新的服務類型,而是在傳統(tǒng)學科服務基礎上以用戶問題為導向,以精準化技術為依托,不斷收集分析學科用戶需求,進而有針對性提供各種資源和服務,實現(xiàn)學科服務全過程的優(yōu)化、升級的一種創(chuàng)新模式。據(jù)此可知,全面獲取識別用戶各種顯性、隱性需求是實現(xiàn)精準化學科服務的首要條件。而在傳統(tǒng)思維下,用戶沒有表達出來或沒有表達清楚的隱性需求,外界很難進行識別,至今沒有取得突破性進展。
近年來,大數(shù)據(jù)、小數(shù)據(jù)及相關技術的發(fā)展為破解這個難題提供了可能性。英國學者維克托·邁爾·舍恩伯格認為:數(shù)據(jù)將為人類的生活創(chuàng)造前所未有的可量化的維度,數(shù)據(jù)已經(jīng)成為了新發(fā)明和新服務的源泉[1]。大數(shù)據(jù)挖掘規(guī)律,小數(shù)據(jù)量化體現(xiàn)自我,聯(lián)合運用大數(shù)據(jù)、小數(shù)據(jù)量化技術,綜合發(fā)揮大小數(shù)據(jù)“小中見大、以大兼小”優(yōu)勢,進行個體特征數(shù)據(jù)集合分析,發(fā)現(xiàn)和預測個人及群體需求特征,在此基礎上提供與之符合的精準服務方案。由此可見,大小數(shù)據(jù)量化分析思維與學科服務精準化服務模式高度契合,因此本文在分析大小數(shù)據(jù)概念內(nèi)涵的基礎上,研究學科服務用戶數(shù)據(jù)構成以及如何采集、處理和應用,探索構建能夠精確識別用戶全部需求的數(shù)據(jù)系統(tǒng),并提供與用戶需求匹配的服務和資源,實現(xiàn)學科服務精準化目標。
2 高校圖書館精準化學科服務數(shù)據(jù)技術應用分析
2.1 大小數(shù)據(jù)概念內(nèi)涵
大數(shù)據(jù)是指一種數(shù)據(jù)規(guī)模大到超出了現(xiàn)有數(shù)據(jù)處理技術和工具能力范圍的數(shù)據(jù)集合[2]。大數(shù)據(jù)以“事”或“物”為中心,側重于行業(yè)、事件的數(shù)據(jù)挖掘,從海量數(shù)據(jù)中尋找事物的共同趨勢或預測發(fā)展方向,為決策提供依據(jù)。目前多應用于大范圍、大規(guī)模的網(wǎng)絡營銷、輿情監(jiān)測、智慧城市等方面。
小數(shù)據(jù)是全部有關于“我”的數(shù)據(jù),是從個體用戶數(shù)據(jù)中提取出的具有個性化特征的數(shù)據(jù),將有效地揭示個體用戶行為模式規(guī)律”[3]。小數(shù)據(jù)概念內(nèi)涵的核心是以個人為對象,對個人數(shù)據(jù)進行深度的、全方位的挖掘,因此小數(shù)據(jù)也被稱為“量化自我”(QuantifiedSelf)。小數(shù)據(jù)應用最大的優(yōu)勢在于不需要復雜的算法、昂貴的硬件設備,在現(xiàn)有技術條件下,具有實現(xiàn)小數(shù)據(jù)的收集、儲存和處理的可能性。目前,小數(shù)據(jù)廣泛應用于醫(yī)療與公共健康、生命科學、計算機科學等領域。
小數(shù)據(jù)概念是在大數(shù)據(jù)環(huán)境下衍生出來的一類新興數(shù)據(jù),小數(shù)據(jù)不是大數(shù)據(jù)的小型化,而是大數(shù)據(jù)的延伸和補充,兩者猶如硬幣的兩面,是融合而非替代關系。美國學者喬納·伯杰(Jonah Berger)指出:“個人的自我量化數(shù)據(jù),將會是大數(shù)據(jù)革命中下一個演進方向?!盵4]
2.2 數(shù)據(jù)技術應用于精準化學科服務的定位分析
我國學者陳輝指出,精準服務數(shù)據(jù)系統(tǒng)是圍繞個體的全方位數(shù)據(jù)及其配套的收集、處理、分析和對外交互的綜合系統(tǒng)[5]。精準服務數(shù)據(jù)系統(tǒng)應用于學科服務的出發(fā)點是收集各類系統(tǒng)中用戶屬性與行為數(shù)據(jù),處理存儲個人特征數(shù)據(jù)庫,經(jīng)標注標簽、繪制用戶間全域關系視圖等系列操作,實現(xiàn)用戶隱性需求顯性化,完整解讀出用戶全部需求,這為精準服務提供準確導向,然后在智能化推送系統(tǒng)支持下,提供與之對接匹配的資源和服務。
當前,高校圖書館逐漸利用學科服務平臺對教學、科研、學習各類人員開展學科服務業(yè)務。雖然這些學科服務平臺能夠進行資源整合和導航,有一定學科服務體系和功能[6],但是學科服務平臺集成化、智能化水平較低,學科資源配置與各類服務還是通用普適性模式,無法滿足用戶個性化精準需求,體驗感和滿意度較差。故此,本研究涉及的學科服務數(shù)據(jù)系統(tǒng)在技術定位上是一個相對獨立的外掛系統(tǒng),它的工作流程主要包括三個步驟:①采集抓取各類系統(tǒng)中有關學科用戶的行為和屬性信息數(shù)據(jù),進行數(shù)據(jù)清洗、過濾噪聲、數(shù)據(jù)集成、數(shù)據(jù)歸約等標準化處理,完成這兩類數(shù)據(jù)的存儲;②對數(shù)據(jù)進行標簽化處理和數(shù)據(jù)挖掘分析,建立可視化的用戶畫像模型來揭示用戶的需求和行為偏好,進而有針對性地從數(shù)據(jù)倉儲中抽取用戶需要資源構建學科資源倉儲,繪制資源畫像并與用戶畫像建立關聯(lián)匹配映射;③對建立的畫像模型進行質量評估,實現(xiàn)畫像動態(tài)監(jiān)測、優(yōu)化與修正,改進應用系統(tǒng)參數(shù),實現(xiàn)精準的學科服務功能應用。
3 高校圖書館學科服務數(shù)據(jù)系統(tǒng)架構
該系統(tǒng)架構由數(shù)據(jù)采集、數(shù)據(jù)預處理與存儲、數(shù)據(jù)分析與決策、精準服務應用四部分模塊組成(見圖1)。其關鍵點在于全面采集大學各類系統(tǒng)中用戶的注冊數(shù)據(jù)、行為數(shù)據(jù)、動態(tài)操作日志數(shù)據(jù)等進行智能分析,精準識別和預測各類用戶需求,以此為驅動實現(xiàn)資源動態(tài)配置和服務優(yōu)化升級。
3.1 數(shù)據(jù)采集
為全面和準確分析預測用戶需求,數(shù)據(jù)采集范圍不僅含有圖書館學科服務、專家機構庫等業(yè)務系統(tǒng),還擴展到校內(nèi)學科用戶的科研、教學、學習相關平臺或系統(tǒng),以廣泛收集用戶的屬性與行為特征數(shù)據(jù)。在技術操作上,主要通過大學內(nèi)部平臺、系統(tǒng)的API(Application Programming Interface, 應用程序編程接口)與數(shù)據(jù)系統(tǒng)對接,并以Heritrix網(wǎng)絡爬蟲爬取為輔。根據(jù)采集數(shù)據(jù)屬性不同,可以分為靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。
(1)靜態(tài)數(shù)據(jù)。它是描述用戶個人信息屬性的數(shù)據(jù),這類數(shù)據(jù)相對不變,如統(tǒng)一身份認證系統(tǒng)(姓名、性別、年齡、院系、學歷等)、教學與成績管理系統(tǒng)(科目名稱、課時、成績等)、科研大數(shù)據(jù)管理系統(tǒng)等(資助項目、發(fā)表論文情況等)。
(2)動態(tài)數(shù)據(jù)。它是學科服務用戶利用圖書館服務產(chǎn)生的一切關聯(lián)數(shù)據(jù),其采集可以通過學科服務平臺、電子閱覽室系統(tǒng)、圖書借閱系統(tǒng)、移動圖書館系統(tǒng)、原文傳遞系統(tǒng)、遠程授權訪問系統(tǒng)、參考咨詢系統(tǒng)、論文提交系統(tǒng)、機構知識庫、微信公眾號、微信小程序等提取出用戶瀏覽日志、搜索和獲取歷史、咨詢反饋等信息,持續(xù)追蹤抓取用戶行為特征數(shù)據(jù)。
3.2 數(shù)據(jù)預處理與存儲
數(shù)據(jù)預處理與存儲就是進行數(shù)據(jù)凈化與規(guī)范處理,是實現(xiàn)數(shù)據(jù)分析與決策的前期準備階段。數(shù)據(jù)系統(tǒng)經(jīng)多元渠道、全方位對用戶數(shù)據(jù)采集后,要針對數(shù)據(jù)噪音、異構、高位稀疏等問題進行預處理,提升學科服務數(shù)據(jù)的價值密度。數(shù)據(jù)預處理的方法有:①數(shù)據(jù)清理。通過填寫缺失值、數(shù)據(jù)去噪音、識別或刪除離散點以實現(xiàn)格式標準化、異常數(shù)據(jù)清除、錯誤糾正、重復數(shù)據(jù)清洗等。②數(shù)據(jù)集成。清除各個數(shù)據(jù)源之間的異構性,提供觀察數(shù)據(jù)的統(tǒng)一視圖過程。③數(shù)據(jù)變換。通過平滑聚集、數(shù)據(jù)概化、規(guī)范化等方式將數(shù)據(jù)轉換成適用于數(shù)據(jù)挖掘的形式。④數(shù)據(jù)歸約。在保持數(shù)據(jù)原貌前提下,采用特征歸約、樣本歸約、特征值規(guī)約等方法最大限度精簡數(shù)據(jù)量,提高挖掘效率和精度。
學科服務數(shù)據(jù)系統(tǒng)存儲是把采集、處理的數(shù)據(jù)儲存起來,建立對應數(shù)據(jù)庫,以便系統(tǒng)調用與管理。它利用分布式計算平臺Hadoop聯(lián)合Flume工具把清理、集成、變換及歸約的數(shù)據(jù)分布式存儲為基礎資源庫、用戶屬性庫與用戶行為庫。Hadoop技術具有海量數(shù)據(jù)分布式存儲、多類型數(shù)據(jù)并行處理,能夠高容錯、高伸縮并擁有強大編程模式與分析功能的優(yōu)點;Flume是一個高可靠、高可用的分布式海量日志存儲、聚合和傳輸系統(tǒng)。二者的聯(lián)合使用優(yōu)勢互補,可為后期的數(shù)據(jù)分析與決策提供可靠保障[7]。
3.3 數(shù)據(jù)分析與決策
數(shù)據(jù)分析與決策是數(shù)據(jù)系統(tǒng)的功能支持中樞,挖掘發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的用戶需求,建立學科用戶與資源、服務的“精準”橋梁。數(shù)據(jù)分析與決策模塊主要由標簽建立、數(shù)據(jù)挖掘與畫像建立、畫像質量評估三個部分組成。
(1)標簽建立。對收集存儲的學科用戶數(shù)據(jù)進行分類、關聯(lián)、序列化、機器學習等方法處理,構建用戶基本屬性和行為屬性兩個維度標簽,通過機器學習、數(shù)據(jù)挖掘、自然語言處理等方法對各類學科用戶潛在(隱藏)特征標簽刻畫建模,分析賦予標簽權重比例,實現(xiàn)學科用戶標簽價值與衡量體系。同樣,系統(tǒng)利用業(yè)務規(guī)則與邏輯推理對學科資源進行標簽化處理,建立資源業(yè)務標簽體系。
(2)數(shù)據(jù)挖掘與畫像建立。Hadoop平臺運用Mahout、RapidMiner工具對學科用戶與資源標簽庫進行聚類、分類、回歸、關聯(lián)規(guī)則等多算法、多維度的數(shù)據(jù)挖掘,分析揭示各類用戶顯性與隱性需求,并引入時間序列與神經(jīng)網(wǎng)絡算法對未來需求趨勢進行預測,基此建立相互關聯(lián)的學科基礎資源畫像與用戶畫像模型。
(3)畫像質量評估。用戶畫像模型需要依據(jù)用戶意見反饋與個人特征數(shù)據(jù)變化進行質量評估,不斷進行優(yōu)化、修正與完善。用戶畫像質量評估有學科服務收益率Pser和學科用戶滿意度Dsat兩個指標,其中Pser權重比為r,Dsat權重比為1-r,那么評估結果是W=rPser+(1-r)Dsat,0lt;W≤100[8]。
3.4 精準服務應用
學科服務數(shù)據(jù)系統(tǒng)經(jīng)過數(shù)據(jù)采集、數(shù)據(jù)預處理與存儲、數(shù)據(jù)分析與決策的流程操作,動態(tài)識別用戶需求,API鏈入學科服務系統(tǒng)與各類資源平臺,能夠有效提高資源利用效率、提升服務精準化水平,進而滿足廣大師生教學、科研、學習等各種要求。
(1)資源:個性化檢索與精準推薦。數(shù)據(jù)賦能圖書館業(yè)務,精準化學科服務首先是要激活圖書館各類資源,實現(xiàn)用戶需求與資源的關聯(lián)匹配,優(yōu)化學科資源的個性化檢索、定制和精準推薦功能,高效、便捷滿足用戶資源需求。學科服務數(shù)據(jù)系統(tǒng)以用戶需求為導向,優(yōu)化資源檢索與推薦系統(tǒng),量身定制檢索式實現(xiàn)個性化檢索,并依據(jù)需求度對檢索結果進行降序排列,并采用深度學習召回算法策略,切實提高系統(tǒng)推薦精度。
(2)服務:精準營銷與決策參考。學科服務數(shù)據(jù)系統(tǒng)采集、識別用戶基礎屬性信息、行為習慣與愛好、活躍度、搜索內(nèi)容、用戶生命周期階段等數(shù)據(jù),構建個體、群體成員間的關聯(lián)畫像,建立個人或群體特征標簽檔案,據(jù)此將學科服務產(chǎn)品提供給特定個人或群體,并及時跟進處理用戶反饋意見,以保證再反饋的有效和時效。此外,學科服務數(shù)據(jù)系統(tǒng)還將學科資源、業(yè)務服務和用戶行為數(shù)據(jù)關聯(lián)、融合起來,挖掘揭示隱藏在數(shù)據(jù)背后的“真相”,可為圖書館業(yè)務發(fā)展與決策提供依據(jù)。
4 學科服務數(shù)據(jù)系統(tǒng)的功能特點
學科服務數(shù)據(jù)系統(tǒng)核心功能主要體現(xiàn)在畫像模型的分析與應用。用戶畫像模型準確分析與預測學科用戶需求,為優(yōu)化現(xiàn)有資源產(chǎn)品的質量、提升學科服務效果提供依據(jù);業(yè)務畫像模型分析監(jiān)控圖書館發(fā)展軌跡,衡量業(yè)務服務價值,支持圖書館管理與決策。
4.1 用戶畫像模型分析
用戶畫像是數(shù)據(jù)驅動環(huán)境下具象描繪用戶形象、表達用戶需求的一種實用工具,是實現(xiàn)用戶與學科資源、服務間數(shù)據(jù)交換的橋梁。依據(jù)用戶行為數(shù)據(jù)畫像精準分析、動態(tài)識別出用戶顯性、隱性需求,改變依靠傳統(tǒng)調查問卷評價的粗放滯后調研模式,全面、及時、準確、高效為廣大師生提供所需資源和服務。用戶畫像不是一成不變的,數(shù)據(jù)系統(tǒng)長期實時追蹤用戶行為、習慣愛好等變化,輔以智慧情景感知,動態(tài)更新用戶畫像并智能分析、解讀及預測用戶需要趨勢。這既豐富了用戶自我了解和認知途徑,又提供了針對需求的更優(yōu)質服務和資源。
4.2 業(yè)務畫像模型分析
數(shù)據(jù)系統(tǒng)全面采集、融合與學科用戶相關的資源、業(yè)務服務數(shù)據(jù),聯(lián)合用戶畫像智慧分析,建立各種相關業(yè)務模型,深入挖掘和有效分析數(shù)據(jù)背后用戶多元化需求,生成大量趨勢分析報告或常態(tài)監(jiān)察數(shù)據(jù)報表以衡量圖書館服務的優(yōu)劣或發(fā)展軌跡,并為學科資源采購配置、業(yè)務類型調整、規(guī)章制定等提供決策依據(jù)。例如:利用數(shù)據(jù)系統(tǒng)建立圖書館學科紙電資源配置與利用模型,分析圖書館學科資源利用情況和貢獻率,揭示各學科專業(yè)館藏與用戶資源需求是否相適應;構建活動宣傳推廣效果模型、業(yè)務跟蹤評價與服務質量指標模型,分析學科服務業(yè)務開展的效果與發(fā)展趨勢,可及時調整服務內(nèi)容不斷動態(tài)滿足學科用戶的需求變化。
5 數(shù)據(jù)技術驅動下高校圖書館精準化學科服務發(fā)展保障對策
高校圖書館精準化學科服務是在精準服務理念基礎上,以數(shù)據(jù)技術發(fā)展成果為依托對傳統(tǒng)學科服務全過程進行優(yōu)化,實現(xiàn)學科服務從常規(guī)通用性向個性化精準服務轉型。
5.1 樹立精準服務理念
目前我國多數(shù)高校圖書館學科服務還處于普適性通用服務階段,人們的思想意識中還保持著傳統(tǒng)觀念,沒有充分認識到隨著智能精準技術迅速發(fā)展,注重用戶體驗、個性化精準的學科服務模式呼之欲出,急需推進基于用戶個性化需求的精準化學科服務建設進展。因此,高校圖書館從館領導到館員都要牢固樹立精準服務理念,轉變傳統(tǒng)“普適”觀念,充分把握高校圖書館精準化學科服務新的發(fā)展契機。
5.2 加強學科服務專業(yè)人才隊伍建設
學科館員是具有圖書情報、計算機等專業(yè)學科知識的復合人才,當前高校圖書館學科館員數(shù)量不足是普遍現(xiàn)象,因此高校圖書館需要制定學科服務人員培養(yǎng)機制。一是設置學科服務專人、專職崗位,評價學科服務的效能;二是從外部引進具有綜合素質、工作經(jīng)驗的高級人才;三是加強內(nèi)部人才培養(yǎng),制定循序漸進、系統(tǒng)化培訓方案,圍繞學科知識、圖書情報知識等展開,鼓勵館員跨專業(yè)、跨學科在職學習。
5.3 統(tǒng)籌規(guī)劃,多方合作共建
高校圖書館學科服務數(shù)據(jù)系統(tǒng)實施是一項多方協(xié)作工程,從圖書館而言,需要在館領導帶領下,整合圖書館各部門力量,組成以學科服務部門為主導的團隊,負責圖書館內(nèi)外協(xié)調;從高校整體而言,需要協(xié)調學校各職能部門,將用戶分散在校內(nèi)各部門的信息數(shù)據(jù),給予圖書館整合利用的權限。因此數(shù)據(jù)系統(tǒng)建設需要高校領導加強頂層設計,制定相關發(fā)展規(guī)劃,協(xié)調校內(nèi)各部門配合,統(tǒng)籌安排人力、物力、資金等。
5.4 優(yōu)化宣傳策略,擴大用戶數(shù)量
數(shù)據(jù)系統(tǒng)的最大特點是“以人為本”,即數(shù)據(jù)來源和數(shù)據(jù)產(chǎn)品屬于同一個用戶個體。數(shù)據(jù)系統(tǒng)處于動態(tài)運行環(huán)境,可以根據(jù)用戶反饋進行修正,調整資源配置和服務策略。因此,為了不斷提升數(shù)據(jù)系統(tǒng)的功能,需要吸引更多潛在的學科用戶參與。圖書館可以采取線下和線上宣傳方式,加強與用戶交流溝通,深入到用戶中主動地向學校師生介紹數(shù)據(jù)系統(tǒng),并在圖書館主頁醒目位置推送數(shù)據(jù)系統(tǒng)。
參考文獻:
[1] 梅宏.數(shù)據(jù)治理之論[M]. 北京:中國人民大學出版社,2020:11.
[2] 馬費成,趙志耘.情報工程學概論[M].北京:科學技術文獻出版社,2019:8.
[3] ESTRIN D,THOMPSON C W.Internet of you:data big and small[J].IEEE Internet Computing,2015,19(6):8-10.
[4] BERGER J.Islittle data the next big data? [EB/OL].[2022-11-12].http://www.linkedin.com/pulse/20130908184001-5670386-is-little-data-the-next-big-data.
[5] 陳輝.小數(shù)據(jù)之美:精準捕捉未來的商業(yè)小趨勢[M].北京:中信出版社,2019:4.
[6] 劉景亮,于海濤,裴麗,等.基于Hadoop2.0+Html5技術的學科服務平臺設計與實現(xiàn):以黑龍江中醫(yī)藥大學為例[J].圖書館學研究,2018(21):58-62.
[7] 伊靜.手機閱讀BI平臺的數(shù)據(jù)采集系統(tǒng)的改進與優(yōu)化[D].北京:北京郵電大學,2017:2.
[8] 張鳳斌.高校圖書館學科服務小數(shù)據(jù)系統(tǒng)的構建與優(yōu)化[J].圖書館,2021(11):64-68.
作者簡介:劉景亮,博士,黑龍江中醫(yī)藥大學圖書館館員,研究方向為精準化學科服務;劉京京,碩士,哈爾濱航天恒星數(shù)據(jù)系統(tǒng)科技有限公司工程師,研究方向為人工智能服務; 翟秀鳳,碩士,長春師范大學圖書館館員,研究方向為精準化學科服務;所瑪,碩士,黑龍江中醫(yī)藥大學圖書館館員,研究方向為精準化學科服務;裴麗,博士,黑龍江中醫(yī)藥大學圖書館研究館員,研究方向為精準化學科服務。
收稿日期:2023-01-03本文責編:孫曉清