孫 鵬 車寶晶
(沈陽師范大學圖書館 沈陽 110034)
在大數據、云計算和移動互聯網等新一代信息技術的聯合驅動下,我們已經從信息時代快速跨入了“數據驅動”的“智慧時代”,數據及相應的附屬產品給我們的生活和工作帶來了極大便利。數據驅動新范式正在迫使圖書館界重新審視自己的思維模式和服務模式,從“基于資源解決問題”的傳統認知逐步轉向“基于數據解決問題”的創(chuàng)新思維,依托數據驅動服務創(chuàng)新與深化,從而推進圖書館在知識服務過程中的供給側結構性改革,深度發(fā)揮圖書館在用戶服務場景和過程中的創(chuàng)新支持能力和智慧服務能力[1]。
本文試圖對數據驅動下的圖書館智慧服務環(huán)境進行新的探索,從環(huán)境建設到數據組織、從計算分析到精準助力,推進圖書館更好地組織數據、挖掘數據、解析數據和利用數據,最終通過理論奠定與場景創(chuàng)設、平臺支撐與數據融合、多維驅動與協同交互等環(huán)節(jié),為用戶創(chuàng)建一套“數據與知識服務相融合”的全流程解決方案和智慧化服務環(huán)境,將圖書館服務推向更高階段。
計算機技術的發(fā)展給圖書館帶來了無限的機遇和可能。近年來,隨著用戶信息獲取渠道的網絡化遷移,圖書館大幅增加了在數字資源領域的館藏布局。這種趨勢在方便用戶獲取資源的同時,也使圖書館能夠全面感知用戶的行為數據,并以數據為中心驅動服務,讓數據化和數據思維在圖書館服務過程中產生無限推力。
數據化是把問題轉化為可制表分析的量化形式的過程。現階段,圖書館依托智能技術存儲了大量動態(tài)化數據,而基于數據的服務,只是依托結構化行為數據進行規(guī)律性揭示,或進行簡單的挖掘分析,增值貢獻度較低。比如,當下部分高校圖書館在年底發(fā)布的閱讀報告或數據報告,只是業(yè)務數據的簡單羅列或對比,沒有發(fā)揮數據的先知性和決策性功能,對業(yè)務水平的提升意義不大。未來圖書館還應繼續(xù)加強資源的全面數字化以及對用戶特征及行為的全面感知,主要圍繞三大類數據:資源數據、用戶數據和行為數據。這些數據通常存在于不同的異構系統中[2](見表1),它們作為重要的資源將為深度的數據服務奠定基礎、創(chuàng)造可能,還需要借助有效的數據思維進行數據化管理與決策支持。
數據思維是根據數據來思考問題、解決問題的一種量化思維模式,其特征主要表現在四個方面:①由樣本思維到全量思維。樣本作為全量的一部分,有時未必能準確反映客觀事實,需要擴大數據半徑,借助全部數據進行分析預測。②由精準思維到模糊思維。在海量數據面前,某條異常記錄可能會產生突變或失去價值,因而我們不應過度糾結,而應該運用模糊思維,注重對大概率事件的預測。③由因果思維到關聯思維。在大數據面前,有些現象可能無法洞察或者沒有必要進行前因后果分析,我們應該注重其關聯特征,讓發(fā)現資源之間的關系比發(fā)現資源更重要,解決資源孤島與服務單一的問題。④由自然思維到智能思維。自然思維模式相對簡單,在數據時代,應該充分依托數據優(yōu)勢,建立全景化、立體化的洞察體系,培養(yǎng)數據驅動思維,進行智慧化分析與預測[3]。現階段圖書館雖然掌握了大量數據,卻沒有很好地依托數據實現知識服務的精準投放,而數據思維正在促使圖書館和圖書館人進行思維模式的跨越式轉變。我們不能簡單地感知數據、存儲數據,而要善于分析數據、利用數據。

表1 圖書館主要數據類型
在大數據環(huán)境下,圖書館的服務不能再局限于需求驅動下的知識供給,而要全面洞悉用戶的數據特征,以數據思維改變圖書館在服務過程中的被動狀態(tài),做好數據驅動場景設計與服務規(guī)劃,從資源數字化、用戶行為感知、館員數據素養(yǎng)提升等方面進行介入,為面向數據的智慧服務創(chuàng)設可靠的場景環(huán)境[4]。
一是資源數字化。圖書館應不斷加強對館藏資源數字格式的加工、轉換及其與網絡開放資源、原生資源等的整合。資源是圖書館服務的根基,在資源結構上,圖書館應該逐漸減輕對傳統紙質文獻資源的依賴,不斷擴大數字資源的占比,適度將網絡熱點信息、政府開放信息、社會公共信息納入保障體系。此外,圖書館還可以加強對本館原創(chuàng)、非公開智力成果的采集、存儲和應用,推動用戶生產內容UGC(User Generated Content)生態(tài)模式持續(xù)發(fā)展,鼓勵用戶持續(xù)創(chuàng)造內容并與其他用戶分享,同時在模式上引入“館店融合”、用戶驅動采購等,促進知識多元融合與深度加工,構建更廣泛意義上的數字化資源保障體系。
二是用戶行為感知。圖書館需要依托用戶行為數據進行用戶需求的采集、分析,并提供智慧服務。數據采集內容主要包括數字資源利用、科研成果產出、紙質書刊借閱、到館、學科服務等方面的數據,盡可能全面、細致。關于用戶數據,重慶大學圖書館館長楊新涯有過這樣的闡述:用戶A 在一年中下載了100 本電子書,這并不是真正的閱讀數據,我們還要知道這100 本書的具體閱讀情況,有哪些只是下載而沒有閱讀,有哪些只是閱讀了目錄,有哪些進行了精讀,等等情況[5]。我們只有掌握了用戶真實的閱讀情況,才能進行準確、有效的分析。隨著數字化和數據化的推進,那些有價值的數據應該成為圖書館關注的重點,而不僅僅是一個概數。
三是館員數據素養(yǎng)提升。圖書館應該通過數據館員計劃加強對數據的科學管理與應用,最終通過數據驅動提升管理與服務能力。館員的數據素養(yǎng)不僅僅體現在對數據的建設、采集和存儲等能力,更主要的是數據管控能力和智慧分析能力。我們對數據產品的利用不能簡單停留在展示、排行、熱度分析等層面,而應通過對底層驅動業(yè)務流程的重組與再造,讓資源與需求聯動,充分發(fā)揮數據支持決策的優(yōu)勢,這才是數據真正的價值和意義所在。
圖書館資源豐富,卻往往疏于對數據進行管理和融合,使諸多數據分散在各個獨立的業(yè)務系統中無法形成規(guī)模,難以發(fā)揮其數據價值。在數據驅動的智慧服務框架構造過程中,數據是最核心、最關鍵的部分,我們不應再讓數據孤立地存在,而應打造不同層級的數據支撐平臺,進行全流程的數據融合,從而推動數據服務升級。

圖1 數據驅動支撐平臺
圖書館的數據主要分為三類,即資源數據、用戶數據和行為數據,支撐平臺也主要圍繞這三部分數據進行構造,采取垂直管控、水平驅動的策略,各子平臺在基礎數據建設上相互獨立,在數據融合與服務上相互協作(見圖1)。資源數據支撐平臺主要依托電子資源管理系統ERMS 實現從采訪到論證、從試用到評估、從付款到使用以及元數據收割的一整套流程。資源數據支撐平臺能夠將圖書館存在于不同異構系統中的資源進行標準化、統一化管理,建立底層的數據一體化平臺;用戶數據支撐平臺主要依托統一身份認證系統IDS 實現各系統間跨域單點登錄,以及從不同系統中獲取、更新身份特征、屬性等,促進用戶數據的同步與共享;行為數據支撐平臺主要依托大數據技術實時感知用戶的行為軌跡特征,穿透平臺壁壘與數據保護墻,全過程收集用戶的文獻、科研、教學、閱讀、活動等數據,發(fā)現用戶知識訴求特征。
在跨界服務平臺支撐下,圖書館能夠有效提升數據的可見度與可訪問性,從而全線推動數據融合,綜合不同異構系統下的多維數據特征發(fā)現用戶知識訴求,注重用戶畫像模型構建,以可視化產品增加服務被關注的可能和被獲取的概率。一是數據的全過程采集。這部分功能主要集成在數據建設層,包括對底層資源的數字化轉換、對用戶特征與屬性的獲取及其行為軌跡的感知和數據化,通過各種技術手段、智能設備等實現資源數據、用戶數據和行為數據的收割與標準化建設。二是數據的跨界協作。我們不能僅關注某一類數據,要統籌全局、融合分析,才能精準定位,比如要對某用戶進行科研支撐,不能只分析其科研成果數據,還要挖掘其借閱數據、活動數據、檢索數據、數字資源利用數據等之間的關聯特征,進行綜合性的加權分析,讓數據彼此能夠相互協作與支持,創(chuàng)建數據服務生態(tài)鏈,這樣才能向用戶提供更具有價值的服務。三是數據的安全與準確。有些數據包含隱私信息,比如手機號、身份證號等,在融合過程中要保證數據傳輸通道的安全,以免敏感信息暴露后被惡意復制或盜用,也就是著重實現用戶隱私與用戶服務之間的動態(tài)平衡,此外還要保證數據的準確到達,也就是一致性,即同一時間節(jié)點的數據在多點利用過程中要完全相同。
數據驅動下的智慧服務更應關注用戶工作流程和場景的主動嵌入與服務探索,從供給側與需求側解決面向用戶服務過程中的驅動機制與協作機制。對于供給側,圖書館要善于“找痛點、抓重點”,通過資源重構、機構改革、服務增值等視角,為用戶創(chuàng)建從數據到信息、到知識、到智慧、到解決方案的知識服務鏈[6];對于需求側,要注重對用戶多維度知識組織、知識關聯、知識服務的可變感知和動態(tài)調整,以需求促進供給服務能力再造。
數據驅動下的用戶服務呈現出碎片化、個性化、精準化和知識化的特征,用戶對圖書館所能創(chuàng)造服務的期望值更高,圖書館也正朝這個方向努力,通過多維需求重新定義服務方式,最大程度發(fā)揮數據驅動的牽引力。
一是知識粒度的不斷細化。在館藏數字化環(huán)境下,用戶的知識需求呈現出深度學科交叉、學科創(chuàng)新等特點,這就要求圖書館在組織服務過程中不斷地細化知識粒度,以實現知識的有序重組,提高知識單元被識別的可能。比如對于圖書資源,我們如果按本進行揭示,那么一本書的館藏記錄是一條;如果按章進行揭示,它的館藏記錄可能是十條,而且更容易通過主題詞被用戶精準定位;如果再擴展到按節(jié)或知識單元進行揭示,其館藏記錄可能達到上千條甚至更多,更容易被用戶發(fā)現和利用。在數據化趨勢下,圖書館必將突破資源的MARC 格式限制,將字段實體化、語義化,加速知識細化,以提高資源利用率和用戶滿意度,推動學術創(chuàng)新。
二是知識單元的高關聯性。在知識數據化環(huán)境下,用戶更希望能夠在海量信息中實現目標信息的快速定位與關聯獲取,這就要求圖書館在知識粒度細化的基礎上進行多維標簽組合標注,構建放射狀的知識圖譜,提升知識關聯性與飽和服務能力。在互聯網的驅動下,信息知識更多存在于網絡空間。從海量信息中提取對用戶有價值的信息,打造具有高附加值的知識服務生態(tài)體系,成為圖書館不斷追求的目標[7]。基于這樣的目標,圖書館應該加強知識的單元化、標引化和聚合化,讓用戶無論從哪個點切入,都能獲取一套完整、準確、可信的關聯化知識及服務產品。
三是知識服務的可再生性。在后知識服務時代,圖書館服務呈現出高度知識化和柔性化特點,更加依托智能技術來實現知識服務的創(chuàng)新與再生[8]。在技術層面,圖書館服務由手工轉向自動化、智慧化,人工智能、大數據、區(qū)塊鏈、云計算等打破了傳統的知識服務形式,讓知識能夠打破時空限制以各種形式到達用戶手中;在需求層面,社會需求和行業(yè)競爭成為雙重驅動力,面對圖書館功能被邊緣化的趨勢,圖書館正謀求功能轉型與服務嵌入,提升用戶活躍度與歸屬感,推動服務產品創(chuàng)新與再生。
時代變革與智能技術正在逐漸消耗圖書館人的生存能力,特別是在大數據時代,圖書館服務能力出現斷崖式下降。這就要求圖書館人必須正視自身缺點、突破重圍、尋求出路,優(yōu)化圖書館內部運行環(huán)境,推動協同交互與創(chuàng)新支撐,增強核心競爭力。
一是資源體系重構。隨著需求側用戶對圖書館知識服務期望值的不斷攀升,圖書館也意識到進行資源擴張與體系重構的緊迫性和必要性。以高校圖書館為例,在資源擴張方面,圖書館在保障商業(yè)數據庫寬口徑覆蓋的前提下,開始主動對地方性特色資源、本校原創(chuàng)智力成果、古籍特藏資源、非物質文化資源等進行大范圍收割與加工,致力于打造具有一定規(guī)模和特色的多元化資源保障體系,為推動學校的學科發(fā)展、學術創(chuàng)新等方面提供全方位的資源支撐;在體系重構方面,以“雙一流”建設為動力,以資源數字化為基礎,打破各數據庫之間的平臺界限,推動資源融合與跨界服務,以學科、課程等為界限,通過打造專題圖書館、課程圖書館、學者庫、機構知識庫等,為重點學科與專業(yè)提供優(yōu)先保障,這也是一些大學圖書館在面向“雙一流”建設服務過程中所倡導和實施的資源保障策略[9]。
二是業(yè)務機構重組。面對新技術的應用、學術研究和交流模式的轉變以及用戶信息需求和行為的變化,圖書館唯有主動變革、重塑組織架構,才能從本質上推動業(yè)務創(chuàng)新與再造。如北京大學圖書館從2013 年從業(yè)務、條件支撐、對外關系三大模塊來重新考慮部門設置與功能定位,11 個部門重組為7 大業(yè)務中心,實現從以“文獻流”為核心向以“信息流”為核心的轉變,全面落實“以人為本”的理念。
三是服務維度延伸。《普通高等學校圖書館規(guī)程》中明確規(guī)定:高校圖書館的服務不應再拘泥于單一的文獻領域,而應更多關注具有文化傳承和歷史擔當的閱讀服務領域,致力于提升用戶的文化自信和創(chuàng)新能力。國家正在全力推進文化軟實力和創(chuàng)新創(chuàng)業(yè)能力的提升,圖書館作為高校的第二課堂,應該深度挖掘自身在資源、空間和服務領域的優(yōu)勢,不斷拓展服務的寬度和深度,將服務全面嵌入學校的人才培養(yǎng)體系。
數字化時代,基于大數據的智慧化服務是圖書館人的追尋方向。目前,圖書館大數據特征十分顯著,在數據驅動下,圖書館的服務正逐步由資源型向智慧型過渡,智慧服務將成為圖書館價值重構的發(fā)力點。未來圖書館應以數據為基礎構建響應速度更快、服務目的更清晰、適配度更精準的生態(tài)化服務體系,幫助用戶發(fā)現自身潛在訴求并提供有較強生命力和較高價值性的知識產品,真正實現以數據驅動服務創(chuàng)新,讓改革發(fā)展的謀劃跟上時代發(fā)展步伐,追尋歷史性的跨越式發(fā)展,將圖書館服務推向更高的發(fā)展階段。
(來稿時間:2019 年6 月)