馬 昀
(山西師范大學 圖書館,山西 臨汾 041000)
當前,信息化、網絡化、高科技化的設施設備日益增多,源源不斷地生成海量數據。圖書館必須采取大數據、云計算等先進技術手段,對大數據、圖書信息和文獻資源進行處理、挖掘、分析,以更好地滿足讀者的知識信息需求,助力其學習、科研、運用等數據生命周期。數據共享空間(Data Commons,DC)以快捷簡便、成本更低、效益良好的手段為用戶提供知識服務。為促進圖書館數據管理的效果提升和改善,圖書館DC服務平臺持續完善和優化數據管理、分析、應用、共享的機制體制,不斷滿足讀者日益增長的數據、知識、信息需求。
Robert L. Grossman等[1]認為,DC是協助用戶使用和供應開放性數據的法律性載體,它可定位、存儲數據,利用各種通用工具進行相關計算活動。為研究機構分析、挖掘、分享數據而建成相應的網絡平臺,可互操作能力比較突出。Metro Boston[2]指出,作為一個開放型存儲庫,DC在社交、教育、圖書館、藝術、醫療等領域中,提供所轄客戶的豐富數據(質量控制以及元數據),包容用作研究的各種原始數據和新數據,消除非結構化數據以及結構化數據的不平等,促進數據、知識、信息的發現以及傳播。作為開放式平臺的DC,它為各個方面共享有效數據集、信息和知識提供有力載體。它支持元數據的開發、存儲、共享、訪問、搜索、檢索等,協助創建數字對象的相關標識符,實現數據可視化,引用數據鏈接到可用的各種出版物或數據存儲庫,有效協調各種數據集,建設具備多向增值功能的數據共享空間。
國外DC建成的數據共享平臺非常強大,可開展數據精確分析活動,是具備工具、數據庫與可擴展功能的大型先進知識網絡,它集數據監控、數據集成、數據共享、計量評價、數據分析等功能于一體。在當前國外圖書館、醫療衛生、科學研究等領域中,DC服務平臺是具有扎實基礎的數據管理設施。DC數據共享平臺可以完善和發展圖書館的信息、知識、數據服務機制體制和模式方式,為用戶帶來個性化、多元化、精準化的功能以及服務。綜合來講,DC建設具有下列特征:(1)管理、策劃與收集質量較高、價值較大的數據;(2)增強數據信息的可訪問性,特別是更易于做出預測、解答難題的各種可增值數據;(3)用作科研與開發分析更多的算法、方法與軟件,使它們用在數據分析中[3];(4)獨立建設各方共建共用共享生態型、可循環數據平臺;(5)具有功能強大的存儲庫,通過自定義方式對抽象化對象進行映射,支持長時間跨存儲;(6)通過相關查詢方法以及名稱實現動態化查詢,DC數據、信息資源的更改、創建和審核等日益透明化[1];(7)打破版權所有者壟斷版權產品的現象,使用者獲取數據的成本減少;(8)促進與鼓勵用戶間、學者專家之間、機構間的溝通、學習和交流。
圖書館DC服務指的是圖書館與DC有機結合,以優化和改進圖書館現有結構與數據服務為主旨,優化改善圖書館用戶利用、學習、研究、分享知識、信息和數據的服務模式。圖書館利用DC技術緩解和解決自身數據控制與開放、自身與系列化規則、集中化存儲與碎片化供給之間的矛盾,改善館內館外的數據管理、分析、分享、分配與應用狀況,將更多資金、精力投向提供具有深度價值的知識、數據、信息分享、開發、運用、分析、管理活動中。
圖書館 DC服務平臺為了讓用戶享受更優質的知識服務,讓數據集與用戶間無縫隙對接,知識訪問與知識發現要從以下方面著手。第一,DC平臺有效存儲、聚合各類數據,對其實施分類化、標準化處理。第二,DC平臺要制定圖書館數據共享的技術標準與合規文件,明確它的元數據、內容訪問策略以及文件格式等,以讓圖書館、用戶及時更新和修正現有知識和數據,實現從數據到信息再到知識的順利轉換[4]。第三,基于用戶的知識需求,借助可視化、數據分析等可互操作科技手段來管理DC數據。第四,結合技術進步、用戶意見與建議,持續改進和完善數據共享、分析、管理、集成、獲取、運用等生態周期。
圖書館DC知識服務平臺的組成部分由下到上依次是數據資源層、DC子平臺、用戶信息庫、用戶需求感知、DC知識服務和知識服務結果的輸出?;贒C的圖書館知識服務平臺由以下4個子平臺組成[1]。首先是數據管理平臺。它具有同步監控、云計算、轉換、協作、數據標準化等多種功能。其次是數據分析平臺。它配備了Mahout、Rapid Miner、R語言等工具,進行高效率的數據分析,便于數據復用等。再次是數據應用平臺。它包括數據產品的發布、數據可視化,培訓和指導讀者科學地處置DC數據。最后是數據共享平臺。它具有數據資源的集成、低成本共享,數據可復用性與可互操作性。
圖書館為有效發揮DC知識服務平臺的功能,要求用戶提供自己的性別、年齡、教育經歷、文化程度、職業工作、專業課程、科研狀況、信息偏好、信息獲取渠道、信息關聯等,希望能夠借此深度挖掘和分析用戶的知識技能需求和需要的系統圖書館資源。
DC服務平臺要準確把握讀者的信息需求,為讀者提供信息的搜索、比對、獲取、咨詢、交流、分享、應用、傳遞、增刪等服務。在感知用戶信息需求的過程中,圖書館DC知識服務平臺要結合用戶的信息庫和信息需求資料,分析用戶信息行為,以特定目的為出發點搜索、分析、比對、交流、運用、咨詢、獲取、分享生活、學習、工作等多種數據資源的“痕跡”,查看和分析用戶瀏覽、甄別、檢索數據的手段、方法等。從用戶的這些信息行為中把握用戶需要哪些數據、青睞何種服務,這些都需要通過圖書館DC服務平臺的四大子平臺精準呈現出來,完整而系統地分析和判斷用戶的信息、數據、知識需求后,準確把握、抓取、匹配館內外資源中客戶信息需求的關鍵詞、主題、所處范圍等,形成科學化、條理化、規范化的數據信息輸出。
圖書館DC知識服務和用戶需求感知有效連接起從用戶形成信息需求到信息需求滿足的全過程。平臺綜合信息庫、信息運用目的、數據交流記錄、數據足跡、相關模型等,深入分析和實時反饋、深度挖掘解讀用戶的信息行為、信息數據以及知識需求,加工、挖掘、調用相關的信息數據、信息以及數據集等。利用語義挖掘技術合理描述讀者的信息痕跡路線,積極校對前面的使用記錄,為用戶后續分享、應用、獲取所需要的數據、知識和信息提供便捷的渠道和路徑。
采用多源數據融合的相關算法工具,全面搜集、調查、研判相關信息,對多種信息數據進行科學分析、有效評價和分類聚合,從豐富的信息資源中汲取更高價值。其核心目標是綜合處置來源、類型、結構各不相同的數據信息,吸收它們各自的優勢。與單一數據相比,DC服務平臺可從海量圖書館數據中汲取價值更大、針對性更強、科學性更突出的知識、數據和信息,進而滿足讀者對數據、知識、信息的旺盛需求。多源數據通過DC數據服務平臺,增強圖書館融合、分析、清洗、搜集數據的能力,增強知識服務的實際效能,使讀者更便捷地獲取、使用、分享知識數據。
DC數據服務平臺融合圖書館的專家系統。根據智庫理論的最優化理論庫或最佳思想,先由DC數據服務平臺向專家系統提供合乎用戶信息需求的資源,再由專家系統選擇和判定最優質的知識服務內容,想方設法滿足客戶的信息需求,幫助他們處理經濟、社會、政治、軍事、科技等領域的問題[5]。該平臺需要各個領域的學者、專家和專業化人才參與研發和完善專家系統,以更豐富的知識、更高的信息數據質量、更突出的解決問題能力,滿足讀者迫切需要獲取、分享、應用圖書館信息、數據、知識的需要。該平臺有利于促進人工智能、大數據、云計算、各種算法和DC數據共享技術的科學運用與深度融合。
這種服務模式有利于滿足圖書館用戶對專題定題等特定的數據、信息、知識的需求,具有顯而易見的針對性、個性化、主動性和創造性特征。圖書館的不少用戶尤其需要某學科或某領域的專業知識,其信息需求整體上體現出國內外實務研究、學術課題前沿的歷史發展狀況、后續發展趨勢與當前發展水平。為此,館員要深入了解和把握這些學科的知識和內容,開展全過程、嵌入式、跟蹤式的知識服務,配合科研工作者從課題立項、課題申報,到最后的成果鑒定、課題結項,盡可能為這些用戶提供相關領域與學科的最新研究動態,對其發展方向做出預測,為科研工作者提供相關學科和專業的大量核心信息等,真正實現其“為科研教學服務”的目標。如今,知識服務越來越注重“再生知識”“新生知識”領域的服務,館員要不斷篩選、提煉分散在相關學科、某領域的專業知識,不斷跟蹤、搜集、整理這方面的內容,融入用戶的知識需求服務,為用戶提供從知識的重組、獲取、新生、再生、科研到運用和反饋的一站式知識服務。
虛擬化的創客空間融合加工、設計功能于一體,也是信息化背景下圖書館數據共享趨勢的全新發展模式,它讓“具有同樣愛好興趣的師生聚集起來分享觀點、交流經驗與協同創造”[6]。不少高校圖書館配備了訓練有素的專業館員、高水平的電腦專家與咨詢館員,讓讀者可以享用創客空間的一站式知識服務。高校圖書館和有關院系強化合作,師生集體開發動手實踐類培訓課程和內容,一條龍式地輔助實踐、教學、科研等活動的完成。在此過程中要聚焦用戶的知識需求,促進學科發展、強化知識服務能力,使創客空間增強服務效能。創客空間服務要結合師生們的制作設想、精彩創意等,提供針對性的知識服務,讓靜態的知識、數據、信息動起來,不斷提升知識科研成果和項目的轉化率。
如今科研用戶紛紛聚焦于知識發現,圖書館DC數據服務平臺應該密切關注和充分優化自身的知識挖掘、分析、互動、關聯、組織、生成、匹配等知識服務。深化對數據、信息、文獻的加工挖掘、關聯匹配、組織生成,盡可能挖掘與展現知識內容間的關系,將DC知識平臺建設成效率高、能力強的知識發現工具。注重資源聚合,進行以單元知識為核心的數據、知識、信息整合,設計開發的DC知識服務平臺實現動態操作、交互處理、實時參與等,做好支持跨數據庫、跨文獻的知識挖掘、關聯與發現。
DC技術的顯著優勢和明顯特征使它和圖書館日益密切地結合起來。圖書館DC知識服務平臺應該持續改進和完善,綜合運用云計算、大數據、計算機、信息化等科技,立足用戶的信息行為、痕跡和基本信息,深度把握和預測感知用戶的信息知識需求,開展針對性的DC知識服務。在此基礎上,高校圖書館要不斷優化基于DC融合的知識服務模式,強化它們的知識服務能力,穩步滿足讀者精神文化生活的迫切需要。