霍速袁琳
大數據技術、圖書館服務平臺、人工智能等技術發展將會影響圖書館的運作與服務,促進學術型圖書館的變革與轉型[1]98。大數據環境下,各種資源類型多樣、數量龐大、分布廣泛、結構復雜[2]83,圖書館資源保障、資源深度利用等方面的工作迎來了各種各樣的挑戰。圖書館的資源服務、數據服務以及自動化管理同時面臨著變革,數據發展驅動著新的轉型時期的到來。
新時代的數據發展與技術變遷將圖書館系統的革新推上歷史舞臺。隨著時代的快速發展,傳統的數據存儲與分析系統已經失去競爭優勢。在過去的十年中,高校圖書館失去了對于科學信息的壟斷,亟待提升系統價值和服務效能。圖書館面對大量數據和資源的同時,增加了對數據的管理困難,許多高校圖書館一直在試圖改變數據收集的效用。圖書館需要擁有足夠多的數據和用戶參數,并且能夠給出理想的檢索結果,對指定任務能夠作出充分而有效的響應[3]503。
傳統圖書館系統的功能滯后與服務制約迫使我們不得不正視這項新的課題,那就是智能圖書館系統的研究與開發。本文通過文獻調研與分析,結合國內外實踐發展與高校圖書館在資源、服務、管理等方面的業務需要,提出了高校圖書館系統從傳統轉向智能的整合框架,為相關智能系統的研發提供參考。
1.研究現狀。通過文獻研究可以發現,從2010年開始,圍繞“智慧圖書館”“大數據”“云計算”等關鍵詞展開的研究逐步增多,圖書館智能系統研究已成熱點。
國外對于智能系統的研究起步較早。Ranganathan的“圖書館學五定律”中,就提到了智能開發新技術以改善用戶服務,滿足人類需求,創造未來的問題。國外學者指出,我們面臨的是眾多類型不同的數據,這些數據都是高速生成的。大數據被列為2017年最重要的戰略技術趨勢之一。國際數據公司(IDC)在其研究中預估,到2020年末,數字世界的整體增長將達到40ZB。在數據的驅動下,社會各個領域生成了不同主題的數據分析報告,數據系統、數據公司應運而生,越來越多的技術被引入到各種組織機構的業務領域。大數據技術在圖書館信息系統中也有著廣泛的影響。數據技術的發展應用到圖書館系統將有助于更好地了解用戶需求,提供數據分析報告、優化圖書館管理與服務[3]512。
2008年,美國的Andrew W.Mellon基金會已經開始自助開放圖書館環境的研究。2009年,普林斯頓大學和波士頓大學開展了一項關于資源管理的研究,他們與ExLibris公司合作在2011年研發出一個基于云計算的新型圖書館管理系統。2011年,大英圖書館將國家圖書館數據作為關聯數據發布,描述了感興趣事物的模型。有關圖書館發現系統的研發、圖書館智能系統的探索從技術領域、服務管理、項目介紹等方面層出不窮。數據圖書館系統的研究利用了各種技術,從技術類型、數據源的大數據分析、業務分析、實時處理等方面都有探討,在智能系統的加工上,給予了我們技術方向和架構思路[4]7。
縱觀國內有關圖書館智能系統的研究,隨著谷歌模式和百度模式以及各種智能交互工具深入大眾生活,圖書館系統發展越發需要加速革新。越來越多的學者和技術人員開始關注圖書館智能系統研發領域,基于發現的檢索系統開始在圖書館領域盛行[5]11。然而,無論從資源的角度出發,還是從服務的角度出發,單純的發現系統都不足以實現智能圖書館系統的業務要求。單純針對資源的發現系統無法滿足數據分析和知識管理的需要,只針對服務的系統也存在數據管理的困境。同時在業務管理上,單純針對采購或者倉儲管理等業務的智能系統,也存在數據管理、系統整合等挑戰。構建新時代的智能系統是當下的關鍵課題[6]76。
我國對智能圖書館系統的研究主要依據國內圖書館系統現存問題、國外智能開發趨勢、智慧圖書館架構等問題進行。一方面提出智能圖書館整體架構規范、智能圖書館建設策略,另一方面展開智能系統相關研發。研發課題多見于發現系統、推薦系統、FRID智能管理系統等單獨層面的技術研究。技術問題依據國外流行的系統和研發成果進行探索。同時,也對國內主流服務平臺進行功能架構等方面的分析,為新型圖書館系統提供參考。在智能系統的研究角度上,主要趨向于態勢研究、模式探討、新技術支撐三個方面。在研究內容上,涵蓋框架體系、服務模式、數據管理、系統開發、新技術引入等方面。
2.發展困境。近年來,在數據驅動下,國內外對智能圖書館系統展開了一系列探索。圖書館界對于智能系統的開發和研究以適應數據驅動需求,滿足圖書館服務要求,拓展數據管理分析能力,升級智慧發現功能,深化知識服務及職能交互為目標而進行。
當前大數據環境要求圖書館采用新技術、新理念建構智慧型圖書館管理系統,這個管理系統應能整合圖書館各個層面的管理功能與服務需求,提供集資源、服務、管理三位一體的智能服務。然而,不同來源的數據及其累積增長嚴重制約了圖書館系統的開發。Rubin認為,教育機構在提供圖書館服務方面正處于一個轉型時期。高校圖書館用戶產生了更多的數據分析、知識管理及智能推薦方面的需求。高校圖書館已經失去了其作為科技信息中心的地位,以上功能的實現效能嚴重制約了高校圖書館與其用戶之間的良好關系,如果不能盡快滿足高校用戶群變更的服務需求,高校圖書館將失去用戶信賴,降低其職能地位。圖書館智能系統的開發已經成為當前高校圖書館業務開展與自身管理的當務之急。
在智能系統發展的道路上,我們面臨的最大的問題就是數據本身。這個時代的數據飛速發展與數據技術的不斷革新推動著智能系統的研發進程,同時數據也是系統構建的核心和基礎。在需求升級與系統轉型中,圖書館擁有海量資源信息,數據量豐富而龐大,包括紙質資源、數字資源、空間資源以及相關的系統數據、用戶參數、日志記錄等。相關數據雜亂無章、大量數據庫資源的基礎數據難易獲取、發現檢索收到噪音數據的干擾等問題,都影響著圖書館智能系統的實現。
數據是系統服務的基礎和保障,圖書館的數據類型繁多、來源廣泛、格式多樣、結構各異、質量參差。數據的標準化、規范化是當前制約系統開發的首要問題。與此同時,智能系統的研討尚處初級時期,理論基礎薄弱、實踐經驗不足,大部分研究仍處于摸索階段,這項課題的開展亟待深入,擴大不同領域和機構的合作交流。
1.概念認知。智能圖書館是指利用智能技術管理圖書館并提供服務的圖書館。20世紀70年代,美國圖書館學家Frederick Wilfrid Lancaster在他的《走向物質情報系統》和《電子時代的圖書館與圖書館員》中,提出了“電子圖書館”的概念,到20世紀80—90年代,又出現“無墻圖書館”“數字圖書館”和“虛擬圖書館”等概念,智能圖書館就是在這些概念和實踐的基礎上提出來的[7]72。智能圖書館必須具備智能特征:自主學習、智能控制、信息傳感等[8]100。

圖1 智能圖書館概念解析
根據我們對于智能圖書館的概念理解,可以認為智能圖書館系統首先必須具備兩個條件,即“智能管理”和“智能服務”。智能圖書館系統應當是融合館長、館員、用戶于一體,集系統管理、自動化辦公、數據分析、智能服務于一身,可以提供智能管理與智能服務的智能化系統。

圖2 圖書館系統概念解析
2.功能定位。智能圖書館是基于組織結構在智能技術和智能設備支撐下,對圖書館資源進行智能管理與開發,最終實現智能化服務。智能圖書館系統是集系統管理、自動化辦公、數據管理與分析、智能服務與一身的面向館長、館員、用戶提供智能管理與服務的自動化系統。
智能圖書館系統的搭建首先需要明確其功能定位,根據以上分析可以將其功能定位基本確定在智能服務與智能管理兩方面。而智能圖書館的服務集合圖書館資源服務和知識服務,基于資源與知識提供智能服務。從資源和服務兩個角度出發,可以將智能圖書館系統的功能進行如下解析。
智能圖書館系統基礎資源與數據,通過技術支持,實現面向用戶、工作者(館員)、管理者(館長)的功能定位。
面向用戶提供基于數據挖掘、分析、利用、發現、推薦等方面的使用功能;面向工作者提供資源管理、數據獲取、數據加工、數據管理、數據服務等方面的系統維護、系統管理、系統分析等應用功能;面向管理者提供數據分析、績效分析等方面的決策功能。

圖3 圖書館智能系統功能定位
1.基本框架。圖書館智能系統應是一個開放、包容、智能的集成系統平臺。在傳統圖書館系統向智能圖書館系統轉型時期,其基本框架必須將傳統模式與數據技術相結合。其系統平臺的基礎是數據,以數據為中心搭建文獻數據管理系統、運行數據管理系統、用戶數據管理系統、數據統計分析系統、智能門戶系統、數據應用控制系統。將圖書館系統管理、自動化工作、資源管理、用戶管理、發現檢索、知識服務、統計分析、績效評價等功能集成整合,實現數據(門禁數據、圖書借閱數據、資源使用數據、用戶數據、訪問數據)管理、數據統計、信息發布、發現檢索、智能推薦等多個模塊功能。簡而言之,智能圖書館系統基于資源,依靠數據,實現服務,基本框架如圖4所示。

圖4 高校圖書館智能系統基本框架
智能圖書館系統應由數據管理、業務管理、系統管理三部分組成。數據管理包含元數據管理、運行數據管理、數據組織管理、數據接口管理。數據管理是在數據獲取與處理的基礎上進行的,包括資質資源、數據庫資源等數據,用戶數據、行為數據、各類系統的業務數據以及其他事實數據和衍生數據等等。對獲取數據進行加工處理后進行數據管理。元數據管理是指對元數據進行規范化、標準化組織、分析,以及對元數據與資源庫進行比對分析產生的數據報告。運行管理是對系統平臺整體進行運行分析。數據組織管理是對數據資源進行匯編,提升資源揭示水平和利用效果。結構管理是對數據結構方式進行管理,保證數據的流通與交換。業務管理是對圖書館工作者而言,實現業務管理功能,包括資源采購、編目、典藏等圖書館相關業務的標準管理及辦公自動化管理。系統管理主要包括系統參數的配置規則、用戶管理、數據分析等等。
2.數據服務。數據服務包括館藏評價、資源揭示、發現檢索、學科決策、數據管理、參考咨詢、科技查新等多個方面。(1)館藏評價是指對紙質資源、電子資源等館藏資源的評價分析。按照不同學科、根據不同維度和不同指標進行資源支撐分析和利用分析。如館藏圖書、期刊的學科保障率,JCR、ESI等來源刊館藏保障率,及JCR各分區、各學科保障率,高被引保障情況,數據庫收錄分析,SCI資源保障情況,機構對標分析,本校學術成果引用館藏分析,數據庫使用情況及績效分析,紙本資源利用情況分析及評價等等。(2)資源揭示是指對圖書館提供的各類資源的指向導航與主動揭示。在整合分析的基礎上,從學科、知識庫、資源類型、適用群體等角度,對資源進行加工和展示。(3)發現檢索是應用數據技術將多來源資源進行合并整理,實現中外文混檢、分面聚類、紙電資源一鍵檢索、智能跨平臺獲取等等,實現學習型檢索與分析發現系統。(4)學科決策是利用數據獲取技術,綜合各機構數據,將數據進行中外文對比、多數據源標識、學科體系分類及重要機構、學者梳理,建設支撐雙一流學科建設的文獻數據支撐服務平臺。(5)數據管理是對科研數據、教學數據、學者數據、用戶數據等數據信息進行分級分類管理,形成科學化、規范化數據管理平臺,實現以研究數據管理為基礎的學術數據管理與共享平臺。(6)參考咨詢是通過數據技術搭建海量知識庫、進行智能應答、智能檢索、咨詢績效等等。(7)科技查新是指利用智能管理系統實現智能化業務委托、進行查看、報告管理、電子簽章、財務管理及查新報告自動生成功能。
3.建設原則。第一,數據關聯。在資源畫像和用戶畫像的驅使下,智能系統務必保證數據關聯原則,運行數據關聯擴展。圖書館的基礎資源對象是用戶,其數據標簽包括資源類型、主題、語言、數據庫源、年代、學科、用戶姓名、ID、IP、類型、院系、身份等等,只有運行數據關聯擴展才能保證各項數據分析的實現與效用。第二,數據模型。數據是核心,算法是關鍵,在系統研發中需要根據系統需要進行數據建模及算法推演,讓數據經過算法實現運行,從而獲得更多數據結果。第三,數據驅動。數據驅動下,圖書館的各項業務流程及業務目標逐漸演變,智能系統的建構首先必須進行需求分析與業務研究,實現各項業務的共生與融合,優化業務流程,簡化業務操作,優化業務管理。
數據驅動下,高校圖書館面臨著智能管理與智能服務的變革,滿足日益更新的高校用戶群的服務需求,需要對傳統圖書館系統進行升級轉型。智能圖書館系統的建設是提升數據服務效能和系統價值的關鍵課題。
高校圖書館智能系統的建設要實現智能管理與智能服務兩項功能,必須為圖書館管理者、工作者、用戶三方面提供相關的應用服務與管理服務。根據用戶對象和業務要求,分析數據服務內容,依據建設原則,搭建數據管理、業務管理、系統管理框架,選擇恰當的數據模型和算法進行系統研發。
圖書館智能系統的建構在理論基礎和實踐上尚不成熟,相關探討出發點和角度各不相同,在綜合型智能系統的建設上仍沒有提出普遍認可的系統模型。當前,有關Hadoop的技術開發在資源整合和發現推薦等方面較為活躍,是否可以進行業務管理、數據管理等方面的深入開發值得深入探索。總之,創新圖書館管理系統,需要新技術與新理念的融合,跨學科的深度研究勢在必行。