王一涵
摘要:現如今圖書館高質量發展已成為圖書館發展之路的必然趨勢,而人工智能的發展發展將充分利用圖書館的資源,是優化圖書館資源開發利用的有效方式之一。基于個性化服務的特點,提供有針對性、有特色的圖書館應用已成為圖書館可持續發展的一項服務和戰略。本文在人工智能的背景下,重點分析了圖書館在個性化服務過程中的應用,提出了創新策略,以更好地促進圖書館的建設和發展。
關鍵詞:人工智能;圖書館;個性化服務
一、人工智能背景下圖書庫服務的特點
(一)資料化
圖書庫系統包括圖書庫員、館藏資料、信息技術、環境和使用者,然而大數據新信息環境的形成,逐漸模糊了圖書庫界與其他信息化的服務業之間的顯示的畫面。
調查發現,84%的使用者使用檢索引擎Google開始信息檢索,1%的人開始在圖書庫頁面上檢索信息,所以圖書庫應為這1%的使用者提供數字圖書庫資料。與此同時,1%的使用者中有70%以上首先選擇使用數字珍藏;數字珍藏具有科學、經濟和可查訪性的特征,而我們需要考慮的是選擇何種模式來存儲數據、怎樣的方式來組織信息供閱讀使用者參觀、以及選擇怎樣的方法來確保信息收集的可持續發展。
(二)網絡化
數字圖書庫的建設需要為使用者提供便利,而為了實現這一目的,網格和數字圖書庫網格將整個網絡集成到一個虛擬的超級計算機中,來實現使用者對多個數字圖書庫的無縫獲取。總之,網格實現了資源的最大共享,實現了硬件資料、軟件資料和各種信息知識資料的全面連接。
二、圖書庫數據發掘簡介
即使手握足夠數據,圖書庫也要面對數據管理的挑戰。首先,數據的存儲、數據模型、數據分析格式、搜集數據的系統的基礎架構都要重頭建起,必須能用而且不能出錯。之后還要進行數據清洗,然而并不是所有數據都是直接可用的,它們大多雜亂無章、難以理解、無法獲取、甚至有所缺失。
人工智能領域最聰明的一群人都想造出能真正促進人類社會發展的產品和應用,比如無人駕駛,比如預測世界經濟走勢的系統,比如超級醫療診斷系統等。但格式良好、適合分析的數據不會從天而降。目前,他們把80%的時間花在了整理歷史數據上,個性化推薦是數據發掘中的常見技術之一。
個性化推薦大致可以分為數據準備、規律尋找、結果表述三個基本流程。它利用了來自統計并解讀解析、人工智能、對模式進行辨識區別、神經網絡、模糊數學、遺傳程序步驟等多個學科領域的思想,并借助于搜集數據的系統所提供的有效存儲、索引和查詢處理支持,以及高性能并行計算、分布式數據處理、可視化等技術而得以實現。
三、Web日記發掘應用
(一)關聯規則在Web日記發掘中的運用
關聯規則在Web日記發掘中用于發現使用者同時查訪哪些頁面,基本上用于查詢大型項目集。我們可以分析格式化的信息,并使用關聯規則的支持和可信度的定義直接通過Apriori程序步驟或其他相關程序步驟獲得經常查訪的序列。
Apriori程序步驟是關聯規則發掘程序步驟的核心。它可以使用分段搜集數據的系統數據的方法來執行發掘,以便使用者只需掃描搜集數據的系統兩次。但分割方法的前提是,整體搜集數據的系統的任何支持級別應該至少有一組本地搜集數據的系統的支持度集合。發掘網絡日記數據是對網絡日記數據集進行預處理,并根據一定的因素將其分成幾個小的數據段。在掃描多個數據段后,Apriori程序步驟用于獲取每個段的支持,然后每個分段的發掘結果被合并和掃描一次,并且最終的關聯規則集被過濾掉。
(二)序列模式分析序列模式用于查詢數據項中的時序關系
在Web日記發掘中,順序對模式進行辨識區別是指查詢在使用者會話中具有時間關系的頁面請求。在Web服務器日記中,使用者查訪會記錄一段時間。數據經過預處理后,它會成為間歇性時間序列。這些順序模式可以預測使用者可能請求的頁面,從而可以在頁面上為特定使用者組放置不同的信息提示,提高信息相關的資料的利用率和使用者信息檢索查詢速度,優化網站結構。
(三)Web日記發掘的一般流程
Web日記發掘的一般流程包括三個階段:數據預處理,發掘階段和模式分析。數據預處理將來自不同數據源的數據重組為適合數據發掘的數據結構是Web日記發掘的基礎,也是整個發掘流程中最繁瑣和耗時的工作。數據預處理包括數據清理,使用者辨識區別,會話辨識區別,路徑補充和格式轉換等幾個步驟。這是成功Web日記發掘的關鍵。
在整個Web日記發掘流程中,數據預處理和日記發掘程序步驟是最關鍵的技術。 數據預處理作為發掘程序步驟的輸入,直接影響到對數發掘的質量,發掘程序步驟的選擇和改進是保證發掘成功的重要因素。
四、個性化推薦及過濾應用
目前,特性化信息化的服務系統要求使用者逐步手動選擇所需的信息類別,然后將這些選擇提交給系統以顯示相應的信息。這種服務方法的低效性也會增加系統的負擔。一旦大家選擇同時提交請求,信息化的服務系統將面臨崩潰的危險。智能過濾技術智能獲取并分析使用者特定的需要信息,然后在頁面上顯示使用者需要的信息相關的資料。有些使用者只是去圖書庫找資料來解決一些實際方面,他們不清楚他們想要的信息。面對這種情況,智能過濾系統通過使用者的操作行為分析使用者的實際特定的需要,然后根據這些特定的需要主動推送滿足使用者特定的需要的使用者信息相關的資料。
另外,使用者的系統追蹤方法也分為顯示追蹤和隱式追蹤兩種。前者是基于使用者反饋的信息,即從圖書庫服務系統閱讀使用者存儲的個人基本信息,包括教育、專業和興趣者在填寫基本信息時主動推薦信息相關的資料,這種追蹤方式需要使用者的參與。后者通過諸如使用者查看的頁面和查詢內容之類的信息來推斷使用者的真實特定的需要,這種追蹤方法有助于提高服務系統的效率和智能。
特性化信息智能挑選系統首先挑選使用者信息,創建使用者興趣知識庫,然后根據使用者的操作行為進一步挑選特性化信息,并基于此更新使用者的興趣知識。該系統基于其掌握的使用者信息,以便再次智能地在信息化的服務系統中屏蔽數字網絡信息。
參考文獻:
[1]王欣, 張冬梅. 大數據環境下基于高校讀者小數據的圖書館個性化智能服務研究[J]. 情報理論與實踐, 2018(2).
[2]柳益君, 何勝, 馮新翎,等. 大數據挖掘在高校圖書館個性化服務中應用研究[J]. 圖書館工作與研究, 2017, 1(5):23-29.
[3]張立濱. 協同過濾技術在高校圖書館學術資源個性化推薦服務中的應用研究[J]. 河北科技圖苑, 2017, 30(4):83-86.
[4]韓冬慧, 韋合普, 李娟,等. 大數據背景下高校移動圖書館個性化推薦平臺研究——以四川高校圖書館為例[J]. 四川圖書館學報, 2017(3):21-24.
[5]崔陽. 高校數字圖書館個性化信息推薦服務策略探究[J]. 科教導刊, 2017(1):182-183.
[6]鐘義信. 人工智能:概念·方法·機遇[J]. 科學通報, 2017(22):2473-2479.
[7]郝登山. 人工智能在計算機網絡技術中的應用分析[J]. 中國新通信, 2016, 18(1):87-89.
[8]何波, 章宏遠, 裴劍輝. 基于大數據的高校圖書館個性化服務研究[J]. 新世紀圖書館, 2017(10):59-61.
作者單位:威海市圖書館