劉淑麗

摘? 要:高校的教職工和在校學生是高校圖書館的主要服務對象,教師需要在圖書館中查尋有價值的資料,并結合實際運用在教學中。學生通過高校圖書館查閱大量資料,拓寬自己的視野,豐富自己的知識。大數據時代的到來,帶來了許多新的變革。因此,許多行業都呈現了新的業態,大數據在高校圖書館的運用,提高了管理的效率,也使得高校的圖書館里工作變得更加的方便快捷。其中高校圖書館的圖書管理更是受到了很大的影響, 由此開始由傳統的管理方式向信息化的方向轉變, 在管理模式上也有較大的創新。
關鍵詞:大數據? 圖書管理? 信息化
1? 大數據背景高校圖書館圖書管理信息化的意義
在原有的高校圖書館管理體系中,教職工和學生如果有信息資料的需求,需要用傳統的方法在大量的圖書資料中查找,既費時又費力,還不容易找到合適的資源,信息化時代信息類型多樣,具備各自的應用價值,大數據時代的到來,高校圖書館創新圖書管理模式。建立專門的信息檢索渠道,提高了文獻資料的查找的效率[1]。
除此之外,以往的圖書館管理工作中的,對資料文獻的采購環節也是圖書館工作中的難題。由于信息的不對稱,采購的圖書資料一定程度上并不使用具體的需要。電影方面采購的效率也受到影響,有可能在這個過程中會發生圖書損壞現象。在大數據時代背景下[2],使用大數據技術體系實現高校圖書館圖書管理信息化能夠深入挖掘有效信息,滿足師生的實際資源需求,不僅使服務面大大拓寬,而且學生獲取知識的渠道也更加廣泛。
2? 研究內容
2.1 數據分析
借助ETL將職工和學生借閱圖書的相關歷史數據進行處理,將處理轉換出的數據作為數據挖掘的數據源,并對讀者借閱圖書的詳細信息和歷史記錄進行數據分析。
2.2 數據挖掘
在數據挖掘算法的選擇上,最終選擇了聚類算法中的K-Means算法,通過對歷史數據進行分析以期將讀者劃分為若干個相似的讀者群,在讀者群內運用關聯規則算法中的APRIORI算法對數據進行挖掘,最后將挖掘結果作為個性化推薦的源數據。
2.3 圖書推薦系統
對職工和學生借閱圖書的相關歷史數據和對歷史數據進行數據挖掘產生的數據通過推薦算法實現用戶登陸圖書借閱系統后根據相關規則自動化與智能化推薦書籍的功能。
3? 數據分析
3.1 數據分析概述
數據分析是指采用適當的統計分析方法對大量數據進行分析,提取出其中有用的信息并且形成結論的過程。在現實生活中,數據分析可幫助人們做出判斷,以便采取適當行動。
3.2 數據分析劃分
對數據分析可以歸納3個類別,分別是:描述性數據分析、探索性數據分析以及驗證性數據分析。其中描述性數據分析為初級數據分析,其他2種數據分析方法相對高級。探索性分析重點在于數據當中發現新的特征。而驗證性數據分析重點在于驗證已有假設真偽證明。其中描述性數據分析為我們工作中經常應用到的數據分析方法。
3.3 數據分析作用
數據分析是為了最大化地開發數據和發揮數據的作用。把隱藏在其中的一大批信息集中和提煉出來,總結出內在規律。在商業領域中,數據分析能夠幫助企業進行判斷和決策。
3.4 圖書管理中的數據分析
(1)將編目信息輸入數據庫用例的時序分析。
首先對圖書進行掃描分析,根據高校的要求將圖書進行整理與歸類,以便完成圖書的檢索功能。通過對所有圖書的檢索數據進行處理分析,并把這些數據關聯結合起來生成其他數據信息,有效地解決日常檢索中的常見問題,最大限度地將信息進行歸類、整理和儲存。
(2)圖書卡發放回收的時序分析。
因為每年都會有高校新生的到來和畢業生的離去。圖書館的讀者信息在一個動態變化狀態,通過對借閱數據的處理分析、可以動態地濾除過期的讀者信息,并增加新的借閱信息。
4? 數據挖掘
4.1 數據挖掘概述
數據挖掘一般指從大量數據中自動搜索出隱藏其中的特殊關系型信息的過程,數據挖掘在技術上的定義是指從有噪聲的、大量的、隨機的和不完全的數據中提取出隱含在其中的、事先并不知道的但又有潛在的有用信息和知識的過程。數據挖掘目前是人工智能和數據庫領域研究的熱點問題,主要基于人工智能、機器學習、統計學、數據庫、可視化技術等。
4.2 數據挖掘過程
數據挖掘首先需要從相關的數據源中選取所需的數據并整合成用于數據挖掘的數據集,然后用某種方法從大量數據中將數據集所隱含的規律找出來,最終以用戶可以理解方式展現出來,比如可視化和報表[3]。
4.3 數據挖掘主要算法
數據挖掘的算法主要分為6類,分別為分類分析、聚類分析、關聯分析、時間序列分析、預測分析和偏差分析。
算法中的分類算法應用是將事先已經存在的數據進行建模,然后對新的數據進行分類,而聚類算法則并不存在已知結果,而是從大量數據中挖掘它們的共性,將大量數據聚類到集中類別。
4.4 圖書管理中的數據挖掘
4.4.1 借閱行為模式與讀者群分析
(1)孤立點分析。對讀者群進行分析,分析的主要依據來源于讀者的以往借閱習慣,通過以往歷史數據的核查,從而推薦可能受歡迎的圖書。
(2)聚類統計。結合讀者借閱記錄以及讀者的群體性特征,通過聚類算法對數據進行挖掘從而獲得讀者的行為規則。
4.4.2 個性化服務工作
(1)關聯規則分析。借助讀者的借閱記錄數據以及借閱圖書數據之間的關聯關系進行分析,從而推算讀者的具體需要以便為不同群體讀者提供各自需求的服務。
(2)時間序列分析。通過分析讀者的借閱時間數據和借閱順序數據,分析讀者的借閱習慣,以便為讀者推薦合適類型的圖書。
4.4.3 文獻排架管理方面
借助數據挖掘技術對所有借閱歷史記錄數據進行處理分析,得出一個在館圖書的受歡迎程度、讀者群體的閱讀習慣和圖書借閱類型的分析結果。這有利于圖書資源的合理調配,提升了在館圖書的利用率[4]。
5? 個性化推薦系統
5.1 個性化推薦系統概述
推薦系統通過發掘用戶的行為數據,得到用戶潛在的個性化需求,從而將物品準確推薦給需要它的用戶,幫助用戶找到他們感興趣但很難發現的物品。高質量的推薦系統能夠使用戶對系統產生依賴,因此,推薦系統不僅能為用戶提供個性化服務,還能與用戶建立長期穩定的關系,提高用戶忠誠度并防止用戶流失。系統總體設計如圖1所示。
5.2 推薦系統一般構建過程
(1)通過用戶行為數據建立用戶模型。
(2)通過物品的基本信息數據建立推薦對象模型。
(3)通過用戶興趣匹配物品的特征信息數據,再經過推薦算法計算篩選,找到用戶可能感興趣的推薦對象,然后推薦給用戶。
5.3 推薦系統主要算法分類
推薦的算法可以分為兩個類別:第一個類別是基于物品的推薦算法,依靠的是基于用戶得對A較感興趣,然后推薦A以及和A相關的B物品。第二個類別是基于用戶的推薦算法。依靠的是為用戶推薦和他興趣相近的其他用戶選擇。
5.4 圖書管理中的個性化推薦
基于借閱圖書人員行為的協同過濾,首先根據搜索的關鍵詞和歷史借閱數據等做推薦,然后考察是否滿足實際用戶的需求,再對推薦列表進行動態更新;基于社交關系的推薦主要側重于其相同或者相似專業的讀者具有什么讀書愛好,據此對推薦列表進行更新[5]。
6? 結語
圖書館在任何一所高校都具有非同尋常的意義,具有不可小覷的作用,最重要的是其館藏資源對于師生提供了重要的知識支撐。目前圖書館大多數仍舊處于落后的傳統管理系統,并不能有效地針對每個用戶提供個性的服務。并且,隨著圖書資源數量的急劇增加和知識更新速度的不斷加快,如何對圖書館產生的歷史數據進行有效的處理分析、如何讓準確高效地向讀者提供所需要的圖書,也是圖書館無法避免也應當積極去做的事情。
參考文獻
[1] 孫軍艷,張博,陳智瑞,等.基于數據挖掘的圖書管理系統分析與應用[J].智庫時代,2019(22):113-114.
[2] 張力鵬.基于用戶興趣變化的高校圖書館個性化圖書推薦技術的研究與實現[D].遼寧大學,2017.
[3] 管巧珍.淺談數據挖掘的圖書館個性化推薦系統研究及應用[J].才智,2018(20):225.
[4] 李娟.高校圖書館信息管理系統分析[J].當代教育實踐與教學研究,2018(7):93-94.
[5] 李會艷.數據挖掘技術在高職院校圖書管理中的應用[J].農業圖書情報學刊,2015,27(3):65-68.