999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)挖掘下的高校圖書館信息資源管理研究

2021-04-14 21:57:40趙玉蓮
卷宗 2021年2期
關(guān)鍵詞:數(shù)據(jù)挖掘圖書館用戶

趙玉蓮

(山東師范大學(xué)圖書館,山東 濟(jì)南 250339)

高校作為我國培養(yǎng)高素質(zhì)人才的重要陣地,高校圖書館需為學(xué)校師生提供科研、教學(xué)所需信息資料,具有十分重要的作用,能夠結(jié)合其他學(xué)科力量,構(gòu)成學(xué)科交叉優(yōu)勢,以提升信息資源在管理、組織、拓展服務(wù)及服務(wù)質(zhì)量等方面的提升。而在信息化時代下,產(chǎn)生信息渠道越來越多,個人利用信息要求不再滿足于獲取原件與檢索文件,還要求深入分析信息內(nèi)容,尋找數(shù)據(jù)隱藏價值。因此,應(yīng)當(dāng)采取數(shù)據(jù)挖掘技術(shù),以提高圖書館信息管理水平與效率,滿足高校師生科研及教學(xué)需求。

1 數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘技術(shù)是從眾多不完整、隨機(jī)模糊、有噪聲的數(shù)據(jù)中提取潛在有意義的知識與信息的過程,數(shù)據(jù)挖掘可采取數(shù)學(xué)方法或非數(shù)學(xué)方法,可以使歸納總結(jié)法,也可以是逐步演技發(fā),挖掘數(shù)據(jù)結(jié)構(gòu)有利于優(yōu)化數(shù)據(jù)庫、信息管理、過程控制及信息決策,維護(hù)數(shù)據(jù)[1]。數(shù)據(jù)挖掘涉及學(xué)科較為廣泛,包含人工智能、數(shù)據(jù)庫、數(shù)學(xué)統(tǒng)計、并行計算等,應(yīng)用范圍也隨理論發(fā)展逐漸延拓,在信息資源管理中實現(xiàn)廣泛應(yīng)用。

高校圖書館在逐步推廣個性化服務(wù)理念下,對于信息資源分類已經(jīng)成為工作重點,利用數(shù)據(jù)挖掘技術(shù)對讀者進(jìn)行歸納總結(jié),尋找讀者特征信息以實現(xiàn)對應(yīng)分類,即可分析學(xué)生學(xué)歷、年齡與專業(yè),掌握用戶特點,提供針對性信息資源服務(wù),還能借此分配購置文獻(xiàn)費(fèi)用與存儲空間。

2 高校圖書館信息資源管理中數(shù)據(jù)挖掘流程

1)確定挖掘目標(biāo)。在數(shù)據(jù)挖掘前應(yīng)當(dāng)明確數(shù)據(jù)挖掘目標(biāo),如,圖書館向了解全校師生對于文獻(xiàn)類型需求,則應(yīng)當(dāng)將圖書館文獻(xiàn)分為多個類型,以此在大數(shù)據(jù)中挖掘所需信息,使得數(shù)據(jù)挖掘具有針對性,更好地為圖書館信息管理提供服務(wù)。

2)用戶信息準(zhǔn)備。可利用圖書館系統(tǒng)確認(rèn)師生基本信息。在師生應(yīng)用圖書館中,利用RFID技術(shù)在系統(tǒng)內(nèi)部反映出個人信息,一方面在參閱文獻(xiàn)及圖書中,獲取師生詳細(xì)記錄,包含證件號、專業(yè)、借閱登記、院系、性別、年齡、類型等。另一方面則為讀者借閱歷史記錄,此為圖書信息資源管理的重要數(shù)據(jù)信息,以此為統(tǒng)計數(shù)據(jù)對象,可整合圖書條碼號、索書號、讀者編號、借閱時間、書名、歸還時間等信息[2]。對上述信息進(jìn)行詳細(xì)分類統(tǒng)計、整理分析,便于圖書館預(yù)測和分析文獻(xiàn)利用率,且借閱歷史信息還包含文獻(xiàn)書目記錄與流通日志,同樣為數(shù)據(jù)挖掘目標(biāo)。

3)數(shù)據(jù)挖掘關(guān)鍵技術(shù)。(1)數(shù)據(jù)清理。該環(huán)節(jié)是指剔除數(shù)據(jù)中的異常數(shù)據(jù),提高數(shù)據(jù)挖掘結(jié)果準(zhǔn)確性。處理圖書數(shù)據(jù)與讀者數(shù)據(jù)中,存在有噪聲、不一致、不完整數(shù)據(jù),需要對數(shù)據(jù)加以清理,其包含使用數(shù)據(jù)光滑技術(shù)及缺失值處理,對于“續(xù)借”“性別”等缺失值替換unknown,“年齡”缺失值替換ageave;記錄中字段為空則使用手工編寫SQL腳本少出,部分圖書分類號為中文字符,在挖掘程序中應(yīng)當(dāng)做好處理工作,此類壞數(shù)據(jù)需及時丟棄。(2)數(shù)據(jù)整合。當(dāng)獲取完整信息后,即可利用大數(shù)據(jù)挖掘技術(shù)深入挖掘數(shù)據(jù),此過程中需使用面向?qū)傩詺w納算法分類數(shù)據(jù),獲得數(shù)據(jù)屬性集合[3]。如,在高校圖書館信息資源管理中,產(chǎn)生數(shù)據(jù)可分為文獻(xiàn)圖書數(shù)據(jù)集合、記錄數(shù)據(jù)集合、用戶數(shù)據(jù)集合、借閱檢索圖書集合等,以此減少數(shù)據(jù)維度即挖掘難度。此過程中,在數(shù)據(jù)庫中導(dǎo)入分散數(shù)據(jù),以此構(gòu)建讀者借閱記錄。(3)數(shù)據(jù)歸約算法。在運(yùn)行數(shù)據(jù)倉庫一段時間后,其中數(shù)據(jù)量迅速增加,不采取歸約算法直接挖掘,則會初夏以下問題,一是表的每個字段均占據(jù)較大空間,提高了內(nèi)存占用率,延長了內(nèi)存導(dǎo)入時間;二是大部分單項為漢字字符串,候選序列生產(chǎn)時間與空間開銷均會增加,為節(jié)省空間與實踐效率,需壓縮每個事務(wù)記錄為6個字符串,且每個字符均為單個小寫字符,當(dāng)系統(tǒng)讀取屬性配置后,按照順序賦予屬性值唯一字母。如程序讀到“本科”,則會將“a”賦值本科,讀到“研究生”,則將“b”賦值“研究生”,通過以此類推的方式,讀取所有屬性值,即可構(gòu)建字母字符到屬性值的映射表,壓縮讀者數(shù)據(jù)庫為文件,將預(yù)處理文件減少,提高效率[4]。如,未壓縮數(shù)據(jù)庫前127M,數(shù)據(jù)壓縮后大小11.6M,有效節(jié)省內(nèi)存資源。

3 高校圖書館信息資源管理中數(shù)據(jù)挖掘技術(shù)應(yīng)用

1)優(yōu)化資源建設(shè)。高校圖書館每年購置文獻(xiàn)費(fèi)用有限,需結(jié)合高校科研、教學(xué)等情況分配各學(xué)科的文獻(xiàn)購置費(fèi)用,以此實現(xiàn)費(fèi)用均衡支出,將購置文獻(xiàn)效益充分發(fā)揮出來。原本圖書館在采集信息中通常是由少數(shù)專家與采訪人員商議決定,不可避免存在信息不全面情況,造成信息資源缺失及經(jīng)費(fèi)浪費(fèi),存儲文獻(xiàn)空間也有限。并且,館藏分布,包含多媒體文獻(xiàn)與傳統(tǒng)文獻(xiàn)擺放、服務(wù)器上文獻(xiàn)索引組織等,以此提高資源利用效率。

通過挖掘圖書館圖書流通、借閱、檢索請求等數(shù)據(jù),根據(jù)類別統(tǒng)計文獻(xiàn)頻繁借閱集與拒借集,可為信息資源補(bǔ)充與豐富決策提供支持,借此分析文獻(xiàn)利用率,將過時文獻(xiàn)剔除,或是減少收集與采訪部分文獻(xiàn)。分析用戶借閱文獻(xiàn)關(guān)聯(lián),以發(fā)現(xiàn)文獻(xiàn)比例關(guān)系及關(guān)聯(lián)規(guī)則,對圖書館館藏布局及信息建設(shè)進(jìn)行優(yōu)化。

2)拓展智能信息服務(wù)。為確保用戶短時間即可獲取信息,需收集用戶專題瀏覽集合,對每位用戶瀏覽記錄構(gòu)建事務(wù)庫,再進(jìn)行事務(wù)庫操作,具體如下:一是通過關(guān)聯(lián)規(guī)則尋找訪問頻率高于閾值項目及,利用分類算法將頻繁項目及與用戶瀏覽模式實現(xiàn)相似匹配,組織瀏覽模式相似用戶到同一服務(wù)器,減少服務(wù)器頁面?zhèn)鬏敂?shù)量及服務(wù)器緩存。二是對于事務(wù)庫內(nèi)訪問頻率超過閾值的專題及,通過關(guān)聯(lián)分析獲得專題關(guān)聯(lián)規(guī)則,將其存儲至服務(wù)器知識庫,用戶進(jìn)行網(wǎng)頁瀏覽,即可根據(jù)規(guī)則對關(guān)聯(lián)頁預(yù)先連接,提高響應(yīng)速度。

智能信息檢索支持聯(lián)想檢索、模糊檢索、概念檢索及多語言檢索,還能借助聚類算法聚類分析查詢結(jié)果,保證呈現(xiàn)內(nèi)容條理化,便于用戶篩選。

3)實現(xiàn)自動化信息處理。圖書館信息資源管理中,文本數(shù)據(jù)較多,可通過文本挖掘技術(shù)自動摘要分類文本數(shù)據(jù)文檔。其中,文本自動摘要應(yīng)用統(tǒng)計算法,挑出與主題聯(lián)系密切的原文語句,自動生成文本摘要,該數(shù)據(jù)挖掘?qū)τ陔娮悠诳㈦娮訄D書等文獻(xiàn)信息應(yīng)用價值較高。而文檔自動分類則是結(jié)合文檔文本數(shù)據(jù)特征挖掘文檔類別,歸入恰當(dāng)主題范圍供人查詢。文本挖掘技術(shù)在海量數(shù)據(jù)信息下彌補(bǔ)了時間有限、人力不足的問題,為高校圖書館信息資源服務(wù)提供了保障。

4 總結(jié)

綜上所述,在高校圖書館信息資源管理中,應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠優(yōu)化和豐富信息資源,提高信息服務(wù)質(zhì)量,拓展信息服務(wù)范圍,進(jìn)而為高校科研及教學(xué)提供范圍廣、質(zhì)量高的信息服務(wù)。因此,高校圖書館應(yīng)當(dāng)在此過程中,通過數(shù)據(jù)清理、數(shù)據(jù)整合及數(shù)據(jù)歸約算法的方式,優(yōu)化圖書館信息資源建設(shè),拓展智能信息服務(wù),實現(xiàn)自動化信息處理。

猜你喜歡
數(shù)據(jù)挖掘圖書館用戶
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
飛躍圖書館
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
圖書館里的是是非非
如何獲取一億海外用戶
主站蜘蛛池模板: 国产视频a| 风韵丰满熟妇啪啪区老熟熟女| 国产一二视频| 欧美国产日韩一区二区三区精品影视 | 日韩欧美国产精品| 青草娱乐极品免费视频| 久久伊人操| 91po国产在线精品免费观看| 欧美成一级| 成人免费网站久久久| 99在线免费播放| 久久精品人妻中文系列| 亚洲第一在线播放| 久久精品国产在热久久2019| 天天综合网在线| 在线无码av一区二区三区| 54pao国产成人免费视频| 国产激情无码一区二区APP| 国产成人亚洲无码淙合青草| 看你懂的巨臀中文字幕一区二区| 亚洲三级电影在线播放| 国产乱子伦视频三区| 欧美在线网| 亚洲精品日产AⅤ| 色久综合在线| 美女被操91视频| 国产麻豆另类AV| 九九热免费在线视频| 99热这里只有免费国产精品| 欧美a在线视频| 国内精自视频品线一二区| 天天色天天操综合网| 成人在线视频一区| 国产乱子伦无码精品小说| 2021亚洲精品不卡a| 女人18毛片一级毛片在线 | 国产又爽又黄无遮挡免费观看| 日韩性网站| 国产欧美专区在线观看| 国产主播喷水| 亚洲成人一区二区| 日韩第九页| 中文精品久久久久国产网址| 色噜噜在线观看| 精品夜恋影院亚洲欧洲| 青青草一区二区免费精品| 青青久在线视频免费观看| 色综合天天视频在线观看| 国产97视频在线观看| 精品久久久久久中文字幕女| 青青操国产视频| 亚洲精品第一在线观看视频| 免费jizz在线播放| 人人艹人人爽| 国产极品嫩模在线观看91| 国产欧美日韩精品第二区| 欧美一级片在线| 人人爽人人爽人人片| 美女无遮挡拍拍拍免费视频| 成人在线不卡视频| 91伊人国产| 国产啪在线| 亚洲最黄视频| 97se亚洲综合| 怡红院美国分院一区二区| 日本成人一区| 久久无码av三级| 免费中文字幕在在线不卡| 一级成人欧美一区在线观看 | 中文毛片无遮挡播放免费| 91久久青青草原精品国产| 欧美一区二区精品久久久| 国产亚洲视频播放9000| 欧美成人免费一区在线播放| 亚洲大尺码专区影院| 亚洲av中文无码乱人伦在线r| 国产高清在线观看| 国产草草影院18成年视频| 国内a级毛片| 久久免费视频6| 2022国产91精品久久久久久| 国产精品jizz在线观看软件|