999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類(lèi)分析算法在圖書(shū)管理系統(tǒng)中的應(yīng)用分析

2017-11-06 13:33:01彭燕
卷宗 2017年29期
關(guān)鍵詞:圖書(shū)館

彭燕

摘 要:文章首先對(duì)聚類(lèi)分析算法的含義進(jìn)行了簡(jiǎn)明扼要的概括,并對(duì)“聚類(lèi)”、“簇”等聚類(lèi)分析算法涉及的重點(diǎn)詞匯進(jìn)行了說(shuō)明,然后又介紹了聚類(lèi)分析算法——K-均值算法,和以該算法為基礎(chǔ)所延伸出的改進(jìn)算法,最后通過(guò)理論與實(shí)際相結(jié)合的方式,以圖書(shū)、讀者這兩個(gè)圖書(shū)管理工作主體為切入點(diǎn),對(duì)圖書(shū)管理系統(tǒng)中聚類(lèi)分析算法的實(shí)際應(yīng)用進(jìn)行了分析,希望本文所討論的內(nèi)容能夠在某些方面為圖書(shū)管理工作的開(kāi)展提供參考或幫助。

關(guān)鍵詞:圖書(shū)館;聚類(lèi)分析算法;圖書(shū)管理系統(tǒng)

隨著科學(xué)技術(shù)的進(jìn)步,各圖書(shū)館在對(duì)圖書(shū)進(jìn)行管理時(shí)應(yīng)用的系統(tǒng)與之前相比也出現(xiàn)了相應(yīng)的變化,將聚類(lèi)分析算法應(yīng)用其中已成為大勢(shì)所趨。通過(guò)實(shí)踐能夠發(fā)現(xiàn),在圖書(shū)管理系統(tǒng)中對(duì)聚類(lèi)分析算法進(jìn)行合理應(yīng)用,不僅能夠?qū)ψx者前往圖書(shū)館的主要目的加以了解,還能夠以讀者需求為導(dǎo)向,對(duì)服務(wù)工作進(jìn)行相應(yīng)的優(yōu)化,除此之外,在采購(gòu)圖書(shū)資源時(shí),工作人員也具有了更加科學(xué)、系統(tǒng)的參考依據(jù)。由此可以看出,本文所研究課題具有一定的現(xiàn)實(shí)意義。

1 聚類(lèi)分析算法的概述

作為數(shù)據(jù)挖掘領(lǐng)域應(yīng)用頻率極高的技術(shù)之一,聚類(lèi)分析計(jì)算的關(guān)鍵在于“聚類(lèi)”。聚類(lèi)指的是將抽象或是物理對(duì)象集合轉(zhuǎn)化為由類(lèi)似對(duì)象組成的簇的全過(guò)程;對(duì)作為數(shù)據(jù)對(duì)象集合而存在的簇而言,同一簇所包含的對(duì)象往往存在高度的一致性,不同簇所包含的對(duì)象則具有高度相異性,這是需要人們準(zhǔn)確掌握的內(nèi)容[1]。只有對(duì)上文所提及的內(nèi)容進(jìn)行了解和掌握,才能準(zhǔn)確、科學(xué)的應(yīng)用聚類(lèi)分析算法,也才能保證對(duì)數(shù)據(jù)分布特征進(jìn)行深入的挖掘和掌握。

現(xiàn)階段,聚類(lèi)分析算法已經(jīng)被廣泛應(yīng)用在諸多領(lǐng)域中,例如,模式識(shí)別、圖像分割、數(shù)據(jù)挖掘等。在商務(wù)領(lǐng)域,聚類(lèi)分析法主要被用于對(duì)客戶信息進(jìn)行分析,保證人們能夠發(fā)現(xiàn)潛在客戶群體,并在購(gòu)買(mǎi)模式的輔助下對(duì)客戶群體具有的特征進(jìn)行刻畫(huà)。除此之外,聚類(lèi)分析算法還能夠被應(yīng)用在對(duì)挖掘算法進(jìn)行預(yù)處理的過(guò)程中,例如,人們可以應(yīng)用該法對(duì)某些數(shù)據(jù)進(jìn)行聚類(lèi),然后再以所得出結(jié)果為基礎(chǔ),開(kāi)展相應(yīng)的研究或是處理工作,保證工作質(zhì)量和效率均能夠得到應(yīng)有的提升。

2 聚類(lèi)分析算法——K-均值算法的概述

2.1 K-均值算法

作為聚類(lèi)分析法中相對(duì)典型的劃分方法,K-均值算法的本質(zhì)為迭代聚類(lèi)算法,通過(guò)在迭代過(guò)程中對(duì)簇集成員進(jìn)行不斷移動(dòng)的方式,保證理想簇集的得出。通過(guò)實(shí)踐能夠發(fā)現(xiàn),K-均值算法具有的優(yōu)勢(shì)主要體現(xiàn)在簡(jiǎn)單和快速這兩個(gè)方面。在應(yīng)用該法展開(kāi)計(jì)算時(shí),需要將對(duì)象劃分為n個(gè)簇,并保證每個(gè)簇所包含對(duì)象具有高度相似性,另外,不同簇所包含的對(duì)象應(yīng)當(dāng)具有高度相異性。但是通過(guò)實(shí)踐發(fā)現(xiàn),K-均值算法受初始值影響較大,也就是說(shuō),如果初始值不同,運(yùn)行效率也會(huì)隨之發(fā)生變化。因此,想要保證運(yùn)行效率的有效提升,相關(guān)人員以K-均值算法為基礎(chǔ)提出了相應(yīng)的改進(jìn)算法。

2.2改進(jìn)算法

通過(guò)對(duì)K-均值算法的應(yīng)用過(guò)程進(jìn)行分析能夠發(fā)現(xiàn),如果能夠在數(shù)據(jù)分布相對(duì)密集的區(qū)域中心處對(duì)初始聚類(lèi)中心進(jìn)行選擇,那么,位于該中心周?chē)臄?shù)據(jù),便能夠被劃分至最近類(lèi)當(dāng)中,聚類(lèi)收斂的速度自然能夠得到提升,迭代次數(shù)也會(huì)因此而減少。也就是說(shuō),以數(shù)據(jù)分布特點(diǎn)為主要依據(jù),對(duì)初代聚類(lèi)中心進(jìn)行選取是十分重要的。想要保證針對(duì)數(shù)據(jù)分布情況所開(kāi)展分析工作的全面性和科學(xué)性,必然需要花費(fèi)更多的時(shí)間。根據(jù)數(shù)據(jù)具有的隨機(jī)分布這一特點(diǎn)可以看出,聚類(lèi)數(shù)據(jù)應(yīng)當(dāng)位于數(shù)據(jù)均值周?chē)酥猓瑢?duì)數(shù)據(jù)分布進(jìn)行評(píng)價(jià)需要應(yīng)用到的指標(biāo)還包括標(biāo)準(zhǔn)差,因此,改進(jìn)算法和K-均值算法最大的區(qū)別體現(xiàn)在對(duì)初始聚類(lèi)中心進(jìn)行選取的方面,改進(jìn)算法在選取初始聚類(lèi)中心時(shí),需要應(yīng)用到的數(shù)據(jù)包括均值和標(biāo)準(zhǔn)差。

可根據(jù)實(shí)際情況在1……n的范圍內(nèi)進(jìn)行選取[2]。通過(guò)實(shí)踐能夠發(fā)現(xiàn),與K-均值算法相比,改進(jìn)算法在準(zhǔn)確率和計(jì)算效率方面都具有十分明顯的提升,因此,下文所開(kāi)展研究工作應(yīng)用的均為改進(jìn)后的聚類(lèi)分析法。

3 圖書(shū)管理系統(tǒng)中,聚類(lèi)分析算法的實(shí)際應(yīng)用

3.1 圖書(shū)數(shù)據(jù)的聚類(lèi)分析

在應(yīng)用聚類(lèi)分析算法對(duì)圖書(shū)進(jìn)行聚類(lèi)分析時(shí),需要應(yīng)用到的數(shù)據(jù)包括圖書(shū)流通總次數(shù)以及圖書(shū)當(dāng)年流通次數(shù),也就是說(shuō)在開(kāi)展相關(guān)分析工作前,工作人員首先需要對(duì)上述數(shù)據(jù)進(jìn)行調(diào)查。圖書(shū)聚類(lèi)分析的結(jié)果能夠?qū)D書(shū)借閱頻率的高低進(jìn)行準(zhǔn)確、直觀的呈現(xiàn),工作人員便可以在此基礎(chǔ)上對(duì)符合圖書(shū)利用情況、讀者需求情況的決策進(jìn)行制定,并對(duì)館藏資源以及布局加以?xún)?yōu)化。圖書(shū)聚類(lèi)分析步驟具體如下:

3.1.1對(duì)數(shù)據(jù)進(jìn)行預(yù)處理

通過(guò)實(shí)踐能夠發(fā)現(xiàn),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理時(shí)需要花費(fèi)挖掘全過(guò)程約70%的成本和時(shí)間,由此可以看出,想要保證數(shù)據(jù)挖掘工作的高效開(kāi)展,關(guān)鍵在于對(duì)數(shù)據(jù)預(yù)處理工作的質(zhì)量和效率進(jìn)行提升。完整的數(shù)據(jù)預(yù)處理工作分為四個(gè)步驟,分別是數(shù)據(jù)的清洗、集成、轉(zhuǎn)換和消減。

在應(yīng)用聚類(lèi)分析法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理時(shí),需要工作人員對(duì)數(shù)據(jù)主要屬性進(jìn)行重點(diǎn)關(guān)注,正常情況下,主要屬性不應(yīng)當(dāng)出現(xiàn)空值的情況,若在實(shí)踐過(guò)程中發(fā)現(xiàn)有某些屬性出現(xiàn)空值,則需要參考挖掘內(nèi)容和表的屬性,及時(shí)對(duì)空值進(jìn)行相應(yīng)的填充。具體來(lái)說(shuō),在對(duì)圖書(shū)數(shù)據(jù)進(jìn)行聚類(lèi)分析時(shí),需要應(yīng)用到的分析屬性包括圖書(shū)流通總次數(shù)以及圖書(shū)當(dāng)年流通次數(shù),如果圖書(shū)館中存在某些從未被讀者借閱過(guò)的圖書(shū),那么這兩個(gè)字段就為空值,在實(shí)際處理的過(guò)程中,工作人員應(yīng)當(dāng)用0對(duì)空值處進(jìn)行填充,保證工作的順利進(jìn)行[3]。除此之外,如果需要挖掘的數(shù)據(jù)分散于數(shù)據(jù)庫(kù)的不同表內(nèi),工作人員還需要對(duì)數(shù)據(jù)庫(kù)字段進(jìn)行整合,并形成完整的表,這樣做的目的在于保證運(yùn)行效率能夠得到一定程度的提高。

3.1.2應(yīng)用聚類(lèi)分析算法對(duì)圖書(shū)數(shù)據(jù)加以分析

在對(duì)圖書(shū)數(shù)據(jù)進(jìn)行聚類(lèi)分析前,工作人員首先需要對(duì)聚類(lèi)個(gè)數(shù)進(jìn)行設(shè)置,在本文中,聚類(lèi)個(gè)數(shù)被設(shè)置為3,分別代表具有較高利用率、中等利用率和較低利用率的圖書(shū),然后再應(yīng)用上文所介紹的改進(jìn)算法,針對(duì)圖書(shū)借閱次數(shù)展開(kāi)聚類(lèi)挖掘工作,得出相應(yīng)的聚類(lèi)情況和統(tǒng)計(jì)結(jié)果。此時(shí),工作人員便可以將聚類(lèi)分析結(jié)果作為主要依據(jù),從3個(gè)聚類(lèi)中對(duì)圖書(shū)群體存在的共性特征進(jìn)行分析,明確對(duì)圖書(shū)利用率產(chǎn)生影響的主要因素,為后續(xù)關(guān)聯(lián)規(guī)則的挖掘工作奠定良好基礎(chǔ)。endprint

3.2 讀者數(shù)據(jù)的聚類(lèi)分析

在應(yīng)用聚類(lèi)分析算法對(duì)讀者進(jìn)行聚類(lèi)分析時(shí),需要應(yīng)用到的數(shù)據(jù)為讀者對(duì)圖書(shū)進(jìn)行借閱的次數(shù),也就是說(shuō),工作人員在掌握讀者借閱次數(shù)后,便可以開(kāi)展相應(yīng)的聚類(lèi)分析工作。

3.2.1對(duì)數(shù)據(jù)進(jìn)行預(yù)處理

應(yīng)用聚類(lèi)分析法對(duì)讀者數(shù)據(jù)進(jìn)行聚類(lèi)分析的步驟與圖書(shū)數(shù)據(jù)分析相同,本文不再贅述,具體參考上文。

3.2.2應(yīng)用聚類(lèi)分析算法對(duì)讀者數(shù)據(jù)加以分析

在對(duì)讀者數(shù)據(jù)進(jìn)行聚類(lèi)分析前,工作人員同樣需要對(duì)聚類(lèi)個(gè)數(shù)進(jìn)行設(shè)置,本文將聚類(lèi)個(gè)數(shù)設(shè)置為3個(gè),分別代表了活躍讀者、一般讀者以及不活躍讀者,然后再通過(guò)對(duì)改進(jìn)算法加以應(yīng)用的方式,針對(duì)讀者所借閱圖書(shū)的數(shù)量展開(kāi)聚類(lèi)挖掘工作,得出相應(yīng)的聚類(lèi)情況和統(tǒng)計(jì)結(jié)果。通過(guò)對(duì)計(jì)算結(jié)果進(jìn)行分析能夠發(fā)現(xiàn),不同類(lèi)型讀者的圖書(shū)利用情況存在著十分明顯的差別,此時(shí),工作人員便可以對(duì)原有的借閱標(biāo)準(zhǔn)進(jìn)行改進(jìn),增加活躍讀者能夠借閱的圖書(shū)數(shù)量,減少不活躍讀者能夠借閱的圖書(shū)數(shù)量,這樣做不僅能夠?qū)Σ煌x者具有的需求進(jìn)行最大限度的滿足,還可以在一定程度上使圖書(shū)利用率得到提升。

除此之外,工作人員還可以將統(tǒng)計(jì)結(jié)果作為主要依據(jù),針對(duì)不同讀者制定相應(yīng)的服務(wù)計(jì)劃,對(duì)活躍讀者具有的借閱習(xí)慣進(jìn)行分析,并推薦符合活躍讀者需求的圖書(shū);對(duì)不活躍讀者則可以進(jìn)行相應(yīng)的問(wèn)卷調(diào)查,了解導(dǎo)致他們較少借閱圖書(shū)的原因和需求,在此基礎(chǔ)上對(duì)館藏資源進(jìn)行優(yōu)化,這樣做能夠使不活躍讀者的借閱次數(shù)得到相應(yīng)的增加。

4 結(jié)論

通過(guò)對(duì)上文所敘述的內(nèi)容進(jìn)行分析能夠看出,文中所應(yīng)用聚類(lèi)分析算法是以K-均值算法為基礎(chǔ)所延伸出的改進(jìn)算法。將改進(jìn)后的算法應(yīng)用在對(duì)圖書(shū)進(jìn)行管理的系統(tǒng)中,能夠?qū)D書(shū)數(shù)據(jù)以及讀者數(shù)據(jù)進(jìn)行準(zhǔn)確、高效的聚類(lèi)分析,工作人員則可以通過(guò)對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行分析的方式,了解圖書(shū)館內(nèi)現(xiàn)有圖書(shū)的利用率以及讀者的需求和愛(ài)好,再以此為基礎(chǔ)開(kāi)展相應(yīng)的圖書(shū)管理工作,則可以取得事半功倍的效果。

參考文獻(xiàn)

[1]丁麗,詹林,孫高峰,馬健.數(shù)據(jù)挖掘技術(shù)在高職院校圖書(shū)管理中的應(yīng)用[J].綏化學(xué)院學(xué)報(bào),2013,3306:121-125.

[2]肖健,刁洪祥.聚類(lèi)分析算法在數(shù)字圖書(shū)館中的應(yīng)用研究[J].當(dāng)代圖書(shū)館,2013,03:14-17.

[3]張衛(wèi)東.基于多維度屬性權(quán)重優(yōu)化的FCM聚類(lèi)算法的圖書(shū)管理數(shù)據(jù)聚類(lèi)研究[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2016,2806:50-57.endprint

猜你喜歡
圖書(shū)館
去圖書(shū)館坐坐
圖書(shū)館
圖書(shū)館里送流年
圖書(shū)館
文苑(2019年20期)2019-11-16 08:52:12
夜間的圖書(shū)館
幽默大師(2019年5期)2019-05-14 05:39:38
圖書(shū)館里的小驚喜
圖書(shū)館 Library
時(shí)間重疊的圖書(shū)館
文苑(2018年17期)2018-11-09 01:29:40
圖書(shū)館
飛躍圖書(shū)館
主站蜘蛛池模板: 无码专区国产精品第一页| 无码内射中文字幕岛国片 | 久久福利片| 日韩视频免费| 天天色天天综合网| 国产中文在线亚洲精品官网| 精品一区二区久久久久网站| 欧美精品不卡| 日本高清成本人视频一区| 亚洲免费播放| 国产麻豆va精品视频| 久久久久久久久久国产精品| 日韩不卡高清视频| 国产成人啪视频一区二区三区| 国外欧美一区另类中文字幕| 久久免费视频6| 国产91小视频在线观看| 秋霞国产在线| 欧美日韩午夜| 99无码中文字幕视频| 一级成人a毛片免费播放| 亚洲无线观看| 性视频久久| 青青久在线视频免费观看| 国产精品视频导航| 一级毛片免费不卡在线| 亚洲天堂网2014| 另类专区亚洲| 色哟哟精品无码网站在线播放视频| 看你懂的巨臀中文字幕一区二区| 久久综合色视频| 狠狠综合久久| 亚洲成人精品久久| 免费一级大毛片a一观看不卡| 久久午夜夜伦鲁鲁片无码免费| 中文字幕第4页| 2020久久国产综合精品swag| 国产区在线观看视频| 天天操精品| 最新精品久久精品| 亚洲人成网站日本片| 欧美69视频在线| 国产福利大秀91| 伊人无码视屏| 在线观看精品国产入口| 3D动漫精品啪啪一区二区下载| 中文字幕中文字字幕码一二区| 456亚洲人成高清在线| 精品久久综合1区2区3区激情| 精品1区2区3区| 亚洲欧美日韩中文字幕一区二区三区 | 国产尤物jk自慰制服喷水| 女人天堂av免费| 国产99精品久久| 无码专区在线观看| 九色免费视频| 中国国产高清免费AV片| 青青国产在线| 99激情网| 久久精品波多野结衣| 在线人成精品免费视频| 欧洲极品无码一区二区三区| 色哟哟国产精品| 91精品国产一区自在线拍| 一级毛片在线播放免费观看| 日韩精品免费一线在线观看| 波多野结衣在线se| 在线色国产| 999在线免费视频| 国产成年女人特黄特色大片免费| 青青草综合网| 国产视频只有无码精品| 婷婷亚洲最大| 国产青青草视频| 99视频只有精品| 中文字幕亚洲综久久2021| 亚洲中文字幕久久无码精品A| 天天综合色网| 少妇精品在线| 网友自拍视频精品区| 无码一区二区波多野结衣播放搜索| 欧亚日韩Av|