999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類算法的圖書館利利用情況分析

2016-11-22 08:21:09魯新明李變秀
中文信息 2016年8期
關鍵詞:圖書館

魯新明 李變秀

摘 要: 高校圖書館是與教學、科研并重的高校三大支柱之一,在大學扮演著十分重要的角色。近年來,高校圖書館在發展的同時,存在諸如經費緊缺、藏書結構不夠合理、采購方案不夠科學等問題,由此造成圖書利用率低(平均只有30%)和人力、物力、財力的嚴重浪費。因此有必要對圖書利用情況進行科學的分析,以支持采購方案的制定、圖書館藏書結構的完善。本文在介紹聚類算法之后,采用k-means這一經典聚類算法對保山學院圖書館近9年的借閱量進行聚類分析。并對以后的圖書采購提供一些建議。

關鍵詞:聚類算法 圖書館

中圖分類號:G251.4 文獻標識碼:A 文章編號:1003-9082(2016)08-0036-03

前言

從建國到至今這65年,我國的教育事業有了長足的進展,在基礎教育教育普及率不斷提高的情況下,高等教育事業也呈現出蓬勃發展的態勢。特別是恢復高考制度以來,高校在校生人數從1978年的80多萬人突增至現在的2000多萬。近年來,高校每年為社會輸送數百萬人才。

高校圖書館,是高校的文獻情報中心,與教學、行政組成高校的三大支柱。在大學扮演著十分重要的角色,是大學生信息素養教育的重要基地[1],是師生們獲取情報、做學術研究和交流的重要場所。近年來,高校圖書館在發展的同時,也在帶來了一些問題,比如說因為學校發展定位、專業設置對相關圖書需求而要求高校圖書館在一個時間內大力采購某一類圖書,而忽視藏書結構的合理性問題;也存在圖書館在高校發展的某一年或幾年因為工作重心傾斜而被縮減撥款的現象。所以,高校圖書館在藏書數量驟增的同時存在諸如經費緊缺、藏書結構亟待完善、采購方案不夠科學等問題,造成了高校學生不能借到想要的圖書,而圖書館的藏書利用率很低,亦即高校圖書館在很大程度上造成人力、物力、財力的嚴重浪費。所以,有必要在大學生借閱傾向等方面進行分析,對圖書的利用情況作一個科學的分析,進而支持采購方案、完善圖書館的藏書結構、為讀者提供更好質量的服務,讓我們的工作更有效益。

一直以來,國內圖書館(包括高校圖書館)圖書利用率極低,只有25%[2][3]到30%[4]。由于藏書利用率低,造成文獻資源大量浪費、積壓和閑置。因此,加大提高圖書有效利用方面的研究,是圖書館相關領域的主要工作,也是保山學院圖書館亟待解決的問題。

一、聚類算法簡述

1.聚類分析

又稱為群分析,是根據“物以類聚”的道理,對樣品或指標進行分類的一種多元統計方法。它區別于分類分析,后者是有監督的學習。通過聚類分析,可以在沒有任何模式可供參考或依循,即在沒有先驗知識的情況下,將大量數據樣本按各自的特性來進行合理的分類。在自然科學和社會科學眾多領域都存在大量的分類問題,因此,聚類分析是數據挖掘領域最常用的技術之一。

所謂聚類就是把整個數據集分成不同的“簇”,使得簇與簇之間的區別盡可能的大,而簇內的數據的相似度盡可能的高,相似或不相似的度量是基于數據對象描述屬性的聚類值來確定的,通常就是利用各個聚類間的距離來進行描述的。

在聚類分析中,對象之間的相似程度可以通過計算相應兩個對象之間距離來確定。最常用的距離計算公式就是歐氏距離(Euclidean distance),具體計算公式如下:

d(I,j)= 公式1.1

d越小,說明兩個對象相似度越高;反之,則說明兩個對象相似度很低。

2.k-means算法介紹

k-means算法最早是Mac Queen在1967年提出的[5],它是一種迭代的聚類算法,迭代過程中不斷地移動簇集中的成員直至得到理想的簇集為止,具有簡單、快速的優點。自算法提出至今已有很長的歷史,但仍然是當前研究的熱點課題。

k-means算法是一個著名并且最常用的基于劃分的聚類算法,它以k為參數(在算法運行前確定),把N個數據對象劃分為k個簇,使簇內數據對象具有就較高的相似度,而簇間的相似度較低,相似度基于簇內數據對象的平均值計算。首先隨機從數據對象中選取 K個點作為初始聚類中心,然后計算各個樣本到聚類中心的距離,把樣本歸到離它最近的那個聚類中心所在的類。計算新形成的每一個聚類的數據對象的平均值來得到新的聚類中心,如果相鄰兩次的聚類中心沒有任何變化,說明樣本調整結束,聚類準則函數已經收斂。本算法的一個特點是在每次迭代中都要考察每個樣本的分類是否正確。若不正確,就要調整,在全部樣本調整完后,再修改聚類中心,進入下一次迭代。如果在一次迭代算法中,所有的樣本被正確分類,則不會有調整,聚類中心也不會有任何變化,這標志著已經收斂,因此算法結束。

k-means算法基本步驟為:

2.1從給定數據對象中選擇k個樣本為初始聚類中心。

2.2將樣本按照歐氏距離最短原則分配給與其最近的簇生成一個新簇。

2.3重新計算簇的中心。

2.4重復步驟2和3直到求出準則函數的最優解(或直到類的成員穩定)。

二、基于聚類算法的圖書館利用情況分析

在圖書收藏和借閱流通活動當中,圖書館積累了很多可供研究的數據。一般高校圖書館,每年新增收藏圖書幾萬冊,每天都接待成百成千的讀者,每天借還書幾百冊甚至幾千冊,經過長時間的積累,手工記錄和計算機管理系統得以保存下來數百萬條各式各樣的數據,比如說讀者類別、數量;館藏各類圖書的種數、冊數;讀者總借閱量,各類讀者借閱量;各類圖書借閱量和圖書預約量;各類讀者到館次數、到館時間和超期違約金等等。

在使用計算機軟件對圖書館館藏、流通等工作進行管理之前,工作人員對數據的積累都是手工操作,對上述這些數據的統計很繁瑣,也不夠精確,圖書館員要對這些錯綜復雜的數據作完全分析幾無可能?,F在,大多數高校圖書館都實現了自動化管理,所以能更快捷、準確地獲取上述這些統計數據。但是到目前為止這些數據并沒有被很好的利用,例如有些館對數據的深層次分析沒有足夠的重視、圖書館工作人員面對圖書管理系統的統計數據時只是簡單的憑經驗說話,而沒有進行科學的分析處理等等。因此,圖書館員需要選擇一些具有重要研究意義的數據進行分析,并做出相關決策和建議。圖書借閱量就是經常被用來分析研究的數據,很多研究人員之所以選擇圖書借閱量來做分析研究,是因為它是讀者使用圖書館的最好證據,圖書館員可以從中發現、掌握讀者興趣并積極滿足讀者的個人信息需求;同時它也是評價圖書館藏書結構和藏書質量的重要指標,圖書館員可以根據借閱量分析館藏結構是否存在不合理之處、圖書館的采購策略是否需要調整??梢哉f,圖書借閱量在研究、提高圖書館資源利用方面具有較高的參考價值。

針對上述情況,本文將采用聚類算法對2007-2015這9年中保山學院圖書館流通數據(僅從中圖法22個大類作分析)進行聚類分析,提高數據分析結果的可靠性和科學性,提高數據處理的效率,將數據進行深層次挖掘分析之后轉化為可以為決策、預測、預報和估計提供參考的信息。

1.用k-means算法對2007年-2015年的圖書借閱量分別作聚類,結果如表1所示。表中1、2、3分別代表圖書借閱量小、大、適中三種聚類結果。

從表1中,我們可看出2007年-2010年的聚類結果沒有變化,說明在這四年里保山學院師生對各類圖書的需求變化不明顯,因而借閱量分布基本保持不變;2011年、2012年兩年哲學類圖書從低借閱量的聚類結果中脫離出來,進入到借閱量適中的聚類結果中,說明這兩年哲學類圖書的借閱量有了明顯的提高;2013年繼哲學類圖書借閱量提高之后,數理化類圖書也躍上借閱量適中的行列,說在這一年里數理化類圖書的需求有了質的變化;2014年工業技術類圖書上升到借閱量適中的隊伍,而此前7年一直都在借閱量適中的文科教體類圖書則降到借閱量低的一類圖書中,說明在2014年讀者對工業技術類圖書的需求較以前增大,而降低了對文科教體類圖書的需求。

2.表1中,文學類圖書始終是單獨一類,是因為其借閱量太大,不足以影響其他各類圖書的聚類情況,特剔除文學類圖書以后,再用k-means算法進行逐年聚類分析后結果如表2所示。1、2、3分別代表借閱量小、適中、大三種聚類結果。

從表2中,我們可以看到哲學類、數理化類圖書2007-2013年的借閱量都沒發生較大變化,在2014年同時出現需求的增大;藝術類、歷史地理類圖書在2011-2013年出現需求變小的情況,在2014年又同時回歸大需求量行列;政治法律、經濟類圖書也是同時出現需求量從小變大,在2011年同時出現低谷,又同時增長;社科總類類圖書也呈一個低需求——增長——降低——增長的趨勢;文科教體類圖書基本呈現需求量從降低的趨勢。

3.在2007-2015年圖書借閱數據中剔除借閱量最大的文學類圖書以及借閱量極小的交通運輸、航空航天2類類圖書以后,用k-means算法進行逐年聚類分析后結果如表3所示。1、2、3分別代表借閱量小、適中、大三種聚類結果。

以表3與表2相比,僅有的區別是2008年里當剔除文學類圖書進行聚類時的社科總論圖書的需求為中等需求,而當剔除三類圖書聚類之時社科總論圖書的需求為低需求。

從表1、2、3近9年的逐年聚類分析中,我們發現隨著時間的推移,哲學類圖書、數理化類圖書、工業技術類圖書和文科教體類圖書的需求在發生著變化,前三類圖書近幾年的需求大致呈上升趨勢,而文科教體類圖書則下降趨勢較為明顯,這可能與保山學院學生結構的變化有關。自2009年開始招收第一批本科學生開始,到2015年本專科學生比例已經超過1.8∶1,更多的本科生對自己的專業書本需求、人文素養書本需求更高;而師范生人數銳減使得學生對于中小學教育相關的文科教體類圖書的需求大大降低。

以文科教體類圖書為例:2007年-2012年6年期間,該類圖書借閱量占當年借閱圖書總量的9%-10%,2013年雖然還在借閱量適中的聚類結果中,但是較2012年的10494冊銳減到6332冊,所占比例也降低到7.3%;2015年借閱量只有4588冊,所占比例已經不到6.2%。說明表1、2、3的聚類結果的變化趨勢很好的反映了文科教體類圖書有學生感興趣的書籍變成冷門圖書。同樣的辦法可以看到哲學類圖書、數理化類圖書、工業技術類圖書逐步成為熱門圖書。

基于此,我們可以作如下預測:待2016年圖書館所購買新書上架之后,正在成為熱門圖書的哲學類圖書、數理化類圖書、工業技術類圖書的被借閱可能性大于已經變成冷門圖書的文科教體類。因此,對保山學院圖書館2016年的圖書采購工作和圖書宣傳工作作以下幾點建議:

第一、降低對文科教體類圖書的采購金額。在師范生人數不斷下降的情況下,要大幅度縮減對中小學教材、教法類圖書,以免造成同類圖書堆積。

第二、增加對借閱量聚類結果中從借閱量低升格到中的幾類圖書的采購金額,特別是計算機類圖書?,F在計算機已經不再作為一種專業技能,而是一種普及的工具,為了掌握這門工具,很多學生爭相學習。因此,圖書館應增加采購經費比例來完成對此類圖書最新版本的更新。

第三、繼續做好圖書推薦工作。2016年要在總結前幾年經驗的基礎上,根據近9年借閱量聚類結果的變化趨勢進行圖書利用率的預估,并加強圖書館的讀者培訓(包括日常的讀者教育和新生入館培訓)、參考咨詢工作、加大宣傳力度,盡可能的讓學生到圖書看書、借書。

第四、加強圖書剔舊工作。按時對藏書當中重復率比較高的這一部分圖書進行剔舊,把老版本、借閱量極低(等于0)的剔出來。比如說文科教體類中的中小學教材、語言類的字典和詞典這些都是重復率較高的,隨著知識不斷在更新發展,這幾類圖書低版本淘汰較快。

參考文獻

[1]閔紅武.十年來我國高校圖書館信息素養教育研究綜述[J].圖書與情報,2008(4):63-67

[2]才宏慧.加強讀者借閱工作 提高文獻利用率[J].圖書館建設,1999(2):57

[3]企業成本核算的啟示——談提高館藏文獻利用率[J].高校圖書館工作,1998(3):47-49

[4]韓樹華,左建新.怎樣提高高校圖書館館藏利用率[J].河北科技圖苑.1996(S1):57-59

[5]J MacQueen.Some methods for classification and analysis of multivariate observations[C]. Proceedings of the Berkeley Symposium on Mathematical Statistics and Probability. 1967:281-297.

作者簡介:魯新明,男,(1984-),碩士,就職于保山學院圖書館,館員。研究方向為圖書館數據挖掘與讀者服務。

李變秀,女,副研究館員,研究方向為圖書館文化建設。

猜你喜歡
圖書館
去圖書館坐坐
發明與創新(2021年6期)2021-03-10 07:13:54
圖書館
圖書館里送流年
圖書館
文苑(2019年20期)2019-11-16 08:52:12
夜間的圖書館
幽默大師(2019年5期)2019-05-14 05:39:38
圖書館里的小驚喜
圖書館 Library
幼兒畫刊(2018年11期)2018-12-03 05:11:44
時間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
主站蜘蛛池模板: 亚洲AⅤ无码日韩AV无码网站| 国产91熟女高潮一区二区| 国产微拍精品| 色噜噜综合网| 男人的天堂久久精品激情| 久久精品人人做人人爽电影蜜月| 国产欧美日韩视频怡春院| 国产成人精品优优av| 波多野结衣一区二区三区四区视频 | 狠狠干综合| 亚洲国产成人超福利久久精品| 97se亚洲综合在线天天 | 一区二区影院| 亚洲AV无码不卡无码| 一级毛片免费高清视频| 国内精自线i品一区202| 极品私人尤物在线精品首页 | 91在线国内在线播放老师| 在线视频精品一区| 欧美亚洲综合免费精品高清在线观看| 亚洲高清中文字幕在线看不卡| 91久久精品国产| 精品伊人久久久大香线蕉欧美| 欧美午夜小视频| 99久久精品免费看国产免费软件| 波多野结衣久久精品| 国产欧美日韩va| 国产肉感大码AV无码| 一级毛片免费的| 五月激情婷婷综合| 亚洲91在线精品| 九九热精品在线视频| 久久婷婷色综合老司机| 精品国产自在在线在线观看| 午夜免费小视频| 免费人成在线观看成人片| 亚洲精品少妇熟女| 欧美一级高清免费a| 99精品视频在线观看免费播放| 黄色三级毛片网站| 国产门事件在线| 国产无码精品在线| 精品成人免费自拍视频| 色婷婷成人网| 精品国产成人三级在线观看| 欧美在线国产| 日韩一级毛一欧美一国产| 亚洲男人天堂久久| 国产jizzjizz视频| 午夜激情福利视频| 中文字幕在线视频免费| 中文字幕 欧美日韩| 久久国产精品波多野结衣| 亚洲精品无码成人片在线观看 | 国产精品永久在线| 国产精品午夜福利麻豆| 欧美一道本| 在线一级毛片| www.精品国产| 亚洲男女在线| 亚洲精品卡2卡3卡4卡5卡区| 成人一级免费视频| 91精品国产自产91精品资源| 欧美成人看片一区二区三区| 久久综合九色综合97婷婷| 午夜视频免费试看| 亚洲第一成年免费网站| 国产第一页第二页| 91亚瑟视频| 色综合热无码热国产| 免费高清a毛片| 精品国产美女福到在线不卡f| 在线精品亚洲一区二区古装| 国产内射一区亚洲| 国产jizz| 国产精品手机在线观看你懂的| 国产免费怡红院视频| 波多野结衣国产精品| 亚洲成人在线网| 国产chinese男男gay视频网| 日韩在线观看网站| 亚洲精品人成网线在线|