999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于定量判別方法在高校圖書借閱信息群中行為數據挖掘的應用

2012-02-01 01:41:20劉宇初
科技傳播 2012年14期
關鍵詞:圖書館用戶分析

劉宇初

北京師范大學,北京 100875

1 研究背景和意義

隨著信息資源的飛速增長和公共信息服務理念的變化,用戶越來越需要個性化、多元化的信息需求,例如網上書店的圖書推薦、搜索引擎中的查詢詞關聯等的產生,正是這種個性化需求的產物。與之相比,作為閱讀密集型群體集中的高等院校,其圖書館的服務和對館藏圖書資源利用仍存在發展不足的問題。高校圖書館的使用者有其特殊的群體特征,例如專業、學歷、身份、年齡層次具有明顯的群體差異。這些特征使高校圖書館的借閱服務不同于普通網絡書店的用戶群服務,它具有自己的模式、特點有待于研究與發現。同時,用戶也希望進入網站后看到的書籍都是自己感興趣的,而不同用戶通過同一搜索關鍵字所搜索的結果應該是不同的,每個用戶進入網站后能夠享受到更貼近自己的服務,從而可以使用戶在浩瀚的書海中方便、快捷的找到自己需要的資源。

與此同時,隨著數據庫技術的迅速發展以及數據庫管理系統在圖書館的廣泛應用,圖書館積累了大量的讀者對資源的歷史訪問數據。這些數據背后隱藏著許多有價值的信息,圖書館記錄的書的借閱信息,可以從兩方面對圖書館個性化推薦服務做出貢獻:一是圖書推薦,包括利用不同借閱者借閱書籍的相似性來決定書籍的推薦和通過借閱者個人的借閱行為分析借閱者興趣走向,并進行相關推薦;二是形成“共書者網絡”幫助用戶形成社交群體網。而目前多數圖書館并未將這些歷史借閱數據進行有效的利用,由此而帶來的大量優秀圖書資源的隱蔽性問題也時刻影響著讀者對于圖書館的滿意度及圖書資源的應用廣泛度。

因此,利用對圖書借閱數據的分析處理,以“書”和“借閱者”為實體,通過對讀者的借閱興趣發現從而為高校圖書館的個性化推薦服務的進一步完善與發展提出建議,這也將逐漸成為當前及未來有關高校圖書館研究熱點問題之一。

本研究基于高校讀者用戶圖書借閱興趣、行為的發現,挖掘相同借閱讀者群、借閱時間段內的關聯關系,分析影響用戶借閱行為的因素。一方面找出借閱行為的影響因子和影響程度大小;另一方面進一步分析列表中數據之間的關系,找出借書頻次較多的讀者列表和借書頻次最多的時間段,進而為后期進一步構建讀者借閱興趣模型提供數據基礎、為圖書館工作人員根據用戶的興趣需求制定相應的個性化推薦服務等提供理論依據。

2 研究方法和實驗設計

2.1 對象說明

數據來源是北京某高校圖書館,時間范圍為2008年~2010年,記錄總數約60萬條,原始數據字段如下:

證件號 學歷及所在院系 借書日期 書名 索書號本研究中需要根據統計內容將數據字段分別刪減為以下兩類:證件號 借書頻次 借書頻率以及:借書日期 日借書頻次

其中,“學號—借書頻次”列表需要統計出每位讀者(即每個學號)在2008年至2010年間總借書頻次及頻率,并將其進行降序排列;“日期—借書頻次”列表需要統計出從2008年~2010年每天的借書頻次,為進一步的分析處理做鋪墊。

2.2 具體操作描述

1)分析借書頻次較多的讀者

由于“學號—借書頻次”列表中數據共1 409位讀者數據,總量約27萬條,數量較大,為了將數據進行準確定位,首先需找出借書頻次和頻次的四分位點、八分位點、十六分位點,并統計出介于兩個相鄰十六分位點間的區間頻率之和,依據區間頻率大小,劃分借書較多的讀者范圍。

2)分析借書頻次較多的時間段

通過縱向與橫向兩個時間軸進行綜合比較:

(1)縱向時間軸

依次統計以月份、周數為單位的借書頻次,繪制折線圖,分別比較在相同年份不同周次、不同月份的借書頻次大小和趨勢,同時將“月份—借書頻次”、“周次—借書頻次”分布圖進行比對分析,找出其相同點與不同點,分析借書高峰期出現時間。

(2)橫向時間軸

①分析一周之內借書頻次最高日

由于2009年數據較全,故將2009年本科生“日期—借書頻次”數據作為整體樣本進行分析,將其劃分為51周,其中,每一周以星期日作為開始日,星期六作為結束日,統計這51周內(除去日期不全的星期)從星期一到星期日每天的借書頻次平均數,并將其進行排序處理,繪制折線圖。

②分析2008年和2009年借書頻次的變化。

分別將2008年和2009年的“月份——借書頻次”趨勢圖進行分析比較,找出其相同與不同之處,并分析可能的原因。

3 統計結果與分析

3.1 借書頻次較多讀者

根據統計結果可以看出,借書頻次在451(含)以上的占到了總借書頻次的18%以上,而其人數僅占總借書人數的6.4%;借書頻次在381(含)以上的占總借書頻次的30%左右,其人數占總借書人數的12.5%;借書頻次在278以上的達到總借書頻次的50%以上,而其人數占總借書人數的25%;因此,由分析可以界定其7/8分位點為判斷借書人數較多的基準線,即借閱書籍頻次超過380的讀者為借書頻次較多讀者。

3.2 借書頻次較多時間段

3.2.1 借書次數與月份、周次之間的關系

借書頻次與月份和周次之間的關系總體上的趨勢是相同的,而“借書頻次—周次”較“借書頻次—月份”之間的關系更為細化一些。從折線圖中可以得出如下結論:借書高峰期一般出現在9月、10月和3月、4月左右,借書低谷期一般出現在7月、8月和1月、2月左右,而相對應的,借書高峰期也正是普通高校學生開學的日期,借書低谷期對應的則是普通高校學生的放假日期。從周次頻次圖中,可以清楚的看到,上半年借書高峰出現在第8周,下半年出現在第36周;同時,在第2周和第26周左右會出現一個小高峰,可知該星期學生正值備戰期末考試期間,借書頻次會有所增加。

3.2.2 一周之內日借閱頻次關系比較

通過對借閱頻次結果進行縱向排序,可以得出,一周之內借閱頻次由大到小的日子依次為:星期一、星期二、星期五、星期四、星期三、星期日、星期六??梢钥闯觯恳恢艿闹芤粸榻钑疃嗟娜掌?,而星期六同學們借書的傾向相對較小。

3.2.3 2008年與2009年借書頻次變化比較

將2008年和2009年借書頻次與月份之間的關系繪制成折線圖,并將其做以比較可以分析得出不同年份之間借書趨勢的變化關系。由于2008年數據缺少8月和9月的相關情況,因此結果并不具有很強的典型性。但從總體折線圖走勢上可以看出,每年借閱書籍的高峰期出現時間大致相同,都為開學初的3月和9月,而借閱書籍次數較少的時間段則為學生放假的1月份、2月份和7月份、8月份。數量上,2009年較2008年借閱書籍平均次數有所減少,造成此類現象的原因可能是由于信息化的普及和網絡的便捷,使得紙質化書籍逐漸在學生們日常閱讀范圍內所占比例逐年減少。

4 結論

根據定量判別結果,在挖掘借閱讀者與借閱頻次之間的關系中,規定借閱書籍頻次超過380的讀者為借書頻次較多讀者;在挖掘借閱時間與借閱頻次之間的關系中,可以看出,借書高峰期一般出現在9月、10月和3月、4月左右,借書低谷期一般出現在7月、8月和1月、2月左右,上半年借書高峰出現在第8周,下半年出現在第36周;同時,在第2周和第26周左右會出現一個小高峰,可知該星期學生正值備戰期末考試期間,借書頻次會有所增加。同時,每一周的周一為借書最多日,而星期六讀者借書的傾向相對較小。

根據已有研究基礎,為進一步構建讀者借閱興趣模型,還需進一步完成的工作是:

1)根據圖書館的歷史借閱數據以“書”和“借閱者”為實體建立圖書借閱模型,以此為基礎分析變量,找出借閱者與借閱者、借閱者與書、書與書之間的關系,形成“共書者網絡”;2)基于“共書者網絡”進行分析,挖掘其隱含的關聯規則,從而分析熱門書籍及其所屬學科特征、書的借閱時間分布、書的借閱頻度分布、“共書者”的各項特征,進而分析影響用戶借閱行為的因素;3)通過對影響讀者借閱行為因素的分析結果建立基于共同興趣的書目推薦模型,為讀者進行熱門書籍推薦、相關聯書籍推薦、為圖書館資源配置提出建議等服務。

[1]王偉,張征芳.基于數據挖掘的圖書館讀者行為分析[J].現代圖書情報技術,2006,11:51-60.

[2]FeiYan,MingZhang,JianTang,TaoSun,ZhihongDeng,and LongXiao,”Users’Book-Loan Behaviors Analysis and Knowledge Dependency Mining “.

[3]劉勘,尹承明,陳凡.圖書借閱信息的分析與挖掘[J].計算機科學,2008,35:139-141.

[4]陳華月,朱征宇.基于用戶近期興趣視圖的個性化推薦[J].計算機工程,2005,10.

[5]蔡會霞,朱潔,蔡瑞英.關聯規則的數據挖掘在高校圖書館系統中的應用,2005,27:85-88.

[6]熊擁軍,劉衛國,張建中.基于資源分類樹的讀者興趣模型設計與實現[J].現代圖書情報技術,2005,3:328-331.

[7]黃曉斌.基于協同過濾的數字圖書館推薦系統研究[J].大學圖書館學報,2006.

[8]閔敏.層次凝聚算法在商品個性化推薦中的應用 [J].電腦知識與技術,2006,2.

猜你喜歡
圖書館用戶分析
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
電力系統及其自動化發展趨勢分析
飛躍圖書館
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
圖書館里的是是非非
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 人妻少妇久久久久久97人妻| 色九九视频| 久久一本日韩精品中文字幕屁孩| 秘书高跟黑色丝袜国产91在线| 国产AV无码专区亚洲A∨毛片| 女人毛片a级大学毛片免费| 亚洲天堂久久久| 伊人久久大香线蕉综合影视| 欧美h在线观看| 中日韩一区二区三区中文免费视频| 天堂在线视频精品| 中文精品久久久久国产网址| 日日拍夜夜操| 欧美 亚洲 日韩 国产| 久久男人资源站| 亚洲v日韩v欧美在线观看| 亚洲成综合人影院在院播放| 国产91无毒不卡在线观看| 9久久伊人精品综合| 一级片一区| 色噜噜综合网| 国产大全韩国亚洲一区二区三区| 亚洲精品无码在线播放网站| 欧美区一区| 国产真实乱子伦视频播放| 欧美精品啪啪一区二区三区| 麻豆国产在线观看一区二区| 色哟哟国产精品| 中文字幕伦视频| 国内老司机精品视频在线播出| 色婷婷成人| 国产成人综合亚洲网址| 免费高清毛片| 精品人妻无码中字系列| 国产特级毛片aaaaaaa高清| 99久久精品无码专区免费| 欧美啪啪精品| 久久精品无码一区二区日韩免费| 亚洲第一中文字幕| 一区二区无码在线视频| 久久精品国产999大香线焦| 免费国产高清精品一区在线| 久久国产乱子伦视频无卡顿| 亚洲人成色在线观看| 在线精品亚洲国产| 99国产在线视频| 亚洲无码高清视频在线观看| 国产精品乱偷免费视频| 麻豆国产精品视频| 国产视频自拍一区| 国产超薄肉色丝袜网站| 色婷婷亚洲综合五月| 国产精品性| 日韩色图在线观看| 小蝌蚪亚洲精品国产| 国产高清在线观看91精品| 欧美日韩久久综合| 在线高清亚洲精品二区| 欧美亚洲欧美| 国产精品一区二区在线播放| 综合色在线| 午夜电影在线观看国产1区| 国产精品久久久久久影院| 青青草综合网| 九一九色国产| 日本道综合一本久久久88| 日韩精品资源| 欧美综合成人| 亚洲天堂伊人| 国产青青草视频| 2020精品极品国产色在线观看| 亚洲精品麻豆| 99久久无色码中文字幕| 免费看一级毛片波多结衣| 亚洲精品日产精品乱码不卡| 久久五月视频| 国产精品黄色片| 四虎成人精品| 人妻中文久热无码丝袜| 日韩在线中文| 国产欧美在线| 国产成人1024精品下载|