999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘在個性化圖書推薦中的應用

2011-12-20 03:49:24王蕊
城市建設理論研究 2011年23期

王蕊

[摘要] 采用數據挖掘中的決策樹方法,對圖書館的圖書借閱數據進行研究和分析,提出了基于讀者閱讀興趣的個性化圖書推薦模型,結果表明,該模型能夠為老讀者個性化推薦新書,為新讀者個性化推薦圖書,較好地實現了圖書館的有針對性的創新服務。

[關鍵詞] 決策樹 個性化圖書推薦 興趣模型

引言

以讀者為中心,根據讀者各種不同的個性化信息需求,實現個性化信息服務,是圖書館服務發展的必然趨勢[1]。在用于圖書館個性化信息服務的眾多技術中,數據挖掘技術[2]有著重要的地位。為了向老讀者推薦符合其閱讀興趣的圖書,預測新讀者將來可能的閱讀興趣,從而推薦合適的圖書信息[3]。本文利用數據挖掘技術中的決策樹算法對某高校圖書館的讀者借閱數據進行分析,根據不同閱讀興趣對讀者分類,建立了基于讀者閱讀興趣的圖書推薦模型,為新老讀者提供具有針對性的圖書推薦服務。

1準備借閱數據

為了對數據進行挖掘并得到正確的結論,選擇合適的圖書借閱數據并進行預處理是非常必要的。數據來源為某高校圖書館近4年讀者借閱記錄,數據源為學校圖書館管理信息系統數據庫,數據庫類型為SQL Server 2000。為簡化數據處理、建模和分析過程,本文從眾多數據庫表中選出以下幾張表:流通庫、讀者庫、館藏書目庫、分類檢索表和檢索索書號庫。為保護讀者隱私,本文中所有數據包括讀者姓名、讀者條碼、聯系方式等信息均經過技術處理。對以上數據處理后,構建用于分析的數據大表。

以流通庫為事實表,根據其外鍵將幾張表合為一張大表,其字段有:讀者條碼、讀者姓名、性別、讀者級別、讀者專業、所屬院系、索書號、書名、外借時間、圖書類別。為方便分析,把圖書按索書號分為理工、醫學、文學、外語、社科等類別。部分數據見表1。

2構建模型

構建模型就是在數據準備后,從數據中采集業務相關的樣本數據集,探索數據的規律,針對數據建模的數據集數據進行修正,選擇一種或幾種挖掘方法,進行數據模型構建,從技術和業務兩個層面進行模型評估。從圖書借閱數據表中建立兩種模型,一個現有讀者圖書推薦模型,一個是新讀者圖書推薦模型。

表1 圖書借閱數據表

讀者條碼 讀者姓名 性別 讀者級別 年級 讀者專業 所屬院系 索書號 書名 外借時間 圖書

類別

0101045XX 張** 女 本科生 2004 臨床醫學 臨床醫學系 I247.5/CMX 星戀 2008-12-23 文學

0101055XX 念** 男 本科生 2005 臨床醫學 臨床醫學系 R6/WZD=7 外科學 2008-12-19 醫學

0601075XX 李** 男 專科生 2007 市場營銷 管理學院 E892.25/SWY 孫子兵法 2009-1-12 社會科學

1002065XX 張** 女 本科生 2006 計算機 信息工程學院 TP312C/ZJY C++面向對象程序 2008-12-30 理工

2.1數據抽樣

當進行數據建模時,要從數據源中取出業務問題相關的樣本數據集。由于本文研究的圖書館數據量3萬多條記錄,這里把整個數據集作為研究對象。

2.2數據探索

結合技術知識與業務知識,探索數據的規律和趨勢,確定數據變量的類型,研究各變量之間的相關性,確保數據集能滿足解決業務問題的要求。針對數據建模的數據集,還要增刪、結合或生成一些新的變量。對數據各個變量進行分布分析,結合數據建模目標,對數據進行歸并、補缺、轉換或過濾。

2.3建立模型

(1)現有讀者閱讀興趣模型

圖1現有讀者圖書推薦模型

首先由圖書借閱數據表可統計出借閱各類圖書的讀者。當新書編好索引號便可以歸入某類圖書中,該書上架后利用該模型可以向喜歡該類圖書的讀者發出電子郵件,推薦該書。

(2)新讀者閱讀興趣模型的建立

為了對表1的圖書借閱數據進行分析挖掘,從而得出分類規則,現在以圖書類別為決策類別屬性,其他為條件屬性。首先對表1中數據初步分析,可知讀者條碼、讀者姓名、索書號、書名、外借時間這些屬性對決策屬性“圖書類別”沒有貢獻,不能作為條件屬性。至于年級,新讀者的年級也不可能與現有讀者的年級相同,但它應該對決策屬性“圖書類別”有貢獻,故可將2007級、2006級、2005級、2004級改為低年級(包括本???年級、專升本1年級)、中年級(含本科2、3年級和專科2年級)、高年級(含本科4年級、醫學本科5年級、???年級、專升本2年級)。經過分析后得到表2,篇幅所限,只列出部分數據。

表2 圖書借閱決策表

序號 性別 讀者級別 年級 讀者專業 所屬院系 圖書類別

1 女 本科生 高年級 臨床醫學 臨床醫學系 文學

2 男 本科生 中年級 臨床醫學 臨床醫學系 醫學

3 男 專科生 低年級 市場營銷 管理學院 社科

4 女 本科生 中年級 計算機科學與技術 信息工程學院 理工

可以做分類分析的數據挖掘軟件很多,這里選用MS SQL Server Analysis軟件的決策樹分類算法[4]對表2進行分析。因為經過分析形成的決策樹較大,故將決策樹整理得到表3,這里僅列出部分數據。

表3 圖書推薦決策表

專業 年級 讀者級別 性別 類別及百分比(%)

農業 醫學 外語 文學 理工 社會科學 其他

臨床醫學(4731) 中年級(1437) 專升本(122) 0.83 20.00 8.33 40.83 3.33 21.67 4.17

非專升本(1325) 0.15 61.07 6.45 21.68 2.33 5.85 2.48

非中年級(3294) 專升本(246) 0.39 41.73 21.05 13.78 4.33 12.99 4.72

非專升本(3048) 男(1148) 0.26 23.62 7.35 41.00 4.07 16.35 7.36

女(1900) 0.21 25.42 12.58 48.17 1.52 8.02 4.09

計算機科學與技術(793) 高年級(113) 0.83 0.83 0.83 4.93 75.21 14.88 2.48

非高年級(680) 0.15 3.49 11.05 24.27 44.33 13.37 3.35

注:表中括號中的數字為圖書借閱次數,空白處表示該屬性對分類沒有貢獻。

由表3可以得出如下規則(這里僅列出一個規則):

條件:專業=臨床醫學 并且 年級=中年級 并且 讀者級別=專升本

結論:借文學類書的占40.83%,借醫學類書的占20%,借社科類書的占21.67%。

分析表3中數據可知,在表2中,專業屬性對分類的貢獻最大,其次為年級、讀者級別、性別,而所在院系對分類沒有貢獻。另外將百分比小于10%的類別忽略掉,這樣能夠為新讀者重點推薦圖書。

3測試模型

有了上述兩個模型,就可以為新老讀者個性化推薦圖書了。

對于老讀者,圖書館新書入庫上架后,利用現有讀者閱讀興趣模型,新書會根據索書號加入到某一圖書類別,然后該類圖書會向已經歸到該圖書類的讀者自動發出Email,對該新書感興趣的讀者閱讀郵件便獲知了該書入庫的信息。經推薦實驗并抽樣調查學生讀者可知書目推薦符合學生興趣率達90%以上。

對于新入學的學生,根據新讀者閱讀興趣模型中的分類規則,向新讀者推薦圖書,經推薦實驗并抽樣調查學生讀者可知書目推薦符合學生興趣率達85%以上。

4 模型評估

確定模型的數據輸入、輸出和分析建模結果的發布方式:以數據接口的方式發布,把分類結果定期寫回數據庫,實現與原有圖書管理系統的集成,提供給圖書館管理人員使用?,F有讀者閱讀興趣模型處理借閱信息的結果可以幫助我們:(1)根據讀者群需求特征提供信息咨詢和定制服務,引導用戶快速查找所需的數據和信息,協助圖書館更好地提供服務;(2)根據分群結果,提供符合用戶需求的個性化服務內容。新讀者閱讀興趣模型對新生推薦圖書可以幫助我們:(1)幫助培養新讀者的的閱讀興趣,節省其查找圖書的漫長過程;(2)極大提高圖書館圖書的使用效率。

此外,讀者閱讀興趣模型的推薦結果有利于圖書館提高圖書資源采購的針對性,有利于館藏資源的整合,能夠使有限的資金發揮最大的作用。對于圖書館網站欄目、內容層次、讀者角色的劃分都有著重要的參考意義。

5 結束語

本文建立了一個基于數據挖掘的讀者閱讀興趣模型,嘗試在利用數據挖掘技術對圖書館借閱數據進行分析,建立了向老讀者個性化推薦新書、向新讀者個性化推薦圖書的模型,對于培養新讀者閱讀興趣,提供符合老讀者的個性化書目信息,做出了有益的探索,并對一個圖書館藏書結構建設有很大的幫助。下一步將結合其他數據挖掘技術對圖書借閱進行處理分析,以提高所推薦書目對讀者興趣的符合率,更好的為讀者提供個性化服務。

參考文獻:

[1] 唐安順. 淺談圖書館的個性化信息服務[J]. 圖書館, 2009(4): 126-127.

[2] 王艷. 數據挖掘在數字圖書館中的應用[J]. 情報科學, 2003(2): 211-214.

[3] 楊文珠. 圖書館個性化信息服務技術與應用分析[J]. 圖書館理論與實踐, 2008(4): 92-94.

注:文章內所有公式及圖表請以PDF形式查看。

主站蜘蛛池模板: 久青草国产高清在线视频| 国产激情第一页| 久久大香香蕉国产免费网站| 久久99久久无码毛片一区二区| 午夜毛片免费观看视频 | 国产精品手机在线观看你懂的| 国产精品视屏| 亚洲V日韩V无码一区二区 | 亚洲国产成人自拍| 丁香五月激情图片| 亚洲人成影视在线观看| 国产一级毛片在线| 国产福利不卡视频| 亚洲中文精品人人永久免费| 免费又黄又爽又猛大片午夜| 黑人巨大精品欧美一区二区区| 22sihu国产精品视频影视资讯| 欧美va亚洲va香蕉在线| 国产精品xxx| 国产成人免费| 在线观看无码av免费不卡网站 | 欧洲高清无码在线| 激情影院内射美女| 国产手机在线ΑⅤ片无码观看| 中文精品久久久久国产网址| 国产在线第二页| 97久久超碰极品视觉盛宴| 一级毛片在线直接观看| а∨天堂一区中文字幕| 伊人91在线| 亚洲欧美日韩动漫| 日韩亚洲综合在线| 国产男女免费视频| 国产精品yjizz视频网一二区| 四虎影院国产| 国产在线91在线电影| a天堂视频| 国产成人精品免费视频大全五级| 亚洲成aⅴ人片在线影院八| 亚洲av综合网| 亚洲午夜福利精品无码不卡 | 欧美视频在线观看第一页| 国产精品久久久久久久久kt| 日韩在线欧美在线| 欧美在线中文字幕| 国产va在线观看免费| 免费毛片全部不收费的| 香蕉网久久| 国产精品页| 国产又色又爽又黄| 午夜性刺激在线观看免费| 日本亚洲欧美在线| 久久精品最新免费国产成人| 天天综合天天综合| 99久久精品免费看国产电影| 天天综合天天综合| 极品私人尤物在线精品首页| 中国成人在线视频| 99在线视频免费| 日本午夜在线视频| 国产精品yjizz视频网一二区| 国产日本欧美在线观看| 日本国产精品一区久久久| 2021国产精品自产拍在线| 亚洲天堂.com| 日韩在线永久免费播放| 欧美乱妇高清无乱码免费| 亚洲男人天堂2020| 成人久久18免费网站| 91伊人国产| 狂欢视频在线观看不卡| 国产精品一区不卡| 精品国产免费观看一区| 精品伊人久久久大香线蕉欧美| 欧美日韩亚洲综合在线观看| 国产成人三级| 本亚洲精品网站| 一级成人欧美一区在线观看| 欧美日韩国产精品va| 伊人成人在线| 国产乱人视频免费观看| 99精品免费在线|