999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶數據挖掘的圖書采購模式研究*

2020-06-08 08:31:58廖宇峰
科技與創新 2020年10期
關鍵詞:數據挖掘圖書館用戶

廖宇峰

基于用戶數據挖掘的圖書采購模式研究*

廖宇峰

(廣東食品藥品職業學院,廣東 廣州 510520)

國內圖書館人對基于用戶數據挖掘的圖書采購模式方面的研究做了一些探索。圖書采購決策過程中用戶數據挖掘的全過程包括收集數據、數據預處理、建立模型和結果調整。探討如何引入數據挖掘技術,深入挖掘用戶數據,為圖書采購決策、管理和服務提供決策支持。

用戶數據;數據挖掘;圖書采購;采購模式

1 前言

作為學校的文獻信息交流和儲存中心,圖書館一直為學校的教學和科研提供服務。因此,高校圖書館的發展必須與學校的發展保持一致,除了專業教育,通識教育和終身學習習慣也是高校人才培養戰略的重要培養目標。圖書館的館藏資源建設必須與學校的專業設置、教學計劃緊密結合,在為學校提供專業文獻資源保障的同時,也為通識教育和終身學習習慣提供保障。

目前,圖書館的館藏資源建設所遇到的需要重點探討的問題,主要集中在怎樣構建快速、真實反映館藏結構分布、用戶實際需求和圖書利用率的動態圖書采購決策方案。

利用目前方興未艾的數據挖掘技術,可以在海量數據中迅速獲取到有價值的信息。本文將探討引入數據挖掘技術,深入挖掘用戶數據,以期幫助館藏文獻資源的建設,充分掌握館藏文獻資源的建設動態,更好地開展圖書采購業務,充分保障用戶的知識獲取權益。

2 目前高校圖書館圖書采購的主要工作方式

2.1 專業采編部門組織采購

部門內部的采編工作人員按照采購計劃,根據各個渠道獲取書目,按照館藏建設制度,挑選合適的書目。由于多個工作人員的知識結構不同,一定程度上增加了選書的多樣性,但因為人員素質不盡相同,可能導致效率低下、選書標準差異分化嚴重。此外,因長期沒接觸一線流通工作,導致采編工作人員與用戶溝通不多,不能完全理解用戶的需求。

2.2 用戶薦購方式

用戶薦購也稱為PDA 模式(Patron-Driven Acquisition),用戶可依據圖書館給出的清單挑選圖書,也可以自選書目,利用現場填寫書單,電子郵箱、電話、微信和QQ等方式告知采購工作者完成圖書推薦過程。目前有條件的圖書館也開始推廣“圖書薦購系統”,用戶可以隨時隨地在系統中選擇圖書,后臺也可以隨時獲取用戶需求清單。

“用戶薦購方式”在很大程度上可以滿足用戶的需求,但是一般用戶只是按照自己的想法來選擇圖書,具有一定的片面性、隨機性和偶發性。此外用戶薦購數量無法與館藏建設規劃相比,只能作為圖書館采購圖書的一種補充。

2.3 館配會和書展現場采購

書展一般展示的是熱門書籍和暢銷書籍,而館配會現場的圖書數量也有限制。圖書館組織人員參加書展和館配會,是對紙質館藏的一種有益補充,但是無法解決專業性強、全面而且有深度的圖書采購。同時,因為經費的問題,參與現場采購的人員不可能數量太多,因受限于各自的知識面,因此也只能滿足少部分用戶的需求。

3 采購決策相關因素

3.1 流通借閱數據

正常情況下,用戶一般都會按需借閱,因此本館的用戶借閱數據基本能反映用戶的實際需求。后臺工作人員可以根據歷史借閱數據,統計分析出用戶的偏好和興趣,為圖書的采購工作提供一定的科學依據。

3.2 主管機構的戰略規劃

對于高校圖書館而言,圖書館的紙書采購必須與學校的長遠規劃和專業設置相匹配,一旦學校開設了新專業,高校圖書館也必須增加相關的專業書籍;而如果高校希望增加學生的通識教育,圖書館也理應增加相關的書籍,以配合學校教學、科研和全面育人的戰略規劃。

而對于公共圖書館而言,圖書采購必須充分考慮當地監管部門的發展戰略和規劃,例如廣州致力于新一代信息技術、人工智能、生物醫藥和新能源、新材料等新興產業的發展,因此相關地區的公共圖書館應該適當增加相應的藏書,以配合廣州的發展規劃,促進相關知識的廣泛傳播。

3.3 圖書出版時間及價格因素

根據市面上紙質圖書的出版規律,紙書的價值一般會隨著時間的推移而降低,這在一些發展迅猛的高新技術類圖書上更為明顯。圖書出版時間是采購人員需要重要考量的因素。同時因為經費有限,所以大多數圖書館也會將圖書的價格考慮進去,以達到效益最大化。

隨著信息技術如火如荼的發展,圖書館獲取和挖掘用戶的數據變得越來越科學和便利。深度挖掘用戶數據,可以全方位獲取到用戶的真正需求,因此,用戶數據已經成為越來越多圖書館制訂采購書單時的重要決策依據。

通過對用戶數據進行深入挖掘,進而形成重要的報告,不僅可以事前為圖書采購提供依據,同時在事后可以作為圖書采購質量的評判標準。在對用戶數據進行深入挖掘分析之后,制定圖書采購計劃,確定圖書的類型比例,同時在過程中可以糾正偏差,有效提高所購圖書的針對性,充分保障用戶的需求,同時保持館藏資源建設的動態平衡。因此,基于用戶數據挖掘的采購模式已經越來越受到廣大圖書館采購工作者的關注。

4 用戶數據挖掘對圖書館圖書采購決策的驅動

4.1 本館電子資源使用記錄

目前大部分高校圖書館都會自建具有學校特色的專業數據庫或者購買知網、萬方、超星之類的學術數據庫,這些數據庫內容豐富,囊括了電子報刊、電子書、試題庫和學習庫等電子資源。用戶利用此類數據庫的記錄,可以在很大程度上反映需求狀況和閱讀偏好。

4.2 用戶借閱數據

用戶的借閱數據,例如用戶借閱類目、借閱時間、借閱偏好和借閱數量等借閱數據,為圖書館館藏結構的科學性和合理性提供一定的依據。

4.3 用戶需求信息

用戶需求信息包括用戶通過“薦購系統”、圈選清單或者QQ、微信發送給圖書館的實際圖書需求。因此必須發動師生用戶,積極參與到館藏資源建設中,圖書館準確地掌握用戶的真實需求。特別是學校的學科專家、科研人員提交的圖書需求信息,館內工作人員應該特別加以關注。此外,也應該注意收集用戶與館員在溝通交流中產生的一些隱含需求信息。高校教師獲取館藏文獻資源主要用于教學和科研,而科研需求在研究型院校中尤為明顯。對于學生用戶而言,低年級學生獲取館藏文獻資源主要是為了了解與專業相關的知識,或者通過課外學習增加全方面的知識儲備,而碩士、博士借閱圖書主要是希望有助于開展科研。

4.4 學校專業建設數據

學科建設數據主要通過全校專業設置情況、重點專業、各專業師生數量等數據進行描述。重點專業是學校學科建設的重中之重,一定程度上體現了一所大學的辦學傳統和優勢,而新增專業是各個大學專業建設新的突破口和新的增 長點。

4.5 圖書流通記錄

在圖書館的自動化管理系統中,保存著圖書館全部的圖書流通記錄,包括各專業相關的圖書借閱情況、按分類號統計的各類圖書借閱情況、每種圖書的續借情況、各學科館藏占比(各個不同的學科與圖書館所有的館藏數量的比例)、某圖書的借閱率與該圖書所在學科的平均借閱率的比較數據,該數據可以充分反映某學科內的熱門和冷門圖書,從而反映用戶的需求。

4.6 OPAC檢索信息

OPAC檢索信息中包含著非常龐大的用戶需求,此類信息包含用戶檢索字段的頻率、檢索時間、點擊瀏覽具體類目情況,甚至還有用戶的所屬專業、性別和年級等信息。此類數據能夠全方位地了解檢索者的需求和借閱偏好,非常有助于對用戶需求進行深度挖掘。

4.7 其他相關數據

除上述數據以外,圖書館的整體館藏數據、大型出版社信息、供應商信息、著者信息和新書書目數據對于數據挖掘也具有重要的意義。例如著者信息,不同著者知識結構、職稱和科學人文素養不盡相同,名家經典、權威專業人士的質量總體會更高一點,因此,著者信息也是必不可少的因素之一;而新書書目數據需要盡量做到覆蓋面廣、保證時效、書目信息完整,否則會影響到數據挖掘的效果。

5 圖書采購決策過程中用戶數據挖掘的模式

收集圖書館的大數據尤其是用戶數據,包括本館電子資源使用記錄、用戶借閱數據、用戶需求信息、學校專業建設數據、圖書流通記錄、OPAC檢索信息和其他相關數據等數據,然后導入到SQLServer數據庫中開始數據預處理[3],刪除冗余、不完整和噪聲較多的不科學、不準確的數據;同時剔除已經失效的用戶信息,最后將預處理后的數據表導入到SPSS Clementine軟件中建立模型;最后依據導出的結果,反饋給用戶,進行結果調整。用戶數據挖掘模式如圖1所示。

圖1 用戶數據挖掘模式

5.1 大數據的采集

圖書館在館藏資源信息化建設過程中,產生了大量蘊藏著對于圖書館來說價值連城的數據,包括結構化、半結構化和非結構化數據,包括本館電子資源使用記錄、用戶借閱數據、用戶需求信息、學校專業建設數據、圖書流通記錄、OPAC檢索信息和其他相關數據等數據。

5.2 數據預處理

收集本館電子資源使用記錄、用戶借閱數據、用戶需求信息、學校專業建設數據、圖書流通記錄、OPAC檢索信息和其他相關數據。這些數據可以通過圖書館自動化管理系統以標準格式導出,然后導入到SQLServer 數據庫中進行數據預處理,刪除冗余缺漏、不完整和噪聲較大的不準確數據。

數據預處理過程中,應對所獲取數據進行統一處理,刪除其中的異常數據,同時進行填補缺漏,確保數據格式的一致性;因數據來源各不相同,所以需要將數據格式進行相應統一轉換;合并重復的數據,確保關鍵數據的準確性、完整性和有序性。

5.3 建立模型

決策樹算法通過標引數據中的獨特、顯著特征,并根據這些特征進一步縮小數據集,直到建立清晰、完整的相關性。該算法可以對源數據中的信息做出科學、明確預測;聚類能夠查找多維空間中數據的自然分組,為用戶呈現數據更直觀的一般分組[4]。

SPSS可將用戶各種相關的數據嚴格地按照要求進行全方位、多角度的整體綜合分析,從而深入挖掘用戶對館藏圖書的真實需求,最后根據反饋結果調整本館圖書采購策略,豐富、完善整體館藏結構,進一步提高圖書資源的利用率,更好地實現用戶的需求和完成本館的工作目標。

在SPSS工具中利用分類和回歸樹(C&RT)算法來構建決策樹,對之前預處理過的用戶信息進行深入地數據挖掘。具體操作路線:將預處理后的結果導入到SPSS Clementine軟件中建立模型;然后將各個數據源節點、導出節點、過濾節點、類型節點、分布圖節點和C&RT節點依次連接起來,按照既定方針配置各個參數;最后執行數據分析處理程序。

5.4 結果調整

按照之前的部署,將各個相關數據導入并進行數據挖掘后,導出完整的結果報表,這份價值連城的結果報表可為工作人員提供科學、嚴瑾和全面的采購決策。

系統不僅能通過決策樹方法為圖書采購工作提供決策依據,而且還設計出新書書目,同時可以吸引潛在的用戶群。圖書采購工作人員可以把導出的新書目發送給學校的師生用戶,讓這些用戶再次挑選、評估新書目。根據用戶們的反饋,工作人員可以對決策結果進行人工干預和修正。系統不僅能夠提供科學工具分析后的決策,而且還能讓廣大用戶群體直接參與到采購評估工作中,兩者相輔相成,進一步提高新書采購的科學性和合理性。

數據挖掘是圖書館信息化決策系統的重要組成部分,如何充分利用信息技術、發揮圖書館工作人員的主觀能動性和創造性,構建科學而高效的數據挖掘系統是一個現代化的圖書館必須面對和研究的課題。越來越多的案例證明,利用數據挖掘技術為圖書采購提供決策依據,不僅可以顯著地提高新書采購質量,同時也有助于圖書館能夠采購到學校和用戶都需要的圖書。本文探討了基于用戶數據挖掘的圖書采購模式,為圖書采購決策、管理和服務提供決策支持,是信息技術在圖書采購領域的一次有益嘗試。

[1]宋宇.基于數據挖掘的圖書采購模型研究[J].圖書館學研究,2014(17):53-55.

[2]王芙蓉.大數據環境下基于讀者決策的圖書館文獻資源采購模型研究[J].圖書館學研究,2017(12):54-59.

[3]廖宇峰.基于用戶數據挖掘的圖書館圖書采購模式研究[J].情報探索,2017(4):31-34.

[4]孫元軍,鄭新奇.基于SQL Server的城市地籍空間數據挖掘探討[J].計算機工程與應用,2007(13):200-202.

2095-6835(2020)10-0118-03

G253.1

A

10.15913/j.cnki.kjycx.2020.10.052

廖宇峰,男,碩士,廣東食品藥品職業學院圖書館館員。

2016年廣東省圖書館科研課題“基于用戶數據挖掘的圖書采購模式研究”(編號:GDTK1611)的研究成果之一

〔編輯:嚴麗琴〕

猜你喜歡
數據挖掘圖書館用戶
探討人工智能與數據挖掘發展趨勢
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
飛躍圖書館
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
一種基于Hadoop的大數據挖掘云服務及應用
圖書館里的是是非非
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 91福利片| 中文字幕欧美日韩| 高清色本在线www| 欧美日韩精品一区二区视频| 91小视频在线| 国产黄网永久免费| 欧美yw精品日本国产精品| 日韩免费中文字幕| 亚洲V日韩V无码一区二区| 国产亚洲视频免费播放| 亚洲aⅴ天堂| 国产成人高精品免费视频| 尤物视频一区| 91精品国产一区| 国产成人久久777777| 亚洲码一区二区三区| 欧美国产在线一区| 国产在线八区| 大香伊人久久| 久久国产高潮流白浆免费观看| 色婷婷在线播放| 国产精品亚洲五月天高清| 91啪在线| 在线精品亚洲国产| 亚洲综合网在线观看| 国产SUV精品一区二区| 国产白浆在线观看| 无码'专区第一页| 国产一级二级在线观看| 亚洲人成网站观看在线观看| 日韩高清欧美| 久久永久视频| 美女被狂躁www在线观看| 亚洲男人天堂2020| 婷婷丁香在线观看| 538国产视频| 色哟哟国产精品| 尤物在线观看乱码| 很黄的网站在线观看| av无码一区二区三区在线| 国产本道久久一区二区三区| 亚洲AⅤ综合在线欧美一区| 免费A∨中文乱码专区| 欧美一级在线| 久久视精品| 国产91线观看| 亚洲视频一区在线| 人妻精品全国免费视频| 日日噜噜夜夜狠狠视频| 99热这里只有精品免费| 色综合激情网| 国产成人1024精品下载| 国产乱子伦无码精品小说| 国产高清色视频免费看的网址| 91精品国产情侣高潮露脸| 在线观看亚洲国产| 欧美一级高清免费a| 国产自产视频一区二区三区| 99re热精品视频中文字幕不卡| 人妻丰满熟妇AV无码区| 激情综合网激情综合| 欧美特黄一免在线观看| 久久综合色天堂av| 日本国产精品一区久久久| 久久香蕉国产线| 中国特黄美女一级视频| 国产激情无码一区二区APP| 不卡的在线视频免费观看| 18禁不卡免费网站| 亚洲最黄视频| 国产伦精品一区二区三区视频优播 | 亚洲国产日韩一区| 无码精品福利一区二区三区| 亚欧美国产综合| 91国内在线观看| 久热这里只有精品6| 国产精品无码久久久久AV| 国产国产人成免费视频77777 | 欧美亚洲一二三区| 欧美一级色视频| 啊嗯不日本网站| 一级一毛片a级毛片|