







摘要:該文旨在分析出不同屬性的讀者與借閱的圖書類別之間多維關(guān)聯(lián)規(guī)則,將讀者所在學(xué)院和年級屬性進(jìn)行細(xì)分,與借閱圖書類別三級類目屬性生成多維屬性事務(wù)表,利用維間編碼自連接的方式將多維屬性整合成單維屬性的模式,對不同學(xué)院不同年級2020年下半年借閱數(shù)據(jù)進(jìn)行多維維間和混合維關(guān)聯(lián)規(guī)則分析,根據(jù)讀者細(xì)分程度,得出不同讀者的個性化需求特征,為圖書館優(yōu)質(zhì)的服務(wù)提供有力的理論依據(jù)。
關(guān)鍵詞:多維關(guān)聯(lián)規(guī)則;圖書館;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;借閱數(shù)據(jù)
中圖分類號:TP311 ? ? ? ?文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)32-0018-04
圖書館隨著智能現(xiàn)代化技術(shù)發(fā)展,服務(wù)器里存儲了大量的讀者借閱行為歷史數(shù)據(jù),這些寶貴的數(shù)據(jù)不應(yīng)僅備份起來保持“有”,還應(yīng)該“活用”起來,使這些數(shù)據(jù)能夠“說話”。發(fā)揮他最大的作用。數(shù)據(jù)挖掘技術(shù)是可以讓數(shù)據(jù)活用起來的技術(shù),是可以從大量的、不完全的、有噪聲的、模糊的數(shù)據(jù)中提取隱含在其中的人們事先不知道的、但又是潛在有用的信息和知識。數(shù)據(jù)挖掘技術(shù)常用的有關(guān)聯(lián)規(guī)則、貝葉斯分類算法、決策樹算法、神經(jīng)網(wǎng)絡(luò)算法、支持向量機(jī)、聚類分析、模糊集方法等。其中關(guān)聯(lián)規(guī)則技術(shù)常被用于圖書館借閱數(shù)據(jù)挖掘中,尋找出其中的借閱規(guī)律,為圖書館資源建設(shè)和提供個性化服務(wù)提供理論依據(jù)[1]。
但目前的研究大多僅在圖書類別之間尋找讀者借閱書籍的關(guān)聯(lián)規(guī)則。侯賀[2]將關(guān)聯(lián)規(guī)則應(yīng)用到圖書館流通數(shù)據(jù)挖掘中,是通過館藏量依照中圖法分類分成T類和其他類進(jìn)行圖書類別間的關(guān)聯(lián)分析;聶飛霞[3]是運(yùn)用Apriori算法在圖書館典藏規(guī)劃中的應(yīng)用,通過建模運(yùn)算得出圖書各類別之間的關(guān)聯(lián)規(guī)則;陳淑英[4]也將關(guān)聯(lián)規(guī)則應(yīng)用到高校圖書館圖書推薦服務(wù)中,通過一次抽取不同專業(yè)不同年級的記錄進(jìn)行多維屬性的關(guān)聯(lián)規(guī)則分析,但僅研究的是讀者屬性與書籍類別之間維間關(guān)聯(lián)規(guī)則,如關(guān)聯(lián)規(guī)則{法學(xué)類專業(yè),大一}==> H31,表示該讀者是法學(xué)類專業(yè)一年級的學(xué)生,同時借閱了圖書H31,是維間關(guān)聯(lián)規(guī)則,缺少混合維規(guī)則的挖掘。王蕾[5]的借閱行為大數(shù)據(jù)應(yīng)用于高校圖書館服務(wù)創(chuàng)新的路徑分析文中使用weka將年級、專業(yè)和圖書分類三個字段進(jìn)行關(guān)聯(lián)分析,分析出的也是維間規(guī)則。本文將讀者的屬性所在學(xué)院、年級信息和圖書類別三級目錄屬性多維屬性通過編碼自連接的方式整合成單維屬性,運(yùn)用weka3.8.0數(shù)據(jù)挖掘工具Apriori算法不僅挖掘出維間規(guī)則,同時挖掘出混合維關(guān)聯(lián)規(guī)則,分析出更多潛在的信息,為圖書館更好地發(fā)展提供豐富的理論依據(jù)。
1關(guān)聯(lián)規(guī)則
1.1 關(guān)聯(lián)規(guī)則基本概念
關(guān)聯(lián)規(guī)則就是發(fā)現(xiàn)描述數(shù)據(jù)庫中數(shù)據(jù)項(xiàng)之間潛在的關(guān)聯(lián),找出大量數(shù)據(jù)之間未知的、有用的依賴關(guān)系。一個關(guān)聯(lián)規(guī)則是[X?Y]的形式,即[A1?A2?…?Am?B1?B2?…?Bn]規(guī)則樣式,其中[Ai和Bj均為屬性值],[X?Y]表明滿足X中條件的數(shù)據(jù)庫元組多半也滿足Y中的條件,X為規(guī)則的前項(xiàng),Y稱為結(jié)果的后項(xiàng)。
定義1:數(shù)據(jù)項(xiàng)和事務(wù)
設(shè)[I=i1,i2,...,im]是m個不同項(xiàng)目的一個集合,每個[ikk=1,2,...,m]稱為數(shù)據(jù)項(xiàng)(Item),數(shù)據(jù)項(xiàng)的集合I稱為數(shù)據(jù)項(xiàng)集。
事務(wù)T(Transaction)是數(shù)據(jù)項(xiàng)集I上的一個子集,即[T?I]。每個事務(wù)均有一個唯一的標(biāo)識符TID與之相聯(lián),不同事務(wù)的全體構(gòu)成了全體事務(wù)集D(即事務(wù)數(shù)據(jù)庫)[6]。
定義2:支持度和置信度
關(guān)聯(lián)規(guī)則的支持度就是事務(wù)集中同時包含X和Y出現(xiàn)的概率,即:
[SupportX?Y=P(X?Y)]
關(guān)聯(lián)規(guī)則的置信度就是在數(shù)據(jù)集X出現(xiàn)的前提下Y出現(xiàn)的概率,即:
[ConfidenceX?Y=P(Y|X)]
定義3:提升度
由于支持度和置信度不足以過濾掉一些無用的關(guān)聯(lián)規(guī)則,再引入提升度作為度量參數(shù),提升度是含有X的條件下同時含有Y的概率與Y總體發(fā)生的概率之比,即:
[LiftX?Y=PY|X/P(Y)]
用來描述X對Y的影響力大小,若值小于1,意味著一個出現(xiàn)可能導(dǎo)致另一個不出現(xiàn),只有值大于1時的關(guān)聯(lián)規(guī)則才有意義[7]。
1.2多維關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則依照數(shù)據(jù)的維數(shù)可分為單維關(guān)聯(lián)規(guī)則和多維關(guān)聯(lián)規(guī)則。如規(guī)則[BookTP3?BookH2],其中TP3和H2是讀者借閱書籍的分類號,是屬于同一個屬性范圍,只有一個謂詞,這是單維關(guān)聯(lián)規(guī)則。涉及兩個屬性或兩個以上謂詞的關(guān)聯(lián)規(guī)則就是多維關(guān)聯(lián)規(guī)則。比如[Dept(X,計算機(jī)專業(yè))?Grade(X,"2")]
[?Book(X,"TP312")],這里就有三個謂詞(Dept、Grade和Book)。規(guī)則中的謂詞只出現(xiàn)一次稱為無重復(fù)謂詞,這樣的關(guān)聯(lián)規(guī)則稱為維間關(guān)聯(lián)規(guī)則(不允許維重復(fù)出現(xiàn)),另外一種允許維在規(guī)則的左右同時出現(xiàn)的,稱為混合維關(guān)聯(lián)規(guī)則,比如[Dept(X,計算機(jī)專業(yè)")?Book(X,"TP311")?Book(X,"I247")],規(guī)則前后項(xiàng)都出現(xiàn)了Book謂詞[8]。
2多維關(guān)聯(lián)規(guī)則在圖書館中數(shù)據(jù)挖掘
2.1數(shù)據(jù)采集
考慮2020年疫情原因,上半年沒有可用的借閱數(shù)據(jù),僅拉取2020年下半年的借閱流通數(shù)據(jù)作為數(shù)據(jù)源。因本次數(shù)據(jù)挖掘需要考慮讀者所在學(xué)院和年級,還選取了讀者庫和館藏清單用來提取讀者對應(yīng)的學(xué)院和年級屬性、所借閱書籍分類號。在智慧借閱系統(tǒng)里選擇2020年9月份~2021年1月份的2017級~2020級大學(xué)四個年級4685名本科生36485筆借閱數(shù)據(jù)和對應(yīng)的讀者庫和2000年以來的館藏清單數(shù)據(jù)。
2.2 數(shù)據(jù)的預(yù)處理
數(shù)據(jù)預(yù)處理是在分析之前對原始數(shù)據(jù)進(jìn)行必要的清理、集成、轉(zhuǎn)換、歸約等一系列處理工作,本文重點(diǎn)在于對多維數(shù)據(jù)的處理,將多維數(shù)據(jù)形式通過編碼自連接的方式轉(zhuǎn)換為單維數(shù)據(jù)形式。
先對借閱流通數(shù)據(jù)做簡單清洗,刪除空白項(xiàng)、缺失項(xiàng)、無效項(xiàng)等數(shù)據(jù)行,再刪除其他無用的屬性列,包括圖書財產(chǎn)號列、借書還書時間列、操作人員列。通過讀者庫和館藏清單,將讀者的學(xué)院、年級和圖書分類號信息對應(yīng)到讀者ID上,經(jīng)處理得到3660名本科生23326筆有效的借閱數(shù)據(jù)。構(gòu)成一個新的讀者借閱流通表,如表1所示。
因直接對圖書分類號進(jìn)行關(guān)聯(lián)分析,得到的數(shù)據(jù)是稀疏的,分析不出實(shí)際意義,需要對圖書分類號依照中圖法進(jìn)行三級分類數(shù)據(jù)合并,對學(xué)院和年級進(jìn)行簡化編碼,學(xué)院名稱統(tǒng)一簡化為首字母縮寫,年級統(tǒng)一用1、2、3、4來表示,如機(jī)械學(xué)院大四學(xué)生簡化為jx4。再通過屬性間邏輯與自連接的方式將讀者屬性與所借閱圖書分類號進(jìn)行融合,將多維屬性轉(zhuǎn)換為單維屬性的形式,最終處理如表2所示。
根據(jù)Weka可以識別的數(shù)據(jù)形式,將此表建立事務(wù)數(shù)據(jù)庫,每個讀者借閱數(shù)據(jù)為一個事務(wù)項(xiàng)目,把每個讀者-圖書值列為一個數(shù)據(jù)項(xiàng)屬性,并保存為.csv格式。
2.3模型建立與分析
2.3.1模型建立
依照中圖法的22大類,將借閱圖書分類號的第一級大類分解出來,進(jìn)行統(tǒng)計分析,借閱范圍大致分布如圖1。
從圖1可知,文學(xué)I類借閱量占整體的46%,借閱量比較大,將所借圖書類別一起進(jìn)行關(guān)聯(lián)分析,其結(jié)果會出現(xiàn)關(guān)聯(lián)關(guān)系集中在文學(xué)類書籍上,不能深入挖掘出其他類別書籍關(guān)聯(lián)結(jié)果,為此我們把讀者借閱的模式分為2種類型:一種是借閱了I文學(xué)類書籍的讀者;另一種是借閱了非文學(xué)類書籍的讀者。
2.3.2 文學(xué)類讀者與圖書類別間關(guān)聯(lián)分析
應(yīng)用Weka3.8.0數(shù)據(jù)挖掘工具[9],使用preprocess模塊打開需要分析的csv文件,選擇Associate關(guān)聯(lián)規(guī)則模塊,運(yùn)用Apriori算法對參數(shù)進(jìn)行設(shè)置,經(jīng)多次試驗(yàn)選用lowerBoundMinSupport為0.5%,MetricType為Confidence,MinMetric為0.1,運(yùn)行結(jié)果如表3和表4。
從表3關(guān)聯(lián)結(jié)果可以看出:
(1)文學(xué)類書籍屬于通識類書籍,大一、大二年級學(xué)生主要課程以基礎(chǔ)課為主,極少涉及到專業(yè)類課程,他們大多借閱書籍以文學(xué)類為主,各學(xué)院大一、大二年級的讀者有2%以上都借閱了文學(xué)類書籍,而大三、大四年級的讀者相對較少,不到1%,說明隨著專業(yè)課的開展和學(xué)習(xí),讀者的偏好有所轉(zhuǎn)移,涉獵了更廣泛類別的書籍。
(2)其中文學(xué)類書籍最受歡迎的是I24中國文學(xué)小說和I56外國文學(xué)小說,70%以上讀者借閱了I24類書籍,25%以上讀者借閱了I56類書籍,而且各學(xué)院各年級都有借閱比例,尤其借閱比例高的是文法學(xué)院和機(jī)械學(xué)院讀者,且I56外國文學(xué)類書籍集中借閱在文法學(xué)院各年級。
(3)這些規(guī)則提升度都大于1,說明規(guī)則前項(xiàng)和后項(xiàng)是正相關(guān)關(guān)系,前項(xiàng)的出現(xiàn)都會有后項(xiàng)同時出現(xiàn),如{文法學(xué)院,大三}==>I56,提升度是2.97,意味著文法學(xué)院大一年級的讀者借閱I56類書籍是所有讀者隨機(jī)借閱I56類書籍的2.97倍。
從表4混合維關(guān)聯(lián)規(guī)則可知:
(1)財經(jīng)學(xué)院、機(jī)械學(xué)院、文法學(xué)院、物電學(xué)院大一新生借閱了I24中國小說類書籍的讀者有60%以上都同時借閱了I26中國散文集書籍,文法學(xué)院和財經(jīng)學(xué)院文科類學(xué)院學(xué)生涉及的類別相對較多些,財經(jīng)學(xué)院大一新生有88%讀者還同時借閱了I71外國文學(xué)類書籍,文法學(xué)院大一、大二學(xué)生有71%都借閱了I21中國作品集。
(2)這些規(guī)則提升度都在27.45以上,表明前項(xiàng)后項(xiàng)關(guān)聯(lián)性很強(qiáng),如規(guī)則1,讀者是財經(jīng)學(xué)院大一新生借閱了I24類書籍,同時也借閱了I71類書籍的概率是讀者隨機(jī)借閱I71類書籍的45.79倍。
2.3.3 非文學(xué)類讀者與圖書類別間關(guān)聯(lián)分析
運(yùn)用Weka3.8.0挖掘工具,選擇非文學(xué)類讀者借閱數(shù)據(jù)表進(jìn)行分析,使用associate關(guān)聯(lián)規(guī)則模塊,對Apriori算法的參數(shù)進(jìn)行設(shè)置,設(shè)置參數(shù)lowerBoundMinSupport為0.5%,MetricType為Confidence,MinMetric為0.1,挖掘結(jié)果如下表5和表6。
從表5關(guān)聯(lián)規(guī)則結(jié)果可知:
(1)非文學(xué)類書籍大多是偏專業(yè)性強(qiáng)的書籍,大多借閱集中在大三大四年級,借閱比例較高的有物電學(xué)院大三學(xué)生借閱了H31英語類書籍,數(shù)信學(xué)院大四學(xué)生借閱了O17數(shù)學(xué)分析類書籍,建藝學(xué)院大三學(xué)生借閱了TU98區(qū)域規(guī)劃類書籍,計算機(jī)學(xué)院大三學(xué)生借閱了TP31計算機(jī)軟件類書籍,機(jī)械學(xué)院大四學(xué)生借閱了TH12機(jī)械設(shè)計類書籍,但也有建藝學(xué)院和計算機(jī)學(xué)院大一大二學(xué)生也開始閱讀TU20建筑學(xué)一般性問題類書籍和TP31計算機(jī)軟件類書籍。
(2)因?qū)I(yè)內(nèi)容范圍的不同,有的學(xué)院學(xué)生借閱書籍類別比較單一,有些則涉及類別比較多樣,如數(shù)信學(xué)院大二、大三、大四學(xué)生有30%以上都借閱了O17數(shù)學(xué)分析類書籍,計算機(jī)學(xué)院大一、大二、大三、大四學(xué)生有34%以上都借閱了TP31類書籍,而且隨著年級提高借閱比例也提高,計算機(jī)學(xué)院大四學(xué)生有88%比例都借閱了TP31類書籍。物電學(xué)院大三學(xué)生都分別有31%借閱了H31英語類書籍,27%借閱了O44電磁學(xué)類書籍,20%借閱了TP31計算機(jī)類書籍,機(jī)械學(xué)院大四學(xué)生都分別有35%借閱了TG50機(jī)床加工類書籍,68%借閱了TH12機(jī)械設(shè)計類書籍,25%借閱了TP31計算機(jī)軟件類書籍。
(3)從提升度來看,有相當(dāng)一部分關(guān)聯(lián)規(guī)則的提升度很高,表明因前項(xiàng)出現(xiàn)導(dǎo)致后項(xiàng)出現(xiàn)概率比后項(xiàng)隨機(jī)出現(xiàn)概率高許多,前后項(xiàng)有很強(qiáng)的關(guān)聯(lián)性,比如關(guān)聯(lián)規(guī)則{數(shù)信學(xué)院,大四}==>O17的提升度為49.13,數(shù)信學(xué)院,大四的學(xué)生借閱O17類書籍是任意學(xué)生借閱O17書籍的49.13倍。
從表6生成的關(guān)聯(lián)規(guī)則可知:
(1)因?qū)I(yè)類知識學(xué)習(xí)也是逐漸遞增的過程,從基礎(chǔ)類專業(yè)到某方向類專業(yè),大多學(xué)生借閱了某類別的書籍后同時也會借閱同類別其他書籍,如機(jī)械學(xué)院大四學(xué)生借閱了TG50機(jī)床一般性問題,有60%借閱了TH12機(jī)械設(shè)計類和80%借閱了TH16機(jī)械制造工藝類書籍,計算機(jī)學(xué)院大三學(xué)生借閱了TP30計算機(jī)一般性問題,有100%借閱了TP3-0計算機(jī)理論類書籍和50%借閱了TP31計算機(jī)軟件類書籍,建藝學(xué)院大四學(xué)生借閱了TU-0建筑理論類書籍,有67%借閱了TU20建筑設(shè)計一般性問題和67%借閱了TU98區(qū)域規(guī)劃類書籍。
(2)有的學(xué)院專業(yè)知識比較集中,借閱書籍類別相對較少,如化工學(xué)院大四學(xué)生借閱了O65分析化學(xué)類書籍100%都會借閱O62有機(jī)化學(xué)類書籍,數(shù)信學(xué)院大四學(xué)生借閱了O15代數(shù)類書籍78%會借閱O17數(shù)學(xué)分析類書籍。
(3)因有的專業(yè)界限清晰,不會涉及跨專業(yè)類學(xué)科,分析出的關(guān)聯(lián)規(guī)則提升度超過100,如化工學(xué)院借閱的書籍是有關(guān)化學(xué)方面的,建藝學(xué)院借閱的書籍都是建筑設(shè)計類書籍,與其他學(xué)院專業(yè)知識基本無交叉,意味著只有化工學(xué)院的學(xué)生才會借閱O62、O65類書籍,只有建藝學(xué)院學(xué)生才會借閱TU建筑設(shè)計類書籍,這些關(guān)聯(lián)規(guī)則極強(qiáng)。
3 多維關(guān)聯(lián)規(guī)則在圖書館的應(yīng)用分析
3.1 優(yōu)化館藏資源建設(shè)
通過對2020年下半年本科四個年級的圖書借閱數(shù)據(jù)分析,可以看出大概有近一半的學(xué)生都偏愛文學(xué)類書籍,尤其是低年級的大一和大二學(xué)生,本校目前只有一個文學(xué)庫,借此圖書館擴(kuò)建時機(jī),可以考慮增加書籍館藏量并增設(shè)文學(xué)庫,來滿足讀者對文學(xué)類書籍的需求。
依照讀者借閱書籍的關(guān)聯(lián)關(guān)系,還可以適當(dāng)調(diào)整館藏布局,將借閱關(guān)聯(lián)度大的書籍就近放置,方便讀者尋找和閱讀。如I24、I56中外文小說類書籍深受讀者喜愛,可以適當(dāng)優(yōu)化館藏布局,為讀者快速找到自己偏愛的書籍提供便利。
3.2 提供個性化服務(wù)
通過讀者大量的歷史借閱數(shù)據(jù),不僅分析出讀者與圖書的維間關(guān)聯(lián)性,還分析出讀者不同學(xué)院不同年級借閱圖書的混合維關(guān)聯(lián)關(guān)系,細(xì)化了讀者屬性,明確了讀者需求分布特征,可以更加精準(zhǔn)地指導(dǎo)圖書館進(jìn)行個性化推薦服務(wù)、個性化檢索和推送服務(wù)。如讀者是大一學(xué)生,都可以給讀者推薦I24、I56文學(xué)類書籍;計算機(jī)學(xué)院的學(xué)生,可以給讀者推薦TP31計算機(jī)軟件類書籍;機(jī)械學(xué)院大四的學(xué)生,都可以推薦TH12機(jī)械設(shè)計類書籍和TP31計算機(jī)類書籍,如果讀者借閱過TG50機(jī)床類書籍,且是機(jī)械學(xué)院大四的學(xué)生,可以給讀者推薦TH12機(jī)械設(shè)計類書籍。建立圖書推薦系統(tǒng),將被動服務(wù)變?yōu)橹鲃臃?wù),主動根據(jù)數(shù)據(jù)分析結(jié)果預(yù)測讀者可能喜愛的書籍,不僅可以縮短讀者借閱圖書的時間,還可以快速找到讀者偏愛的書籍,節(jié)約了讀者的時間,同時也提高了書籍流通率和借閱率,將圖書館的價值充分發(fā)揮出來。
3.3 學(xué)科服務(wù)
通過讀者不同學(xué)院不同年級對借閱書籍的關(guān)聯(lián)規(guī)則,可以找出不同讀者對借閱的圖書類別的分布特征,可以與所在學(xué)院和年級進(jìn)行合作,開展一些文獻(xiàn)信息咨詢服務(wù)和文獻(xiàn)資源分布指南培訓(xùn)等活動,并嵌入到學(xué)院、教學(xué)第一線的信息素養(yǎng)教育中,使讀者更深入地了解圖書館資源信息分布,使資源被充分利用起來。也從中挖掘出學(xué)科間隱藏的關(guān)聯(lián),可以引導(dǎo)讀者拓寬閱讀范圍,為跨學(xué)科建設(shè)指明方向。
4 結(jié)論
本文以讀者屬性所在學(xué)院、年級、所借閱圖書來建立挖掘的體系架構(gòu),不僅細(xì)化了讀者屬性,也將圖書的類別依照中圖法劃分成三級類目,將多維屬性通過編碼自連接的方式轉(zhuǎn)換成單維屬性,運(yùn)用Weka3.8.0數(shù)據(jù)挖掘工具進(jìn)行多維關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,分析出維間規(guī)則和混合維規(guī)則豐富的潛在信息,其結(jié)果不僅可以指導(dǎo)圖書館優(yōu)化館藏資源建設(shè),還可以為讀者提供更精準(zhǔn)的個性化服務(wù)和學(xué)科服務(wù)。但本文僅使用了關(guān)聯(lián)規(guī)則一種數(shù)據(jù)挖掘技術(shù),在以后的研究中應(yīng)加入更多的數(shù)據(jù)挖掘技術(shù)如聚類分析、分類分析、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林等算法,挖掘出更多潛在和可用的信息,以此來進(jìn)一步指導(dǎo)高校圖書館發(fā)揮更大的服務(wù)職能。
參考文獻(xiàn):
[1] 馮磊.大數(shù)據(jù)挖掘在高校圖書館個性化服務(wù)中應(yīng)用研究[J].圖書館學(xué)刊,2019,41(1):109-112.
[2] 侯賀.基于關(guān)聯(lián)規(guī)則的圖書館流通數(shù)據(jù)挖掘——以深圳大學(xué)城圖書館為例[J].圖書館學(xué)刊,2017,39(2):107-111.
[3] 聶飛霞,陳長明.Apriori算法在圖書館典藏規(guī)劃中的應(yīng)用[J].情報探索,2018(7):30-35.
[4] 陳淑英, 徐劍英.關(guān)聯(lián)規(guī)則應(yīng)用下的高校圖書館圖書推薦服務(wù)[J].圖書館論壇,2018 (2):97-102.
[5] 王蕾, 高翔.借閱行為大數(shù)據(jù)應(yīng)用于高校圖書館服務(wù)創(chuàng)新的路徑分析[J].大學(xué)圖書館情報學(xué)刊, 2020(11):107-120.
[6] 鄭繼剛. 數(shù)據(jù)挖掘及其應(yīng)用研究[M].昆明:云南大學(xué)出版社,2014.
[7] 李珺, 劉鶴. 基于改進(jìn)的K-means算法的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘研究[J].小型微型計算機(jī)系統(tǒng),2021(1):15-19.
[8] 溫海波.多維關(guān)聯(lián)規(guī)則在圖書館中的應(yīng)用研究[D].合肥:合肥工業(yè)大學(xué),2013: 9-11.
[9] 周捷, 章增安.基于大數(shù)據(jù)的高校圖書館個性化推薦書目生成研究[J].晉圖學(xué)刊,2017(5):29-33.
【通聯(lián)編輯:王力】
收稿日期:2021-04-10
基金項(xiàng)目:河南理工大學(xué)人文社科基金資助,年度項(xiàng)目“改進(jìn)Apriori算法在圖書館信息知識發(fā)現(xiàn)中應(yīng)用分析”(項(xiàng)目編號:722618/172)
作者簡介:李華群(1985—),女,河南省焦作市人,河南理工大學(xué)圖書館助理館員,碩士研究生,主要研究方向:圖書情報、數(shù)據(jù)挖掘。