999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

預(yù)測(cè)模型對(duì)多校區(qū)圖書館典藏規(guī)劃的啟示

2014-06-26 20:09:53聶飛霞
河南圖書館學(xué)刊 2014年3期

聶飛霞

關(guān)鍵詞:預(yù)測(cè);多校區(qū)圖書館;典藏規(guī)劃

摘 要:隨著高校圖書館的多校區(qū)發(fā)展,圖書館典藏工作迎來了新的挑戰(zhàn)。文章提出了運(yùn)用預(yù)測(cè)技術(shù)對(duì)圖書借閱量進(jìn)行預(yù)測(cè)分析,從而使多校區(qū)圖書館的典藏工作更加科學(xué)有效的方法。

中圖分類號(hào):G250.78 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-1588(2014)03-0118-03

進(jìn)入2012年,“大數(shù)據(jù)”這個(gè)專有名詞開始出現(xiàn)在人們的視野中,各行各業(yè)的專家學(xué)者開始提出“大數(shù)據(jù)時(shí)代”所帶來的挑戰(zhàn)。那么,何謂“大數(shù)據(jù)”?目前業(yè)內(nèi)對(duì)“大數(shù)據(jù)”一詞仍沒有統(tǒng)一的定義,但筆者認(rèn)為,大數(shù)據(jù)(Big Data)就是指隨著某一行業(yè)的發(fā)展而不斷增長(zhǎng)的數(shù)據(jù)量,它并不是一種技術(shù),而是人們對(duì)龐大繁雜數(shù)據(jù)的一個(gè)稱謂。由于其量的龐大,使得我們經(jīng)常所用到的統(tǒng)計(jì)分析功能已經(jīng)無從下手。所以,在“大數(shù)據(jù)”時(shí)代,一種技術(shù)再一次得到升溫,那就是數(shù)據(jù)挖掘技術(shù)。

數(shù)據(jù)挖掘(Data Mining)技術(shù)在1998年作為一種數(shù)據(jù)處理技術(shù)概念被提出,并在上世紀(jì)末開始活躍于各個(gè)領(lǐng)域[1]。其在圖書館領(lǐng)域的應(yīng)用晚于諸如通信、銀行等其他行業(yè),但數(shù)據(jù)挖掘技術(shù)在其他領(lǐng)域的廣泛應(yīng)用,給其在圖書館的應(yīng)用打下了良好基礎(chǔ)。作為圖書館工作的重中之重,隨著RFID (Radio Frequency Identification)射頻識(shí)別技術(shù)在圖書館的應(yīng)用,使得典藏工作更加科學(xué)系統(tǒng)化。然而,由于國(guó)內(nèi)很多大學(xué)圖書館都實(shí)行了多校區(qū)辦館,在適應(yīng)了高?,F(xiàn)有的多校區(qū)辦學(xué)的現(xiàn)狀的同時(shí),卻給典藏工作帶來了前所未有的挑戰(zhàn)[2]。面對(duì)因?yàn)槎嘈^(qū)辦館而激增的流通數(shù)據(jù),如何從這些龐大的數(shù)據(jù)源中發(fā)現(xiàn)真正有利于多校區(qū)典藏規(guī)劃的信息呢?如何使得多校區(qū)典藏工作更加科學(xué)有效呢?數(shù)據(jù)挖掘的分析方法主要有分類、預(yù)測(cè)、關(guān)聯(lián)規(guī)則、聚類分析、回歸、順序規(guī)則、時(shí)間序列和決策樹。這些分析方法都可以用來建立一些模型,這些模型可以用來描述數(shù)據(jù)之間的聯(lián)系以及模式[3]。筆者主要介紹如何將數(shù)據(jù)挖掘技術(shù)之一的預(yù)測(cè)技術(shù)應(yīng)用于多校區(qū)典藏規(guī)劃中。

1 如何建立多校區(qū)典藏預(yù)測(cè)模型

預(yù)測(cè),即Forecast。預(yù)測(cè)技術(shù)是通過已知數(shù)據(jù)來了解事物今后發(fā)展情況和走勢(shì)的技術(shù)。建立預(yù)測(cè)模型的方法有很多,常用的方法有回歸分析預(yù)測(cè)、趨勢(shì)外推預(yù)測(cè)、基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)和時(shí)間序列預(yù)測(cè)等。

1.1 分析預(yù)測(cè)目標(biāo)以及確定預(yù)測(cè)時(shí)間

多校區(qū)辦館導(dǎo)致了圖書館典藏機(jī)制面臨重大的挑戰(zhàn)——[KG*4]一類圖書放到哪個(gè)學(xué)區(qū)才能使其被充分利用。因此,筆者的分析目標(biāo)就是圖書需要的科學(xué)擺放區(qū)域,而預(yù)測(cè)時(shí)間選擇為十二年。

1.2 預(yù)測(cè)前期的資料采集與調(diào)研

圖書館典藏工作中的圖書擺放模式有兩種,一種是按照內(nèi)容的擺放,例如分類排架;另一種是按照?qǐng)D書的形式擺放,例如裝訂方式排架等[4]。目前,高校圖書館運(yùn)用較多的是按照索取號(hào)排架的方法。由于索取號(hào)是由分類號(hào)和著者編號(hào)組合而成,因此在進(jìn)行數(shù)據(jù)挖掘的前期可以對(duì)圖書進(jìn)行分類號(hào)的特征采集,這有利于我們下一步預(yù)測(cè)方法的選擇。以西北大學(xué)圖書館的借閱數(shù)據(jù)為例,由于西北大學(xué)圖書館有南區(qū)圖書館和北區(qū)圖書館兩個(gè)分館,需要預(yù)測(cè)某一特征的圖書某一年在南北分館的借閱量,以此來確定典藏地點(diǎn)的分配(見表1)。如表1所示,北校區(qū)圖書館借閱量為Nyi,南校區(qū)圖書館借閱量為Syj,表1為某類特征值圖書兩校區(qū)借閱數(shù)量統(tǒng)計(jì)。

1.3 選擇一種適用方法

如表1所示,特征采集過程中兩個(gè)校區(qū)的借閱量是我們要預(yù)測(cè)的對(duì)象。預(yù)測(cè)建模的諸多方法中,回歸分析預(yù)測(cè)建模中的一元線性回歸預(yù)測(cè)方法可以應(yīng)用到多校區(qū)借閱量預(yù)測(cè)中。

1.4 對(duì)預(yù)測(cè)結(jié)果的分析與評(píng)估

通過一元線性回歸預(yù)測(cè)方法,我們可以預(yù)測(cè)到一個(gè)分類號(hào)在兩校區(qū)的借閱趨勢(shì)。這里應(yīng)該對(duì)預(yù)測(cè)的結(jié)果進(jìn)行分析與評(píng)估,確定結(jié)果是否符合預(yù)測(cè)的要求,并運(yùn)用預(yù)測(cè)模型進(jìn)行檢驗(yàn),以此來比較本次預(yù)測(cè)的精確度。

[HS2]2 一元線性回歸預(yù)測(cè)模型的應(yīng)用

一元線性回歸分析是處理兩個(gè)變量x(自變量)和y(因變量)之間關(guān)系的最簡(jiǎn)單的模型,研究的是這兩個(gè)變量之間的線性相關(guān)關(guān)系[3]。一元回歸的公式為:

yi=a+bxi+ui(i=1,2,…n)

其中u是一個(gè)隨機(jī)變量,稱為隨機(jī)項(xiàng);a、b是兩個(gè)常數(shù),稱為回歸系數(shù)(參數(shù));i表示變量的第i個(gè)觀察值,共有n組樣本觀察值。

由于需要預(yù)測(cè)某一特征的圖書在兩個(gè)分館的借閱量,所以本次預(yù)測(cè)因變量y分別設(shè)為y1(北校區(qū)圖書館借閱量)、y2(南校區(qū)圖書館借閱量)。在得到預(yù)測(cè)結(jié)果y1和y2后,通過設(shè)計(jì)SQL語(yǔ)句來比較y1與y2的結(jié)果值,從而返回典藏地點(diǎn)的推薦值。以下為一元回歸預(yù)測(cè)的具體過程(見表2)。

3 預(yù)測(cè)模型對(duì)多校區(qū)典藏規(guī)劃的啟示

3.1 預(yù)測(cè)前期工作簡(jiǎn)單化

該預(yù)測(cè)模型前期數(shù)據(jù)準(zhǔn)備工作為數(shù)據(jù)的特征提取,這里提取了圖書的分類號(hào)作為分析的目標(biāo)。例如:需要分析“數(shù)據(jù)挖掘技術(shù)與應(yīng)用”這一類的書,我們提取到的特征為TP274,以TP274為分析目標(biāo)在圖書館自動(dòng)化系統(tǒng)中統(tǒng)計(jì)出分析范圍內(nèi)(十二年)的借閱量。

3.2 預(yù)測(cè)模型應(yīng)用簡(jiǎn)單化

預(yù)測(cè)模型建立起來后,典藏工作人員只需將分析范圍內(nèi)(十二年)的借閱數(shù)據(jù)輸入模型,系統(tǒng)會(huì)自動(dòng)生成回歸方程(如y1[DD(-*5]∧[DD)]=20.9895+1.217x),只需要選擇需要預(yù)測(cè)的年份(如2014年),就可以得到某一類圖書在某一年內(nèi)在各個(gè)校區(qū)的借閱量預(yù)測(cè)結(jié)果。

3.3 對(duì)非典藏領(lǐng)域的啟示

該預(yù)測(cè)模型建立起來后,可以預(yù)測(cè)某特征類型的圖書的多校區(qū)借閱量,可以指導(dǎo)典藏規(guī)劃實(shí)施圖書的具體布局。對(duì)于借閱量在某一閾值以下的圖書,典藏部門可以對(duì)該類圖書進(jìn)行剔舊或者下架處理,而采訪部門可以少量購(gòu)買或者不予購(gòu)買。同時(shí),對(duì)于借閱量大于某一閾值的圖書,典藏部門可以開設(shè)特色化服務(wù)進(jìn)行推薦,而采訪部門可以通過增加復(fù)本或增加同類書來滿足讀者的要求。

參考文獻(xiàn):

[1] Han Jiawei,Kamber Micheline.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:高等教育出版社,2001:42-60.

[2] 賈宇群, 李桂祥, 劉東燕.多校區(qū)模式下高校圖書館文獻(xiàn)資源的布局與管理[J].情報(bào)科學(xué),2009(3).

[3] 陳燕.數(shù)據(jù)挖掘技術(shù)與應(yīng)用[M].北京:清華大學(xué)出版社,2011:72-80

[4] 林曉玲,楊明華.RFID圖書管理系統(tǒng)中圖書定位排架方式探析[J].圖書館論壇,2012(3).

(編校:崔萌)endprint

關(guān)鍵詞:預(yù)測(cè);多校區(qū)圖書館;典藏規(guī)劃

摘 要:隨著高校圖書館的多校區(qū)發(fā)展,圖書館典藏工作迎來了新的挑戰(zhàn)。文章提出了運(yùn)用預(yù)測(cè)技術(shù)對(duì)圖書借閱量進(jìn)行預(yù)測(cè)分析,從而使多校區(qū)圖書館的典藏工作更加科學(xué)有效的方法。

中圖分類號(hào):G250.78 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-1588(2014)03-0118-03

進(jìn)入2012年,“大數(shù)據(jù)”這個(gè)專有名詞開始出現(xiàn)在人們的視野中,各行各業(yè)的專家學(xué)者開始提出“大數(shù)據(jù)時(shí)代”所帶來的挑戰(zhàn)。那么,何謂“大數(shù)據(jù)”?目前業(yè)內(nèi)對(duì)“大數(shù)據(jù)”一詞仍沒有統(tǒng)一的定義,但筆者認(rèn)為,大數(shù)據(jù)(Big Data)就是指隨著某一行業(yè)的發(fā)展而不斷增長(zhǎng)的數(shù)據(jù)量,它并不是一種技術(shù),而是人們對(duì)龐大繁雜數(shù)據(jù)的一個(gè)稱謂。由于其量的龐大,使得我們經(jīng)常所用到的統(tǒng)計(jì)分析功能已經(jīng)無從下手。所以,在“大數(shù)據(jù)”時(shí)代,一種技術(shù)再一次得到升溫,那就是數(shù)據(jù)挖掘技術(shù)。

數(shù)據(jù)挖掘(Data Mining)技術(shù)在1998年作為一種數(shù)據(jù)處理技術(shù)概念被提出,并在上世紀(jì)末開始活躍于各個(gè)領(lǐng)域[1]。其在圖書館領(lǐng)域的應(yīng)用晚于諸如通信、銀行等其他行業(yè),但數(shù)據(jù)挖掘技術(shù)在其他領(lǐng)域的廣泛應(yīng)用,給其在圖書館的應(yīng)用打下了良好基礎(chǔ)。作為圖書館工作的重中之重,隨著RFID (Radio Frequency Identification)射頻識(shí)別技術(shù)在圖書館的應(yīng)用,使得典藏工作更加科學(xué)系統(tǒng)化。然而,由于國(guó)內(nèi)很多大學(xué)圖書館都實(shí)行了多校區(qū)辦館,在適應(yīng)了高校現(xiàn)有的多校區(qū)辦學(xué)的現(xiàn)狀的同時(shí),卻給典藏工作帶來了前所未有的挑戰(zhàn)[2]。面對(duì)因?yàn)槎嘈^(qū)辦館而激增的流通數(shù)據(jù),如何從這些龐大的數(shù)據(jù)源中發(fā)現(xiàn)真正有利于多校區(qū)典藏規(guī)劃的信息呢?如何使得多校區(qū)典藏工作更加科學(xué)有效呢?數(shù)據(jù)挖掘的分析方法主要有分類、預(yù)測(cè)、關(guān)聯(lián)規(guī)則、聚類分析、回歸、順序規(guī)則、時(shí)間序列和決策樹。這些分析方法都可以用來建立一些模型,這些模型可以用來描述數(shù)據(jù)之間的聯(lián)系以及模式[3]。筆者主要介紹如何將數(shù)據(jù)挖掘技術(shù)之一的預(yù)測(cè)技術(shù)應(yīng)用于多校區(qū)典藏規(guī)劃中。

1 如何建立多校區(qū)典藏預(yù)測(cè)模型

預(yù)測(cè),即Forecast。預(yù)測(cè)技術(shù)是通過已知數(shù)據(jù)來了解事物今后發(fā)展情況和走勢(shì)的技術(shù)。建立預(yù)測(cè)模型的方法有很多,常用的方法有回歸分析預(yù)測(cè)、趨勢(shì)外推預(yù)測(cè)、基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)和時(shí)間序列預(yù)測(cè)等。

1.1 分析預(yù)測(cè)目標(biāo)以及確定預(yù)測(cè)時(shí)間

多校區(qū)辦館導(dǎo)致了圖書館典藏機(jī)制面臨重大的挑戰(zhàn)——[KG*4]一類圖書放到哪個(gè)學(xué)區(qū)才能使其被充分利用。因此,筆者的分析目標(biāo)就是圖書需要的科學(xué)擺放區(qū)域,而預(yù)測(cè)時(shí)間選擇為十二年。

1.2 預(yù)測(cè)前期的資料采集與調(diào)研

圖書館典藏工作中的圖書擺放模式有兩種,一種是按照內(nèi)容的擺放,例如分類排架;另一種是按照?qǐng)D書的形式擺放,例如裝訂方式排架等[4]。目前,高校圖書館運(yùn)用較多的是按照索取號(hào)排架的方法。由于索取號(hào)是由分類號(hào)和著者編號(hào)組合而成,因此在進(jìn)行數(shù)據(jù)挖掘的前期可以對(duì)圖書進(jìn)行分類號(hào)的特征采集,這有利于我們下一步預(yù)測(cè)方法的選擇。以西北大學(xué)圖書館的借閱數(shù)據(jù)為例,由于西北大學(xué)圖書館有南區(qū)圖書館和北區(qū)圖書館兩個(gè)分館,需要預(yù)測(cè)某一特征的圖書某一年在南北分館的借閱量,以此來確定典藏地點(diǎn)的分配(見表1)。如表1所示,北校區(qū)圖書館借閱量為Nyi,南校區(qū)圖書館借閱量為Syj,表1為某類特征值圖書兩校區(qū)借閱數(shù)量統(tǒng)計(jì)。

1.3 選擇一種適用方法

如表1所示,特征采集過程中兩個(gè)校區(qū)的借閱量是我們要預(yù)測(cè)的對(duì)象。預(yù)測(cè)建模的諸多方法中,回歸分析預(yù)測(cè)建模中的一元線性回歸預(yù)測(cè)方法可以應(yīng)用到多校區(qū)借閱量預(yù)測(cè)中。

1.4 對(duì)預(yù)測(cè)結(jié)果的分析與評(píng)估

通過一元線性回歸預(yù)測(cè)方法,我們可以預(yù)測(cè)到一個(gè)分類號(hào)在兩校區(qū)的借閱趨勢(shì)。這里應(yīng)該對(duì)預(yù)測(cè)的結(jié)果進(jìn)行分析與評(píng)估,確定結(jié)果是否符合預(yù)測(cè)的要求,并運(yùn)用預(yù)測(cè)模型進(jìn)行檢驗(yàn),以此來比較本次預(yù)測(cè)的精確度。

[HS2]2 一元線性回歸預(yù)測(cè)模型的應(yīng)用

一元線性回歸分析是處理兩個(gè)變量x(自變量)和y(因變量)之間關(guān)系的最簡(jiǎn)單的模型,研究的是這兩個(gè)變量之間的線性相關(guān)關(guān)系[3]。一元回歸的公式為:

yi=a+bxi+ui(i=1,2,…n)

其中u是一個(gè)隨機(jī)變量,稱為隨機(jī)項(xiàng);a、b是兩個(gè)常數(shù),稱為回歸系數(shù)(參數(shù));i表示變量的第i個(gè)觀察值,共有n組樣本觀察值。

由于需要預(yù)測(cè)某一特征的圖書在兩個(gè)分館的借閱量,所以本次預(yù)測(cè)因變量y分別設(shè)為y1(北校區(qū)圖書館借閱量)、y2(南校區(qū)圖書館借閱量)。在得到預(yù)測(cè)結(jié)果y1和y2后,通過設(shè)計(jì)SQL語(yǔ)句來比較y1與y2的結(jié)果值,從而返回典藏地點(diǎn)的推薦值。以下為一元回歸預(yù)測(cè)的具體過程(見表2)。

3 預(yù)測(cè)模型對(duì)多校區(qū)典藏規(guī)劃的啟示

3.1 預(yù)測(cè)前期工作簡(jiǎn)單化

該預(yù)測(cè)模型前期數(shù)據(jù)準(zhǔn)備工作為數(shù)據(jù)的特征提取,這里提取了圖書的分類號(hào)作為分析的目標(biāo)。例如:需要分析“數(shù)據(jù)挖掘技術(shù)與應(yīng)用”這一類的書,我們提取到的特征為TP274,以TP274為分析目標(biāo)在圖書館自動(dòng)化系統(tǒng)中統(tǒng)計(jì)出分析范圍內(nèi)(十二年)的借閱量。

3.2 預(yù)測(cè)模型應(yīng)用簡(jiǎn)單化

預(yù)測(cè)模型建立起來后,典藏工作人員只需將分析范圍內(nèi)(十二年)的借閱數(shù)據(jù)輸入模型,系統(tǒng)會(huì)自動(dòng)生成回歸方程(如y1[DD(-*5]∧[DD)]=20.9895+1.217x),只需要選擇需要預(yù)測(cè)的年份(如2014年),就可以得到某一類圖書在某一年內(nèi)在各個(gè)校區(qū)的借閱量預(yù)測(cè)結(jié)果。

3.3 對(duì)非典藏領(lǐng)域的啟示

該預(yù)測(cè)模型建立起來后,可以預(yù)測(cè)某特征類型的圖書的多校區(qū)借閱量,可以指導(dǎo)典藏規(guī)劃實(shí)施圖書的具體布局。對(duì)于借閱量在某一閾值以下的圖書,典藏部門可以對(duì)該類圖書進(jìn)行剔舊或者下架處理,而采訪部門可以少量購(gòu)買或者不予購(gòu)買。同時(shí),對(duì)于借閱量大于某一閾值的圖書,典藏部門可以開設(shè)特色化服務(wù)進(jìn)行推薦,而采訪部門可以通過增加復(fù)本或增加同類書來滿足讀者的要求。

參考文獻(xiàn):

[1] Han Jiawei,Kamber Micheline.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:高等教育出版社,2001:42-60.

[2] 賈宇群, 李桂祥, 劉東燕.多校區(qū)模式下高校圖書館文獻(xiàn)資源的布局與管理[J].情報(bào)科學(xué),2009(3).

[3] 陳燕.數(shù)據(jù)挖掘技術(shù)與應(yīng)用[M].北京:清華大學(xué)出版社,2011:72-80

[4] 林曉玲,楊明華.RFID圖書管理系統(tǒng)中圖書定位排架方式探析[J].圖書館論壇,2012(3).

(編校:崔萌)endprint

關(guān)鍵詞:預(yù)測(cè);多校區(qū)圖書館;典藏規(guī)劃

摘 要:隨著高校圖書館的多校區(qū)發(fā)展,圖書館典藏工作迎來了新的挑戰(zhàn)。文章提出了運(yùn)用預(yù)測(cè)技術(shù)對(duì)圖書借閱量進(jìn)行預(yù)測(cè)分析,從而使多校區(qū)圖書館的典藏工作更加科學(xué)有效的方法。

中圖分類號(hào):G250.78 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-1588(2014)03-0118-03

進(jìn)入2012年,“大數(shù)據(jù)”這個(gè)專有名詞開始出現(xiàn)在人們的視野中,各行各業(yè)的專家學(xué)者開始提出“大數(shù)據(jù)時(shí)代”所帶來的挑戰(zhàn)。那么,何謂“大數(shù)據(jù)”?目前業(yè)內(nèi)對(duì)“大數(shù)據(jù)”一詞仍沒有統(tǒng)一的定義,但筆者認(rèn)為,大數(shù)據(jù)(Big Data)就是指隨著某一行業(yè)的發(fā)展而不斷增長(zhǎng)的數(shù)據(jù)量,它并不是一種技術(shù),而是人們對(duì)龐大繁雜數(shù)據(jù)的一個(gè)稱謂。由于其量的龐大,使得我們經(jīng)常所用到的統(tǒng)計(jì)分析功能已經(jīng)無從下手。所以,在“大數(shù)據(jù)”時(shí)代,一種技術(shù)再一次得到升溫,那就是數(shù)據(jù)挖掘技術(shù)。

數(shù)據(jù)挖掘(Data Mining)技術(shù)在1998年作為一種數(shù)據(jù)處理技術(shù)概念被提出,并在上世紀(jì)末開始活躍于各個(gè)領(lǐng)域[1]。其在圖書館領(lǐng)域的應(yīng)用晚于諸如通信、銀行等其他行業(yè),但數(shù)據(jù)挖掘技術(shù)在其他領(lǐng)域的廣泛應(yīng)用,給其在圖書館的應(yīng)用打下了良好基礎(chǔ)。作為圖書館工作的重中之重,隨著RFID (Radio Frequency Identification)射頻識(shí)別技術(shù)在圖書館的應(yīng)用,使得典藏工作更加科學(xué)系統(tǒng)化。然而,由于國(guó)內(nèi)很多大學(xué)圖書館都實(shí)行了多校區(qū)辦館,在適應(yīng)了高校現(xiàn)有的多校區(qū)辦學(xué)的現(xiàn)狀的同時(shí),卻給典藏工作帶來了前所未有的挑戰(zhàn)[2]。面對(duì)因?yàn)槎嘈^(qū)辦館而激增的流通數(shù)據(jù),如何從這些龐大的數(shù)據(jù)源中發(fā)現(xiàn)真正有利于多校區(qū)典藏規(guī)劃的信息呢?如何使得多校區(qū)典藏工作更加科學(xué)有效呢?數(shù)據(jù)挖掘的分析方法主要有分類、預(yù)測(cè)、關(guān)聯(lián)規(guī)則、聚類分析、回歸、順序規(guī)則、時(shí)間序列和決策樹。這些分析方法都可以用來建立一些模型,這些模型可以用來描述數(shù)據(jù)之間的聯(lián)系以及模式[3]。筆者主要介紹如何將數(shù)據(jù)挖掘技術(shù)之一的預(yù)測(cè)技術(shù)應(yīng)用于多校區(qū)典藏規(guī)劃中。

1 如何建立多校區(qū)典藏預(yù)測(cè)模型

預(yù)測(cè),即Forecast。預(yù)測(cè)技術(shù)是通過已知數(shù)據(jù)來了解事物今后發(fā)展情況和走勢(shì)的技術(shù)。建立預(yù)測(cè)模型的方法有很多,常用的方法有回歸分析預(yù)測(cè)、趨勢(shì)外推預(yù)測(cè)、基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)和時(shí)間序列預(yù)測(cè)等。

1.1 分析預(yù)測(cè)目標(biāo)以及確定預(yù)測(cè)時(shí)間

多校區(qū)辦館導(dǎo)致了圖書館典藏機(jī)制面臨重大的挑戰(zhàn)——[KG*4]一類圖書放到哪個(gè)學(xué)區(qū)才能使其被充分利用。因此,筆者的分析目標(biāo)就是圖書需要的科學(xué)擺放區(qū)域,而預(yù)測(cè)時(shí)間選擇為十二年。

1.2 預(yù)測(cè)前期的資料采集與調(diào)研

圖書館典藏工作中的圖書擺放模式有兩種,一種是按照內(nèi)容的擺放,例如分類排架;另一種是按照?qǐng)D書的形式擺放,例如裝訂方式排架等[4]。目前,高校圖書館運(yùn)用較多的是按照索取號(hào)排架的方法。由于索取號(hào)是由分類號(hào)和著者編號(hào)組合而成,因此在進(jìn)行數(shù)據(jù)挖掘的前期可以對(duì)圖書進(jìn)行分類號(hào)的特征采集,這有利于我們下一步預(yù)測(cè)方法的選擇。以西北大學(xué)圖書館的借閱數(shù)據(jù)為例,由于西北大學(xué)圖書館有南區(qū)圖書館和北區(qū)圖書館兩個(gè)分館,需要預(yù)測(cè)某一特征的圖書某一年在南北分館的借閱量,以此來確定典藏地點(diǎn)的分配(見表1)。如表1所示,北校區(qū)圖書館借閱量為Nyi,南校區(qū)圖書館借閱量為Syj,表1為某類特征值圖書兩校區(qū)借閱數(shù)量統(tǒng)計(jì)。

1.3 選擇一種適用方法

如表1所示,特征采集過程中兩個(gè)校區(qū)的借閱量是我們要預(yù)測(cè)的對(duì)象。預(yù)測(cè)建模的諸多方法中,回歸分析預(yù)測(cè)建模中的一元線性回歸預(yù)測(cè)方法可以應(yīng)用到多校區(qū)借閱量預(yù)測(cè)中。

1.4 對(duì)預(yù)測(cè)結(jié)果的分析與評(píng)估

通過一元線性回歸預(yù)測(cè)方法,我們可以預(yù)測(cè)到一個(gè)分類號(hào)在兩校區(qū)的借閱趨勢(shì)。這里應(yīng)該對(duì)預(yù)測(cè)的結(jié)果進(jìn)行分析與評(píng)估,確定結(jié)果是否符合預(yù)測(cè)的要求,并運(yùn)用預(yù)測(cè)模型進(jìn)行檢驗(yàn),以此來比較本次預(yù)測(cè)的精確度。

[HS2]2 一元線性回歸預(yù)測(cè)模型的應(yīng)用

一元線性回歸分析是處理兩個(gè)變量x(自變量)和y(因變量)之間關(guān)系的最簡(jiǎn)單的模型,研究的是這兩個(gè)變量之間的線性相關(guān)關(guān)系[3]。一元回歸的公式為:

yi=a+bxi+ui(i=1,2,…n)

其中u是一個(gè)隨機(jī)變量,稱為隨機(jī)項(xiàng);a、b是兩個(gè)常數(shù),稱為回歸系數(shù)(參數(shù));i表示變量的第i個(gè)觀察值,共有n組樣本觀察值。

由于需要預(yù)測(cè)某一特征的圖書在兩個(gè)分館的借閱量,所以本次預(yù)測(cè)因變量y分別設(shè)為y1(北校區(qū)圖書館借閱量)、y2(南校區(qū)圖書館借閱量)。在得到預(yù)測(cè)結(jié)果y1和y2后,通過設(shè)計(jì)SQL語(yǔ)句來比較y1與y2的結(jié)果值,從而返回典藏地點(diǎn)的推薦值。以下為一元回歸預(yù)測(cè)的具體過程(見表2)。

3 預(yù)測(cè)模型對(duì)多校區(qū)典藏規(guī)劃的啟示

3.1 預(yù)測(cè)前期工作簡(jiǎn)單化

該預(yù)測(cè)模型前期數(shù)據(jù)準(zhǔn)備工作為數(shù)據(jù)的特征提取,這里提取了圖書的分類號(hào)作為分析的目標(biāo)。例如:需要分析“數(shù)據(jù)挖掘技術(shù)與應(yīng)用”這一類的書,我們提取到的特征為TP274,以TP274為分析目標(biāo)在圖書館自動(dòng)化系統(tǒng)中統(tǒng)計(jì)出分析范圍內(nèi)(十二年)的借閱量。

3.2 預(yù)測(cè)模型應(yīng)用簡(jiǎn)單化

預(yù)測(cè)模型建立起來后,典藏工作人員只需將分析范圍內(nèi)(十二年)的借閱數(shù)據(jù)輸入模型,系統(tǒng)會(huì)自動(dòng)生成回歸方程(如y1[DD(-*5]∧[DD)]=20.9895+1.217x),只需要選擇需要預(yù)測(cè)的年份(如2014年),就可以得到某一類圖書在某一年內(nèi)在各個(gè)校區(qū)的借閱量預(yù)測(cè)結(jié)果。

3.3 對(duì)非典藏領(lǐng)域的啟示

該預(yù)測(cè)模型建立起來后,可以預(yù)測(cè)某特征類型的圖書的多校區(qū)借閱量,可以指導(dǎo)典藏規(guī)劃實(shí)施圖書的具體布局。對(duì)于借閱量在某一閾值以下的圖書,典藏部門可以對(duì)該類圖書進(jìn)行剔舊或者下架處理,而采訪部門可以少量購(gòu)買或者不予購(gòu)買。同時(shí),對(duì)于借閱量大于某一閾值的圖書,典藏部門可以開設(shè)特色化服務(wù)進(jìn)行推薦,而采訪部門可以通過增加復(fù)本或增加同類書來滿足讀者的要求。

參考文獻(xiàn):

[1] Han Jiawei,Kamber Micheline.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:高等教育出版社,2001:42-60.

[2] 賈宇群, 李桂祥, 劉東燕.多校區(qū)模式下高校圖書館文獻(xiàn)資源的布局與管理[J].情報(bào)科學(xué),2009(3).

[3] 陳燕.數(shù)據(jù)挖掘技術(shù)與應(yīng)用[M].北京:清華大學(xué)出版社,2011:72-80

[4] 林曉玲,楊明華.RFID圖書管理系統(tǒng)中圖書定位排架方式探析[J].圖書館論壇,2012(3).

(編校:崔萌)endprint

主站蜘蛛池模板: a国产精品| 免费无遮挡AV| 国产一二三区在线| 精品无码一区二区三区电影| 综合色婷婷| 熟女视频91| 熟女日韩精品2区| 超薄丝袜足j国产在线视频| 国产精品私拍在线爆乳| 日韩在线视频网| 亚洲综合天堂网| 欧美另类视频一区二区三区| 人妻无码中文字幕第一区| 久久综合色视频| 亚洲欧美另类视频| 一本大道香蕉高清久久| 国产精品无码一二三视频| h视频在线播放| 国产精品亚洲а∨天堂免下载| 久草美女视频| 综合网久久| 国产成人一区在线播放| 成年人免费国产视频| 欧美日韩免费在线视频| 国内精品自在欧美一区| 久久综合九色综合97网| 97se亚洲综合在线韩国专区福利| 一级黄色网站在线免费看| 亚洲综合中文字幕国产精品欧美| 亚洲无码视频图片| 日本亚洲欧美在线| 欧美亚洲网| 91福利在线观看视频| 亚洲美女高潮久久久久久久| 国产精品主播| 亚洲欧美不卡视频| 精品福利视频导航| 久久青草精品一区二区三区| 国产网友愉拍精品视频| 国产1区2区在线观看| 精品国产黑色丝袜高跟鞋| 四虎永久免费网站| 天天操天天噜| 亚洲国产精品日韩av专区| 亚洲精品免费网站| 91色老久久精品偷偷蜜臀| 伊人久久大香线蕉影院| 日韩最新中文字幕| 国产精品冒白浆免费视频| 拍国产真实乱人偷精品| 亚洲伊人电影| 91精品国产一区| 欧美在线精品怡红院| 国产第一页免费浮力影院| 国产欧美日韩va| 亚洲成人手机在线| 国产欧美日本在线观看| 高清码无在线看| 国产电话自拍伊人| 亚洲无限乱码一二三四区| 99热这里只有精品在线观看| 精品偷拍一区二区| 免费国产在线精品一区| 久热这里只有精品6| 伊人久综合| 久久熟女AV| 久久综合伊人77777| 婷五月综合| 高清久久精品亚洲日韩Av| 超薄丝袜足j国产在线视频| 国产对白刺激真实精品91| 人妻出轨无码中文一区二区| 日韩精品无码一级毛片免费| 九色国产在线| 久久综合色视频| 色爽网免费视频| 国产在线精品人成导航| 亚洲不卡影院| 91香蕉视频下载网站| 国产女人18毛片水真多1| 麻豆国产在线观看一区二区| 色综合热无码热国产|