王建芳



摘 要:高校的內涵建設和學科建設與圖書館資源建設密不可分。為了使館藏圖書盡可能地滿足讀者需求,文章在研究灰色系統理論的基礎上,對圖書借閱的原始數據進行分析,建立了灰色關聯度模型,得到圖書的綜合指標值,由此可判斷圖書的相對重要性。分析結果與實際相符,具有較高的精度和實用價值,為圖書館資源建設提供了可靠的科學依據。
關鍵詞:資源建設;圖書流通量;關聯度模型
中圖分類號:G250.76 ? ?文獻標識碼:A ? ?文章編號:1671-0037(2018)11-93-3
DOI:10.19345/j.cxkj.1671-0037.2018.11.025
Research on Library Resource Construction based on Grey Correlation Analysis
Wang Jianfang
(Xi'an Railway Vocational and Technical Institute, Xi'an Shaanxi 710026)
Abstract: The connotation construction and discipline construction in the universities are inseparable from the construction of library resources. In order to satisfy the readers' needs of books as far as possible, based on the study of Gray System Theory, this paper analyzed the original data of books borrowing, and established a gray correlation model to get the comprehensive index value of the books, on that basis, the relative importance of the books is determined. The analysis results are consistent with the actual situation, and have high accuracy and practical value, which have provided reliable scientific basis for the construction of library resources.
Key words: resource construction; book circulation; correlation model
隨著社會的迅速發展,科技的不斷進步,人們的閱讀方式越來越多元化,許多高校圖書館借閱量呈現下滑趨勢。為改變現狀,圖書館定期投入大量資金購置圖書,但效果甚微。因此,圖書館資源建設勢在必行。由于圖書流通量受多種不確定因素影響,不能用定數論規律描述,而灰色系統理論可以對多指標模糊事物進行識別。本文在灰色關聯度模型基礎上,結合實際需要做了適當改進,利用圖書借閱的原始統計數據,分析了各類圖書的相對重要性,為圖書館資源建設提供了可靠的依據。
1 評價指標體系的確定
研究以西安鐵路職業技術學院圖書館為例,圖書館每學年都要投入大量資金購置圖書,以滿足各學科專業老師和學生的需求。目前,館藏圖書涵蓋工程、自動化、電工、運輸、經濟、法律、軍事、文學、藝術、醫學、天文學、計算機、化學、能源等,每學年不同圖書流通量差異很大。在此選取15種圖書,統計其5個評價指標的數據進行分析,5個評價指標分別為種類數、借出種類數、圖書冊數、借出冊數和借出天數。
2 灰色關聯度分析法原理及步驟
灰色關聯度模型的基本思想是利用灰色關聯分析法對系統發展變化態勢的定量比較和反映。所謂灰色關聯分析,就是系統的因素分析,是根據系統各因素之間發展趨勢的相似或相異程度,即“灰色關聯度”,作為衡量因素間關聯程度的一種方法[1-2]。具體步驟如下:
2.1 收集評價指標體系數據
假設有[n]個對象,[m]個指標,[xij]表示第[i]個對象第[j]個指標的值,則原始數據矩陣表示為
[Xn×m=x11 ? x12 ? … ? x1j ? … ? x1mx21 ? x22 ? … ? x2j ? … ? x2m? ? ?? ? ? ? ? ? ? ? ? ??xi1 ? xi2 ? … ? xij ? ?… ? ?xim? ? ? ? ? ?? ? ? ? ? ? ??xn1 ? xn2 ? … ? xnj ? … ? xnm1≤i≤n,1≤j≤m] (1)
2.2 數據標準化處理
由于系統中各因素列可能因單位不同,即量綱不同,使得各指標值的數量級別差距很大,不便于比較,或在比較時難以得到正確的結論。因此,在進行灰色關聯度分析時,一般都要對原始數據進行標準化(無數量級、無量綱化)的預處理,使其具有可比性。常用的處理方法有初值化、均值化和歸一化法,初值化法適用于較穩定的社會經濟現象的數據處理;均值化法適用于無明顯升降趨勢現象的數據處理。具體應用可根據實際情況選用其中之一。本文采用均值化法,即
[x*ij=xij1ni=1nxij] ? ? ? ? ? ? ? ? (2)
2.3 分析序列確定
在相互關聯的指標體系中,要進行關聯分析,必須確定出母序列和子序列。母序列作為參考數據列應該是一個理想的、對方案影響相對重要的指標,因此,以各指標的最優值(或最劣值)構成母序列(參考序列),也可根據評價目的選擇其他參照值,記作[X0],即[Xo=x10,x20,…xi0…xn0]其他影響因子構成子 ? ? 序列(比較序列),記作[Xj],即[Xj=x1j,x2j,…xij…xnj]。
2.4 關聯系數計算
關聯系數是衡量各因素列對應曲線間幾何形狀的差別程度。對于一個參考序列[Xo]和若干個比較序列[Xj],各比較序列與參考序列在第[k]點(即曲線中的[k]點)的關聯系數可分別由下式算出:
(a)鄧氏算法[yjk=a+AξΔjk+Aξ] ? ? ? (3)
其中,[Δjk]為差序列,記為[Δjk=x*kj-x*kok=1,2,…n,j=1,2,…m],兩極最小差為[a= ? ?min1kn ? ?min1jmΔjk],兩極最大差為[A= ? ?max1kn ? ?max1jmΔjk],[ξ0ξ1]為分辨系數,其作用是削弱最大差太大引起的失真,以提高關聯系數之間差異的顯著性。[ξ]越小,表明關聯系數差異越大,區分能力越強。(通常取[ξ=0.5])。
(b)斜率算法[yjk11+Δxokσxo-Δxokσxi] ? ?(4)
其中,[Δxok,Δxik]為后減差序列,[σxoσxi]為標準差,分別由下式計算:
[Δxok=xok+1-xok] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (5)
[Δxik=xik+1-xik] ? ? ? ? ? (6)
[σxo=1nk=1nxok-xo2] ? ? ? ? ? (7)
[σxi=1nk=1nxik-xi2] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (8)
2.5 關聯度計算
關聯度是衡量子序列與母序列相似程度的測度。比較序列構成的曲線與參考序列構成的曲線的幾何形狀越相似,其關聯度越大。由于上述關聯系數的數值很多,使得信息過于分散,不方便比較,因此,可將各個點的關聯系數集中為一個值,即求出其平均值反映各比較序列與參考序列的關聯程度,稱為關聯度[3-4](等級如表1所示)。
表1 關聯度分級表
[等級 關聯度 評價描述 低關聯 0~0.3 兩指標耦合作用弱 中等關聯 0.3~0.6 兩指標耦合作用中等 較高關聯 0.6~0.8 兩指標耦合作用較強 高關聯 0.8~1 兩指標耦合作用極強 ]
(a)鄧氏關聯度算法
[rj=1nk=1nyjk] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (9)
(b)斜率關聯度算法
[rj=1n-1k=1n-1yjk] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (10)
歸一化處理后,即
[r*j=rjj=1mrj] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(11)
2.6 改進的關聯度計算
考慮到實際問題中,數列內各元素的重要性互不相同,直接取關聯系數平均值作為關聯度,缺乏一定的可信度,因此可主觀引入權重因素來消除該誤差,若[wj]為第[j]個元素的權重值,則改進后的關聯度可由下式計算:
[w*j=wj·r*jj=1mwj·r*j] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (12)
其中[wj]可由圖書館主管領導結合資料與實踐給出指標比較矩陣,通過層次分析法計算確定。
2.7 綜合指標值計算
綜合各個因素的權重和各個指標的取值,可得到第[i]個參評對象的綜合指標值[Zi],即
[Zi=j=1mw*j·x*ij] ? ? ? ? ? ? ? (13)
[Zi]式中愈大,說明其重要程度愈大。由此,可判斷各指標的相對重要程度。
3 實證分析
3.1 數據資料收集
收集西安鐵路職業技術學院15種圖書一學年流通量數據。通過統計分析,不同圖書的出借量差異很大,但影響因素相互關聯。因此,下面用灰色關聯度模型進行分析,在計算得到5個指標相應權重的基礎上,定量表示出各類圖書的相對重要程度。
3.2 數據標準化處理
對數據進行均值化處理,通過matlab編程[5-6]得到
3.3 確定分析序列
母序列:借出冊數,即
[X0=0.6350,0.5042,3.2637,…0.5264,0.2555']
子序列:種類數、借出種類數、圖書冊數和借出天數,即
[X1=0.6796,0.6614,2.2305,…0.8074,2.0321']
[X2=0.6078,0.5523,2.4967,…0.6732,2.2712']
[X3=0.7775,0.6288,3.0.488,…0.6738,0.2465']
[X4=0.4987,0.4890,3.4671,…0.4866,0.3183']
3.4 AHP法確定評價指標權重
由西安鐵路職業技術學院圖書館主管領導及館員綜合分析圖書資料數據,結合實際給出指標比較矩陣,通過層次分析法計算確定。采用1-9標度法構造5項指標間相對重要性的比較矩陣如下:
由matlab編程求解得到
[wj=0.0776,0.2650,0.0506,0.4693,0.1375]。為了滿足實際需求,此項指標也可靈活調整給出。
3.5 計算關聯系數和關聯度
由公式(1-12)依次計算得到關聯度,其中分辨系數取值[ξ=0.5],由matlab編程求解分別得到鄧氏關聯度和斜率關聯度(見表2)。
3.6 計算各類圖書的綜合評價值
由公式(13)計算得到。選取表2中任一組關聯度即可,在此選改進后的斜率關聯度計算,通過matlab求解得到排序結果如表3所示。
4 結語
由表3的結果可知,模型計算結果與客觀實際均相符。其中經濟類、文學類、語言類和自動化、計算機類在上述圖書中占據相當大的權重。文學和語言屬于通識類,各專業均有需求,經濟類是社會發展需求,而計算機類作為技能課重要性可見一斑。此外,作為公共課的數理科學、法律和重點專業的建筑、電工、運輸等也具有相當的重要性。由此分析可見,改進后的灰色關聯度模型對圖書館資源建設是完全可行的,根據模型分析合理調整館藏圖書結構,可有效提高圖書利用率,達到學科建設和內涵建設的需要。
參考文獻:
[1] 王顯燕.基于讀者決策采購的高校圖書館資源建設策略研究[J].情報探索,2013(10):68-71.
[2] 李曄,秦夢.基于灰色關聯分析法的城鎮化水平的綜合評價:以中原城市群為例[J].河南科學,2013(3):388-393.
[3] 鮑學英,李海連,王起才.基于灰色關聯分析和主成分分析組合權重的確定方法研究[J].數學的實踐與認識,2016(9):129-134.
[4] 劉盼盼,洪旭東,郭劍毅.基于灰色關聯分析的中文新聞事件關聯性識別[J].計算機應用, 2016,36(2):408-413.