張春友 閆偉 吳曉強 郝瑞參
摘 要: 數字資源服務是現代化圖書館提供的重要服務,數字資源服務績效評價是圖書館改善數字資源的基礎。針對現有數字資源服務績效評價方法存在的不足,提出一種新的基于區間數支持向量回歸機的圖書館數字資源服務績效評價方法。在構建數字資源服務績效評價指標體系的基礎上,建立了基于區間數支持向量回歸機的圖書館數字資源服務績效評價模型。仿真結果表明, 所建立的評價模型是合理有效的,并且具有較強的泛化能力。
關鍵詞: 圖書館; 數字資源; 服務績效; 區間數; 支持向量回歸機; 泛化能力
中圖分類號: TN919?34; TP301.6 文獻標識碼: A 文章編號: 1004?373X(2018)22?0021?04
Abstract: Digital resource service is an important service provided by modern library. The performance evaluation of digital resource service is a foundation for improving digital resources of the library. In allusion to the shortcomings of the existing digital resource service performance evaluation methods, a new performance evaluation method based on interval numbers and support vector regression is proposed for the digital resource service of the library. On the basis of constructing the performance evaluation index system for the digital resource service, a performance evaluation model based on interval numbers and support vector regression is established for the digital resource service of the library. The simulation results show that the established evaluation model is reasonable, effective, and has a strong generalization capability.
Keywords: library; digital resource; service performance; interval number; support vector regression; generalization capability
在計算機、網絡技術飛速發展的大背景下,具有種類繁多、信息量大、存儲便捷等諸多優勢的數字資源逐漸成為人們獲取信息的重要渠道。圖書館數字資源建設的優劣直接影響圖書館的服務水平和層次,已成為圖書館建設的關鍵問題之一。如何客觀評價數字資源的建設情況,如何科學衡量數字資源服務的優劣,如何解決數字資源種類繁多與經費有限的矛盾,都需開展數字資源服務績效評價問題的研究。目前,數字資源服務績效評價問題已成為圖書館界的研究熱點。很多學者在評價指標體系、評價方法、評價模型等方面開展了深入的研究。文獻[1]采用改進的層次分析法對數字資源服務績效評價指標體系進行了研究;文獻[2]提出基于擬熵權模糊綜合評價的數字資源服務績效評價方法;文獻[3]采用模糊多屬性決策方法對高校圖書館電子資源服務績效評價問題進行了研究;文獻[4]基于模糊語義法研究了電子資源服務績效評價問題;文獻[5]采用模糊神經網絡方法構建了數字資源服務績效的智能評價模型?,F有研究方法中均需計算指標權重,但數字資源服務績效評價指標繁多,指標權重計算復雜且主觀性較大。雖然文獻[5]提出了智能評價模型,取得了較好的預測效果,但神經網絡方法存在收斂速度慢、學習效率低、網絡結構復雜和泛化能力弱等問題。支持向量回歸機(Support Vector Regression,SVR)是SVM在解決回歸問題方面的具體應用,在各種預測領域表現出了較好的能力,支持向量機基于結構風險最小化理論,普遍認為其泛化能力要比神經網絡的強。此外,數字資源服務績效評價問題具有確定性評價,而用區間數表示不確定性更加符合思維習慣。鑒于此,本文擬采用區間數和SVR理論相結合的方法對數字資源服務績效評價問題進行研究,以期為數字資源服務績效評價問題提供一種新的智能評價方法。
構建一個科學有效的圖書館數字資源服務績效評價指標體系,是優化發展圖書館數字資源、提高數字資源服務質量效益的關鍵。和媛媛等人基于用戶滿意度,建立了以數據庫內容、檢索系統及功能和數據庫利用情況為一級指標的電子資源服務績效評價指標體系[3];隸屬于美國研究圖書館協會(ARL)的統計和測度委員會于2000年開始啟動的數字資源評估項目中,將指標體系分為網絡統計和績效統計兩部分,其中網絡統計指標包含用戶可使用的數字資源、網絡資源的使用、網絡資源與相關設施的花費和圖書館數字化工作四類一級指標;梁冬瑩等人參照美國研究圖書協會ARL E?Metrics項目推薦的高校圖書館數字資源統計和測評數據指標的體系結構的基礎上,結合我國數字資源使用的實際情況和相關研究成果,構建了我國高校圖書館數字資源服務績效評價指標體系[1];周慶梅以文獻[1]構建的指標體系為基礎,利用模糊神經網絡方法開展了圖書館數字資源服務績效評價研究,取得了較好的效果。綜合上述研究成果中的評價指標體系,本文構建多層次的數字資源服務績效評價指標體系,如圖1所示。
近年來,區間數理論在不確定數學規劃和不確定多屬性決策等領域得到了廣泛的應用。區間數是指用區間表示的數,具有不確定性,實際上是一個閉區間上所有實數所組成的集合。假設[a]是實數[x]的集合,[a=[a1,a2]={a1≤x≤a2,a1,a2∈R}],[a1]和[a2]是區間的下界和上界,則[a]定義為區間數。如果[a1≥0],那么[a]為正區間數。區間數的運算法則一般與集合的運算法則類似,設[a=[a1,a2]]和[b=[b1,b2]]為兩個區間數,[k≥0],則區間數的運算法則為[6]:
核函數[K(x,y)]的形式有多種,常用的有徑向基核函數、多項式核函數、Sigmoid感知核函數和多二次曲面核函數等。
通過數字資源服務績效評價指標體系的建立以及對區間數和支持向量回歸機模型原理的介紹,構建基于區間數SVR的數字資源服務績效評價模型,模型的具體實現步驟如下:
1) 建立圖書館數字資源服務績效評價指標體系,確定支持向量回歸機的輸入和輸出參數。依據前面的分析,本文選用評價指標體系中數字資源內容、供應商提供服務、用戶使用情況、檢索系統和資源成本5個一級指標下的29個二級指標作為數字資源服務績效評價模型的輸入參數,數字資源服務績效評價等級作為評價模型的輸出參數。
2) 為提高預測的準確性,對實驗樣本數據進行規范化處理,使各指標值均處于[0,1]區間內。將“優”“良”“一般”“較差”和“差”作為數字資源服務績效評價等級,各等級對應的規范化區間數分別為[0.8,1.0],[0.6,0.8],[0.4,0.6],[0.2,0.4]和[0,0.2]。
3) 確定最佳的支持向量回歸機核函數。通過比較分析和測試,最終選擇應用最為廣泛的徑向基核函數,其表達式為:[K(x,y)=exp-x-y22σ2]。
4) 利用基于區間數SVR的數字資源服務績效評價模型對訓練樣本進行訓練,在訓練過程中不斷調整徑向基核函數的寬度參數[σ],以及支持向量回歸機的正則化參數C和不敏感值[ε],直到訓練誤差達到相應的精度要求為止。
5) 通過校驗樣本檢驗預測模型的泛化能力。利用基于區間數SVR的數字資源服務績效評價模型對校驗樣本進行評價研究。
為了驗證基于區間數SVR的數字資源服務績效評價模型的合理性和有效性,現以文獻[5]中的樣本數據為例進行仿真實驗驗證。樣本數據中共有11個樣本,各指標數值通過邀請多位專家進行打分后取平均值獲得,打分過程中,評價等級為{“優”,“良”,“一般”,“較差”,“差”},對應的取值范圍為{[4,5],[3,4],[2,3],[1,2],[0,1]},具體的打分情況見表1。這里以前8個樣本為訓練樣本,后3個樣本為校驗樣本進行仿真驗證。文獻[5]采用模糊神經網絡方法對這11個樣本進行仿真分析,所得的前8個樣本的模糊綜合評價結果如表2所示。
利用Matlab 7.0編寫基于區間數SVR的數字資源服務績效評價模型的仿真程序。通過多次仿真測試,得到SVR最優的仿真參數:[ε]=0.001,懲罰參數[C]=800,參數[σ=]10。在仿真過程中,首先將各指標值進行歸一化處理,然后將歸一化的29個指標值作為SVR的輸入參數,分別將區間數評價值的下界和上界作為輸出參數對8個訓練樣本進行訓練仿真,訓練效果較好,相對誤差均小于0.36%。為了驗證評價模型的推廣能力,對后3組樣本進行校驗預測,可得預測的區間數評價值分別為[0.564,0.764],[0.482,0.694]和[0.226,0.426],相應的區間評價中值分別為0.652,0.588和0.326,分別對應評價等級“好”“一般”和“較差”。該評價結果與文獻[5]所得的結論完全一致。由校驗樣本的預測結果可知,本文所建立的評價模型預測效果較好,具有較強的推廣能力。文獻[5]采用模糊神經網絡方法得到的評價結果為模糊數形式,難以對處于同一評價等級的樣本進行有效排序,而利用本文所提出的評價模型所得到的區間數形式的評價結果,可以依據區間數的排序法則或區間數取中間值的方法對各個樣本進行評價排序,評價結果更加科學合理。
科學合理地評價圖書館數字資源服務績效水平,可以為圖書館提高數字資源服務能力和優化數字資源建設策略提供理論依據和參考。本文基于構建的數字資源服務績效評價指標體系,采用區間數理論和支持向量回歸機相結合的方法建立了數字資源服務績效評價模型。在此基礎上利用Matlab 7.0工具箱編寫了評價模型的仿真程序。在將模糊評價結果轉化為區間數的基礎上,利用區間數的下界和上界分別對樣本進行預測,進一步對得到的區間數形式的評價結果進行分析。通過與文獻[5]的評價結果進行對比分析,說明本文提出的智能評價方法是合理有效的,為數字資源服務績效智能評價提供了新的思路,有助于圖書館提高數字資源服務質量和水平。
參考文獻
[1] 梁冬瑩,周慶梅,王克奇.基于層次分析法的數字資源服務績效評價體系構建[J].情報科學,2013,31(1):78?81.
LIANG Dongying, ZHOU Qingmei, WANG Keqi. An improved AHP?based performance evaluation system of digital resources service [J]. Information science, 2013, 31(1): 78?81.
[2] 李迎迎,王煥景,鄭春厚.高校圖書館數字資源服務的擬熵權糊綜合評價[J].圖書館論壇,2014,34(5):71?78.
LI Yingying, WANG Huanjing, ZHENG Chunhou. The quasi?entropy weight fuzzy comprehensive evaluation of digital resources service in university library [J]. Library tribune, 2014, 34(5): 71?78.
[3] 和媛媛,鞏在武.基于模糊多屬性決策的高校圖書館電子資源服務績效評價研究[J].情報科學,2011,29(3):412?415.
HE Yuanyuan, GONG Zaiwu. Study on the service evaluation of academic library electronic resources based on multi?attribute decision making [J]. Information science, 2011, 29(3): 412?415.
[4] 賀秀英,王曉文,呼翠俠.基于模糊語義法的高校圖書館電子資源績效評價研究[J].情報理論與實踐,2016,39(2):113?115.
HE Xiuying, WANG Xiaowen, HU Cuixia. Research on the performance evaluation of university library electronic resources based on fuzzy semantic method [J]. Information studies: theory & application, 2016, 39(2): 113?115.
[5] 周慶梅,王克奇.圖書館數字資源服務績效模糊神經網絡評價研究[J].情報科學,2015,33(2):41?45.
ZHOU Qingmei, WANG Keqi. FBP based evaluation on performance of digital resource service of library [J]. Information science, 2015, 33(2): 41?45.
[6] 王根霞,王祖和,段德宏,等.基于區間數層次分析法的民用建筑太陽能熱水系統評價[J].沈陽建筑大學學報(自然科學版),2012,28(5):897?903.
WANG Genxia, WANG Zuhe, DUAN Dehong, et al. Evaluation based on interval number analytic hierarchy process for solar water heating system of civil buildings [J]. Journal of Shenyang Jianzhu University (Natural science), 2012, 28(5): 897?903.
[7] 關山,聶鵬.L?M優化算法BP網絡在刀具磨損量預測中的應用[J].機床與液壓,2012,40(15):22?26.
GUAN Shan, NIE Peng. Application of improved L?M optimization algorithm BP neural network in tool wear prediction [J]. Machine tool & hydraulics, 2012, 40(15): 22?26.
[8] 侍紅巖,吳曉強,張春友.基于支持向量回歸機的刀具壽命預測[J].工具技術,2015,49(11):47?50.
SHI Hongyan, WU Xiaoqiang, ZHANG Chunyou. Prediction of cutting tool life based on support vector regression [J]. Tool engineering, 2015, 49(11): 47?50.
[9] 安文森,孫彥廣.一種新的支持向量回歸核函數構建方法[J].信息與控制,2006,35(3):378?381.
AN Wensen, SUN Yanguang. A new method for constructing kernel function of support vector regression [J]. Information and control, 2006, 35(3): 378?381.
[10] 沈曉安.基于支持向量回歸機的反卷積技術[J].機床與液壓,2009,37(3):105?107.
SHEN Xiaoan. Study on deconvolution technique based on support vector regression [J]. Machine tool & hydraulics, 2009, 37(3): 105?107.