摘 要:建立BP神經網絡系統模型,闡述其基本原理與計算方法。以某地方圖書館2012年借閱量為例使網絡進行訓練學習,得到基于BP神經網絡理論的圖書借閱量預測系統模型,經驗證,此模型對圖書借閱量的預測有一定的理論意義。
關鍵詞:圖書館;BP神經網絡;圖書借閱量
引言
圖書是信息傳遞和文化傳播的主要工具,圖書的借閱量是學術與文化氛圍的重要標志。對較長時期借閱量的總結分析能從側面了解網絡電子圖書館的貢獻。圖書的借閱量受很多因素的影響,如圖書的質量、圖書館的環境和圖書館工作人員服務態度等[1],因此對借閱量的預測是非常復雜和困難的。
1 BP網絡及其學習算法
圖1 BP神經網絡結構
如圖1為BP神經網絡結構。標準的BP算法是基于梯度下降法的學習算法,學習過程是通過調整權值和閥值,使輸出期望值和神經網絡實際輸出值的均方差趨于最小而實現的[2]。為方便描述,現定義如下:
輸入向量 ;
隱含層的輸入 ;
隱含層的輸出 ;
輸出層的輸入 ;
輸出層的輸出 ;
期望輸出 ;
輸入層與隱含層連接權值wih;
隱含層與輸出層連接權值who;
隱含層各神經元的閥值bh;
輸出層各神經元的閥值bo;
樣本數據個數k=(1,2,...,m);
激活函數f=(·)。
BP標準算法如下:
(1)初始化,給wih、wih、bh、bo分別賦值(-1,1)之間的隨機數,設
定穩態誤差函數 ,設定計算精度和最大學習次數。
(2)隨機選取第k個樣本 及對應的期望輸出 。
(3)計算隱含層各神經元的輸入hih(k),再與激活函數聯合計算隱含層各神經元的輸出hoh(k):
(4)結合期望輸出向量 和網絡實際輸出yoo(k),計算誤差函數對輸出層的各神經元的偏導數
o=1,2,…,q
(5)結合隱含層到輸出層的權值who(k)、輸出層的?啄o(k)和隱含層的輸出hoh(k)計算誤差函數對隱含層各神經元的偏導數?啄h(k):
(6)結合輸出層各神經元的?啄o(k)及隱含層各神經元輸出hoh(k)對連接權值who(k)和權值bo(k)進行修正:
式中:N-調整前;N+1-t調整后;
?濁-學習率,取值在(0,1)之間。
(7)利用隱含層各神經元的?啄h(k)和輸入層各神經元的輸入xi(k)修正閥值:
(8)計算全局誤差E
(9)當誤差E小于計算精度值或學習次數大于設定的最大次數則結束運算,否則選取下一個學習樣本及期望輸出進行下一輪的學習訓練。
2 BP神經網絡在借閱量預測中的應用
2.1 數據歸一化處理
以某圖書館2012年各月份的借閱量為例,各月份借閱量如表1所示。
表1 2012年各月圖書借閱量
為便于神經網絡學習訓練,對上述數據進行歸一化處理,歸一化公式為X=■,式中xi為當前數據,xmin為最小數據,xmax為最大數據,歸一化后的數據見表2。
表2 各月份借閱量歸一化數據
2.2 Matlab環境下預測與驗證
以每四個月的借閱量歸一化數據為依據,預測第五個月的借閱量,以此類推[3]。在Matlab中輸入如下程序:
圖2 訓練誤差曲線
每組輸入為第n個月到第n+3個月的借閱量,對應的期望輸出為第n+4個月的實際借閱量。設置最大訓練次數為15000,訓練目標誤差為0.01,學習速率為0.1。對網絡進行訓練,訓練誤差曲線如圖2所示,可見在訓練11402次后誤差滿足設定的要求。輸入如下程序:
以7-10月和8-11月的借閱量預測11月和12月的借閱量對預測模型進行檢驗。輸出結果為U=0.3014 0.6030。對比11月與12月的實際數據誤差率分別為0.225和0.183。
3 結束語
圖書借閱量受多因素影響,參考以上數據可見,BP神經網絡可以對圖書借閱量進行預測,且準確率較高。將此類預測系統應用于實際情況可對圖書館新書采購、服務環境改善等工作提供一定的理論依據。
參考文獻
[1]孫寶,趙艷梅,王志麗,等.基于借閱統計的采購量建模研究[J].情報科學,2011,29(1):103-107.
[2]張良均,曹晶,蔣世忠.神經網絡使用教程[M].機械工業出版社,2008.
[3]石維,李慶芬.淺論利用Elman神經網絡實現圖書流通量預測[J].科技情報開發與經濟,2011,12(21):18-20.
作者簡介:汪玉杰(1987-),女,碩士研究生,主要從事圖書情報方面的研究。