王最 王立宏 劉斌
摘要:高校數字信息化建設快速發展,圖書館數據呈爆炸性增長,對相關數據進行統計分析有助于優化圖書館管理,提高服務水平。但圖書館大數據研究過程中存在概念不統一、研究對象單一、認識不全面等問題,嚴重制約了圖書館現代化管理水平的提高。針對上述問題,提出應采取規范統一概念、擴大研究內容范圍、采用多維度分析等措施,促進高校圖書館大數據研究科學健康快速發展。
關鍵詞關鍵詞:大數據;統計分析;圖書館
DOIDOI:10.11907/rjdk.171727
中圖分類號:TP391
文獻標識碼:A文章編號文章編號:16727800(2017)011020002
0引言
大數據(Big data)是在一定時間內無法使用現有技術進行收集、運輸、處理和分析的數據集合,需要新理論、新技術才能發現和挖掘出其價值的高增長率和多樣化的信息資產[1](研究機構Gartner觀點),它通常具有數據規模大、數據增長快、數據類型多樣和價值密度低4大特征[2]。大數據的價值在于對數據進行深度分析,挖掘出其中的規律,進而運用規律服務于人們的生產生活,而不在于數據規模是否龐大。假如將大數據比作一種產業,那么這個產業能夠盈利的關鍵之處就在于提高數據“加工能力”,通過“加工”實現“增值”。
高校圖書館大數據指高等學校在圖書館運作過程中產生的海量數據,如采訪、編目、典藏、流通等環節積累和產生的數據[3]。通過對數據進行采樣和統計分析,能為圖書館采訪剔舊管理工作提供統計基礎,為領導決策提供科學依據,優化借閱規則、深化讀者服務、提高圖書利用率。
1圖書館大數據研究現狀
圖書館大數據統計分析在優化圖書館職能方面地位十分重要,吸引了諸多學者進行研究。熊哲夫[4]針對圖書館數據服務現狀,提出基于數據運營平臺對現有業務流程和服務模式進行重構,促使圖書館服務水平更加智能化,管理工作更高效;陳學文[5]采用文獻分類、讀者排行榜、文獻借閱排行榜以及文獻年借閱量等維度,對襄樊學院圖書館2008-2010年的流通數據進行了統計分析,總結出讀者閱讀規律和特征,有助于優化館藏文獻結構,調整文獻布局,提高文獻利用率,為上層領導決策提供有力支撐;袁紅軍[6]針對大數據環境下圖書館參考咨詢服務內容和形式進行了研究分析,提出了基于大數據思維的圖書館參考咨詢服務創新機制研究框架,為圖書館咨詢模式的形成和咨詢服務水平的提高提供了新方法和新途徑;王蘭英[7]提出大數據是高校圖書館的財富,也是服務創新的依據和源泉,采用大數據能掌握讀者閱讀需求,創新服務策略;吳玉等[8]針對大數據時代特點,提出高校要把握大數據時代機遇,通過對圖書館產生的海量數據進行統計,分析讀者預約情況,評估已有文獻結構是否合理,從而促進圖書館采訪水平的提升。
圖書館大數據在分析讀者閱讀喜好、揭示閱讀規律、統計熱門書籍、分析圖書利用率和借閱量等方面具有舉足輕重的地位,為圖書館圖書采購行為、服務策略、管理和服務水平、數據圖書館建設、用戶信息化服務和個性化服務等提供科學依據。作為圖書館大數據的關鍵問題和核心問題,圖書館大數據統計分析在提升圖書館應用和服務水平方面有著至關重要的作用。
2存在的問題
伴隨著圖書館信息化和圖書館資源數字化進程的加快,圖書館管理系統每天都會產生龐雜的表單信息。
通過大數據統計分析圖書利用率、讀者排行榜、圖書借閱率等情況,可以客觀反映讀者的借閱傾向、館藏資源質量等問題,為圖書館資源建設及設備合理配置提供重要依據。筆者2017年3月21日登陸CNKI數據庫,用“大數據”、“統計分析”及“圖書館”為關鍵詞進行檢索,得到結果為14篇,可見國內在這方面的研究甚少,還處于起步階段。
目前關于圖書館大數據統計分析的研究主要集中在以下3個方面:①使用文獻借閱率指標預測讀者閱讀需求和閱讀傾向;②采用文獻利用率統計分析館藏文獻和圖書布局結構是否合理;③基于借閱量、入館率等統計數據揭示借閱量不足等問題,并提出相應解決措施。
圖書館大數據統計分析研究問題主要表現在以下幾個方面:
(1)概念不統一。對 “文獻利用率”概念定義較少,只有河北聯合大學在《基于文獻利用率的館藏分析》中對其進行了定義和說明[9]。關于文獻利用率,同樣的普通高校,同樣用中圖法分類統計出來的文獻利用率差別很大。比如:山東農業大學2010~2012三年平均利用率為38.96%,塔里木大學的綜合利用率為12.9%,而伊犁師范學院統計的利用率則超過了100%[10]。之所以會出現這種情況,是由于該作者將文獻利用率概念與其它概念混淆。
(2)研究對象單一。圖書館大數據統計分析中值得研究的數據較多,比如:借閱人次統計、文獻外借周期統計、圖書借還周轉統計、讀者借閱排行統計、圖書預約排行統計等。但目前關于這方面的研究都集中在文獻利用率、借閱量這兩個統計指標上,對于圖書館其它有價值的數據研究幾乎沒有涉及,而這些沒有涵蓋到的圖書館大數據,往往能夠揭示出高校圖書館的運行規律。
(3)認識不全面。館藏結構包括館藏規模結構、館藏時間結構、種冊及經費比例結構、館藏學科結構、館藏等級結構、館藏語種結構、文獻類型結構(圖書、期刊、專利文獻、科技報紙、學位論文等)、書刊比例結構、讀者知識結構(文化程度、研究范圍等)。從館藏結構所包含的內容來看,它受多種因素影響。因此,研究如何優化館藏結構是較復雜的問題,應從多維度進行分析研究,但現有的研究方法僅僅只是通過分析文獻利用率來推測館藏結構是否合理,可能走入以偏概全的誤區。
3對策措施
為保證高校圖書館能夠有效利用大數據進行統計分析,優化圖書館管理職能、提高服務水平,針對以上問題,筆者提出以下措施:
(1)規范統一概念。比如:文獻利用率的計算方法是:在指定時間段內,某館藏地的文獻借閱冊次或種次/本館或全館指定時間段入藏的文獻總冊數或種數(同一冊書或刊被借閱多次,仍記為一冊),所以文獻利用率不可能超過100%。而文獻借閱率的計算方法是圖書借閱次數與其復本數之比。通過比較兩者計算方法可以看出,文獻利用率是針對某類圖書的借閱情況,而文獻借閱率是針對某冊圖書的借閱情況。endprint
(2)擴大研究范圍。目前,圖書館數據的研究基本集中在文獻利用率、借閱量上,而圖書館值得研究的數據非常多。比如:采用文獻預約情況統計分析可知哪些圖書最炙手可熱;借閱外界周期統計可分析當前圖書的借閱規則是否合理,是否符合讀者需求;圖書借閱排行榜可以得出哪些圖書或哪類圖書最受歡迎等等。所以應該擴大研究數據范圍,而不應只限定在某一個或兩個數據特征上。通過全面分析,有助于了解、掌握圖書館運行現狀和規律,進而對圖書館館藏結構進行優化,合理安排業務流程。
(3)針對特定問題,進行多維度分析。在研究比較復雜的問題時,不應僅分析一兩個因素就得出結論,應該全面分析得出有效結論。比如:前文提到的館藏結構受館藏規模結構、館藏時間結構、種冊比例及結構、經費比例結構、館藏學科結構、館藏等級結構、館藏語種結構等方面的影響,應從多維度進行深入分析研究,提出一種綜合或加權的評價標準,才能出客觀規律,進而采取有效的解決方案。
4結語
大數據時代給圖書館管理和服務帶來新的發展機遇,圖書館界應正確認識大數據,充分挖掘大數據的價值,利用大數據分析結果,有效預測圖書館事業發展過程中的新變化和新趨勢,科學預測和判斷讀者需求,為圖書館的科學管理提供依據,最大限度地滿足讀者需求。
參考文獻參考文獻:
[1]蘇明偉.圖書館大數據體系構建的探討[J].科技創新與應用,2015(21):8788.
[2]張宏.我國高校圖書館大數據研究現狀分析[J].圖書館工作與研究,2015(5):4650.
[3]蒲虹穎,閆智.論大數據時代以及給圖書館帶來的挑戰[J].吉林廣播電視大學學報,2016(8):124128.
[4]熊哲夫.淺談圖書館大數據的服務模式創新[J].電腦知識與技術,2016(6):1112.
[5]陳學文.高校圖書館流通數據的統計分析[J].科教文化,2012(6):166167.
[6]袁紅軍.大數據時代下圖書館參考咨詢服務創新機制探究[J].圖書館工作與研究,2017(1):1619.
[7]王蘭英.高校圖書館大數據時代數據建設及功能轉型探析[J].圖書館界,2014(1):6163.
[8]吳玉,張作來,苗永菊.大數據時代高校圖書館面向學科建設的中文圖書采訪機制[J].中國冶金教育,2015(6):8185.
[9]趙鴻雁,馮鑫,李秀鳳,等.基于文獻利用率統計的館藏分析——以河北聯合大學主校區圖書館為例[J].農業網絡信息,2014(2):7779.
[10]祁瑞.我院圖書館中文圖書流通數據統計分析及提高文獻利用率的措施[J].伊犁師范學院學報:社會科學版,2010(3):137140.
責任編輯(責任編輯:杜能鋼)endprint