史克紅(鄭州科技學院圖書館)
圖書館數字資源訪問監控系統的設計與實現
史克紅(鄭州科技學院圖書館)
互聯網和計算機的迅猛發展催生出各種數字資源,但質量參差不齊,采購單位的使用效果也不盡相同。本文針對圖書館數字館藏評價沒有統一標準、數據統計分析存在諸多問題的現狀,開發了數字資源訪問監控系統,運用 ASP.NET和SQL Server 2008相結合對平臺進行了基礎實現。本系統的研發為擁有海量數字資源的圖書館提供一個輕便、快捷、易用的軟件系統,精細完整地記錄用戶訪問與瀏覽行為信息,靈活易讀地展現電子資源的使用統計結果,科學全面地評價數字資源的價值和質量。
數字資源;評價系統;數字資源訪問監控
近年來,國內高校先后購置了大量的數字資源供廣大師生開展教學科研活動。對不斷出現的種類繁多、價格不菲的數字資源,圖書館如何合理利用有限的建設經費,建立符合本校特點又具有特色的數字館藏;如何在數字資源的建設中選用適合的、利用率高的、專業性強的、讀者滿意的、具有較高學術水平的數字館藏,已經成為現代圖書館建設的首要問題,同時也是所有圖書館人在進行數字圖書館建設實踐中面臨的嚴峻挑戰。
目前,數字資源使用情況的統計主要由數字資源商提供,數據不夠及時、準確,館員統計海量資源使用情況更是費時費力。通過市場調查,了解到有商家已研發出了相應的系統,但并沒有真正在圖書館推廣使用,原因主要有以下幾點:參數和格式參差不齊,無法便捷提供豐富多彩的統一性圖形、表格報告;數據庫使用效果評估缺乏合理性,無法提供資源采購和應用的決策參考;用戶校外訪問只能通過VPN或遠程,而校內IP用戶的使用量根本無法統計;讀者使用規律與服務績效分析無法實現;數據庫遭遇非法闖入及惡意下載,不能及時警告或阻止;如需精確數據統計,往往需要購買尖端的硬件設備并輔以復雜的部署環境;安裝過程往往需要校內多部門(網絡中心等)的許可及配合,增加了工作難度等。基于以上原因,我們開發了圖書館數字資源訪問監控系統。它以圖書館網絡建設為基礎,資源整合、數據挖掘和知識發現為最終目標,能夠應對上述提到的目前圖書館數字資源應用中所遇到的全部問題,為圖書館數字資源應用服務的發展提供堅實基礎和有力保障。
數字資源訪問監控系統服務器與校內核心交換機連接,通過獲取網絡數據,解析網絡數據包,分析統計并存儲數據到數據庫,并通過瀏覽器前端展示數據。本系統對大量網絡數據包進行及時和完整的采集,采取有針對性的過濾,進行準確的解析和安全有效的存儲;把存儲數據依據用戶的查詢統計要求,給出表格統計結果,并通過圖形直觀地顯示出來;通過對資源使用數據進行多維的科學分析,得出資源的具體使用情況,并提供使用報告;針對不良的數字資源訪問行為以及所引起的流量異常進行實時監控、報警和記錄,并可以對其訪問實施鏈接阻斷。
2.1系統的架構設計和關鍵技術
系統采用B/S架構,易于開發和維護。視圖層采用能夠將 ASP.NET應用程序的視圖、模型和控制器分開的MVC設計模式。業務邏輯層將圖書、借閱、讀者和管理員分別抽象為實體,各自的信息和行為模式都封裝在它們的類中,這種面向對象的設計方法縮短了開發周期。[1]數據訪問層采用 ADO技術進行數據庫訪問,并與 ASP結合起來,建立提供數據庫信息的網頁內容,對數據庫進行查詢、插入、更新、刪除等操作。[2]
系統使用.NET開發工具VS2013,采用MVC4+EF6.0開發方式,自動產生數據模型,使數據庫的操作更加簡單。當遇到多表查詢和更新時,仍然是數據庫的存儲過程,減小對數據庫的壓力,處理數據時返回結果較快。后臺設計主要采用SQL Server 2008作為數據庫系統,SQL Server 2008中的 Declarative Management Framework(DMF)是一個新型管理框架,大多數數據庫操作通過DMF定義一組簡化日常維護操作的通用策略,降低總擁有成本。[3]SQL Server 2008提供存儲性能數據的中央數據存儲庫、收集廣泛的性能數據。數據庫設計采用關系數據模型,將各類數據規范地存儲在數據庫中。[4]
2.2系統業務流程設計
系統業務流程設計內容是數據輸入開始到獲得輸出為止,各個處理工序的邏輯過程。本系統管理員通過輸入用戶名和密碼登錄,根據該用戶名和密碼核實操作員的使用權限,結合授權進入系統進行操作。根據用戶需求,把操作員權限分成兩類:(1)系統管理員用戶權限(維護人員),擁有此系統的所有權利,可增加和刪除操作員,并給操作員賦予權限;(2)普通管理員權限,只擁有此系統的基本使用權限,完成資源信息的錄入、查詢、統計數據的查看等基本信息使用權限。系統業務流程如圖1所示。
前臺主頁包括資源管理、統計分析和監測預警3個子系統,采用內嵌框架技術。

圖 1 系統業務流程圖
2.2.1資源管理子系統的實現
資源管理模塊包含四個方面內容:館藏資源管理、商務管理、讀者管理和系統管理。
(1)館藏資源管理包括三部分:館藏資源總覽、館藏資源查看、資源屬性設置。館藏資源總覽按照不同資源屬性區分數據資源,給出不同屬性資源的數量和所占比例。主要是數據的增、刪、改,資源的錄入,包括資源全稱、資源簡稱、資源分類、資源年限(開通日期、截止日期)、資源域名、資源提供商等信息的錄入。館藏資源查看,顯示現有資源列表、添加新資源、可組合篩選出符合要求的館藏資源、編輯館藏資源。使用Entity Framework EF 6.0.0對數據庫操作,對需要操作的字段進行Model(數據對象)編寫。資源屬性設置,通過對數字資源分類管理,從語種、數據庫類別和學科范圍三個方面設置。
(2)商務管理從產品供應商和合同管理兩個方面設計。產品供應商菜單中包含供應商列表、供應商編輯;合同管理中包含合同列表和合同編輯,即將到期合同可通過郵件提醒。
(3)讀者管理可實現多校區管理。通過讀者分組,對不同區域分配不同的IP段,可添加和編輯。
(4)系統管理包含賬戶管理和短信提醒管理兩個方面。在系統運行出現問題的情況下,有短信提醒功能,保證24小時監測系統運行。不同級別的賬號管理范圍不同,針對系統問題可不定時給不同用戶發送短信提醒信息。在系統不能正常運行的情況下,系統會發送給圖書館負責人短信提醒。
2.2.2統計分析子系統的實現
(1)數據采集與分析基本指標。對數字資源評價主要是對其使用情況、成本和性能等指標綜合評價。評價數字資源使用情況的主要指標有登錄次數、檢索次數、下載次數。登錄次數是一段時間內讀者登錄該數據庫的次數。該指標反映一個讀者對這個數據庫是否感興趣,但它并不能反映出讀者對該數據庫內容的使用效率,因此登錄次數這個評價指標是一個較次要的指標,但有必要提出。
檢索次數是一段時間內讀者在數據庫中使用檢索式的次數。這項指標可從三個方面評價:一個讀者一次檢索時使用的檢索式的個數;一段時間內對該數據庫使用檢索式的個數;檢索時使用的檢索詞與學科之間的關聯度。一個讀者在一次檢索時使用相同或相近的檢索詞越多,說明該數據庫的檢索效率越低,查全率越差。
下載次數是一段時間內讀者從數據庫服務器下載到本地終端上的全文或部分信息的數量,這是一個非常重要的評價指標,因為讀者對非常感興趣的文獻通常要下載下來,以便將來進一步研究。
數字資源的成本包括采購價格、檢索系統成本、相應的軟硬件設備的投入成本和管理成本的總和。數字資源的評價要體現以讀者為中心的原則,數字資源的性價比常常和資源的使用情況結合起來分析,常用評價指標主要有登錄成本、檢索成本、全文下載成本。登錄成本是指讀者登錄一次數據庫的成本投入。檢索成本是指讀者檢索一次數據庫的成本投入。下載成本是指讀者每下載一篇全文(文摘)所需的成本投入。[5]
本系統針對圖書館每種數字資源的訪問、應用、下載等行為的數據分析與評價,全都以下列四個“基本指標”的采集和分析為基礎進行計算與統計。①首頁訪問次數統計,用戶訪問數據資源網站首頁的次數,對于統計規則來說,是首頁 URL地址在統計時間段范圍內合計出現的次數。②數據庫及用戶應用次數統計,在統計時間段范圍內,所有用戶在一個數據資源站點下,產生的所有與首頁 URL地址不同的頁面次數。從連接進入算“首頁點擊”,刷新算點擊一次,收藏在收藏夾里直接進去,也算一次。總之,發生網絡請求的就算一次,但視頻的點擊暫停等是不算作點擊次數的。③下載次數統計,在統計時間段范圍內,所有用戶在一個數據資源站點內下載、并保存生成為本地物理文件的累計操作次數。④在線活動時長統計,對一個數據資源網站的“訪問活動”中,首次訪問時間和最后一次訪問時間之間的間隔,算作一次“活動時間”。在線活動時長,是指在統計時間范圍(例如從月初到月末)內,所有用戶對該資源網站各次“活動時間”的累計時長。
(2)系統統計結果。統計分析模塊是通過資源使用情況、資源成本、讀者使用情況來綜合分析產品的性價比和受歡迎程度。統計分析模塊使用COUNTER標準,對數字資源的使用情況規定了三種統計方式:報告1:每月、每種數字資源總訪問量和下載量;報告2:每月、每種數字資源的被拒絕請求量;報告3:每月、每種類型數字資源總檢索及會話量。
目前,本系統采用的實時統計、自定義圖表等統計方式,超越了數據資源商提供的最短按照月份來提交的頻次。完全滿足用戶任意時間點(段),甚至精確到小時來導出每個數據庫使用情況的固定圖表(或表格)的需求,能夠更大程度地滿足高校對于資源使用情況總體的把控。表現為下述三種優勢:今后不用煩請每家數據商必須配合提供數據;具有雙重分析標準,更有利于監控數據商提供數據的準確性;能夠使用同一種標準和表格圖形統計所有的電子資源。
2.2.3監測預警子系統的實現
監測預警子系統從商務和系統管理2個角度監測數據庫資源。監測數字資源使用行為,對不良閱讀與使用行為進行預警,保證數字資源的正常使用。不良閱讀與使用行為如:某ip主機1分鐘內向某電子資源數據庫請求訪問200次;某ip主機持續30小時對某電子資源數據庫進行全文下載;某ip主機月訪問某電子資源流量異于其他所有ip地址,超出下載閾值;某ip主機每天都是在凌晨2~5點對電子資源數據庫進行大量訪問。
針對這些可能會影響圖書館電子資源正常訪問的不良使用行為都需要做監測預警。監測預警子系統通過資源監測預警以圖形或列表的形式展現出異常情況比例,如圖2所示。
在數據庫中開啟了作業,每20分鐘對關鍵數據進行掃描,出現錯誤時以郵件、短信方式發送給管理者。當出現錯誤數據、冗余數據時能在后臺查詢得到。通過查看資源數據可以看到原始數據和實時數據情況,能夠更直觀地看到數據變化過程。
數字資源訪問監控系統依據對網絡數據的解析推導出讀者對數字資源的使用情況統計。數據統計參考標準是遵從 COUTNER的標準規范。

圖2 資源無效訪問比
3.1統計數據的準確性
目前,國內外許多家數據資源商的統計標準實際上是不同的,而且差異極大,以后也不可能完全實現統一,只有極少數幾家外文數據庫廠商遵循著COUNTER標準,所以不具備統一性。其次,絕大多數資源商的統計標準偏向于統計數據的最高值,即把一些無用鏈接全部計算在內。例如:在“應用次數”統計中,點擊一次鏈接的總體使用次數為29次,但有效的次數僅為16次,絕大部分數據商都會按照29次計算,而本系統會剔除那些無效的圖片鏈接等,僅僅計算index、css和js等有效文件。這就是為什么本系統計算得更為精確,同時統計數據會比廠商統計的數據量要略少的原因。
3.2統計數據的公平性
本系統采用人性化的、實用性的標準統計數據,所有數據庫采用一個標準統計,雖然數據量會少于數據庫廠商,但卻是真實的、有效的數據。并且它能夠提供給圖書館相對的可比較的統計量。例如:在某個圖書館,系統統計的A、B兩個數據庫的使用量數據比例為1:100,而A、B兩家廠商提供的使用量數據比例為1:1000,顯而易見有一個數據庫廠商數據造假。所以統計的最終,圖書館往往關注的是各數據庫的相對使用次數,而不是絕對次數。本系統能夠幫助圖書館在某種程度上統計出數據庫的真實使用情況。
圖書館數字資源訪問監控系統為數字資源科學評價提供依據,實現了圖書館對于數字資源服務績效與使用狀況的精確評估;幫助圖書館在數字資源購買與選擇、數字資源針對性發展與建設、讀者服務策略調整等方面實現科學決策。
本文順利通過了Load-Runner的性能測試。[6]經由本館試用,對系統所提供的功能進行了確認,系統能夠幫助用戶評價出哪些資源是讀者歡迎的,哪些是不受歡迎的,哪些是使用效率高、質量高的數字資源,為館藏發展決策提供大量的數據依據。
[1]李瑩.山西電大圖書管理信息系統的設計與實現[D].北京:北京工業大學,2012.
[2]Vivek Chopra.JSP高級程序設計[M].北京:機械工業出版社,2001:45.
[3]微軟公司.SQL Server 2008數據庫應用開發基礎[M].北京:人民郵電出版社,2010.
[4]薩師煊,王姍.數據庫系統概論[M].北京:高等教育出版社,2000:4.
[5]宋迎迎.數字館藏評價指標體系研究[D].鄭州:鄭州大學,2006.
[6]車清太.軟件測試方法和策略[J].山西電子技術,2003(7):10-11.
The Design and Implementation of Library Digital Resource Evaluation System
Shi Ke-hong
The rapid development of Internet and computers accelerated the birth of a variety of digital resources which are purchased by colleges,universities and research institutes.Uneven quality of the digital resources led to different use effect.This article develops a library digital resources evaluation system by investigating the operation and management mechanism of the system,which not only provides necessary purchasing information for library acquisition,but also provides valuable reference information for the readers.Research and development of library digital resource evaluation system can basically meet the demand of statistical data analysis and scientific evaluation of various digital resources in most college and university libraries.
Digital Resources;Evaluation System;Digital Resource Evaluation
G255.76
B
1005-8214(2016)07-0093-04
史克紅(1975-),女,鄭州科技學院圖書館館員,研究方向:圖書館信息化。
2015-12-03[責任編輯]王鈞梅