, ,
隨著信息資源的多元化發展,互聯網為圖書館用戶提供了資源獲取的多條途徑,傳統意義的圖書館也隨著信息技術的不斷發展而改變,主要表現在用戶對紙質資源的需求逐漸降低,利用數字資源進行教學與科研工作的需求逐步提升。數字資源是高校資源建設的重要組成部分,各高校圖書館在資源建設時不斷提高數字資源的采購經費比例[1]。
由于數字資源存在知識產權保護以及數據庫的商業化性質,數據庫商并不希望某一個單位購買的數據庫共享給非該單位用戶使用,同樣數據庫的購買單位也不希望自己購買的資源被無償使用[2]。因此高校在購買數字資源時,數據庫商都會明文規定數據資源的適用范圍,設置IP地址訪問限制[3],由專門的管理人員維護數據庫的使用權限。
為了維護單位用戶的使用權益,各高校圖書館也都采用各種技術實現數字資源的校外訪問[4-5]。如何在尊重知識產權的前提下,既不侵害數據庫商的權益,又能讓合法用戶隨時隨地方便快捷地訪問數字資源,是每個圖書館都在考慮的問題。圖書館作為資源保障中心,提供信息資源保障以及相關服務功能。
如何提高數字資源的使用效率,如何對圖書館購買的這些資源的使用情況進行合理的評價,如何提高用戶對資源需求的滿意度,也是圖書館在資源建設時應該重點考慮的。
近幾年,學者開始研究圖書館數字資源的利用統計及評價問題。西安交通大學設計了電子資源訪問網關系統,通過統一的身份認證獲取用戶日志,對電子資源的使用情況進行評價分析[6];北京工業大學也利用電子資源的日志,設計開發了電子資源日志統計分析系統[7]。
建立高校圖書館的資源統計系統,不僅可以對資源的效益進行評估,還可以從數據系統中對用戶的資源需求進行分析,利用分析數據向用戶提供分類服務。
南京曉莊學院圖書館(以下簡稱“我館”)數字資源校外訪問及統計分析系統的建設是為了方便本校用戶在校外使用圖書館的數字資源,從提高數字資源利用率和優化數字資源建設兩個方面考慮,構建優化的信息環境給用戶提供更好的服務。
系統使用代理服務器技術,將圖書館的資源站點地址映射到一臺代理服務器上,代理服務器可以記錄所有用戶的訪問日志信息,通過對用戶日志進行統計分析,可以得到數字資源及用戶的訪問情況分析表,為優化數字資源建設及用戶個性化服務提供基礎數據保障。
用戶權限的控制采用與數字化校園一卡通對接,實現用戶一卡通實名認證登錄,有效限制非法用戶的訪問。經過4個月的運行測試,系統的使用提高了數字資源的利用率,也為資源建設和信息服務部門提供了可靠的資源訪問統計數據。
隨著信息技術的發展,圖書館的資源逐步由紙質資源向數字資源不斷轉變,用戶對資源的利用也逐步從到館閱讀方式向遠程訪問方式轉變。為了滿足用戶遠程訪問數字資源的需求,圖書館都在建設本館的遠程訪問系統。圖書館可以借助于遠程訪問系統對用戶的資源行為記錄進行分析,從而形成以用戶為中心的資源建設目標。采用遠程訪問系統,可以提高圖書館數字資源的利用率,能更好地為教學和科研提供服務。國內圖書館都相繼開通了數字資源訪問系統,將圖書館所有的數字資源訪問匯集到一個系統或者平臺中管理。數字資源訪問系統的一般做法是校內可以通過IP地址直接訪問,而校外需要安裝客戶端,或者與圖書館文獻服務系統進行接口對接,輸入用戶名和密碼后可以訪問圖書館的數字資源。
由于數字資源訪問用戶大多是非計算機專業的人員,因此用戶使用的簡單、方便性應該是首先要考慮的因素。系統應該能夠實現用戶的數據資源遠程訪問,方便用戶在學校內外使用數據資源,實現身份統一認證。系統應具備較高的安全性和高性能的實時處理能力,實現多人并發登錄使用。設置訪問策略,對惡意訪問或惡意下載用戶及時提出預警,限制非法用戶的訪問。
為了實現資源的統計分析,對資源的使用情況給出合理性評價,系統要能夠記錄用戶的資源使用情況,給出資源使用情況分析結果。
系統采用代理服務器的方式,可以實現校園網用戶和校外用戶對圖書館資源的訪問。將圖書館的所有數字資源統一到一個系統中,不僅方便用戶登陸查找,也方便管理員對資源的使用情況進行查詢統計和分析。通過對系統服務器上的用戶訪問日志進行數據搜集和處理,獲取用戶在電子資源系統的訪問檢索及下載信息。
從安全角度考慮,代理服務器使用Linux系統。用戶權限的控制分為兩種情況,校內用戶直接通過IP認證自動登錄,外部用戶通過數字化校園的一卡通對接,實行用戶一卡通實名認證登錄,使用統一的入口訪問圖書館的數字資源,有效地控制非法用戶的訪問。
數字資源校外訪問及統計分析系統的總體構架如圖1所示。將所有的數據資源放到代理服務器上,通過地址轉換,將所有資源訪問的出口控制在一臺虛擬服務器上,代理服務器同時進行認證管理和日志記錄。用戶訪問系統時,認證服務會先判斷是否是合法用戶,日志服務會記錄所有訪問數據庫系統的行為數據,并將用戶訪問記錄通過網頁展示給管理員,可作為資源統計的依據。

圖1 數字資源校外訪問及統計分析系統的總體構架圖
系統實現的主要功能為遠程訪問功能和統計分析功能。
2.3.1 遠程訪問功能
實現圖書館數字資源遠程訪問的功能,用戶登陸系統時系統會根據用戶的IP進行判斷,將用戶分為校內用戶和校外用戶。校園網內部用戶可以直接訪問所有數字資源,用戶只要處于該IP段內,瀏覽器打開頁面時,用戶會自動以IP為當前賬號免密碼登錄。當用戶在校外訪問圖書館的數字資源時,用戶通過與OPAC對接,使用OPAC的賬號和密碼進行統一認證登陸。用戶的賬號信息存儲用戶的院系、聯系方式等,方便數據的統計及消息推送。
2.3.2 統計分析功能
當用戶訪問圖書館數字資源訪問系統時,系統會在后臺記錄下用戶的每一步操作日志,如用戶選取的是哪個數據庫、輸入的檢索詞、點擊的鏈接、下載了文章或電子書等。通過代理服務器記錄的用戶訪問日志,可以將這些主句按照不同的統計方法進行統計和分析,并生成相應的報表。
圖書館數字資源校外訪問及統計系統分為前臺資源訪問頁面和后臺管理端,普通賬戶登錄系統之后可以使用圖書館的授權使用資源,管理員賬戶同時可以登錄到管理端,查看資源統計情況。資源訪問頁面可以根據文獻類型、學科門類、中文外文等進行分類查看。系統結構如圖2所示。
前臺資源訪問頁面是所有用戶都可以看到的,用戶登錄系統之后圖書館所購買及試用的資源均顯示在頁面上,資源展示將按照站點資源管理模塊中設置的資源類型展示給用戶。如按照文獻類型分類時,可以將資源數據庫分為電子圖書、期刊論文、多媒體資源、學科導航等;按照學科門類分類時,可以將資源歸類到各個學科下面,用戶可以根據自己的學科需求訪問自己需要的數字資源。下面主要介紹后臺系統管理模塊。

圖2 系統模塊結構圖
站點資源管理模塊中可以設置系統中所有的站點資源,對資源站點進行添加、修改和刪除,添加或修改站點信息時需要設置站點名稱、站點主域名、站點端口、站點首頁地址、用戶組、文獻類型、學科門類、中文外文、是否使用資源及試用結束日期、是否重定向、資源描述等。
用戶組的設置可以將不同的資源設置為被不同組的用戶訪問,如可以特殊設置試用資源。試用資源在試用結束日期到期時,資源將會自動停用。地址重定向的設置是指用戶通過前臺導航頁面訪問的資源才會被本服務器托管,否則用戶在前臺導航頁面看到的資源是沒有經過服務器代理的。部分訪問量大的網站或者免費的資源,例如暢想之星光盤下
載資源網址,希望通過本服務器的資源導航顯示出來,但希望用戶直接訪問暢想之星網站,而免費的資源不需要代理服務器也可以正常訪問。
為了保證高校師生的合法權益及圖書館數字資源的產權保護,數字資源的管理必須進行用戶登錄認證。管理員在此模塊還可以對用戶進行分組管理,用戶分組體現在站點資源管理的授權,可以設置哪些用戶組可以授權訪問不同的資源,同時還可以設置每種用戶的最大同時登錄數。用戶的認證管理分為管理員帳戶、內部認證用戶、外部認證用戶和受限制用戶4種類別。
管理員賬戶不受范圍限制,可以訪問所有資源,并具有所有模塊的操作權限,可以設置或修改系統的站點資源,也可以登陸統計模塊進行資源使用分析。內部認證用戶,管理員將校園網的IP地址輸入到IP認證列表中,校園網內部用戶可以直接訪問所有數字資源,用戶只要處于該IP地址段內,瀏覽器打開頁面時,用戶會自動以IP地址為當前賬號免密碼登錄。外部認證用戶是嵌入的外部賬號系統,目前通過與匯文OPAC對接,使用OPAC的賬號和密碼進行統一認證登陸,也可以設置為使用郵箱賬號,這樣用戶就不會忘記賬號和密碼了。如果需要禁止惡意用戶登陸,可以將惡意用戶的賬號添加到限制用戶列表里,也可以設置受限制的開始時間和結束時間。
下載統計模塊中的功能有數字資源統計匯總、活躍用戶使用排行、熱門資源訪問排行、用戶登入次數。“數字資源統計匯總”可以統計某時間內所有資源的下載次數并在圖中顯示,如圖3為本校某一個月內數字資源的訪問情況。從圖3可以看出,2015年8月份的數字資源訪問統計信息。數字資源訪問的統計分析,減少了人為因素對資源利用的參與,其結果具有較高的客觀性和準確性。
“活躍用戶使用排行”統計某段時間內下載量為前50名的活躍用戶排行榜,并自動將前10名用戶排行用柱狀圖顯示出來。“熱門資源訪問排行”是查詢熱門資源的排行榜,“用戶登入次數”查詢一段時間內用戶登入次數統計,以折線圖顯示出來。

圖3 2015年8月份本校數字資源統計匯總
資源統計模塊可以對圖書館數據庫資源的訪問量進行統計分析。如用戶下載詳細信息查詢中可以根據日期、資源名稱和用戶賬號來查詢用戶的下載詳細信息,查詢內容包括下載時間、站點、下載文件名、用戶賬號、客戶端IP、姓名、部門等信息。
此模塊還可以統計資源訪問趨勢、用戶訪問趨勢、數字資源匯總、用戶訪問匯總等。如按月統計數字資源CNKI的下載結果(圖4)。從圖4可以看出,由于系統是4月份開始測試,5月份開始上線,而7、8月份是暑假期間,下載量不會增長太快,統計時間為2015年9月。

圖4 2015年4-9月CNKI數字資源的下載量
我館數字資源遠程訪問系統自從2015年4月上線以來,得到用戶的大量好評。系統的運行方便了教職工及學生訪問學校的數字資源,系統登錄簡單,不需要安裝客戶端或插件,也不需要提前登錄VPN,只要有網絡可就可隨時隨地訪問資源。信息服務部的反饋是用戶電話咨詢資源訪問情況的變少了,需要遠程桌面協助的用戶沒有了,用戶基本上都是查詢或修改系統初始密碼。從管理者的角度來看,系統的運行使用可以實現以下幾個功能。
通過數字資源利用率數據信息,有針對性地對不同的數字資源進行宣傳和組織培訓,以達到使廣大用戶充分了解和利用圖書館數字資源的目的。做到資源的合理化利用,提高資源的利用率,避免數字資源的浪費;也可以根據依據資源的利用情況有針對性的對用戶開展培訓,提高數字資源的利用率。
以CNKI數據庫為例,系統上線以來資源的下載量上升了20%。統計2015年全文下載的數據量,并與前兩年同期每個月的全文下載量進行比較,結果如圖5所示。由于2月份和7、8月份是寒暑假,用戶的下載量有所降低,但與同期相比下載量還是上升的。

圖5 CNKI數據庫同期每月全文下載量比較分析
從圖書館的統計需求出發,對用戶訪問數字資源的行為進行統計分析,系統實現的統計功能主要包括數字資源訪問趨勢、數字資源匯總、用戶訪問趨勢、用戶訪問匯總、用戶下載詳細信息等內容。有了用戶訪問數字資源的原始數據,同樣可以統計到某一種資源的訪問趨勢、某個用戶的訪問趨勢以及數字資源的匯總統計等。對數字資源的訪問情況進行統計可以直觀地看出資源的利用率,可以作為優化資源的采購方案。
通過對用戶檢索及下載內容的分析,可以得到用戶的資源需求與研究動態,結合學校重點學科發展的方向,調整數字資源建設和采購的方向,優化數字資源的建設。根據用戶的下載行為統計數字資源的利用率,可以優化數字資源的建設方案,達到合理應用資源經費的目的。
在電子資源使用的過程中,有用戶使用代理軟件批量下載的情況,被數據商視為“違規”下載,數據商會將學校的某個IP段或整個學校的使用權停止使用,這樣會使學校的權益受到損害[8]。
通過系統可以直觀地看到用戶的下載明細,同樣也可以直接統計到用戶在某段時間內的下載量排行,實現網絡監控和實時監控資源使用情況。服務器記錄用戶對數據資源的訪問,如果提前設置好策略,就可記錄惡意下載日志,對非法的訪問或下載,服務器以郵件或短信的方式及時提醒網絡管理員。對惡意用戶進行控制權限,我們會將惡意用戶的賬號添加到限制用戶列表里面,從而維護合法用戶的權益。
圖書館數字資源校外訪問及統計系統的主要目的,是方便用戶對數字資源的訪問,讓用戶能隨時隨地訪問圖書館的數字資源,同時對圖書館所購買的數字資源使用情況進行統計分析,了解用戶的資源獲取行為,從而為圖書館的數字資源建設及用戶服務工作提供真實可靠的統計分析數據。系統的運行獲得了較好的效果,但是也存在一些問題,需要進一步完善。
外部用戶通過對OPAC授予權限統一登錄,但是校園網內部通過IP登錄的用戶部分,數據庫只能記錄到其IP地址,不能與用戶的工號或學號相關聯,所以要想做進一步的數據挖掘開展個性化服務,需要在校內也進行實名制認證。另外,代理服務器的數據傳輸沒有VPN那樣隱秘,如果代理服務器遭到病毒入侵、被惡意攻擊或者無意泄露用戶名密碼等都會造成安全隱患。因此校外訪問需要重點關注監控日志,監測惡意用戶的訪問或下載,防止非法用戶的使用。
資源的多樣化決定了圖書館拓展多渠道服務的必要性,圖書館的資源利用率的統計方式也需要從不同角度進行分析。如不能局限于從入館人次,圖書的借閱量分析圖書館的利用率。高校圖書館由于用戶教學與科研、學習的場所不固定,用戶通過網絡途徑訪問圖書館的資源,不僅節省了用戶的時間,提高了使用效率,同時提升了圖書館資源的利用率,避免了資源建設浪費,也在一定程度上提升圖書館的服務能力。
圖書館遠程訪問系統不僅是一個工具,更是一個拉近用戶與圖書館之間的橋梁。圖書館的資源信息服務,可以通過這個橋梁源源不斷地將前沿的學科信息推送給用戶,并通過用戶訪問信息獲得用戶的具體需求,形成了用戶與圖書館之間圍繞資源的互動,可以使圖書館資源建設更加能夠貼近用戶的真實需求,從而提升用戶的滿意度。圖書館技術的創新,不僅僅是體現在純粹技術應用方面,更加體現在基于人性化需求的技術提升方面。圖書館技術無止境,缺乏的不是技術人才,而是創新性思維。