摘 要:針對圖書館電子資源惡意下載的診斷與限制問題,文章對關(guān)于高校海量的圖書資源進(jìn)行了介紹,提出了圖書資源安全的存儲(chǔ)與備份的要求,探討了圖書資料的快速查詢,包括對電子圖書的快速查詢和對電子圖書違規(guī)使用的保護(hù),探討采用行為審計(jì)設(shè)備的訪問識(shí)別與記錄,提出針對具體訪問數(shù)據(jù)包的特征分析與控制方法。
關(guān)鍵詞:圖書館;電子資源;惡意下載;診斷
電子資源在現(xiàn)代圖書館中所占的份額越來越重。高校在圖書購置方面的花費(fèi)也有很大一部分是投入在電子資源的購買上。電子資源指國內(nèi)外出版商發(fā)行的、由學(xué)校購買了校園使用權(quán)(或院系使用權(quán))的網(wǎng)絡(luò)正式出版物或由學(xué)校建設(shè)的數(shù)字資源,包括數(shù)據(jù)庫、電子期刊、電子圖書和多媒體資源等。隨著信息化建設(shè)的深入,電子資源越來越顯示出其優(yōu)越性。
1 海量的圖書資源
在南潯的古鎮(zhèn)里面,曾見過一屋子的磚,上面刻了密密麻麻的字,比最早的書簡還要占地方,一間客廳也放不了幾本書。而現(xiàn)在,一般10G容量的硬盤就可以存一兩萬本的書籍。電子圖書的存放空間問題不再是主要的問題。按照前面的算法估計(jì),一座千萬冊書籍的圖書館只要幾十個(gè)TB的容量即可,最多也就是兩三臺(tái)個(gè)人電腦所占的空間。隨著技術(shù)的進(jìn)步,硬盤的價(jià)格越來越低,海量的數(shù)據(jù)存儲(chǔ)越來越低成本、越來越時(shí)尚。在大規(guī)模關(guān)系型數(shù)據(jù)庫技術(shù)、便攜式數(shù)據(jù)文件技術(shù)、各種索引技術(shù)的支撐下,海量圖書資源的存放與索引也逐漸實(shí)現(xiàn)了自動(dòng)化。電子圖書資源的規(guī)模也基本沒有真正意義的上限。
2 安全的存儲(chǔ)與備份
基于現(xiàn)代技術(shù)的快速備份技術(shù),異地容災(zāi)技術(shù)等都為數(shù)據(jù)資源的安全提供了有效的保障。省卻了傳統(tǒng)圖書修復(fù)的人力和物力。同時(shí),也不用再擔(dān)心有人在書上亂寫亂劃而影響下一個(gè)人的閱讀。每個(gè)人只修改自己的拷貝,只在自己的空間內(nèi)做筆記。
3 圖書資料的快速的查詢
結(jié)合各種優(yōu)化的索引技術(shù),基于關(guān)鍵索引信息的查詢耗時(shí)可以優(yōu)化在毫秒級(jí)內(nèi),得到的結(jié)果快而全;通過一定的條件可以繼續(xù)篩選,直到找到有用的文章;可以在復(fù)制、粘貼間完成文章的摘錄。基于圖書文獻(xiàn)管理軟件的查詢(如EndNote,NoteExpress等),更是可以方便地在文章引用的過程中自動(dòng)添加參考資料索引,方便地形成結(jié)構(gòu)化的文章。
3.1 對電子圖書的快速查詢
電子圖書資源在區(qū)域控制、資源利用率統(tǒng)計(jì)等其它諸多方面也都有著硬拷貝無法比擬的優(yōu)勢。盡管如此,在電子資源推廣的過程中仍有許多新的課題,比如電子資源的惡意下載問題。一般情況下,高校圖書館所購買的電子資源中,有很大一部分是最新的期刊數(shù)據(jù)庫,包括國內(nèi)的和國外的。國內(nèi)數(shù)據(jù)庫一般管理比較寬松。對于授權(quán)用戶的下載,基本不控制下載的數(shù)量和相關(guān)性。而國外昂貴的數(shù)據(jù)庫則管理相對嚴(yán)格,對數(shù)字資源的違規(guī)使用行為往往是判斷條件苛刻,處理方式干脆。
3.2 對電子圖書違規(guī)使用的保護(hù)
學(xué)校電子資源違規(guī)使用行為主要包括單位或個(gè)人私設(shè)代理服務(wù)器,為校外人員提供訪問本校購買的、僅限于合法用戶使用的電子資源;利用工具軟件批量下載電子資源或以非正常閱讀速度連續(xù)、集中、批量下載電子資源或整本下載電子期刊;將個(gè)人賬號(hào)借出或租給非合法用戶使用,或私自將所獲得的文獻(xiàn)批量提供給非合法用戶;因賬號(hào)保管不當(dāng),被他人利用,而造成電子資源違規(guī)使用;單位或個(gè)人利用下載電子資源所獲得的文獻(xiàn)資料進(jìn)行商業(yè)牟利。所有這些行為,有一個(gè)共同的特征,就是惡意下載。
電子資源一般是按照學(xué)校的網(wǎng)絡(luò)地址范圍來購買許可。在校內(nèi)基于學(xué)校身份認(rèn)證的訪問屬合法使用。針對正常查閱和引用的特征,多數(shù)數(shù)據(jù)庫都會(huì)設(shè)置一個(gè)閾值(單位時(shí)間內(nèi)的下載數(shù))來控制惡意使用行為。比如,同一個(gè)IP地址在一分鐘內(nèi)不得超過閾值篇數(shù)的下載量,否則將中斷數(shù)據(jù)庫的使用并發(fā)送協(xié)查通知。對惡意下載的診斷與限制也將成為數(shù)據(jù)庫正常使用的有效保障。
4 采用行為審計(jì)設(shè)備的訪問識(shí)別與記錄
鑒于國內(nèi)IP地址的緊張,學(xué)校一般會(huì)在網(wǎng)絡(luò)出口處做地址映射,一個(gè)實(shí)際的IP地址可能對應(yīng)了成千上萬個(gè)用戶的訪問。
(1)行為審計(jì)設(shè)備可以記錄所有這些用戶的校內(nèi)端IP地址,以及對應(yīng)的訪問地址。這一步獲得校內(nèi)地址(內(nèi)部ip)和訪問數(shù)據(jù)庫地址(NAT IP)的對應(yīng)關(guān)系。(2)出口訪問端的認(rèn)證設(shè)備記錄訪問者的IP(內(nèi)部IP)和認(rèn)證賬號(hào)(USERID)的對應(yīng)關(guān)系。(3)認(rèn)證設(shè)備采用的認(rèn)證信息來自認(rèn)證服務(wù)器(如LDAP或其它域認(rèn)證設(shè)備),通過認(rèn)證服務(wù)器內(nèi)認(rèn)證賬號(hào)(USERID)可以獲得對應(yīng)的用戶信息(USER INFO)。
5 針對具體訪問數(shù)據(jù)包的特征分析與控制
獲得認(rèn)證用戶與訪問數(shù)據(jù)庫的關(guān)系后還需要具體辨別用戶的行為。用一臺(tái)設(shè)備抓取所有的針對管控?cái)?shù)據(jù)庫的訪問記錄,然后在后臺(tái)即時(shí)地進(jìn)行特征分析,區(qū)別瀏覽和下載行為。針對不同管控?cái)?shù)據(jù)庫的控制維度時(shí)間和下載次數(shù)的設(shè)置,判斷是否超過規(guī)定的閾值。如果超過則觸發(fā)預(yù)警機(jī)制,通知認(rèn)證設(shè)備,暫時(shí)封鎖相應(yīng)的用戶賬號(hào),并提醒網(wǎng)管相應(yīng)的事件信息,達(dá)到管控的目的。
6 結(jié)束語
需要注意的是,一般的審計(jì)設(shè)備都不建議放在核心的出口設(shè)備,防止單點(diǎn)故障。建議采用光端口分光或者監(jiān)聽的方式搭建審計(jì)設(shè)備。不同的數(shù)據(jù)庫其實(shí)際訪問和下載的IP地址有可能會(huì)變動(dòng),需要及時(shí)更新數(shù)據(jù)庫對應(yīng)IP地址列表的字典。
參考文獻(xiàn)
[1]時(shí)彤,郭青,馮佳,等.高校圖書館電子資源惡意下載現(xiàn)狀及對策[J].醫(yī)學(xué)信息學(xué), 2011(12).
[2]左平.試論如何提高高校圖書館電子資源利用效率[J].科技創(chuàng)新導(dǎo)報(bào), 2012(28).
作者簡介:張?jiān)鲂蓿?974-),男,華東師范大學(xué)信息化辦公室副主任。從事學(xué)校網(wǎng)絡(luò)與應(yīng)用系統(tǒng)建設(shè)。
通訊作者:王江濤(1971-),男,華東師范大學(xué)軟件學(xué)院高級(jí)工程師,上海嵌入式系統(tǒng)研究所副所長,研究方向嵌入式軟件。