趙俊玲 馬環 宛玲(河北大學管理學院 河北 保定 071002)
數字信息的保存不同于紙本信息的保存,其顯著的區別是數字信息保存活動的責任方不僅限于保存者,還包括數字信息生產者。隨著對數字信息保存研究的逐步深入,學者們日益關注從信息生產者的角度探討保存活動,如密歇根大學的Margaret Hedstrom[1]對數據生產者提交數據的激勵機制進行了研究。目前,有關數字信息出版者的保存行為的研究還比較少,因此本文在前人研究的基礎上,對數字信息出版者的保存行為進行系統研究。數字信息出版者涵蓋的范圍非常廣,包括數據庫商、學科庫、機構庫、個人博客等。本文主要考查數據庫商的保存行為。這里的數據庫商并不排除學會、協會等非營利機構,同時也包括開放獲取資源的出版者。
本文以中國高等教育文獻保障系統(China Academic Library & Information System,簡稱CALIS)和中國科學院國家科學圖書館的數據庫產品列表為依據選取研究樣本,除去其中重復的,共有99家數據庫商。其中具有公司性質的出版商54家、非營利機構性質(主要指學會、協會等)的44家,政府機構1家;開放獲取數據庫商(者)6家,非開放獲取數據庫商93家。數據庫商經營的產品種類包括電子期刊、電子圖書、會議錄、科技報告、數值數據、學位論文、專利文獻、報紙文件等。其中,電子期刊種類所占比重最高,其次是電子圖書和科技報告(見下頁表1)。本文對99家數據庫商網站相關信息進行了調查分析,以研究數據庫商的保存行為。

表1 數據庫商樣本類型構成表
通過調研發現,數據庫商的保存模式主要有3種:數據庫商自己保存、許可使用者進行保存、由數據庫商和使用者之外的第三方進行保存(見表2)。目前約有58%的數據庫商采取了保存行為,很多數據庫商在保存數據時并不局限于一種保存行為。從這幾種保存方式來看,目前只有少數出版商自己保存數據,多數已將數據交由第三方保存。

表2 數據庫商保存行為表
通過對國內外數據庫商網站內容和許可協議的深入分析發現,有5家數據庫商(ProQuest、AIP、JSTOR、AGU和Project Muse)自己保存數字信息,約占樣本數量的5%。
3.1.1 特點
通過對數據庫商自己保存數據行為的分析發現,其保存有兩個特點:①多形態備份,如ProQuest分別采用數字形態(磁盤陣列)和縮微形態(縮微膠卷)進行備份。②多地點存儲備份,如AIP將保存本分別放置在不同地點以確保數據安全。 JSTOR也有穩定的數據備份政策,將多個備份存儲到不同的地方。
3.1.2 保存方法
銀行作為整個供應鏈條的金主,對于整個供應鏈的作用是至關重大的。銀行可以以自身的地位,結合鏈上企業之間的差異,設立一些相關的激勵措施。供應鏈中的企業信息明確,責任明確。加強企業之間的有效合作,建立信任。在激勵機制下表現的更加的真實。
數據庫商很少提供數字保存方法的信息,只有AIP提到了遷移和仿真策略、AGU提到了遷移和更新策略。但是英國的一項研究表明,目前數據庫商采用的保存策略比較多樣,如更新、技術保存、遷移、仿真等方法。其中,數據庫商采用最多的是更新策略,占53.8%,還有3家數據庫商采用了仿真策略[2]。
3.1.3 影響因素分析
采取自己對數據進行長期保存模式的數據庫商所占比例非常小,究其原因主要有以下兩個:
(1)數據庫商能力有限
數字信息保存是一項需要持續投入的活動,盡管目前還沒有成熟的計算數字信息保存成本的模型,但是數字保存成本較高已經是普遍認可的事實,特別是在數字信息保存活動的初期。同時數字保存需要有專門的技術人員,這對數據庫商來說也是一項很大的挑戰。因此,絕大部分數據庫商沒有能力依靠自己的力量對所出版的數據進行長期保存。
(2)使用者的信任度低
數字信息的保存不同于紙本出版物的保存。對于紙本出版物來說,圖書館在購買的同時就享有對文獻的保存權。對于數字信息來說,目前國外數據庫商更多地采用許可使用的方式提供使用。由于使用者對已購買使用權的數據沒有保存權,所以對數據的長期可存取非常關注。從使用者的角度分析,數據庫商自己保存數字信息會面臨很多問題,其中一個最重要的問題就是保存機構的可持續性,數據庫商隨時有倒閉、被兼并的可能,所以使用者對數據庫商自己保存數字信息這種模式的信任度并不大。
3.2.1 數據庫商許可保存現狀
為了了解數據庫商賦予使用者哪些與保存相關的權利,筆者對數據庫商的網站進行了調查,查找網站上是否有正式協議,如果有正式協議,查看正式協議中是否有關于保存方面的規定;如果沒有正式協議,就到網站上的條件條款(terms and conditions)和常見問題解答(Frequently Asked Questions,簡稱 FAQ)中查找相關內容。
通過對99家數據庫商網站的調查發現,14家數據庫商允許購買者通過購買光盤進行保存。APS(American Psychological Society,美國心理學協會)在其協議模板中規定,圖書館可以選擇是否購買電子期刊的物理存儲形式,如光盤;允許購買者將數據從光盤等物理存儲形態轉換到本地系統中,并且允許授權用戶使用[6]。SPIE(The International Society for Optical Engineering,國際光學工程學會)digital library在正式協議中對保存權利進行了明確規定,SPIE的授權用戶可以選擇是否購買年度物理載體版本,包括CD和DVD兩種形式,費用為350美元。用戶可以將這些信息裝載到本地信息系統上,并允許其他授權用戶使用,但是如果訂購檢索使用權終止,SPIE就不再提供這項服務[7]。CABI(Centre Agriculture Bioscience Internaional,國際應用生物科學中心)正式許可協議中的有關條款提到,數據庫商有責任向授權用戶提供已授權許可資料的物理拷貝[8]。
筆者研究表明,在同意使用者(采購者)進行物理拷貝的14家數據庫商的協議或者說明中,更多的是強調購買者可以獲得物理存儲載體形態的產品,但是在協議中并沒有明確購買者可否對數字信息進行遷移、仿真等操作。
3.2.2 使用者缺乏保存意識和能力
即使數據庫商許可使用者對數據進行保存,但如果使用者沒有責任意識和能力進行保存,那么這種許可對于數字信息保存毫無意義,因此需要對使用者的保存意識和能力進行研究。目前最早的研究是英國對圖書館保存意愿進行的一項研究。該研究對239名圖書館員進行了調查,很多圖書館員并不認為他們應該保存購買的數字信息,而是應該保存反映當地歷史文化的數據,或者是本館特藏等具有特殊意義的數字文獻[2]。
2008年1月,Portico就電子期刊長期保存現狀向美國1 371位大學圖書館館長發放問卷,調查結果表明[9],大部分圖書館館長認為他們應該在數字保存中承擔某種職責,但是認為意識到數字信息保存的重要性和采取措施進行數字信息保存是不相關的,53%的研究型大學圖書館和74%的教學型大學圖書館沒有采取任何關于數字信息保存的措施。
由于數據庫商對自身商業利益的保護與使用者的保存意愿和能力兩方面因素產生影響,由數據庫商許可使用方進行保存的模式應用得并不廣泛。
所謂第三方保存,是指由除生產者和使用者之外的第三方機構對數據進行保存。由于生產者和使用者能力的限制以及二者沒有足夠的信任機制,所以產生了第三方保存項目。目前比較有影響力的第三方保存項目有Portico、LOCKSS(Lots of Copies Keep Stuff Safe,海量數據安全計劃)和CLOCKSS(Controlled LOCKSS,管控的LOCKSS)等。這些保存項目大多采用向數據庫商和圖書館收取會員費的形式,為數據庫商和圖書館提供數字信息保存相關服務。數據庫商將數據提供給第三方,第三方對數據進行更新遷移等以確保數據的永久讀取,這樣能夠解決數據庫商沒有能力自己保存數據的問題。只有在遇到特定的突發事件的情況下,如數據庫商破產或者自然災害導致圖書館不能存取已購買使用權的數據,第三方才能向數據庫商和圖書館開放相應數據。這種模式既可以保障數據庫商的商業利益,同時也消除了使用者對數據不能持久存取的擔心。
3.3.1 數據庫商委托第三方保存總體情況
通過對數據庫商的網站和第三方保存項目的網站進行深入調查研究發現,數據庫商樣本中有46家數據庫商委托第三方保存項目進行保存,約占數據庫商樣本總數的46%。同時很多數據庫商加入多個保存項目。例如,BioOne加入Portico 和LOCKSS;Taylor & Francis將其數據存儲到多個第三方保存庫中,包括Portico 、LOCKSS和 CLOCKSS試驗項目,同時和荷蘭國家圖書館簽署協議,委托荷蘭國家圖書館保護其數字文獻。
3.3.2 數據庫商的責任
在數據庫商許可第三方進行保存的模式下,數據庫商的責任會因委托的第三方保存項目的不同而有區別。本文以電子期刊出版商和Portico簽署的協議為例說明數據庫商應該承擔的責任。數據庫商與Portico簽署非排他性協議,授予Portico在世界范圍內的長期保存權利,數據庫商在內容出版3個月之內向Portico提交保存內容,允許其抽取文本、音頻或其他內容,并使用元數據、索引及其他補充數據來豐富這些內容,允許Portico對數據格式進行遷移[10]。
3.3.3 委托第三方保存的影響因素和激勵措施
目前委托第三方保存在數據庫商的保存模式中占主導地位,但是還有一半以上的數據庫商沒有加入第三方保存項目。那么,如何激勵數據庫商加入第三方保存項目?下面結合委托第三方保存的影響因素進行分析。
(1)保障數據庫商的商業利益
數據庫商不加入第三方保存項目的一個非常重要的原因就是擔心其商業利益受損。曾經有研究表明,很多數據庫商不愿意通過英國國家圖書館的自愿呈繳系統提交數據,主要是因為擔心其他圖書館使用英國國家圖書館文獻提供中心的數據后就不再從數據庫商處采購數據,從而影響其商業利益[2]。 所以第三方保存項目在設計保存機制的時候要充分保障數據庫商當前的商業利益。因此第三方保存項目如果能向數據庫商證明其有能力將保存的數據使用限制在一定范圍內,并承諾數據庫商加入第三方保存項目不會影響其利益,那么就比較容易和數據庫商達成協議。
(2)使用者的壓力
第三方保存項目不會影響數據庫商的商業利益,是數據庫商加入第三方保存項目的必要條件,但不是充要條件。也就是說,保存項目要想數據庫商加入,就必須保證其商業利益,但是,不是保證了其商業利益數據庫商就一定會加入保存項目。因為加入保存機構也需要成本,需要付給保存機構相關費用,即使有些第三方保存項目對數據庫商免費,但數據庫商也需要向保存項目提供數據,需要一定的人力成本等。所以要激勵數據庫商加入保存機構,還需要圖書館(使用者)對數據庫商施加壓力這一充分條件。ALPSP協會的出版者表示,90%以上的出版者都將圖書館界的強烈訴求作為最主要的激勵因素[3]。
本文通過系統考查數據庫商的保存行為發現,目前有相當比例的數據庫商具備數字信息保存的責任意識,約有一半的數據庫商進行各種形式的數字信息保存活動。從目前來看,委托第三方保存是比較適合的數字信息保存模式,該模式一方面可以最大限度地保障數據庫商的商業利益,同時也消除了使用者對數據不能持久存取的擔心。激勵數據庫商加入第三方保存項目的措施包括第三方保存項目努力確保并證明數據庫商的商業利益不受損害和使用者向數據庫商施壓。
[1]Hedstrom M, Niu Jinfang. Incentives for Data Producers to Create“Archive-Ready” Data: Implications for Archives and Records Management[EB/OL].[2010-10-22]. http://www.archivists.org/publications/proceedings/researchforum/2008/papers/M-HedstromJNiu-SAA-ResearchPaper-2008.pdf.
[2]Ayre C, Muir A.Right to Preserve? The Copyright and Licensing for Digital Preservation Project Final Report [EB/OL].[2010-10-22].http://www.lboro.ac.uk/departments/dis/disresearch/digpreserv.html.
[3]ALPSP and Portico Collaborate on Long-Term Digital Preservation Survey [EB/OL]. [2010-10-22]. http://www.Portico.org/digitalpreservation/news-events/news/research-surveys/alpsp-and-Portico-collaborate-on-long-term-digital-preservation-survey/.
[4]The Importance of Archiving and Availability of Geophysical Data[EB/OL].[2010-10-22]. http://www.paleostrat.org/Documents/agu%202005.pdf.
[5]Archiving and Use of AIP Electronic Information[EB/OL].[2010-10-22].http://www.aip.org/journals/archive/arch&use.html.
[6]American Physical Society Institutional Single-Site User License [EB/OL].[2010-10-22]. http://librarians.aps.org/sitelicense.pdf.
[7]Sample License [EB/OL].[2010-10-22].http://dlinfo.org/library/documents/samplelicense.pdf.
[8]CABI. Academic Institution Licence for Perpetual Access to the CAB eBooks Archive Database [EB/OL].[2010-10-22]. http://www.cabi.org/files/Licences/cabebooksarchivesalesagreement101207.pdf.
[9]Digital Preservation of E-Joumals in 2008:Urgent Action Revisited[EB/OL].[2010-10-22].http://www.Portico.org/digital-preservation/wp-content/uploads/2010/02/Porticosurveyondigitalpreservation.pdf.
[10]E-Journal Agreement [EB/OL].[2010-10-22]. http://www.PORTICO.org/digital-preservation/join-PORTICO/for-publishers/.