999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代圖書館數字資源長期保存問題研究*

2016-02-12 15:09:04劉曉英
圖書館 2016年7期
關鍵詞:圖書館資源

劉曉英

(中南大學圖書館醫學分館 長沙 410013)

?

大數據時代圖書館數字資源長期保存問題研究*

劉曉英

(中南大學圖書館醫學分館長沙410013)

〔摘要〕大數據時代已經到來,數據資源長期保存研究和實踐面臨諸多挑戰和問題,數據資源長期保存受人、財、技術、設備、制度等眾多因素的制約,其中保存對象、保存技術、保存標準、保存時間、保存成本、保存管理、保存法律等問題都是數據資源長期保存關注的核心問題。

〔關鍵詞〕大數據數字資源圖書館長期保存

〔引用本文格式〕劉曉英:大數據時代圖書館數字資源長期保存問題研究[J].圖書館,2016(7):90-96

1 引言

2000年以來,隨著信息基礎設施日益完善,移動互聯網、云計算、物聯網等現代信息技術迅猛發展,以及社交網絡、電子商務、手機客戶端和各種智能服務終端等迅速普及,數據量呈極速增長,“大數據時代”已經來臨。

“大數據(Big Data)”這一術語最早可追溯至Nutch項目[1]。2008年9月,《Nature》發表了“Big Data: Science in the petabyte era”系列專題文章,正式提出“大數據”這一概念[2]。2011年,《Science》推出 “Dealing with Data”專刊[3],討論了大數據在科學研究中的應用。隨后,世界各國相繼提出了大數據發展計劃和戰略,IBM、微軟、蘋果等IT巨頭也相繼實施了大數據計劃和項目,因而2012年被稱為世界“大數據年”。我國從2011年開始引入“大數據”,并將其上升為國家戰略。2013年7月習近平總書記在中國科學院考察時指出:“大數據是工業社會的‘石油’資源,誰掌握了數據,誰就掌握了主動權。”[4]2013年11月,國家統計局與阿里、百度等11家企業簽署了大數據戰略合作框架協議,將大數據發展推向高峰[5]。2015年8月31日,國務院發布《促進大數據發展行動綱要》,對我國大數據發展戰略進行了國家層面的頂層設計和總體部署。2015年12月16日,國家主席習近平在第二屆世界互聯網大會開幕式上發表主旨演講時指出:“十三五”期間,中國將大力實施網絡強國戰略、國家大數據戰略、“互聯網+”行動計劃。目前大數據已經廣泛應用于政府管理、社會保障、醫療衛生、食品安全、交通旅游、工業制造、基礎建設等領域[6]。

大數據(Big Data),或稱為海量數據、大規模數據,是指數據量規模巨大到無法通過目前主流的軟件工具在合理的時間內達到擷取、管理、處理并整理成為幫助企業經營決策的資訊[7]。大數據是對通過各種設備和技術采集到的海量數據的總稱[8]。據估計,2020年全球數據總量約為40ZB[9-10]。

如此巨大的數據量給圖書館數字資源存儲和保存帶來了極為嚴峻的挑戰。哪些數據應該保存?由誰來保存?如何保存?保存多久?這些問題成為圖書館數字資源長期保存研究中的焦點,引起了學術界和實務界的廣泛關注。中國工程院院士、國家科技文獻中心副理事長胡啟恒指出:從總體上講,我國還沒有建立起可靠的數字資源長期保存體系[11]。因此,國家圖書館總工程師孫衛認為:解決電子數字文獻長期保存問題已刻不容緩[12]。

2 數字資源長期保存概述

2.1數字資源

數字資源是指一切以數字形式將文字、圖像、聲音、動畫等存儲在光、磁等介質中,通過網絡通信、計算機及其終端再現出來的信息[13]。是計算機技術、通信技術以及多媒體技術相互融合而成的以數字形式發布、存取和利用的信息資源總和[14]。數字資源具有存儲空間小、數量龐大、超越時空限制、擴展性強、存取便捷等優勢,逐漸成為人們學習、生活、工作的主要信息來源。

數字資源從組織形式上來看有數據庫、電子期刊、電子圖書、網頁、多媒體資料等多種類型;從存儲介質來看有磁介質和光介質兩種類型,其中磁介質有軟盤、硬盤、磁盤陣列、活動硬盤、優盤、磁帶等,光介質有CD、DVD、LD等[15]。

隨著計算機技術和網絡技術的快速發展和廣泛應用,特別是移動互聯網、物聯網、智能終端等的日益普及,海量數字資源已經累積成為大數據。數字資源急劇膨脹帶來的直接影響是其快速存取、長期保存和信息安全等問題。

2.2數字資源長期保存

1991年,耶魯大學圖書館在大批量數字化館藏可行性研究報告中首次提出“數字保存”這一術語[16]:“數字保存旨在保障數字資料可在所需時間段里被持續訪問的一系列必要的管理工作。”此后“數字保存”逐漸成為科學研究、圖書情報、檔案管理、信息技術等領域的重要研究課題。因為數字資源保存“所需時間段”較長,故也稱“長期保存”(Long-term Preservation)[17]。

數字資源長期保存是指保證數字比特流(或數字資源)可長期維護和內容可長期獲取必要的管理活動[18]。數字資源長期保存有兩層含意:一是長期可存儲(Storage),一是長期可獲取(Access)。長期可獲取是長期存儲的目的,包括技術層面的可獲取和權利層面的可獲取[19]。

大數據是現代信息技術高速發展的必然產物,它使人類置身于數字信息海洋卻又面臨前所未有的挑戰。因為數字資源本身及其存儲載體異常脆弱,具有易改變、易消失、易受環境影響、存儲載體不穩定等特征,且現代信息技術的日新月異又使得數字資源的軟硬件載體、技術框架、數字化對象等都處于動態變化之中[20]。因此,大數據,一方面使海量數字資源變得易于獲取,而另一方面又使海量數字資源保存面臨挑戰。

3 大數據時代圖書館數字資源長期保存的主要問題

隨著大數據時代的到來,整個社會已不可避免地被卷入數字洪流,如何保存人類社會的數字文明,圖書館數字保存工作面臨著越來越多的挑戰和考驗[21]。這些挑戰和考驗不僅源于數字資源本身增長速度快、生命周期短、格式變化快、數據類型多樣、環境依存度高、載體不穩定等特征[22]。還來自于圖書館內部管理和外部環境的動態變化,如工作流程、管理制度、運行機制、政策法律、技術更新、資金約束、社會需求、合作協調等因素[17]。

數字資源長期保存是一項復雜的系統工程,是一個綜合性課題,受人、財、技術、設備、制度、法律、政策、管理等眾多因素制約。整體來看,數字資源長期保存涉及“保存什么”、“如何保存”、“誰來保存”、“保存多久”等一系列問題。具體來看,數字資源長期保存需要解決保存對象、保存成本、保存技術、保存期限、保存法律、保存標準、保存管理等問題。“保存什么”主要是解決數字資源長期保存對象的選擇問題,并非所有的數字資源都需要長期保存且同等對待,因此,如何識別和鑒定數字資源的保存價值并合理制定分級保存策略才是關鍵。“如何保存”涉及保存技術、保存標準、保存模式和保存策略等問題。“誰來保存”涉及保存成本、保存管理和保存法律等問題,就是要確定數字資源長期保存的實施主體,即數字資源長期保存由誰來承擔和實施。數字資源長期保存并非某一機構或組織能獨立完成,需要數字資源生產者、出版商、保存機構、軟硬件開發者、非盈利組織和政府部門等系統通力合作,才能可持續發展。“保存多久”涉及保存期限和時間問題,不同的數字資源保存期限要求不同。在大數據環境下,圖書館作為數字資源長期保存的重要承擔者和實施者,要妥善解決這些問題,面臨著巨大的壓力和挑戰。

據PRWeb網站報道[23]:英國30余所高校組織了一項圖書館數字化保存和大規模數字化管理調查,調查內容主要涉及,高校中哪些部門主要承擔了數據保存工作,數據保存的成本是多少,使用哪些軟件,有哪些困難,培訓教職員工的模式,以及其他在大規模數據管理過程中出現的問題等。這些正是各類數字資源長期保存承擔者和實施主體所面臨的重要問題。

在圖書館數字資源長期保存所面臨的主要問題上,眾多專家學者都認為,技術問題(存儲介質、數據格式、數據恢復、數據免疫、數據再生、技術更新、標準與規范、模式與策略)、管理問題(法律法規、公共標準、信息安全、組織機構、運行機制、合作協調)、經濟問題(資金投入、運行費用、商業運作)和資源選擇問題(價值評估、內容評價和資源選擇)等是主要挑戰[14, 24-33]。這些問題可大致歸結為規范、技術、管理三個維度,內容、格式、載體、系統、安全五個方面。

在大數據背景下,由于數據總量以每年62%的速率按指數增長規律遞增,加上人們對數字資源長期保存的要求不斷提高(如要求數據存儲后不改變、不降低分辨率、不被污損、不消失且數據可恢復、可再生),而目前數據保存狀況正日益惡化[34],所以圖書館數字資源長期保存是一個極為困難而又日益迫切的問題。

4 大數據時代圖書館數字資源長期保存的對象問題

圖書館數字資源長期保存首先解決的問題是要確定保存對象和范圍,即明確哪些數字資源需要長期保存[14]。在大數據環境下,圖書館要保存所有數字資源是不現實的,因為圖書館數字資源長期保存受經濟、技術、設備、法律、政策等多種外部條件制約,既然不能全部保存,那就應該有所選擇,因而哪些數字資源需要長期保存就成為數字保存關注的首要問題。所以,圖書館應該制訂數字資源鑒別與選擇標準,將具有保存價值的數字資源挑選出來長期保存[24]。

數字資源作為保存對象,因其在存在形式、依附載體以及擁有者等方面具有多樣性,所以如何根據數字資源的特點、載體、需求、服務對象以及經費等因素確定數字保存對象和階段性保存目標至關重要[27]。面對大數據,圖書館既無能力,也無必要,更沒有充足的資源保存所有數字信息,關鍵問題在于,圖書館如何從內容繁雜、質量參差的龐大數字資源中確定數字資源保存和選擇標準,并對數字資源進行價值評估,依此確定圖書館數字資源長期保存的范圍和程度[35]。

圖書館數字資源長期保存對象的選擇包括資源選擇和媒體選擇。專家指出[24,27,35]:在資源選擇上應該首先保存容易丟失、與未來有關聯且有重要價值的數字資源。而媒體選擇涉及磁、光等存儲介質的選擇及其組合(如只讀式光盤、一次寫入光盤、可擦式光盤、硬磁盤、縮微膠卷、光盤與磁盤陣列等)。世界各國的數字資源保存機構和保存項目都對長期保存對象進行了不同的規定,做出了不同的選擇。如,美國NDIIPP項目的長期保存對象基本上包含了Web信息、視頻、音頻、數字期刊、電子圖書、數字電視等資源[36]。德國國家科技圖書館的TIB致力于科學原始數據的保存與訪問。DARIAH則專注于所有歐洲數字化人文和文化遺產信息保存。上海圖書館則重點實現了館藏文化遺產的長期保存[27]。

5 大數據時代圖書館數字資源長期保存的經濟問題

數字資源長期保存的經濟問題主要涉及資金投入、維護費用、商業模式等問題。隨著海量數字資源的急劇增長,數字資源長期保存的資金投入越來越大,維護成本和費用也越來越高,就像滾雪球一樣,不斷放大。數字資源長期保存的巨額投資該由誰來承擔?是由國家統籌規劃,還是由各保存機構自籌,亦或兩者共同承擔,能否通過商業化運作模式解決數字資源長期保存的資金來源、維護費用和可持續投資?這些經濟問題引起了圖書館數字資源長期保存界的廣泛關注,并嘗試用不同的方式和途徑來解決數字資源長期保存的經濟問題。

英國教育部、文化和科技部聯手資助的Testbed 計劃研究了數字資源長期保存的成本影響因素,設計了數字保存成本模型,并將其分為五個方面[37]:①數字存儲系統的花費。包括:物理空間:服務器存放空間和辦公空間;數字存儲庫硬件:服務器、光盤、磁帶和其他存儲媒介、備份系統和網絡連接;數字存儲庫軟件:操作系統、數據庫、安全系統、記錄管理軟件、通訊軟件,軟件測試和評估;軟件保存系統:仿真保存已有軟件和新軟件的應用環境、測試和評估軟件保存。②員工花費。③開發軟件和記錄保存方法的花費。④實施保存行動的花費。⑤其他影響總開銷的因素。這一模型為我們確定數字資源長期保存的資金投入量提供了依據。

目前我國圖書館進行數字資源長期保存實踐所需的經費主要是由上級單位撥款和圖書館自籌,而由國家或政府部門專項投資或其他機構贊助的極少,可持續性難以保證。據調查,在我國圖書館數字資源長期保存的經費來源中,上級部門撥款占68.42%,圖書館自籌占32.89%,國家或政府部門直接投資僅占15.79%,出版商或用戶贊助十分稀少[38]。

圖書館在數字資源長期保存規劃時,要充分考慮到可持續發展問題,應該尋求多方資金支持,只有逐步形成多元化的資金投入體系,才能獲得持續的經費來源。專家認為,應該按照共同投入、共同開發和共同受益的原則,大力鼓勵企業、社會團體、基金會和個人投資,并且多渠道、多形式地尋求多方資金支持,這樣才可能在一定程度上緩解數字資源長期保存資金的窘況。美國和歐洲的一些數字資源長期保存項目開始嘗試采用商業化運作模式解決巨額資金投入問題[39]。可以通過出租存儲空間、委托存儲等模式實現數字資源長期保存的可持續發展。

6 大數據時代圖書館數字資源長期保存的技術問題

數字資源長期保存的技術問題是長期保存的核心問題,是重中之重,而關鍵技術、存儲載體、硬件平臺、軟件系統、實現工具、格式變化、技術更新等技術因素則是數字資源長期保存面臨的最嚴峻挑戰[14]。因此,張曉林指出:目前我國圖書館數字資源長期保存面臨嚴重的技術危機[11]。

在技術問題中,長期保存技術、長期保存系統和長期保存策略倍受關注。

(1)長期保存技術

數字資源長期保存面臨兩大技術難題[14]:一是防止數字資源變更和破壞。“媒體的腐壞與脆化會帶來信息的丟失,即使保存條件再好,數字媒體的保存壽命也是有限的。”長期保存中的數字資源會隨外界環境變化而不斷變化,因此,需要在其生命周期中經歷多次遷移,包括硬件、軟件、格式、版本、訪問點、載體等多種遷移。一是維護數字資源的長期真實性和可獲得性。由于數字資源載體極易受外界環境和條件影響,因此,必須對保存的數字資源進行定期檢測,以保證數據真實和完整。為了防止數字資源在長期保存過程中變更和被破壞,并保證其長期真實性和可獲得性,衍生出一系列數字資源長期保存技術。

數字資源長期保存涉及多項關鍵技術,但根據其特點大體可分為遷移和仿真兩大類[40]。數字資源長期保存中常見的技術有拷貝、仿真、遷移、封裝、風干、標準化、復制(數據備份)、計算機博物館(技術保存)、通用計算機虛擬(UVC)、數字再造技術(數據恢復、數據考古)、再生性保護、數據抽取、更新、轉換、自動存儲、數字圖形輸入板、數據檢測等技術[21,24]。每種技術和方法都各有優劣,應根據圖書館數字資源長期保存的需要、目標、資源特點等進行綜合選擇。

此外,數字資源長期保存技術還面臨系統異構挑戰,包括網絡協議異構(如http、ftp、GridFTP、SOAP)、遠程執行方案異構(如Web services、RMI、CORBA)、用戶平臺異構(如操作系統異構)以及認證機制異構(如Kerberos、GSI)等[41]。如何實現這些異構系統之間交互通信和訪問也成為數字資源長期保存面臨的技術難題之一。

(2)長期保存系統

隨著數字資源長期保存的不斷發展和完善,歐美等發達國家產生了一批數字資源長期保存系統,如LOCKSS、DSpace、DAITSS、Fedora、DIAS、PANDAS、EPrint、PAWN和NEDLIB等。這些系統基于OAIS模型和開源代碼,多方式、多層次地開展了數字資源長期保存實踐。其中LOCKSS、DSpace、DAITSS、PAWN 和NEDLIB等長期保存系統影響力較大且日益成熟,并得到了廣泛應用。中國科學院國家科學圖書館就是采用Fedora作為底層存儲系統,構建了電子期刊長期保存系統(CASE-Journal Archiving System)[42-44]。

(3)長期保存策略

數字資源長期保存過程涉及多種技術、系統和工具,而每種技術、系統和工具都有其優缺點及適用性,因此需要采用一定的策略與方案對長期保存技術、系統和工具進行選擇和組合。

在數字資源長期保存策略中,技術方案是基礎。而技術方案又取決于被選擇保存的資源對象及其技術特征。目前有多種技術方案和數據標準模型可供選擇,技術方案有遷移、仿真、UVC、封裝、技術保存、數據再造等,數據開放描述與標準化模型有元數據、永久標識符或唯一資源標識符、文件格式注冊、OAIS模型等[26]。不同的保存策略原理不同,適用于不同的資源對象和保存需求,成本相差也很大。重用和開源是目前長期保存技術、系統和工具的兩大特點,大量保存系統和工具以及模塊都以開源形式發布和共享,間接地降低了保存成本,提升了投資價值[24]。

7 大數據時代圖書館數字資源長期保存的法律問題

數字資源長期保存涉及眾多的法律問題,而法律問題本身是一個十分復雜和棘手的問題。不同的國家有不同的法律,不同的資源對象有不同的法律問題,不同的承擔和實施主體也有不同的法律問題,但目前國內外還沒有出臺專門針對數字資源長期保存的法律法規。總體來看,目前數字資源長期保存主要涉及版權、安全、隱私等法律問題。這些法律問題主要源自兩個方面:一是數字資源及軟件本身涉及的版權、許可協議、采購合同、呈繳制等法律問題,數字資源又包括商業數據庫和網絡公開數字資源;一是長期保存行為涉及的保存權、復制權、隱私權、使用權、安全風險等法律問題。

圖書館數字資源長期保存中涉及的法律問題不可小覷,一點疏忽就可能危及數字資源長期保存全局。目前數字資源所有者主要通過“許可”模式授權合法用戶使用數字資源[14]。也就是說圖書館所購數字資源并未獲得所有權,而只能以獲取得“使用權”的方式利用數字資源[26]。數字版權和許可協議禁止圖書館復制或存儲數字資源,如果圖書館希望長期保存這些數字資源,就需要獲得“永久使用權”,就必須在許可協議中增加“永久保存”條款,或者利用圖書館復制權例外解決數字資源長期“保存權”問題[45]。也有不少學者呼吁國家出臺相應的政策和法律法規,要求信息生產者和出版商將數字資源保存權轉讓給圖書館,或建立相應的數字資源長期保存機制,確定數字資源長期保存中的權利和責任,如建立數字資源呈繳制度,將一些數字資源保存權轉移或授權給其他機構(如圖書館、檔案館),或國家指定的機構保存[19]。

在大數據和互聯網+環境下,因特網數字資源長期保存法律問題尤其引人關注,眾多機構在缺乏嚴密的授權機制下自行大量采集全球公開網頁并加以保存,圖書館也積極參與其中。這是否會引起數字資源版權糾紛,是否會侵犯隱私和商業秘密,或者導致保存權之爭?如英國數個圖書館聯手開展了一項歷史資料保存計劃,12個月時間就保存了10億網頁資料[48]。這些公開的網頁資料是否需要授權才能長期保存?又應該由誰授權?如何授權?授權長期保存的數字資源存在的安全風險由誰承擔?如何防范人為破壞?這些都是數字資源長期保存急需要研究和解決的法律問題。

8 大數據時代圖書館數字資源長期保存的時間問題

我們知道有些數字資源需要長期保存,甚至永久保存。但并非所有數字資源需要保存的期限一樣,用戶需求不同、內容價值不同、存儲介質不同保存期限長短也會不同。“長期保存”的“長期”應該是多久?這是一個難以確定的問題,也沒有明確統一的標準。

長期保存期限主要受數字資源內容價值、用戶需求和存儲介質三大因素制約。

首先從內容價值和用戶需求來看,不同類型的數字資源因價值不同、用戶需求不同,保存期限差異巨大。例如,美國職業安全與衛生管理局(OSHA)要求每一事故文檔記錄至少保留30年;美國健康保險便利轉移和責任法案(HIPAA)規定:數字醫療記錄至少保留7年,而少年患者醫療記錄需要保留至他們21歲之后再延長7年,慢性病或需要以后處理的病歷,數字數據必須保存幾十年;有些類型的數字數據需要保存很長時間,以備查用,如建筑圖紙(在樓房、橋梁、大壩、水渠等修理或翻新中相當重要)、工程圖紙、計算結果、設計、原始資料編碼和歷史記錄等[34]。

其次從存儲介質來看,數字資源以各種格式存儲在磁、光等存儲介質上,使用壽命完全依賴于其讀取數據所需的軟硬件更新換代速度和存儲介質壽命,也就是說,數字資源長期保存期限取決于存儲介質及其利用環境的整體壽命[49]。我們知道,石頭和粘土可以保存記錄幾百年甚至幾千年,羊皮紙和紙張如能精心保管,可以保存100多年,而賽璐珞照片、醫療記錄、電影膠片和縮微膠片等在氣候條件控制良好的環境中也能大約保存100年。但在計算機和數字化存儲技術高度發達的大數據時代,數字資源保存時長卻不容樂觀。磁介質數據每2-3年要重寫一次,否則會因輻射、氧化和退化等造成數據損壞。即使是光盤,雖然其保存壽命可達50年,但一旦寫入數據,其壽命就會縮減至5年。目前還沒有哪種數字存儲媒介在結構上能使數字數據安全保存幾年以上。所以,數字資源長期保存需要建立一種長期保存機制,采用一定的技術手段和管理措施,使數字資源在軟硬件環境不斷變化的情況下,能夠真實、完整地保存(至少 5 年以上),并能夠得到有效利用[17]。

數字資源長期保存時間還需要綜合考慮存儲介質和保存成本。不同的存儲介質保存時長不一,成本差異巨大,而且很多存儲介質由于各種原因不適合于長期保存。從保存時長來看,在現有的存儲介質中,最適合于長期保存的是特殊光盤,其后依次為磁帶、一般光盤和磁盤陣列,單體硬盤則最不適合于長期保存。而從保存成本來看,磁盤陣列成本最高,磁帶和光盤居中,且能脫機保存,而磁盤陣列則不能長期脫機運行[14]。綜合考慮保存期限和成本等因素,特殊光盤和專業磁帶最適合于長期保存,可以保存30-50年。如中國國家圖書館數字資源長期保存就是根據這些因素確定了數字館藏分級保存策略[12]。

9 大數據時代圖書館數字資源長期保存的標準問題

標準與規范是數字信息資源長期保存各個環節之間互操作的基礎,貫穿于其生命周期的全過程,對長期保存系統建設意義重大[50]。因此,劉家真指出[51]:創建與使用有利于數字信息資源長期存取的標準與規范是管理數字文獻的一項首要工作。可以說,數字資源長期保存標準與規范問題既是一個技術和管理問題,但又超越了技術和管理的范疇。數字資源長期保存涉及數據存取規范、數據共享和互訪標準、數據安全和認證等問題,是長期保存實現的基礎問題。

數字資源長期保存實踐與研究始于20世紀90年代,長期保存技術系統和實踐項目在經歷初期的自行建設、各自為政、重復建設、資源浪費等失敗之后,逐步發展為跨領域、跨行業、跨系統、跨區域的合作與共享,目前已積累形成了一些成熟的國際標準和規范,這些標準與規范是開展數字資源長期保存活動的指南和基礎。有METS(Metadata Encoding &Transmission Standard,元數據編碼傳輸標準)、PREMIS(Preservation Metadata Implementation Strategies,保存元數據實施策略)等保存元數據標準,有ISO14721數字資源長期保存系統核心標準,有開放檔案信息系統(Open Archival Information System,OAIS)參考模型,有數字資源長期保存指南文件ISO/TR18492和數字資源長期保存格式標準ISO19005-1:2005[14,19,24]。我國也于2002 年 10 月由中國科技信息研究所、中國科學院文獻情報中心和中國國家圖書館聯合發起《我國數字圖書館標準與規范建設》項目[52]。

除標準與規范之外,合作與共享是長期保存領域的永恒主題,涉及地域間、機構間、學科間、集合間、系統間等的協作與共享,以及合作與共享策略、技術、工具、平臺、元數據等問題。其中數據互操作是長期保存活動中實現數據共享和互訪的重要問題[27]。數據共享和訪問主要集中在互操作、統一存儲格式、研發數據訪問和提供開放接口等方面[21]。隨著長期保存系統的不斷發展,數據、系統及服務可信度日益受到關注,數據認證和系統安全問題也不容忽視[53]。

10 大數據時代圖書館數字資源長期保存的管理問題

數字資源長期保存活動是一項復雜的系統管理工程,需要合理有效的管理來保障其正常、正確、有序地實施。管理是一個綜合性課題,包含多項管理要素。在影響數字資源長期保存的各種因素中,組織和管理要素最為關鍵。組織要素包括職能聲明、業務連續性保障、組織機構與人員設置、資金保障等,管理要素包括業務連續性計劃、業務流程管理(工作流程和操作規范)、風險控制、合同許可義務、質量管理、文檔管理等。

從廣義來講,標準、規范、法律、法規、政策、制度、機制、組織、安全、風險、資源等都屬于管理問題。從狹義來看,數字資源長期保存的管理問題涉及質量識別、風險防范(安全策略、責任機制)、運行機制(分級存儲、分層管理、可擴展、監控、生命周期、遺忘管理)、資源配置(人、財、物保障)、業務流程(工作流程和操作規范)、人員培訓、組織機構、數據監管等一系列具體問題。隨著全球數字資源長期保存項目和系統的部署與運行,數字資源種類不斷增加和長期保存規模不斷擴大以及數字資源監控需求不斷增強,數據監管成為長期保存研究的重要領域。

具體到某個機構或系統來說,數字資源長期保存涉及資源層、實施層和應用層的有效管理。資源層涉及保存對象和保存資源(實施保存中涉及的資金、技術、系統、人員和機構等)的管理。實施層的重點是工作流程,包括工作流程設計、工作流程自動化和工作流程管理。定義清晰、權責明確的工作流程對降低成本、及時發現錯誤、保障長期保存系統的正常運轉十分關鍵,工作流程管理貫穿數字資源長期保存的整個生命周期。而數據、系統與服務的可信度以及使用過程中的權益管理是應用層管理的重心,關系到整個保存體系的安全和可信賴程度[53]。

11 結語

數字資源長期保存是一個復雜的系統工程,涉及人員、資金、技術、設備、政策、法律、制度、管理等諸多要素,是一項長期艱巨的任務。隨著大數據時代的到來,數據資源長期保存研究和實踐面臨諸多挑戰和問題,任重道遠。數字資源長期保存不僅是一個技術難題,更是一個管理難題,需要統籌規劃、協調合作,并建立有效的管理體制、運行機制、政策法規、標準規范以及人才、資金、技術等資源綜合保障體系,才能有效實現。早在1996 年,美國研究圖書館協會(Research Library Group,RLG) 發表的《數字信息保存》報告中就已經提到[53]:保存數字資源會比保存紙本相似物需要更大的責任、更好的技術和更多的資源,僅僅由保存機構自己宣稱可以保存數字資源是不可靠的,需要一種公開和公共機制來證明保存機構確實有能力勝任數字資源長期保存任務。但愿圖書館界能勇于迎接挑戰,早日攻克這一難題。

(來稿時間:2016年4月)

參考文獻:

1.編輯部.大數據(Big Data)[J].中國無線電,2014(9):43

2. Nature. Big Data [EB/OL].[2016-03-10].http://www.nature. com/news/specials/big data/index.html

3. Science. special online collection: Dealing with data [EB/ OL].[2016-03-10].http://www.science mag.org/site/special/data/2011

4. 郭華東,王力哲,陳方,等.科學大數據與數字地球[J].科學通報,2014(4):1047-1054

5.周寶曜,劉偉,范承工.大數據戰略·技術·實踐[M].北京:電子工業出版社,2013

6.習近平在第二屆世界互聯網大會開幕式上的講話[EB/ OL].[2016-04-10].新華網. http://news.xinhuanet.com/video/2015 -12/16/c_1117481089.htm

7.百度百科.大數據[EB/OL].[2015-04-08].http://baike. baidu.com/link?url=aCqG1nPdBCxi0BxfSn

8. ACCA 中國事務總監 梁淑屏. 大數據,大挑戰[N]. 中國會計報/2014 年/1 月/10 日/第 007 版

9. Gantz J,Reinsel D. The Digital Universe In 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East[M]. Framingham: IDC Analyze the Future,2012

10.(英)維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].盛楊燕,周濤, 譯.杭州:浙江人民出版社,2013

11.劉瑞英. 國內外數字資源長期保存實踐項目綜述[J].光盤技術,2009(10):7-8

12.《國家圖書館學刊》記者.解決電子數字文獻長期保存問題刻不容緩——國家圖書館孫衛總工程師專訪之三[J].國家圖書館學刊,2006(3):52-55

13.張小芳.數字信息資源長期保存體系研究[J].四川圖書館學報,2011(5): 44-46

14.邢軍.國家圖書館數字資源長期保存現狀與研究[J].數字與縮微影像, 2011(4):18-22

15.何雪英.數字資源長期保存研究[J].圖書館學研究,2009(9):81-83,86

16.Digital Preservation Coalition. Preservation Management of Digital Materials: The Handbook.[EB/OL]. [2016-03-06].http:// www.dpconline.org/component/docman/doc_download/299-digitalpreservation-handbook

17.劉越男, 劉語葉, 李雪君, 等. 電子文件的長期保存:多維互動的領域——第四屆中國電子文件管理論壇綜述[J].檔案學研究,2014(4):56-60

18. RLG. Trusted Digital Repositories: Attributes andResponsibilities[EB/OL].[2016-03-05]. http://www.rlg.org/ longterm/repositories.pdf

19.旻蘇,李景,殷立新, 等. 數字資源長期保存的標準與法律問題綜述[J]. 標準科學, 2009(5):46-47, 53-57

20.郭紅梅,張智雄.歐盟數字化長期保存研究態勢分析[J].中國圖書館學報,2014(2):120-127

21.吳振新,付鴻鵠,李文燕, 等.第10屆數字對象長期保存國際會議(IPRES2013)綜述[J].圖書情報工作,2014(4):127-133

22.王志庚,肖紅.全球圖書館自動化系統發展綜述[J].圖書館建設,2012(7):85-87,91

23.學術圖書館數據保存實踐國際調查報告發布[EB/ OL]. [2016-03-10]. http://www.csstoday.net/xueshuzixun/ jishizixun/82681.html

24.張杰,伍若梅.我國數字資源長期保存策略研究綜述[J].圖書館學刊,2013(4):135-138

25.宛玲,張長安. 我國高校數字資源長期保存權交易現狀的調研[J].圖書館雜志,2013(1):51-55, 105

26.宛玲,吳振新,郭家義.數字資源長期戰略保存的管理與技術策略——中歐數字資源長期保存國際研討會綜述[J].現代圖書情報技術,2005(1):56-60

27.吳振新,劉建華,張玫, 等. 數字資源長期保存:當前進展和最佳實踐——2007年數字資源長期保存國際會議(IPRES2007)綜述[J]. 現代圖書情報技術,2007(11):1-6

28.劉家真. 技術更新與數字信息長期保存調研紀要[J].檔案管理,2004(1):18-20

29.劉家真.數字信息保存的策略[J].情報學報,2000 (4):349-353

30.劉家真,許杰.影響我國數字信息長期保存的問題與解決方案[J].檔案學研究,2008(4):50-55

31.趙成軍.數字信息長期保存面臨的挑戰與發展策略[J].綏化化學學報,2011(1):169-170

32.柯燕紅. 試論我國數字信息長期保存的挑戰及策略[J].新世紀圖書館,2013(5):62-65

33.周玲玲. 數字資源長期保存在歐盟的戰略部署[J].情報理論與實踐,2010(3):125-128

34.張進京.數字數據的長期保存[EB/OL]. [2016-04-05]http://blog.sina.com.cn/s/blog_4843fbb101016xfm.html

35.徐寬,任河. 數字資源長期保存的內容價值判斷依據研究[J].圖書情報工作,2013(7):72-75, 100

36. Parochial Libraries Act1708[EB/OL]. [2016-03-20]. http://www·statutelaw·gov·uk/content·aspx? LegType= All+P rimary&PageNumber=1&NavFrom=2&parentActiveTextDocId=151 6319&ActiveTextDocId=1516319&filesize=15263

37.蘇小波,常娥.數字資源長期保存的成本影響因素分析[J].圖書與情報,2011(1):20-24, 44

38.王若琳,燕輝,黃輝,等. 我國圖書館數字資源長期保存策略運用現狀調查分析[J].圖書館,2014(2):56-59

39.張艷敏,馬秀峰.中外數字資源長期保存策略比較研究[J].圖書館學研究,2009(6):29-32

40.王小林. 數字資源長期保存技術綜述[J]. 數字與縮微影像,2011(3):31-35

41.白如江,冷伏海.“大數據”時代科學數據整合研究[J].情報理論與實踐,2014(1):94-99

42.張莉.圖書館在操作系統中實現數字信息長期保存的技術探討[J]. 圖書館理論與實踐,2010(12):69-72

43.吳振新,向菁.開源長期保存系統DAITSS研究[J].現代圖書情報技術,2009(7):18-22

44.田碩,黃國彬.近十年國外數字資源長期保存研究綜述[J].圖書館雜志,2011(7):8-13

45.黃國彬.復制權例外對圖書館數字資源長期保存的影響剖析[J].圖書情報工作,2012(1):47-50,54

46.楊梅玲.淺談圖書館數字資源的建設[J].南昌教育學院學報,2011(8):194-196

47.鐘源,吳振寰,劉燦姣.數字資源長期保存館社合作模式調查分析[J].圖書情報工作,2014(1):91-95

48.英國圖書館:12個月保存了10億網頁資料[EB/OL].[2016-04-10]. http://www.199it.com/archives/110284.html

49.李菲菲,周文云,王喜.數字資源長期保存項目接口的技術難點分析[J].情報探索,2013(7):103-105

50.郭家義.數字信息資源長期保存系統的標準體系研究[J]. 現代圖書情報技術,2006(4):14 -18

51.劉家真.標準化與數字信息的長期存取[J].圖書館雜志,2001(9):6-9

52.中國數字圖書館標準規范建設項目[EB/OL].[ 2016-03-20].http://cdls.nstl.gov.cn

53.吳振新. 數字資源長期保存可信賴認證研究發展綜述[J].中國圖書館學報,2015(3):114-126

*本文湖南省圖書館學會項目“數字時代的圖書館績效評價研究”(項目編號:XHYB1030)、湖南省高校圖工委項目“網絡環境下的圖書館評價研究”(項目編號:2015L003)成果之一。

〔分類號〕D913

〔作者簡介〕劉曉英(1975-),女,碩士,中南大學圖書館醫學分館副研究館員。

Long-term Preservation of Library Digital Resources in Big-data Age

Liu Xiaoying
( Library of Center South University )

〔Abstract〕The With the advent of big-data long-term preservation research and practice of digital resources face many problems and challenges. Long-term Preservation of digital resources are conditioned by many factors, such as person,money, technology, equipment and regime, and so on. And the core problems are preservation object, technology, standard,term, cost, management and law.

〔Keywords〕Big-dataDigital resourcesLibraryLong-term preservation.

猜你喜歡
圖書館資源
讓有限的“資源”更有效
基礎教育資源展示
一樣的資源,不一樣的收獲
圖書館
文苑(2019年20期)2019-11-16 08:52:12
資源回收
時間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
飛躍圖書館
圖書館里的是是非非
主站蜘蛛池模板: 久久精品免费看一| 超碰色了色| 伊人激情久久综合中文字幕| 亚洲最新在线| a级毛片免费在线观看| 色噜噜综合网| 日本免费a视频| 久热99这里只有精品视频6| 国产网站黄| 性网站在线观看| 全色黄大色大片免费久久老太| 欧美黑人欧美精品刺激| 成人福利在线视频| 国产成人一二三| 国产综合欧美| 在线欧美日韩国产| 青青草原国产免费av观看| 国产xx在线观看| 永久免费AⅤ无码网站在线观看| 无码视频国产精品一区二区 | 国产美女自慰在线观看| 日韩经典精品无码一区二区| 国产黑丝一区| 美女视频黄频a免费高清不卡| 国产尤物jk自慰制服喷水| 亚洲天堂日韩av电影| 国产91九色在线播放| 亚洲第一在线播放| 亚洲日韩AV无码精品| 亚洲人成网址| av性天堂网| 国产成人综合亚洲欧美在| 在线观看国产精品一区| 日韩成人高清无码| 97人妻精品专区久久久久| 成人精品视频一区二区在线| 久久狠狠色噜噜狠狠狠狠97视色| аv天堂最新中文在线| 青青操视频在线| 亚洲免费福利视频| 日韩午夜福利在线观看| 在线不卡免费视频| 99草精品视频| 成年免费在线观看| 69精品在线观看| 波多野结衣的av一区二区三区| 国产精品xxx| 精品无码视频在线观看| 国产一区自拍视频| 国产一区二区色淫影院| 国产成人在线无码免费视频| 伊人天堂网| 精品久久综合1区2区3区激情| 亚洲男人的天堂久久香蕉网| 三区在线视频| 东京热高清无码精品| 日本免费福利视频| 欧美一区精品| 亚洲欧美成aⅴ人在线观看| 无码中文字幕乱码免费2| a色毛片免费视频| 国产91麻豆免费观看| 伊人久久婷婷五月综合97色| 免费人成在线观看视频色| 毛片手机在线看| 无码日韩视频| 国产剧情伊人| 尤物在线观看乱码| 亚洲VA中文字幕| 成年女人a毛片免费视频| 国产免费怡红院视频| 亚洲国产欧美国产综合久久 | 色悠久久久| 国产h视频免费观看| 97超碰精品成人国产| 欧美日韩午夜| 国产高清在线丝袜精品一区| 欧美日韩精品在线播放| 91口爆吞精国产对白第三集| 亚洲综合激情另类专区| 欧美激情视频二区三区| 欧美成人亚洲综合精品欧美激情|