999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數字保存的認知與實踐

2012-04-29 04:10:13臧國全郭營
圖書與情報 2012年1期

臧國全 郭營

摘 要:數字保存的認知是對數字保存基本問題的看法,對地觀測數據保存的認知調查包括保存的重要性、保存原因、保存用途和保存威脅。數字保存的實踐是對數字保存領域中相關問題的目前解決方法,對地觀測數據的實踐調查包括保存數據的內容、采用的元數據標準和保存數據的使用。基于認知調查,提出了加強數字保存經濟可持續性研究的思想?;趯嵺`調查,提出了制定數字保存質量保證標準與設計質量認證模型的思路。

關鍵詞:數字保存 認知調查 實踐調查 對地觀測

中圖分類號: G250.76文獻標識碼: A 文章編號: 1003-6938(2012)01-0062-05

Perception and Practice on Digital Preservation: Based on Survey for Data Preservation in Earth Observation

Abstract The perception on digital preservation consists of some ideas to basic problems in the field of digital preservation. The perception survey on Earth Observation data preservation includes preservation importance, reasons, usages and threats. Practices on digital preservation are the current resolving methods for the related issues in the field of digital preservation, including preserved data content, metadata standards, data access and its usage. Based on the perceptionsurvey, the author proposes an idea on digital preservation economic sustainability and based on the practice survey the author puts forward to study on setting up preservation quality standard and designing quality certification models.

Keywords digital preservation; perception survey; practice survey; earth observation

目前的數字保存對象主要有兩類:學術論著和研究型數據。前者比較普遍,其保存理論和實踐相對成熟;后者集中在數據密集型領域,保存理論和實踐相對滯后。對地觀測產生大量的觀測數據(一種重要類型的研究型數據),該類數據在地球科學的研究中扮演重要角色。

據普查,目前為止對地觀測數據的保存與使用調查案例非常少見,僅發現的一個案例是歐盟科學研究院第七框架項目組的PARSE.insight項目 (2010年)[1],該項目的調查對象來源有二:一是對地觀測數據保存的實施人員(下稱保存者,共計105人給予了完全回答,一些保存者同時也是研究人員),選自于全球各地太空項目(一些大型項目擁有多個對地觀測數據的保存系統),如歐洲太空總署ESA[2]、美國NASA[3]、中國航天集團等,這類項目是對地觀測數據的主要收集者和保存者;二是該類數據的使用者(共計600人給予了完全回答),選自地球科學、大氣科學和海洋科學的研究人員,這三個領域的科研人員是對地觀測數據的集中使用者。筆者基于該項調查,總結對地觀測數據的保存者和使用者對數字保存的認知與實踐,分析數字保存存在的問題,尋求可能的解決方案。

1 數字保存的認知

認知就是看法,對地觀測數據的保存認知是指保存者和使用者對這類數字資源保存基本問題的看法,包括:保存的重要性、保存原因、保存用途和保存威脅。

1.1 保存的重要性

總體上,被調查者中71.8%的認為長期保存對地觀測數據非常重要,22.4%的認為重要,4.6%的認為比較重要,只有1.2%的認為不重要。

可能因為對地觀測數據的幾乎不可重復性(難以出現或創建完全相同的觀測環境),被調查者對一些領域中觀測數據的長期保存重要性認知度相當高(90%以上認為非常重要),這些領域有海洋水質監測、海洋生物變遷、海洋水文地理、地面沉降、地震和火山爆發等(其他領域的調查結果見表1)。整體上,與保存者相比,使用者對保存的重要性認知度更高一點,可能的解釋是這些學科都是數據密集型學科,科學研究活動高度依賴于對地觀測數據。

1.2 保存原因

保存原因有很多,但得到比較廣泛認可的有四個(見表2)。總體上,與數據使用者相比,數據保存者對保存原因的認知度要略低一點,也許是因為數據保存者對對地觀測數據保存的困難體會較深,對保存原因的認知更趨理智。

1.3 保存用途

對地觀測數據主要來自于通過圍繞地球運行的人造衛星收集到的有關地球物理、化學和生物系統的信息,這類信息是地球科學研究的基礎,廣泛應用于自然環境和人造環境的監控和預測。

1.4 保存威脅

調查顯示,數據保存的最主要威脅來自保存系統缺乏可持續性、軟硬件和數據格式過時導致數據無法訪問以及描述型元數據丟失導致數據對象無法發現(見表4)。整體上,數據保存者對保存威脅的認知度略高,說明了保存者對數據保存過程的困難與缺憾深有感悟。

注:原因1:對地觀測多由公共資金支持實施,觀測數據為公共財產,理應合理保存,為未來科學研究之用;

原因2:對地球狀態(包括地球環境和演變過程)的分析需要長期的盡可能全面的觀測數據;

原因3:時間無法逆轉,環境無法復制,對地觀測無法重復取樣,因此需要完整地保存這類數據;

原因4:對地觀測數據的價值難以估量,未來的潛在應用難以預測。

注:用途1:地球災害觀測(如水災、地震、颶風、火山爆發);

用途2:氣候變化監控;

用途3:生態追蹤(如海洋、碳化循環);

用途4:天氣預測;

用途5:土地使用測量與統計(如深林濫伐、城市膨脹) 。

2 數字保存的實踐

對地觀測數據的保存實踐是指目前對該類數據保存中相關問題的解決方法,包括:保存數據的內容、采用的元數據標準和保存數據的使用。其中前兩個問題的調查對象是數據保存者,最后一個問題的調查對象是數據使用者。

2.1 保存內容

基于對地觀測數據保存者調查的結果顯示,不同的對地觀測數據保存系統所保存的數據內容分布比較集中(見表5),表明保存系統在此項實踐上比較一致。

注:威脅1:數據保存系統缺乏可持續性;

威脅2:軟硬件過時導致保存數據無法訪問。

威脅3:數據文件格式過時導致用戶無法理解和使用。

威脅4:描述型元數據丟失導致數據對象無法檢索利用。

威脅5:數據保存系統的可信任性遭到質疑。

威脅6:數據訪問與使用的限制無法保證導致知識產權受到侵犯。

威脅7:數據來源信息改變或丟失導致數據的真實性無從考究。

2.2 元數據標準

用戶對對地觀測數據的訪問是通過元數據實現的,不同的對地觀測數據保存系統采用的元數據標準也不盡相同,針對保存者的調查顯示,對地觀測數據保存采用的元數據方案比較集中在HDF、netCDF、ISO19xxx系列空間元數據標準、INSPIRE和OGC等(見表6)。

2.3 數據使用的目的與問題

總體上,使用者對保存數據高頻率訪問的占61.7%,經常訪問的占22.7%,偶爾訪問的占15.6%。從用途角度,使用者訪問保存數據的目的比較分散(見表7)。

從訪問和使用的保存數據類型角度,被調查者中有79%經常使用原始觀測數據,50%經常使用合成數據(基于多項原始數據加工而成的數據產品),37%經常使用解釋型數據(針對一些難以理解的原始數據進行解釋的輔助數據)。

在數據使用過程中,最常遇到的問題見表8。

針對上述第一個問題,可能導致的原因有數據遷移和數據恢復。數據遷移包括存貯介質遷移和數據格式遷移。存貯介質遷移是將保存數據從不穩定的存貯介質轉移到穩定的存貯介質中,這個過程可能會導致數據的丟失。數據格式遷移是數據存貯的文件格式從過時的格式轉換為新格式的過程,這個轉換過程也會導致數據的丟失。另外,存儲介質本身的老化和損壞也是導致數據丟失的常見原因。

針對上述第二個問題,可能的原因是元數據丟失。用戶對數字資源的檢索是通過描述性元數據實現的,描述型元數據的丟失和不充分使得用戶無法找到相對應的數字資源。

針對上述第三個問題,可能的原因是數據存貯格式過時。數據格式過時是用戶使用當前瀏覽器無法打開瀏覽原來的數據存貯文件格式。

針對上述第四個問題,可能的原因是表征信息缺失或不充分。表征信息是指有效瀏覽和使用保存數據所必須的工具,比如瀏覽軟件、分析軟件、理解保存數據所需的知識、記錄對地觀測數據生產的文檔等,這類信息常常要求與對地觀測數據一起保存。由于一些對地觀測數據的高度復雜性,表征信息對有效使用和理解這類數據至關重要。

3 對數字保存的思考

3.1 認知上的思考

認知上,雖然保存人員和使用人員認為對地觀測數據的保存非常重要,并且對保存原因和用途的認識也基本一致,但對該類數據保存的未來高度憂慮,具體體現在表4中最嚴重的保存威脅為“數據保存系統缺乏可持續性”,實際上該表中的其他6項威脅也是可持續性的細化。因此,學術界應該加強對數字保存的可持續性研究。

宏觀上,影響數字保存可持續性的最主要問題有管理、技術和經濟三個方面。多年來,對數字保存的研究主要集中在管理和技術層面,但對經濟問題涉獵甚少,因此應該開展對數字保存經濟可持續性的探討。實際上,數字保存本身就是一種經濟產品,要么是基于市場機制運營的市場經濟產品(如CNKI的中國期刊網),要么是基于公益性機制運營的公共經濟產品(如美國國會圖書館的American Memory)。從經濟產品角度,數字保存經濟可持續性可以從經濟要素和經濟評價兩個方面進行研究。

數字保存的經濟要素可以從宏觀和微觀兩個層面進行解析。宏觀上的經濟要素主要是“供給與需求”。在“供給”方面,應該研究其影響因素(如數字資源的保存價值、數字資源非排斥性消費以及由此產生的搭便車問題、保存動機的缺失與錯位等)以及解決方法;在“需求”方面,同樣也應該研究其影響因素(如當前用戶需求的發散性、未來用戶需求的預測性、數字保存的派生需求等)以及解決方法。微觀上的數字保存經濟要素主要是“成本與收入”,成本方面的研究應該構建數字保存成本的計量模型(如已出現的LIFE模型[4]、BCL模型[5]等),收入方面的研究應該設計用戶訪問收費和保存者委托保存收費的計量方法(如英國考古學數據保存ADS項目[6])。

數字保存的經濟評價可以參考其他相近類型項目(如IT項目)的經濟評價方法結合數字保存項目特征來實施,一般從定性和定量兩個角度進行。在定性評價方面,可以從供給的必要性(如數字資源保存價值大小、搭便車問題的影響與解決、保存動機缺失與錯位的存在情況及提升與糾正等)和需求的充分性(如現實需求水平、未來需求預測、派生需求的市場供給)等方面,分析數字保存項目的經濟必要性。在定量評價方面,應該基于“成本與收入”的計量或預測值,評價數字保存項目的經濟可行性,一般包括的步驟有建立評價指標體系、設計評價指標計量模型、設置評價指標基準值以及評價實施等。

3.2 實踐上的思考

實踐上,保存人員保存對地觀測數據的類型比較一致;所采用的元數據標準雖然比較分散,但大都遵從該類數據的特點;使用者的訪問目的雖然也比較分散,但大都因任務而異;最突出的問題表現在訪問過程中遇到的不足。實際上,這些不足都是數字保存質量問題的具體體現。作為一種經濟產品,同其他類型產品一樣,數字保存質量可以通過建立質量標準(如不少產品都有質量標準)并在此基礎上進行質量認證(如產品的ISO9000系列認證)來解決。但目前為止,對數字保存的質量標準與認證探討不多,應該加強這方面的研究。

在質量標準研究方面,可以首先分析影響數字保存質量的因素,然后建立數字保存的質量標準。

在數字保存質量影響因素解析方面,根據全面質量管理的原理,應該基于數字資源生命周期包含的階段,從各個階段實施的主體來分析。一般認為,數字資源生命周期包括的主要階段有:數字資源的生產階段(由數字資源生產機構實施)、數字資源的存儲階段(由保存機構通過建立運行數字保存系統來實施,有的保存者與生產者是同一個機構,有的則是不同機構)、數字資源的訪問階段(由用戶通過對數字保存系統進行檢索、結果瀏覽與下載來實現)等。因此,數字保存質量影響因素可以從數字保存系統、數字資源生產機構、保存機構、用戶、信息技術支撐(由于數字保存的整個生命周期都需信息技術支撐)等方面進行分析。

在數字保存質量標準建立方面,應該在上述分析的基礎上,從數字保存的管理質量、保存系統的性能質量、用戶服務質量和技術支持質量等方面來實現。其中:(1)數字保存的管理質量,應該涵蓋數字保存方針、所需人力資源與員工職責、保存系統監控與反饋、保存系統運行日志管理、數字資源的完整性監控與測度、災難性事件的防御與恢復計劃、數字遷移等各種長期保存措施的風險管理、數字資源產權管理等;(2)保存系統的性能質量,可以參照OAIS參考模型來研究,內容應該涵蓋數字資源獲取與收錄、存檔技術與管理規范、檢索元數據和管理元數據、數字對象質量指標、檢索功能與檢索效率、各種導航與鏈接規范等;(3)用戶服務質量,應該涵蓋目標用戶及其需求、滿足用戶信息需求的元數據方案、用戶服務模式與方針、用戶訪問記錄的管理與分析、數字資源的用戶可用性與可理解性的測試與核實、用戶信息反饋機制等;(4)技術支持質量,可以參照信息安全標準ISO17799來研究,內容應該涵蓋多平臺支持、數據備份與同步訪問機制、損壞和丟失數據的檢測與恢復、存儲介質遷移與數據檢驗、軟硬件對用戶服務的支持水平、保存系統環境分析與安全報警機制等。

在數字保存質量認證方面,可以參考ISO產品質量認證的方案,結合數字保存的特點,設計數字保存的認證模型。該模型應該包括的基本模塊有:(1)認證機構與認證人員,內容應該涵蓋認證機構的基本要求、認可獲得程序、認證人員資格獲取與監視、認證人員行為準則與職責及能力的評價與管理等;(2)認證模式,應該參考ISO9001的認證模式,研究數字保存認證模式的構成要素,并據此設計認證模式的種類,探討每種認證模式的優缺點和適應范圍;(3)認證流程,應該研究認證流程的構成要素(如認證的申請、數字保存質量管理體系檢查、數字保存性能抽查、審查與審定及認證批準等);(4)認證方案,應該涵蓋認證方案的形式、認證實施階段(如資格檢查、認證、跟蹤)、認證方案的內容等。

參考文獻:

[1]Kuipers T, Hoeven J. Insight into digital preservation of research output in Europe: Case studies report[EB/OL]. [2011-04-01].http://www.parse-insight.eu/downloads/P

ARSE-Insight_D3-3_CaseStudiesReport.pdf.

[2]EAS.The European Space Agency portal[EB/OL].[2011

-09-10].http:www.esa.int/.

[3]NASA.National Aeronautics and Space Administration[EB/OL].[2011-05-01]. http://www.nasa.gov/.

[4]Ayris P.etal. The LIFE: Final Project Report[EB/OL].[2011-08-10]. http://www.life.ac.uk.

[5]Beagrie N et al. Keeping Research Data Safe: A Cost Model and Guidance for UK Universities[M].London: JISC, 2008.

[6]ADS. Archaeology data service[EB/OL].[2011-09-07]. http://archaeologydataservice.ac.uk/.

作者簡介:臧國全(1963-),男,博士/博士后,鄭州大學信息管理系教授,研究方向:數字保存;郭營(1988-),女,鄭州大學信息管理系碩士研究生。

主站蜘蛛池模板: 在线观看国产一区二区三区99| 亚洲精品欧美日韩在线| 日韩在线视频网站| 亚洲一区二区无码视频| 亚洲精品成人福利在线电影| 成人精品免费视频| 欧美性爱精品一区二区三区 | 国产午夜无码专区喷水| 视频一本大道香蕉久在线播放| 久久精品国产精品国产一区| 欧美乱妇高清无乱码免费| 午夜毛片免费观看视频 | 婷婷综合缴情亚洲五月伊| 一本色道久久88| 欧美α片免费观看| 欧美特黄一级大黄录像| 日韩精品专区免费无码aⅴ| 日韩欧美成人高清在线观看| 日韩黄色大片免费看| 国产精品极品美女自在线网站| 日本不卡免费高清视频| h网址在线观看| 97亚洲色综久久精品| 91色爱欧美精品www| 无码丝袜人妻| 久久精品娱乐亚洲领先| 人妻无码一区二区视频| 日本黄色a视频| 美女国内精品自产拍在线播放| 中文字幕永久视频| 美女国内精品自产拍在线播放 | 人妻丰满熟妇αv无码| 国模在线视频一区二区三区| 欧美激情视频二区| 99无码熟妇丰满人妻啪啪| 亚洲国产精品日韩av专区| 女同国产精品一区二区| 国产精品99久久久久久董美香| 国产精品毛片一区| 亚洲一区无码在线| 久草中文网| 国产亚洲日韩av在线| 无码av免费不卡在线观看| 欧美日韩国产综合视频在线观看| 亚洲欧美精品在线| 欧美精品亚洲精品日韩专区va| 亚洲高清在线天堂精品| 毛片基地视频| 免费观看无遮挡www的小视频| 亚洲永久视频| 久久99国产视频| 四虎在线观看视频高清无码| 激情午夜婷婷| 亚洲AV无码久久天堂| 久久亚洲高清国产| 亚洲欧美国产高清va在线播放| 日本欧美一二三区色视频| 福利国产微拍广场一区视频在线| 欧美精品亚洲精品日韩专| 美女被狂躁www在线观看| 国产精品久久自在自线观看| 99久久精品国产精品亚洲| 亚洲色中色| 国产综合色在线视频播放线视| 精品国产毛片| 精品国产成人三级在线观看| 国产成人无码AV在线播放动漫| 国产精品自在在线午夜| 99九九成人免费视频精品| 成人午夜免费观看| 亚洲第一视频区| 91精品专区国产盗摄| 国产精品无码AV片在线观看播放| 55夜色66夜色国产精品视频| 亚洲国产高清精品线久久| 免费午夜无码18禁无码影院| 日本高清在线看免费观看| 欧美自慰一级看片免费| 红杏AV在线无码| 亚洲免费播放| 三级视频中文字幕| 日韩AV手机在线观看蜜芽|