999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據起源技術的政府網站信息長期保存研究

2017-04-11 17:23:51黃新平
新世紀圖書館 2017年3期

摘 要 論文對數據起源的概念、數據起源追蹤方法、數據起源的存儲機制進行了概述,將數據起源技術創新性的引入政府網站信息長期保存研究,分析了基于數據起源技術開展政府網站信息管理的價值,在此基礎上,對數據起源技術支撐下的政府網站信息長期保存管理系統進行設計,并提出實現政府網站信息長期保存應解決的關鍵問題及策略。

關鍵詞 數據起源 政府網站信息 長期保存

分類號 G255.76

DOI 10.16810/j.cnki.1672-514X.2017.03.008

The Application of Data Provenance Technology Within Government Website Information Long-term Preservation

Huang Xinping

Abstract This paper gives a fair summary of the concept of data provenance, the tracing method of data provenance, and the storage mechanism of data provenance, and innovatively introduces the data provenance technology within government website information long-term preservation, and analyses the value of government website information management based on the data provenance technology. On this basis, it designs the government website information long-term preservation and management system supported by the technology of data provenance. In addition, the problems and countermeasures of how to realize the government website information long-term preservation are also discussed.

Keywords Data provenance. Government website information. Long-term preservation.

在電子政務促進政府服務轉型背景下,各類政府網站每天都在生產大量信息數據,這些規模巨大的信息資源涵蓋政府服務的方方面面,具有極大的開發利用價值。然而由于不同政府網站的構建相對獨立,受到技術、法律、管理等因素的限制,形成政務信息“條塊分割”的局面,無法抵擋媒體遷移、技術更新等帶來的影響。如何借助網絡信息采集處理技術,實現對政府網站信息的長期保存,是當前迫切需要解決的問題[1]。數據起源是處理大量派生數據,掌握數據由產生到利用整個生命周期變化的技術,能詳細記錄數據對象的動態變化,完整保存初始數據及其衍生物,保障了數據資源存儲的真實性和可靠性。因此,將數據起源技術引入政務網站信息長期保存中,通過分析政府網站信息管理特點,設計政府網站信息數據起源管理系統,對于電子政務信息的存儲與共享具有重要意義。

1 數據起源技術及其相關研究

1.1 數據起源的概念

起源又稱為溯源,體現了數據信息的產生與發展過程。人們通過記錄起源信息,可以掌握數據對象的一系列變化,了解與之相關的原因、地點、時間等信息,進而解決包括數據分析、數據引用、數據可靠度等在內的復雜問題。數據起源技術產生于上世紀九十年代,在金融、生物、計算機等領域均有應用。數據起源的基礎研究包括語義描述、起源捕獲、組織模型等。Greenwood認為其屬于記錄實驗過程、工作流的元數據;Lanter則認為其是對原始數據及其轉換過程的動態描述。實質上,每個數據對象都要經歷從生成、加工、轉換、存檔直至消亡的過程,即具備獨特的生命周期,而數據起源技術正是對數據對象生命周期的記錄[2]。

1.2 數據起源追蹤方法

由于不同的系統對數據的記錄、加工方式不同,要想有效追蹤、管理起源信息,首先需要設計相應的組織模型,發揮統領全局的作用。而數據起源技術的應用關鍵,也在于通過設計與構建組織模型,分析起源信息包含的內容,對數據捕獲、存儲與加工等進行引導。對起源信息的追蹤和捕獲,主要應用到雙向指針追蹤、標注、位向量存儲定位等方法。其中標注法是將與起源數據相關的信息記錄下來,操作相對簡單,應用頻率高;而雙向指針追蹤法僅適用于特定數據庫中,基于位向量的存儲定位只能記錄簡單的數據路徑,目前還無法得到廣泛推廣[3]。工作流起源管理系統中多采用標注法,以前是將標注作為元數據進行存儲,隨著數據環境的日益復雜,逐漸將兩者分開存儲,以方便后續調用。

1.3 數據起源的存儲機制

基于數據起源的數據采集和存儲,改變了傳統的數據管理模式,使得標注與數據的聯系更為緊密。由于標注具有多粒度特性,因此附帶起源的數據存儲對象并非常規數據,而是包含標注的數據。同時針對用戶的數據查詢,數據起源系統可以提供數據查詢、標注查詢,以及數據和標注查詢三種方式。根據數據與標注的不同關系,將數據存儲分為離散、混合存儲兩類。離散存儲實現了標注與數據物理層面的分離,可以采取邏輯鏈接的方式將兩者結合起來[4]。在數據管理過程中,應該考慮該存儲方式是否存在數據修改,以及是否需要更新版本等。混合存儲需要構建數據集索引,以特定信息維持標注與數據之間的共同存儲。數據起源的引入給數據管理帶來了新變化,要求創建、設置與獲取標注,也要求尋找全新的數據索引、查詢與存儲方法。為避免起源信息對數據應用的影響,要求標注、數據之間相對獨立,因此采取離散存儲方式更為合適。

2 基于數據起源技術開展政府網站信息管理的價值

數據起源技術是在起源追蹤、捕獲、查詢、可視化等技術上發展起來的,解決復雜數據存儲問題的全新處理方法。在政府網站信息管理中引入數據起源技術,只需要選擇合適的軟硬件設備,設計合理的起源數據組織模型,而無需考慮系統的負載和計算能力。這樣不僅可以解決政府網站信息分散、基礎設施建設重復、系統缺乏互聯等問題,也可以有效降低信息管理成本,提升政務信息利用率,最大限度實現電子政務信息共享。

2.1 促進政務信息資源共享

數據起源技術可以模擬數據對象的產生、傳播和衍生過程,促進數據的優化與共享。對于政府網站信息的存儲管理,首先需要考慮數據的可靠性和可用性。由于電子政務系統不斷更新,數據源處于動態變化中,當政府網站的信息發生變化時,數據起源可以描述數據對象的演變過程,并根據起源信息進行數據重構,保障數據傳播的順暢、有序性,也為政府網站信息共享提供了便利。同時數據起源技術實現了異構分布政務信息的高效采集,在對數據來源進行跟蹤審計的基礎上,為不同政務部門的數據存儲提供了公共平臺。通過構建基于數據起源的政務信息存儲系統,可以實現對分散系統的信息集成,從業務層面實現政務信息整合,促進不同政府網站之間的數據交換共享,消除政務“信息孤島”。

2.2 降低政府網站資源維護成本

數據起源技術的應用改變了政府網站傳統的軟硬件設施開發模式,能夠實現對政務系統配套軟硬件資源的統一分配,避免出現部分伺機服務器超負荷運轉而部分服務器利用率低的問題。同時借助數據起源技術,可以對政府網站信息進行追蹤、捕獲和采集,計算不同信息資源的負載分配情況,迅速定位系統錯誤部位,分析出現錯誤的原因,進而幫助系統管理者迅速制定解決方案,極大提升了政務系統的穩定性。此外,數據起源技術對政務系統數據資源的配置和管理,能夠保障不同功能模塊互不干擾,提高軟硬件設施的利用率,降低政府網站各類資源的維護成本。

2.3 提升政府系統運行穩定性

數據起源技術對政府網站信息的追蹤采集過程中,在分析數據來源的同時,也可以構建與數據版權相關的派生樹,方便用戶根據派生樹驗證數據對象的版權,分析數據對象的真實性。而數據對象的創建者,也可以借助數據起源技術,通過查找派生樹的方式,了解其創建數據的使用情況,實現對數據版權的有效保護,避免出現版權糾紛。同時數據起源與分布式、虛擬化技術的結合,可以實現對異構分布政務信息的追蹤、監測,并通過設置訪問控制權限的方式,降低政務信息利用中存在的風險。從硬件角度分析,數據起源技術能夠迅速定位系統故障,確保系統的高容錯性和故障動態遷移性,并且以數據冗余備份的方式,降低發生故障的頻率。

3 基于數據起源技術的政府網站信息長期保存管理系統設計

數據起源技術在長期存儲系統中,可以形成以事件為中心的起源信息記錄方式。因此,可通過分析數據對象的一系列變化,實現對政務信息的動態管理。

3.1 起源管理系統設計原則

在政府網站信息長期存儲的整個生命周期中,要綜合考慮起源管理的影響因素,筆者認為數據起源管理系統的設計應該遵循以下原則:①以數據保存周期為依據,將數據對象產生作為起始,對其錄入系統后整個生命周期的所有變化進行動態管理;②以OAIS(長期保存通用標準)為準則,遵循OAIS了解數據對象長期保存的基本流程,明確定義起源信息的構成,將其作為系統設計的依據;③以事件作為起源信息記錄中心,數據對象在存儲管理活動中會產生大量事件,可以說起源信息與事件是相伴相生的;④保障適用性和交互性,管理系統設計應該為數據對象管理提供所有可能的功能與流程,明確不同存儲系統與不同模塊之間的嵌入關系,強化數據對象在不同系統中的交互性,并嵌入OAIS流程實現高效管理。

3.2 面向數據周期的起源事件清單

事件是數據對象一系列變化的驅動力,借助事件不僅可以捕獲起源信息,也能夠掌握數據的動態變化。隨著起源管理活動中事件的增多,通過了解與數據對象相關的事件鏈,就可以展現長期存儲對象的狀態變化[5]。因此,對于數據起源管理系統的設計,將起源事件定義為系統可識別的,能夠至少影響一個對象的動作,如捕獲起源信息、調取文件等。在整個數據生命周期中,OAIS包含攝入、歸檔、數據處理、業務管理、保存規劃以及訪問等環節。對于起源事件的判斷和甄選,應該以OAIS流程為依據,綜合考慮數據對象的產生、發生的變化,以及數據對象的派生產物,進而為數據長期保存提供依據。在政府網站信息產生之初,就存在不可預知的變化因素,包括元數據、信息內容、格式、保存責任人等,即使部分數據本身變化不大,也需要考慮與之相關的數據對象或管理版權的變化,全面了解基于數據周期的詳細起源事件。

3.3 嵌入OAIS的起源管理框架

根據基于數據周期的起源事件來看,數據起源管理涉及與OAIS相關的所有功能模塊,因此對于政府網站信息的長期保存,應該嵌入OAIS流程中形成完整的起源管理框架,具體如圖1所示。

由圖1可知,起源信息管理貫穿于OAIS的整個流程中,實現了對不同環節起源事件的動態追蹤,也可以根據系統預先設定的起源事件清單,實現對數據對象的動態捕獲。然后,將需要長期保存的數據對象,依據相應的起源組織模型轉換為規范的歸檔信息,保障起源信息的真實性、完整性和可用性,并且存儲于特定數據庫中,由對應的管理模塊實現對數據信息的長期保存。對于政府網站信息長期保存的起源管理,需要設置事件配置、事件監控、事件組織等功能模塊。其中,事件配置模塊主要功能在于定義需捕獲數據的類型,實現對事件的合理配置。在起源信息捕獲前,由長期保存系統的管理者根據實際需求,結合系統的基本操作按類型歸納需要捕獲的起源事件,在對其進行詳細描述的基礎上,對起源事件清單進行格式轉換,最后配置為系統可讀的內容。事件監控模塊負責對長期保存系統的所有事件進行動態監測,若發現某個起源事件或預定義事件,與清單中其它事件相互匹配時,就需要將完整的事件信息呈遞給組織模塊。由事件組織模塊獲取動態信息,并將其添加至起源管理任務列表中,采取異步記錄的方式實現對起源信息的合理組織,減少服務器的運行壓力[6]。存儲模塊的功能在于接收并存儲經過有序化組織的數據信息,并維護不同數據對象間的聯系。

4 基于數據起源的政府網站信息長期保存應解決的關鍵問題

基于數據起源的政府網站信息長期保存,目的在于實現對數字政務信息的有序化管理和長期訪問。其數據起源管理的實現,實質上就是建設一個長效訪問機制,通過起源信息捕獲、鑒定與整合,保障訪問信息與網站原生信息的一致性。在數據起源技術具體應用過程中,需要制定合理的網站信息采集策略,實現對采集的科學編目,并解決數據歸檔安全問題,真正為政務信息長效利用提供保障。基本策略如圖2所示。

4.1 制定網站信息采集策略

面對海量異構的網絡資源,要求制定科學合理的網頁信息采集策略,這也是實現數據起源管理需要解決的問題。由于目前缺乏專門針對數據長期存儲的起源捕獲工具,因此在長期保存系統中多依據OAIS流程開發捕獲插件或工具包,或者通過編寫獨立函數模塊,用于感知和記錄系統內部發生的所有起源事件。也可以采用工作流軟件,以轉換、制作復本的方式抽取起源,利用系統插件迅速捕獲內部起源信息。目前市面上出現了專門的起源元數據抽取軟件,如DROID,可以通過動態追蹤數據對象,記錄與之相關的各類事件,是當前網頁數據采集的常用方式。此外,云計算具有并行處理大規模異構數據的優勢,適用于分散數據的高速計算,可以分布式計算框架為依托,借助網絡爬蟲技術篩選網頁信息,實現對存儲目標的高效、自動采集[7]。

圖2 政府網站信息長期保存應解決的關鍵問題及策略

4.2 網站信息的歸類與編目

在采集完成政府網站信息后,需要通過科學分類、編目與鑒定,使大規模數據資源有序化,為后續的長期保存奠定基礎。根據政府網站信息的特點,可以從數據的產生、利用和流通三個方面,設計適應起源數據管理的元數據存儲方案,選擇基于XML的元數據標準,為信息編目提供依據。同時利用貝葉斯分類、云計算等方法,實現對政務信息的科學歸類。然后構建政務信息存儲的智能鑒定模型,對采集數據進行鑒定,實現系統資源的優化配置[8]。由于政府網站信息存儲屬于持續、長期的活動,面對不斷增加的信息存儲量,還需要引入開源計算技術,通過調用Web服務器中的運行程序,完成對網站存儲信息的提取、讀寫和刪除等操作,提升用戶數據訪問的響應速度,實現政府網站信息的高效存取和優化利用。

4.3 網站信息歸檔的安全防護

由于網頁信息的動態性、易變性,這就需要著力解決政務信息歸檔的安全保護問題。在起源數據管理過程中,可以引入數據保護、數據加密等技術,借助虛擬化技術平臺,設置政務信息訪問控制或隔離機制,進而保障信息安全。也可以通過設置用戶信任等級證書,在獲取驗證信息的基礎上控制訪問量,實現對長期保存數據的適當隔離[9]。為避免出現政府網站無法鏈接、網頁數據丟失等問題,可以采用超鏈接、HTML重寫等技術,達到重現歸檔政務信息的目的。同時為提升政府網站信息的歸檔價值,數據管理者可以引入信息推送、大數據技術,為用戶提供多元化的增值服務,如信息檢索、數據挖掘等,體現“以人為本”的服務理念。

5 結語

對政府網站信息的長期保存,需要綜合考慮軟硬件投入、資源維護、參與主體等因素。數據起源作為描述數據對象演變歷程的技術,為解決政務信息存檔問題提供了可能。由于起源信息與情境信息存在重疊,加上復雜的網絡環境,因此在設計政府網站信息長期保存系統時,應該明確界定起源事件,詳細記錄起源信息,并制定完善的數據起源管理規劃,切實保障存檔信息的安全性和真實性。

參考文獻:

[ 1 ] 何歡歡.政府網站信息資源保存挑戰及對策[J].圖書情報工作,2011,55(7):130-133.

[ 2 ] 戴超凡,王濤,張鵬程.數據起源技術發展研究綜述[J].計算機應用研究,2010,27(9):3215-3221.

[ 3 ] 徐揚,王申罡.數據起源研究進展[J].情報理論與實踐,2016,39(7):136-140,135.

[ 4 ] 苗麗娟.基于XML的起源計算和起源存儲研究[D].南京:南京理工大學,2012.

[ 5 ] 吳振新,李文燕,蔣世銀.構建以事件為核心的長期保存系統起源管理框架[J].圖書情報工作,2016(6):91-96.

[ 6 ] 吳振新,李文燕.起源技術在長期保存中的應用與研究[J].圖書情報工作,2015,59(8):118-125.

[ 7 ] 王萍,黃新平,陳為東,等.政府網站原生數字政務信息云歸檔模型及策略研究[J].情報理論與實踐,2016,39(4):60-65.

[ 8 ] HAN Y. Cloud storage for digital preservation:optimal uses of Amazon S3 and Glacier[J].Library Hi Tech,2015

(2):261-271.

[ 9 ] 顏倩倩,王鳳英.云計算平臺下的數據起源安全方案[J].山東理工大學學報(自然科學版),2011,25(5):67-70.

黃新平 吉林大學管理學院博士研究生。吉林長春,130022。

(收稿日期:2016-12-06 編校:劉忠斌)

主站蜘蛛池模板: 日本在线视频免费| 日本精品视频| 2020国产精品视频| 亚洲天堂啪啪| 国内精品久久久久鸭| 亚洲天堂啪啪| 波多野结衣亚洲一区| 欧美色综合久久| 亚洲综合天堂网| 国产精品不卡片视频免费观看| 婷婷亚洲视频| 亚洲日本韩在线观看| 国产精品冒白浆免费视频| 91久久大香线蕉| a级毛片免费网站| 国产黄色片在线看| 波多野结衣中文字幕一区二区| 欧美中文字幕一区二区三区| 热久久这里是精品6免费观看| 69国产精品视频免费| 久草中文网| 国产一级毛片网站| 狠狠色综合网| 人人91人人澡人人妻人人爽| 国产91在线免费视频| 欧美日韩中文字幕二区三区| 91久久夜色精品国产网站 | 精品午夜国产福利观看| 成人国产一区二区三区| 精品少妇人妻av无码久久| 国产成人1024精品| 99热这里只有精品5| 国产精品亚洲综合久久小说| 亚洲国产成人超福利久久精品| 欧美在线一级片| 欧美国产综合色视频| 色噜噜中文网| 91在线视频福利| 农村乱人伦一区二区| 九九热视频在线免费观看| 国产精品久久久久久久久久98| 国产农村妇女精品一二区| 毛片手机在线看| 亚洲欧美自拍视频| 亚洲无码高清视频在线观看| 亚洲欧美日韩动漫| 国产午夜无码专区喷水| 国产一级二级三级毛片| 91激情视频| 99在线小视频| 欧美成人国产| 国产精品污视频| 99久久国产自偷自偷免费一区| 粗大猛烈进出高潮视频无码| 国产理论最新国产精品视频| 九九九久久国产精品| 114级毛片免费观看| 久久精品这里只有精99品| 日本在线亚洲| 2020久久国产综合精品swag| 国产69精品久久久久妇女| 精品久久久久成人码免费动漫| 免费无码网站| 人人91人人澡人人妻人人爽| 欧美成人在线免费| 第一页亚洲| 欧美日一级片| 国产精品美女自慰喷水| 久久一本日韩精品中文字幕屁孩| 国产精品亚洲va在线观看| 日韩精品无码免费一区二区三区 | 日本五区在线不卡精品| 欧洲高清无码在线| 免费观看欧美性一级| 一本大道AV人久久综合| 宅男噜噜噜66国产在线观看| 欧美有码在线观看| 欧美无专区| 国产91成人| 欧美有码在线观看| 国产九九精品视频| 亚洲男人天堂网址|