999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

國家綜合檔案館檔案數據資源智慧化管理路徑及其實現機制研究

2022-07-11 00:49:00張慧穎曹玉
北京檔案 2022年6期

張慧穎 曹玉

摘要:在《“十四五”全國檔案事業發展規劃》的政策背景下,從檔案收集、整理、保管的檔案工作業務流程視角出發,基于新一代信息技術提出檔案數據資源智慧化管理路徑,通過以數據化為導向的協同統一機制、以數據流通為主線的開放共享機制、以人才與技術為支撐的保障機制三個實現機制,來全面高效地對國家綜合檔案館館藏資源進行智慧管理,深入挖掘檔案資源的潛在價值,為用戶提供智慧服務。

關鍵詞:國家綜合檔案館 檔案數據資源 檔案資源管理 智慧管理

Abstract:Considering the The 14th Five- year Plan for the National Archival Enterprise Develop? ment, and the archives business process of archives collection, sorting and storage, this paper offers the intelligent management path of archives data re? sources based on the new generation of information technology. Through the implementation mechanism of data-oriented coordination and unification mecha? nism, open and sharing mechanism with data circula? tion and guaranteed mechanism supported by tal? ents and technology, the national comprehensive ar? chives can comprehensively and efficiently manage the collection resources, reach the highest potential value of resources, and provide intelligent services for archives users.

Keywords:National General Archives; Archive da? ta resources; Archives resource management; Intelli? gent management

(一)政策背景

《中華人民共和國檔案法》第十條規定中央和縣級以上地方各級各類檔案館的職責是“負責收集、整理、保管和提供利用各自分管范圍內的檔案”。《“十四五”全國檔案事業發展規劃》(以下簡稱《規劃》)將提升檔案管理的數字化、智能化水平設為發展目標之一,提出了“加快推進檔案信息化建設,引領檔案管理現代化”及推進檔案資源體系建設的主要任務。同時,《規劃》對檔案資源建設和檔案信息化建設提出了更高的要求,多次提出檔案收集、整理和保管任務,從戰略層面明確檔案資源建設是貫穿于檔案工作流程中的主要角色,新一代信息技術的應用是檔案資源建設走向現代化的重要工具,能加速數字轉型和智能升級。

《規劃》在檔案資源收集方面對移交、征集、采集做出了明確指導,要求“增量電子化”,對電子檔案應收盡收,并推動電子文件單套制歸檔。在物理空間的限制下,云端存儲電子檔案及檔案數據順應了時代發展的要求,推動檔案工作數字化轉型。在檔案資源整理方面,《規劃》對檔案數字化成果的語音、文字識別的指示,本質上是對檔案資源開展數據化工作;通過加強檔案資源質量控制,來挖掘檔案數據資源的潛在價值,統籌檔案專題數據庫建設。檔案數字資源的備份和異地保存是保障檔案數字資源安全的有效途徑,檔案信息化建設可加強檔案保管的安全監控,健全檔案資源安全體系,推動數字檔案館的智慧化升級。

(二)研究現狀

自2013年楊來青以青島市檔案館為例,首次提出智慧檔案館的建設構想[1]后,各地檔案館隨之加快了智慧化建設進程。智慧檔案館的目標是滿足用戶的智慧需求,其建設的重點為智慧服務及智慧檔案。[2]國內檔案學者對檔案智慧服務的研究多是著眼于信息技術對智慧服務的影響,對最重要的館藏資源卻是一帶而過。在檔案館的建設與升級過程中,過度關注信息技術的應用是“智能”而非“智慧”。莫家莉等[3]構建了“3層7子系統”的智慧檔案館頂層架構模型,并從需求牽引、協同競爭、循環反饋、開放式創新驅動和主導轉換五個方面闡明架構運作機理。唐霜[4]提出了檔案整理2.0模型,即“檔案資源數據化——檔案歷史及邏輯整理——原始索引信息創建——信息再生產”的檔案整理構想。楊茜茜[5]在數字人文視野下提出了“構建還原歷史的概念模型——檔案數據深度處理——歷史關聯可視化”的歷史檔案資源整理與開發的路徑。

檔案資源管理在理論探討層面的研究取得了多方面的成果,學者們能夠基于多種技術視角對各行業的檔案管理進行信息化構建,明確在信息化時代中對檔案資源進行電子化、智慧化管理的重要性。但現階段的研究在檔案工作的業務流程中較為理想化,將人工智能、云計算等技術應用于檔案管理平臺的相關研究中更多的是對技術功能的陳述,少有結合實際情況對檔案數據資源管理的實現路徑進行檔案工作協同研究。

浙江省檔案館憑借其規范的系統建設、先進的技術應用,構建了數字檔案資源體系,在全國范圍內率先通過全國示范數字檔案館測試。[6]蘇州市工商檔案管理中心擴大檔案征集范圍,開展檔案編研開發,于2017年10月完成的“近現代中國蘇州絲綢檔案”入選聯合國教科文組織《世界記憶名錄》。[7]因此,筆者以浙江省檔案館、蘇州市工商檔案管理中心以及最先提出智慧檔案館理念的青島市檔案館為對象開展網絡與實地調研,充分了解實踐層面的建設現狀,以提出檔案數據資源智慧化管理的合理化路徑與實現機制。

檔案館傳統的工作流程,主要是面向實體檔案,接收立檔單位形成的檔案后按來源、時間等特征分類整理并保管于庫房。部分檔案館雖已實施“雙軌制”,保管電子化、數字化的檔案資源,但僅支持計算機閱讀的數字化檔案資源仍是“重藏輕用”理念的延伸,無法被計算機理解和處理。在大數據環境下,海量異構的檔案資源極大程度上推動檔案工作流程和思維的轉變。[8]本文以《規劃》為背景,在檔案收集、整理、保管的傳統業務工作的基礎上,應用智慧工具,以檔案資源數據化為開端提出檔案數據資源智慧化管理路徑。

(一)檔案收集智慧化

檔案收集作為國家綜合檔案館豐富館藏資源的重要來源之一,是實現檔案數據資源管理智慧化的開端。根據不同的收集對象,從面向機關、團體、企業事業單位及其他組織的檔案移交工作、面向社會及個人的檔案征集工作和面向互聯網的檔案采集工作三個方面實現檔案收集智慧化,如圖1所示。

1.檔案移交。在電子檔案的移交接收過程中,云技術是實現館室一體化的基本要求,立檔單位通過政務云與檔案館建立聯系,按照相關業務標準,以遠端操作的形式完成檔案的移交工作。在結合相關政策及標準的要求下,以元數據管理技術明確規定歸檔的元數據類型及相應約束性、字段類型等,規范立檔單位的歸檔格式,實現檔案資源數據化,從源頭上控制檔案數據資源的質量。電子檔案移交系統中提供文字識別功能,自動錄入立檔單位的掃描版檔案資源,并分類著錄電子檔案元數據的固定模板中,實現移交檔案標準的統一,便于后續電子檔案數據管理工作智慧化的開展。

2.檔案征集。在云技術的支持下,通過官方網站建設專題檔案征集模塊,實現在線與離線狀態下的檔案接收工作。借助移動互聯網技術建立移動終端平臺,開設檔案征集功能,主動面向社會公眾設立檔案征集服務,拓展檔案征集渠道,豐富檔案資源。在線下場景中,使用“訊飛檔案機”“訊飛智錄”等智能終端、智能感知設備[9],利用人工智能和物聯網技術征集檔案并存于云端,以高效地完成檔案收集工作。

3.檔案采集。移動互聯網和通訊技術的快速發展,使人們傾向于直接在互聯網上發布信息,且部分信息具有一定憑證作用和保存價值,國家綜合檔案館應及時采集并鑒定、整理、保存,以完整記錄專題事件。大數據技術可實時關注重大活動、突發事件,并跟蹤網絡熱點,實現對網絡信息的智慧感知。面對異構的信息資源,應用“數據魔方”理念,將爬蟲、API技術等多種數據采集技術組合,靈活應對多樣的數據源[10],有針對性地爬取相關新聞及公眾反饋數據,并通過數據清洗、數據分析得出具有真實性、完整性的電子分析報告,根據相關標準及時歸檔。

(二)檔案整理智慧化

結合相關研究基礎及《規劃》中的要求,本文將從檔案資源數據化、檔案資源質量控制、特色檔案資源建設三個方面實現檔案整理智慧化,如圖2所示。

1.檔案資源數據化。對于館藏實體檔案和數字化檔案資源需要以檔案數據化作為檔案整理工作的開端。目前,OCR技術已普遍應用于檔案數據化的實踐中,該技術能夠快速、高效地對紙質全文進行文字識別,實現對檔案內容的全文檢索。對于外文語種記錄的檔案資源,應用機器翻譯技術,自動將外文檔案翻譯成中文,并自動著錄中外雙語元數據,保存于數據庫中,提高檔案檢索的查全率。除紙質檔案外,國家綜合檔案館還保管了大量其他載體的檔案資源。對于實物檔案可采用3D掃描技術,來獲得物體的三維信息,并詳細著錄相關元數據,保存到對應的數據庫中,以便實現檔案檢索、虛擬展廳、自助展覽等場景。[11]圖像、音頻、視頻檔案數據化需要運用人臉識別、文字識別、語音識別等技術,對其中的人、物、字、語音進行識別,提取檔案中的重要信息,還原歷史事件經過。

2.檔案數據質量控制。檔案數據質量控制是對檔案數據完整性、準確性、規范性、關聯性等質量問題,進行識別、檢測、分析、預警、整改,以控制檔案數據出現質量問題的因素,提高檔案數據質量。[12]在紙質資源模糊、字體難以辨認等各種因素的限制下,OCR技術識別的正確率仍有缺陷,對全文檢索的查全率和查準率有一定影響。另外,因檔案的專業性較強及其原始記錄的本質屬性,要求對外文檔案要嚴格翻譯出其原始含義,而機器翻譯技術雖能做到語句通順,但仍存在領域識別困難、專業背景知識不足等問題,因此機器翻譯尚不能獨立運用,還需要人工干預。[13]

在開展檔案數據質量控制工作前,國家綜合檔案館需充分考慮檔案資源的特性,在規范和體系的指導下,開發適用于檔案資源的數據質量控制工具。首先,在國家綜合檔案館發展規劃中明確檔案數據質量標準,規范檔案數據質量控制范式;其次,成立專題項目組,豐富不同類別檔案資源的語言規則和知識基礎,在字、詞、句等語言、語法和專業知識上建立規則庫;再者,在項目、課題科研過程中,總結案例,用以標注語料,完善語料庫;最后結合ETL理念,基于規則庫、語料庫,在神經網絡算法的支持下,提高OCR技術、機器翻譯技術的準確率,實現對檔案資源的抽取、清洗、轉換。針對已經數字化的檔案資源數據質量問題,一方面要重視在利用過程中發現的問題,另一方面,利用OCR等技術識別數字化成果并與數據庫中已錄入的數據進行對比,如發現數據不準確不完整,則發出預警,及時通知數據管理人員進行修正。

3.特色檔案資源建設。特色檔案資源建設是將檔案數據資源存放于相應的數據庫中,借助新一代信息技術對計算機可識別的檔案數據進行提煉、整理、開發、挖掘的深層次處理過程,實現知識的增值和延伸。在海量的歷史檔案資源中,文本挖掘、機器學習等能夠促進深度開發,以關聯數據技術形成知識關聯,將不同要素串聯成知識圖譜,以多元化視角完善歷史事件的原始面貌。[14]如對以新冠疫情、鄭州大水為例的突發事件,健全規范的收集、整理、保管工作機制,建設專題數據庫,并應用自然語言處理、文本挖掘等技術從國家、社會、個人等多角度還原事件經過,分析事件影響,保存事件憑證,強化應對突發事件的檔案整理及開發利用,以在類似事件發生時及時警醒并提供文獻參考和決策支持。

(三)檔案保管智慧化

在大數據時代背景下,檔案的保管對象從單一的實體檔案轉變成實體與電子檔案的并行,國家綜合檔案館的建設重點不再只局限于檔案庫房,還將電子檔案、檔案數據資源的保管與存儲納入重要關注范圍。因此對于電子檔案、檔案數據資源的保管需要建立長期保管系統,以在長時間內對電子檔案、檔案數據進行存儲、維護。蘇州市工商檔案管理中心建立的電子檔案長期保存系統,接收并保存立檔單位移交的電子檔案,系統能夠監管人員對電子檔案的操作,在增加、刪除、修改出現問題時及時恢復原始信息,以防電子檔案的原始性遭到破壞。

檔案的保管期限決定了檔案開放的時間,在檔案開放的相關政策要求下,基于深度學習模型,融合背景知識,從鑒定方法和算法中入手,開發檔案保管期限管理工具,能夠有效提高保管期限劃分的準確率,為檔案數據資源的保管和開放共享提供決策支持。[15]在云技術的支持下,建立異地備份中心,實時動態保存檔案數據并定期遷移備份,達到對檔案資源全生命周期的長久保存和有效恢復檔案數據的目的,保證電子檔案及檔案數據資源的安全。如浙江省檔案局成立的省電子政務數據災難備份中心承擔了重要電子檔案與檔案數字化成果、館際數字檔案資源的備份,防止自然災害和網絡災害造成的檔案數據資源泄漏帶來的損失。

檔案數據資源智慧化管理路徑是在以數據化為導向的協同統一、以數據流通為主線的開放共享、以人才與技術為支撐的運行保障的基礎上實現的,本文從上述三個方面闡述檔案數據資源智慧化管理實現機制。

(一)以數據化為導向的協同統一機制

檔案資源的數據化是實現智慧管理的基礎,也是提供智慧服務的首要條件。大數據時代,檔案管理的理念發生了改變:從實體檔案的收集、整理、鑒定、保存、開發利用走向檔案數據的采集、處理、維護、服務。[16]彼時數據并非僅是數字或文本,更是一種資產,具有不可估量的價值。檔案智慧服務是在新一代信息技術的支持下實現的,其核心是借助智慧工具對檔案資源的開發利用和深度挖掘,以智慧化的方式感知、匯編檔案資源中潛在的知識成果,是知識服務的升華。

智慧工具的應用是在數據化的基礎上實現的,國家綜合檔案館要以檔案資源數據化為導向,一是加速檔案數據資源的量化建設,二是各部門共同協作,在檔案數據生命周期的全過程處理工作中,嚴格按照元數據管理相關標準統一檔案數據類型、格式等信息,提高檔案資源結構化、半結構化、非結構化數據的質量,簡化以文本挖掘為主要技術工具的信息抽取處理環節,為檔案資源的智慧管理和深度開發奠定基礎,從而實現以檔案用戶需求為導向的智慧服務。

(二)以數據流通為主線的開放共享機制

在檔案數據環境混亂、檔案資源開放爭議等因素的影響下,檔案部門存在滯后的“數據孤島”現象,各自掌握著不完全、不對稱的檔案數據,致使檔案工作效率低下,影響檔案研究、開發利用等進程。

以數據流通為主線的開放共享機制要求國家綜合檔案館依據全國統一的管理辦法,規范檔案資源的元數據著錄法則,運用云技術、大數據技術打破空間和時間壁壘,優化檔案數據環境,實現跨地區、跨層級、跨部門間的元數據管理統一,保證檔案數據的流通。同時,國家綜合檔案館要全面整合檔案數據,完善檔案數據共享的標準與制度,明確檔案數據的開放共享是在社會參與理念下的協同合作,促使各個領域的社會公眾參與到檔案的收集、利用和監管工作當中,并以合作、外包等方式與不同組織、團隊、個人建立聯系,以多元化視角挖掘檔案資源,實現協同共贏,促進檔案事業的發展。[17]如浙江省檔案館開放民生檔案API,聯合浙江省民政廳推進婚姻登記檔案數據共享,將查檔服務納入補辦結婚證業務流程,構建業務協同新方式,實現部門間數據共享與業務協同。

(三)以人才與技術為支撐的運行保障機制

檔案工作者既要具備歷史、檔案、法律等專業知識素養,又需要一定計算機操作技術、翻譯能力等。目前,國家綜合檔案館普遍存在編制不足、人手不夠等問題,甚至無法自主招聘工作剛需的專業對口型人才。針對人才缺失的問題,國家綜合檔案館通常以與高校或其他組織合作、招聘編外工作人員等方式來解決,但如此方法治標不治本,難以從根源上解決缺少人才的問題。

機器學習等新一代信息技術的應用能夠幫助檔案工作人員完成繁雜無意義的工作任務,從而有余力投身到檔案事業的進一步建設當中。國家綜合檔案館應以進階學習為目標,通過學科交叉培養的方式對在編工作人員進行培訓,完善工作人員晉升標準,鼓勵在職人員提升學歷,提高其技術素養、知識素養等,同時要明確數據化、數據質量控制、數據標記等檔案工作技術需求,理性選擇數字技術工具[18],以適應大數據時代下檔案館工作的轉變。

技術設備的安全保障是檔案數據資源智慧化管理的支撐,因涉密檔案數據的特殊性質,需要嚴格按照檔案防控體系進行保密工作。在檔案數據資源的管理流程中均存在安全風險,為防止檔案數據泄露、破壞、入侵,國家綜合檔案館要利用加密技術、防火墻技術、入侵檢測技術等,智慧防控檔案數據安全問題。另外,對檔案數據進行異地備份,提高云服務器的可靠性,一旦檢測到盜取風險,立即銷毀相關檔案數據資源,以防對社會公眾造成有害影響。同時,服務器、存儲設備、備份機等基礎設備也是檔案數據資源安全存儲的重要保障。

國家綜合檔案館豐富的館藏資源,全面記錄了歷史面貌和經濟、社會等發展進程,在云計算、大數據、人工智能等新一代信息技術的幫助下,對檔案數據資源進行智慧化管理可以更全面、更高效地挖掘檔案價值,編研成順應現代用戶使用偏好的知識成果,主動、快速、精準地提供檔案智慧服務,使檔案工作在相關政策的指引下走向依法管理、走向開放、走向現代化。

*本文系2020年國家社會科學基金青年項目“社會責任視角下國家綜合檔案館服務能力提升路徑研究”(項目編號:20CTQ035)階段性研究成果之一。

注釋及參考文獻:

[1]楊來青,徐明君,鄒杰.檔案館未來發展的新前景:智慧檔案館[J].中國檔案, 2013, 472(2): 68-70.

[2]王素紅.對智慧檔案館建設和研究熱的冷思考[J].檔案學通訊,2015(4):39-44.

[3]莫家莉,史仕新,許楊.智慧檔案館頂層設計研究:總體架構及運行機理[J].浙江檔案, 2016, 424(8): 6-9.

[4]唐霜.信息化環境下檔案整理理論研究[D].南昌:南昌大學,2015.

[5]楊茜茜.數字人文視野下的歷史檔案資源整理與開發路徑探析——兼論檔案管理中的歷史主義與邏輯主義思想[J].檔案學通訊,2019(2):17-22.

[6]王肖波.數字檔案館建設的創新與發展——以浙江省檔案館創建全國示范數字檔案館為例[J].檔案學研究,2021(1):104-109.

[7]吳飛,卜鑒民.創新發展鏗鏘有力勇攀高峰敢立潮頭——蘇州市工商檔案管理中心十年創新發展紀實[J].檔案與建設,2018(1):70-72.

[8]滕春娥.大數據環境下檔案工作轉型研究[J].北京檔案,2015,(2):17-19.

[9]中國日報中文網.訊飛智錄榮獲2019世界人工智能大會“創新成果”證書[EB/OL]. [2019-09-27].http://ex. chinadaily.com.cn/exchange/partners/82/rss/channel/cn/ columns/j3u3t6/stories/WS5d8c7d74a31099ab995e293d. html.

[10]程知.基于數據魔方的異構檔案信息資源采集方法分析[J].浙江檔案,2018(8):60-61.

[11]張嘉欣.實物檔案三維數字化研究[D].武漢:湖北大學,2018.

[12]金波,楊鵬.大數據時代檔案數據治理研究[J].檔案學研究,2020(4):29-37.

[13]范冠艷.機器翻譯在檔案學科的應用研究——以ITrust北美團隊最新學術成果為例[J].檔案學研究,2018(3):114-120.

[14]陳海玉,向前,萬小玥.數字人文視域下抗戰檔案資源的開發策略與路徑研究[J].山西檔案,2021(3):71-80.

[15]楊建梁.基于深度學習的數字文書檔案保管期限智能化劃分研究[J].檔案學通訊,2021(4):108-112.

[16]陳雪燕,于英香.從檔案管理走向檔案數據管理:大數據時代下的檔案管理范式轉型[J].山西檔案,2019(5): 24-32.

[17]迂娜.開放政府背景下檔案開放路徑探究[J].山西檔案,2020(1):41-47.

[18]龍家慶.數字人文項目中檔案數據開發工具及應用研究——以“歐洲時光機”為例[J].北京檔案,2021,(3): 10-15.

作者單位:天津師范大學管理學院

主站蜘蛛池模板: 激情综合网址| 毛片在线播放a| 国产视频自拍一区| 一级一级一片免费| 成人综合网址| 国产在线观看一区精品| 欧美亚洲一二三区| 国产精品部在线观看| 日韩激情成人| 爆操波多野结衣| 丰满人妻久久中文字幕| 成·人免费午夜无码视频在线观看| 日本高清免费一本在线观看 | 波多野结衣一级毛片| 四虎亚洲精品| 91精品国产一区| 国产簧片免费在线播放| 人人91人人澡人人妻人人爽 | 久久久久久久久久国产精品| 999精品在线视频| 欧美日韩一区二区在线免费观看| 国产精品欧美在线观看| 99久久免费精品特色大片| 久久婷婷国产综合尤物精品| 婷婷激情亚洲| 久久婷婷国产综合尤物精品| 久久青草精品一区二区三区| 亚洲午夜片| 日韩高清欧美| 国产成人凹凸视频在线| 成人久久精品一区二区三区| 久久综合婷婷| 亚洲 欧美 偷自乱 图片| 干中文字幕| 国产精品女同一区三区五区| 国产成人永久免费视频| 亚洲日韩精品欧美中文字幕| 日韩AV无码免费一二三区| 青青青视频91在线 | 成人精品视频一区二区在线 | 免费无码AV片在线观看中文| 久久久久久高潮白浆| 99久久精品久久久久久婷婷| 在线观看的黄网| 国产在线小视频| 美女一级免费毛片| 国产精品午夜福利麻豆| 亚洲av成人无码网站在线观看| 国产区免费| 亚洲欧美自拍中文| 2020国产免费久久精品99| 亚洲人成色在线观看| 中文无码精品A∨在线观看不卡| 91福利免费视频| 欧美在线观看不卡| 国产99热| 高h视频在线| 久久96热在精品国产高清| 精品国产成人高清在线| 嫩草影院在线观看精品视频| 亚洲男人天堂网址| 国产成熟女人性满足视频| 老司机精品一区在线视频| 国内精品小视频在线| 国产综合另类小说色区色噜噜| 91在线日韩在线播放| 久久亚洲欧美综合| 国产成人夜色91| 天天综合色天天综合网| 国产激爽爽爽大片在线观看| 成人精品区| a毛片在线播放| 国产成人精品日本亚洲77美色| 亚洲日韩精品无码专区97| 成人一级黄色毛片| 成人看片欧美一区二区| 中文字幕调教一区二区视频| 久久不卡精品| 91成人在线观看视频| 亚洲Aⅴ无码专区在线观看q| 中文字幕精品一区二区三区视频| 欧美国产精品不卡在线观看|