■袁少瓊,李秀麗
(1.廣東省特種設(shè)備檢測研究院珠海檢測院,廣東 珠海 519000;2.嶺南師范學(xué)院,廣東 湛江 524000)
數(shù)智賦能作為一種新興的技術(shù)方向,正在逐漸應(yīng)用于檔案服務(wù)領(lǐng)域。通過運用先進的數(shù)字技術(shù)和數(shù)據(jù)分析方法,數(shù)智賦能可以提高檔案管理和服務(wù)的效率、準確性和可靠性,從而為用戶提供更加優(yōu)質(zhì)的服務(wù)體驗。本文通過對數(shù)智賦能在檔案服務(wù)中的微觀機理和效應(yīng)進行深入剖析,從數(shù)據(jù)數(shù)字化、智能化、可視化和安全性等方面入手,探討數(shù)智賦能對檔案服務(wù)的影響和作用。通過本文的研究,可以更加深入地了解數(shù)智賦能在檔案服務(wù)領(lǐng)域的應(yīng)用和發(fā)展趨勢,為進一步推進數(shù)字化檔案管理和服務(wù)提供有益的參考。
檔案管理是指對構(gòu)成檔案內(nèi)容信息的基本粒子及其形成、聚合、運動的深層機理進行分析和探索。因此,從微觀層面深入分析和研究檔案內(nèi)容信息的內(nèi)在機制,可以更好地認識檔案信息服務(wù)創(chuàng)新的緊迫性需求。同時,通過深入分析數(shù)據(jù)和記錄之間的因果關(guān)系,以及檔案和記錄的邏輯聯(lián)系和微觀結(jié)構(gòu),可以探究數(shù)據(jù)和檔案的共存機制和演化路徑,從而為當(dāng)前中國的檔案數(shù)字化實踐提供基礎(chǔ)理論指導(dǎo)。
檔案的記錄殼層結(jié)構(gòu)模型包含四個層次(見圖1),分別是記錄核、記錄幔、記錄殼和記錄表。這個模型類似于地球地質(zhì)構(gòu)造的殼層結(jié)構(gòu),由內(nèi)向外分別為:記錄核(Record Core) 是指檔案文本中承載著核心信息的部分,可以反映檔案形成者對于特定歷史時期社會系統(tǒng)各類實體及其屬性、關(guān)系的描述結(jié)果。記錄幔(Record Mantle)是指在記錄因子之外的檔案文本中存在但語義關(guān)系不明確的命名實體符號,如人名、機構(gòu)名、地名、物品名等。這些命名實體雖然不屬于核心語義信息,但仍是檔案內(nèi)容信息的重要組成部分。記錄殼(Record Crus)是指記錄的物質(zhì)載體,是任何可以承載語義符號的現(xiàn)實物質(zhì),在實踐中一般分為紙質(zhì)載體和電子載體兩種類型。記錄表(Record Surface)是指附著于記錄載體之上的自然語言文本或其他符號,用于對特定歷史時期社會系統(tǒng)狀態(tài)特征及其演變過程進行表達和描述[1]。

圖1 檔案的記錄殼層結(jié)構(gòu)模型
這個模型描述了檔案作為記錄載體的內(nèi)在結(jié)構(gòu)和信息內(nèi)容,可以幫助人們更好地理解和使用檔案信息。
隨著歷史的不同階段,數(shù)據(jù)和檔案之間的關(guān)系會呈現(xiàn)不同的重要性和層次。在20 世紀80 年代前后,主要的技術(shù)驅(qū)動因素是辦公自動化,這促進了數(shù)據(jù)和檔案之間的數(shù)字化轉(zhuǎn)換,數(shù)據(jù)是輔助檔案管理的附屬資源;在20 世紀90 年代,計算機輔助檔案管理成為主要驅(qū)動因素,檔案管理元數(shù)據(jù)成為關(guān)注的焦點;而2000 年以后,隨著“檔案數(shù)字化”和“電子文件管理”的興起,數(shù)據(jù)和檔案的重要性逐漸平衡。檔案管理元數(shù)據(jù)仍然非常重要,但是現(xiàn)在它涉及更多的業(yè)務(wù)數(shù)據(jù)和檔案內(nèi)容信息。近年來,數(shù)據(jù)的重要性不斷凸顯,“檔案數(shù)據(jù)化”成為推動粗粒度檔案文件管理向細粒度檔案數(shù)據(jù)管理轉(zhuǎn)型的關(guān)鍵因素,數(shù)據(jù)成為整體性管理的中心,RDF 數(shù)據(jù)和檔案數(shù)據(jù)本體ADO 成為關(guān)鍵性資源。
總體上,數(shù)據(jù)與檔案的關(guān)系經(jīng)歷了三個階段,從以檔案為中心,數(shù)據(jù)為輔助資源,到數(shù)據(jù)與檔案并重,再到以數(shù)據(jù)為中心的整體性管理。這個演化過程打破了不同階段對用戶檔案利用的制約,使得用戶可以通過網(wǎng)絡(luò)直接獲取與其需求高度契合的精準化檔案內(nèi)容信息,不再需要以人工閱讀方式在相關(guān)檔案文件中查找所需內(nèi)容。同時,每一類新型檔案管理和檢索工具是在之前階段檔案信息化建設(shè)實踐基礎(chǔ)上實現(xiàn)的,不會影響原有檔案管理模式的正常運行。
波普爾在三個世界理論的基礎(chǔ)上提出的“信息三個世界”理論,該理論將現(xiàn)實世界、信息世界和機器世界三個層面聯(lián)系起來,為人們理解數(shù)據(jù)與檔案之間的關(guān)系提供了參照體系[1]。在過去,檔案管理活動主要是在“信息世界”中進行,依靠文本、圖像等類型的檔案,而數(shù)據(jù)庫等機器工具只是輔助資源。但隨著數(shù)據(jù)庫技術(shù)的應(yīng)用,檔案管理活動開始在“信息世界”和“機器世界”中并存,成為一種非平衡型的共生形態(tài)。隨著大數(shù)據(jù)時代的到來,人們開始認識到數(shù)據(jù)與檔案是密不可分的資源,需要同時兼顧數(shù)據(jù)管理與檔案管理,呈現(xiàn)出相對平衡的雙軌共生關(guān)系。而在數(shù)智賦能下,將檔案文本轉(zhuǎn)化為機器可處理的數(shù)據(jù),例如,利用RDF 數(shù)據(jù)生成檔案數(shù)據(jù)本體ADO 等新技術(shù),成為檔案管理的新趨勢。在未來,檔案管理活動可能會進入一個新的時代,以“機器世界”為中心、以“信息世界”為表征的雙軌融合型共生時代。這個時代下,機器和信息將會共同作為檔案管理活動的核心要素,并相互融合以達到更高效的管理目標。
數(shù)智賦能檔案服務(wù)的微觀機理主要是基于檔案的記錄殼層結(jié)構(gòu)模型和三個世界理論,應(yīng)用數(shù)智技術(shù)實現(xiàn)數(shù)智賦能。
檔案的記錄殼層結(jié)構(gòu)模型提供了一個基于檔案的信息組織和管理的框架,包括不同層次的記錄單元、記錄組織和記錄關(guān)聯(lián)等內(nèi)容。這種結(jié)構(gòu)模型可以使檔案信息的存儲、檢索、利用和分析更加高效和便捷。通過數(shù)智技術(shù),如自然語言處理、機器學(xué)習(xí)、知識圖譜等,可以更好地理解和分析檔案信息的內(nèi)容和結(jié)構(gòu),實現(xiàn)檔案信息的智能化加工和應(yīng)用。
三個世界理論提供了一個理論框架,用于描述信息的不同層次和類型,包括個體心智世界、符號交互世界和物理世界[2]。通過這個理論,可以更好地理解檔案信息的內(nèi)涵和意義,并在此基礎(chǔ)上實現(xiàn)檔案信息的知識化整合和智能化應(yīng)用。
數(shù)智技術(shù),如自然語言處理、機器學(xué)習(xí)、知識圖譜等,可以幫助檔案管理機構(gòu)更好地理解和分析檔案信息,實現(xiàn)檔案信息的智能化加工和應(yīng)用。例如,可以利用自然語言處理技術(shù)對檔案文本進行自動化處理和抽取,將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),方便后續(xù)的分析和利用;可以利用機器學(xué)習(xí)技術(shù)對檔案信息進行分類和推薦,實現(xiàn)個性化的信息服務(wù);可以利用知識圖譜技術(shù)對檔案信息進行語義化整合,建立檔案信息之間的關(guān)聯(lián)關(guān)系,實現(xiàn)知識的跨領(lǐng)域應(yīng)用[3]。
綜上所述,數(shù)智賦能檔案服務(wù)的微觀機理主要包括,檔案的記錄殼層結(jié)構(gòu)模型、三個世界理論和數(shù)智技術(shù)的應(yīng)用。通過這些機理的相互作用和協(xié)同,可以實現(xiàn)檔案信息的智能化加工和應(yīng)用,為各個領(lǐng)域提供更加高效、更加便捷的信息服務(wù)。
為更全面地認識數(shù)智賦能技術(shù)在檔案服務(wù)領(lǐng)域的優(yōu)勢和局限性,分析應(yīng)用場景與特點,從而更加客觀地評價數(shù)智賦能在檔案服務(wù)中的作用和價值。
數(shù)智賦能在檔案服務(wù)領(lǐng)域具有廣泛的應(yīng)用場景,主要包括以下幾個方面。
1.數(shù)字化檔案管理
數(shù)智賦能可以將紙質(zhì)檔案數(shù)字化,實現(xiàn)檔案信息的電子化管理和存儲。數(shù)字化檔案管理可以提高檔案信息的可訪問性和可用性,為用戶提供更加便捷的服務(wù)。隨著數(shù)字技術(shù)的不斷進步,數(shù)字化檔案管理逐漸成為檔案管理的主要形式。許多檔案服務(wù)機構(gòu)已經(jīng)推廣數(shù)字化檔案管理,并逐步完善相關(guān)的技術(shù)和管理體系,提高了檔案管理的效率和質(zhì)量。
2.檔案信息挖掘
數(shù)智賦能可以通過數(shù)據(jù)分析和挖掘技術(shù),對檔案信息進行深入挖掘和分析,發(fā)掘出其中有價值的信息。檔案信息挖掘可以幫助用戶更好地了解檔案信息,為用戶提供更加精準的服務(wù)。
3.智能化檔案檢索
數(shù)智賦能可以通過人工智能等技術(shù),實現(xiàn)智能化的檔案檢索和查詢。利用人工智能、自然語言處理等技術(shù),智能化檔案檢索可以實現(xiàn)精準的檔案檢索和查詢,提高了檔案服務(wù)的效率和質(zhì)量,為用戶提供更加高效的服務(wù)。
4.客戶化與可視化
數(shù)智賦能可以根據(jù)客戶的需求和要求,定制個性化的檔案服務(wù)方案,為用戶提供更加貼心的服務(wù)。客戶化檔案服務(wù)可以提高用戶的滿意度和忠誠度,促進服務(wù)商與用戶的深入合作。數(shù)智賦能還可以將檔案信息以可視化的形式呈現(xiàn),讓用戶可以更加直觀地了解檔案信息。檔案信息可視化可以提高用戶對檔案信息的理解和認知,為用戶提供更加便捷的服務(wù)。
數(shù)智賦能檔案服務(wù)具有數(shù)字化管理、智能化服務(wù)、客戶化服務(wù)、數(shù)據(jù)挖掘和分析、高效性和安全性等特點,是檔案管理和服務(wù)的一種重要形式。一是實現(xiàn)數(shù)字化管理。數(shù)智賦能檔案服務(wù)具有數(shù)字化管理的特點。通過數(shù)字技術(shù)的應(yīng)用,檔案管理和服務(wù)實現(xiàn)了全面數(shù)字化,實現(xiàn)了信息化管理和智能化服務(wù)。二是具有智能化服務(wù)。通過人工智能、自然語言處理等技術(shù),實現(xiàn)了檔案信息的智能檢索、智能分析和智能推薦等服務(wù),提高了服務(wù)效率和服務(wù)質(zhì)量。三是數(shù)智賦能檔案服務(wù)具有數(shù)據(jù)挖掘和分析的特點。通過數(shù)據(jù)分析和挖掘技術(shù),挖掘出有價值的信息和知識,為用戶提供更加精準的服務(wù)。四是數(shù)智賦能檔案服務(wù)具有高效性和安全性的特點。通過數(shù)字化管理和智能化服務(wù),提高了服務(wù)效率和質(zhì)量。同時,通過數(shù)據(jù)保護和安全管理等措施,保證了檔案信息的安全性和可靠性。
數(shù)字檔案平臺是利用數(shù)字技術(shù)手段,集成、管理、共享全社會數(shù)字化檔案資源的開放平臺。數(shù)字檔案平臺可以實現(xiàn)檔案資源的統(tǒng)一管理、全文檢索、多媒體展示、數(shù)字化保護和長期保存等功能,為檔案管理和服務(wù)提供了全方位的支持。通過構(gòu)建數(shù)字檔案平臺,可以實現(xiàn)檔案的全生命周期管理,提高檔案服務(wù)效率和質(zhì)量,同時也可以促進檔案資源的共享和利用。
1.建立數(shù)字化檔案管理系統(tǒng)
數(shù)字化檔案管理系統(tǒng)是數(shù)字檔案平臺的核心。該系統(tǒng)可以將紙質(zhì)檔案數(shù)字化,實現(xiàn)檔案信息的電子化存儲、管理、查詢、共享和保護。在建設(shè)數(shù)字化檔案管理系統(tǒng)時,需要考慮系統(tǒng)的開發(fā)、數(shù)據(jù)安全、接口集成等方面的問題。智能化管理系統(tǒng)需要具備多維度的數(shù)據(jù)分析能力,包括數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)可視化等功能,可以為檔案管理者提供數(shù)據(jù)分析和決策支持。
2.推行檔案數(shù)據(jù)基因系統(tǒng)建設(shè)
檔案數(shù)據(jù)基因系統(tǒng)建設(shè)可以確保數(shù)字化檔案的質(zhì)量和可靠性。“檔案數(shù)據(jù)基因系統(tǒng)”是建立國家檔案大數(shù)據(jù)體系的基礎(chǔ)規(guī)則,通過相關(guān)規(guī)章和技術(shù)規(guī)范作為行業(yè)標準,由國家檔案行政機關(guān)推行,以確保檔案數(shù)據(jù)化成果的規(guī)范性和邏輯的一致性,同時減少耗時費力的檔案數(shù)據(jù)整合任務(wù)。這些規(guī)范和標準的推行可以大幅提高檔案數(shù)據(jù)化的效率和質(zhì)量,為檔案管理提供更好的支持和保障。具體內(nèi)容為:建立數(shù)字化檔案標準,包括數(shù)字化檔案的格式規(guī)范、數(shù)字化過程的標準流程和數(shù)字檔案管理的規(guī)范要求等。此外,還需要制定數(shù)字檔案質(zhì)量控制標準和數(shù)字檔案的備份和恢復(fù)標準等,以保障數(shù)字檔案的可靠性和完整性。
3.實現(xiàn)數(shù)字檔案的共享和互聯(lián)互通
數(shù)字化檔案平臺的最終目標是實現(xiàn)數(shù)字檔案的共享和互聯(lián)互通,便于各部門之間的信息共享和協(xié)作。通過建立跨機構(gòu)、跨地域的信息共享平臺,使得各個部門、單位之間能夠共享檔案信息和資源。同時,還需要加強檔案數(shù)字資源的共建共享,實現(xiàn)數(shù)字化檔案互聯(lián)互通,使得不同機構(gòu)和地區(qū)的數(shù)字檔案資源能夠互相訪問和使用。實現(xiàn)數(shù)字檔案的共享和互聯(lián)互通需要考慮到數(shù)字檔案的安全、數(shù)據(jù)格式兼容性等問題,可以通過建立數(shù)字檔案的交換平臺和制定數(shù)字檔案數(shù)據(jù)交換標準等來實現(xiàn)。
1.推廣數(shù)字簽名技術(shù)
數(shù)字簽名技術(shù)是一種基于密碼學(xué)原理實現(xiàn)的電子認證技術(shù),可以用于保證電子文檔的完整性、真實性。傳統(tǒng)的紙質(zhì)檔案具有簽名和印章來確保檔案的真實性,但是數(shù)字檔案在互聯(lián)網(wǎng)上的傳輸不具備這樣的功能,因此,需要借助數(shù)字簽名技術(shù)來實現(xiàn)身份驗證。在檔案服務(wù)中,數(shù)字簽名技術(shù)可以用于實現(xiàn)檔案鑒別、審計、檢索、傳輸和存儲等環(huán)節(jié)的電子認證。通過數(shù)字簽名技術(shù),可以有效防止檔案篡改、丟失和偽造,提高檔案服務(wù)的可信度和安全性。有效解決檔案信息傳送的身份驗證問題,首先,建立數(shù)字簽名驗證體系。確保接收者能夠?qū)ξ募系暮灻M行核實,如果雙方對于簽名的真?zhèn)未嬖诋愖h,則需要第三方進一步驗證簽名的真?zhèn)蝸泶_定事實。這樣可以保證數(shù)字檔案在傳輸過程中的真實性和完整性。其次,建立強制簽名確認機制。在文件發(fā)送完成后,要求發(fā)送者承認自己對文件的簽名,確保數(shù)字檔案在傳輸過程中不會被篡改。如果發(fā)送者不確認簽名,文件則無法傳輸,這樣可以有效地防止信息發(fā)送者否認簽名,保證檔案的安全性。最后,限制簽名權(quán)限。數(shù)字簽名技術(shù)確保只有信息發(fā)送者可以簽名,其他任何人皆不可偽造簽名或篡改傳送的信息。因此,在數(shù)字檔案服務(wù)中需要限制簽名權(quán)限,只有授權(quán)人員才能簽名。
2.構(gòu)建云計算體系
云計算體系是一種基于互聯(lián)網(wǎng)的計算和數(shù)據(jù)服務(wù)體系,可以實現(xiàn)資源共享以及易擴展性等功能。在檔案服務(wù)中,云計算體系可以用于實現(xiàn)檔案數(shù)據(jù)的存儲、處理和分析,提高檔案服務(wù)的響應(yīng)速度和質(zhì)量。同時,云計算體系還可以實現(xiàn)檔案服務(wù)的數(shù)字化轉(zhuǎn)型,通過數(shù)據(jù)挖掘和分析等手段,為檔案管理和服務(wù)提供更加科學(xué)、精準的支持。
(1)建立云存儲體系
云存儲是一種基于云計算技術(shù)的存儲方式,它將數(shù)據(jù)存儲在互聯(lián)網(wǎng)上的遠程服務(wù)器上,用戶可以隨時隨地通過網(wǎng)絡(luò)訪問數(shù)據(jù)。建立云存儲體系可以實現(xiàn)檔案數(shù)字化存儲、共享和備份。同時,云存儲可以實現(xiàn)數(shù)據(jù)的冗余備份,保證數(shù)據(jù)的安全性和可靠性。在建立云存儲體系的過程中,需要選擇穩(wěn)定可靠的云服務(wù)提供商,保證存儲空間、訪問速度和數(shù)據(jù)安全。
(2)搭建云計算平臺
搭建云計算平臺可以為檔案管理工作提供更加高效、智能的服務(wù)。一是通過建立全文檢索引擎和搜索算法,用戶可以通過關(guān)鍵字、時間等多種檢索方式快速找到需要的電子檔案,提高檢索效率。二是提供大規(guī)模數(shù)據(jù)分析服務(wù),使得檔案管理可以對檔案數(shù)據(jù)進行動態(tài)分析,例如,數(shù)據(jù)挖掘、關(guān)聯(lián)分析、預(yù)測分析等。這些分析結(jié)果可以為檔案管理提供更加準確、全面的數(shù)據(jù)支持。三是提供數(shù)據(jù)備份與恢復(fù)服務(wù),保障檔案數(shù)據(jù)的安全性。一旦出現(xiàn)數(shù)據(jù)損壞、丟失等問題,可以及時通過云端備份的數(shù)據(jù)進行恢復(fù)。
3.開發(fā)云應(yīng)用服務(wù)
云應(yīng)用服務(wù)是指基于互聯(lián)網(wǎng)的一種軟件服務(wù)模式,通過網(wǎng)絡(luò)技術(shù)將軟件、硬件等資源提供給用戶使用,用戶無需安裝在本地計算機上,可以通過互聯(lián)網(wǎng)進行訪問和使用。在檔案管理中,云應(yīng)用服務(wù)可以具有很多便利和優(yōu)勢,可以支持多種業(yè)務(wù)場景。開云應(yīng)用服務(wù)可以包括,檔案數(shù)字化處理、檔案數(shù)據(jù)挖掘和分析、檔案共享和交流等。
首先,云應(yīng)用服務(wù)可以提高檔案管理的靈活性和可擴展性。由于檔案管理涉及大量的數(shù)據(jù)和信息,需要相應(yīng)的硬件和軟件支持。使用云應(yīng)用服務(wù)可以避免購置和維護大量的硬件設(shè)備和軟件系統(tǒng),可以根據(jù)實際需求對服務(wù)進行擴展和收縮,從而降低檔案管理的成本和風(fēng)險。其次,云應(yīng)用服務(wù)可以提高檔案管理的安全性和可靠性。云服務(wù)提供商會投入大量的資源和技術(shù)保障數(shù)據(jù)的安全性和可靠性,例如,數(shù)據(jù)備份、災(zāi)難恢復(fù)、安全認證等,可以有效防范數(shù)據(jù)泄露和數(shù)據(jù)丟失等風(fēng)險。最后,云應(yīng)用服務(wù)可以提高檔案管理的效率和協(xié)作性。云服務(wù)可以實現(xiàn)多人協(xié)作,不同部門和用戶可以通過網(wǎng)絡(luò)訪問同一份檔案資料,可以實現(xiàn)信息共享和協(xié)同處理,大大提高了工作效率和協(xié)作效果。