倪 榕
(廈門藍極檔案技術有限公司,福建 廈門 361000)
《“十四五”全國檔案事業發展規劃》提出“積極探索知識管理、人工智能、數字人文技術在檔案信息深層加工和利用中的應用”,為檔案管理的智慧化標準化建設指明了方向。當前,人工智能技術成為推動社會治理效能的關鍵因素,要激發其在檔案服務體系建設中的作用,推動檔案工作更好地服務經濟社會發展。
人工智能技術與檔案管理有天然的契合性,為二者融合開闊了空間,奠定了深度融合的物質基礎。
一是檔案服務進入轉型發展期。伴隨新技術廣泛應用,催生了數字化、網絡化、智慧化的公共服務新模式和檔案治理新理念,為人們生活帶來了極大便利。同時,人們對優質服務的需求也隨著提升,將人工智能技術應用檔案服務已成為必然要求。比如,當利用者進行資料編研時,機器學習技術根據利用者需求自動推送相關內容,提升利用者編研效率。再比如,數據挖掘技術可以按照不同用戶的需求,進行檔案信息的收集和處理,保證了數據服務的個性化。二是傳統檔案服務模式的滯后性。隨著電子檔案的鋪開,檔案信息資源管理難度越來越大,大量結構化的數據資源成為管理的主要對象。與之相對的是對電子檔案服務能力和效率的要求提升,需要借助知識管理工具開展科學管理。比如,《“十四五”全國檔案事業發展規劃》指出,檔案開放審核是檔案開放利用的基礎,也是檔案工作中的難點問題。在電子檔案開放中應用人工智能的自動審核優勢,將檔案人員從繁重任務中解脫出來,提高檔案開放的準確性和實效性。
目前,我國正處于向數字社會建設的轉型時期,檔案工作的環境、對象、內容、方法都發生了根本性變化,檔案管理與人工智能相融合也將有助于更好發揮人工智能的優勢。具體表現在:從管理來說,人工智能與物聯網技術相結合,通過射頻信號實現自動識別管理對象獲取數據,依托人工技術的機器學習和深度學習,從海量數據中提取有用價值,應用較為廣泛的是智能庫房建設,實現檔案位置、類別和庫房“九防”的跟蹤和感知;從服務來說,人工智能實現從低層次數據記錄到高層次知識聚合、圖像查詢由目錄級向內容轉變,體現了人工智能在知識挖掘和開發利用中的獨特優勢,為檔案資政服務和公共服務打開了更為廣闊的空間。從資源來說,人們對電子檔案質量和效率有了更高要求,人工智能通過搭建數據化管理系統,依托計算機視覺、自然語言處理、機器學習等技術,實現檔案的自動化識別、分類、存儲和檢索,從而提高檔案管理的效率和準確性。
根據《基于人工智能的接入網運維和業務智能化場景與需求》(YD/T 4070-2022)和《國家新一代人工智能標準體系建設指南》,人工智能技術在檔案服務領域主要體現在利用、鑒定、安全、審核等方面,應用場景廣闊。
電子檔案呈現海量增長的趨勢,對檔案利用提出了新要求。要突破傳統的人工檢索模式,降低人力、精力和時間的損耗,需要借助人工智能自然語言技術加以解決。自然語言處理就是用人工智能來處理、理解以及運用人類語言,已在生產生活領域廣泛運用。比如,機器語言翻譯、繁體字和手寫體字符識別,語音識別文字轉換、文本語義的抽取、過濾與分析等。它融合了語言處理中的語法、語義和篇章分析技術,是人工智能方面最前沿的研究方法。時至今日語言分析技術已把識別準確率從70%提高到了90%以上。電子檔案管理可以運用語言分析技術,實現某一內容的智能化檢索服務,尤其是對年代較為久遠的檔案資料,比如手寫體、繁體字文檔,依靠人工模式出錯率高、效率低,依托該種技術,可極大提升文字識別的效率和準確度,實現提升查詢利用的效果。比如,昆山市檔案館建立AI 智能校對系統,將大量的檔案數據機器學習與人工智能服務的文字識別(OCR)服務、自然語言(NLP)分析服務進行對接,實現檔案數據智能校對。
根據《人工智能知識圖譜技術框架》(GB/T 42 131-2022)人工智能賦能檔案編研的途徑有三種形式:一是自助編研。人工智能技術利用知識圖譜中的數據,以可視化的方式結合語義檢索、推薦和大語言模型,打造自主編研模式,深度挖掘利用檔案內容和知識。比如,有的檔案部門根據《數字檔案館室建設指南》《電子文件歸檔和電子檔案管理規范》,搭建智能編研模塊,只要輸入關鍵字、時間節點、事件等系統能夠自助按照模式進行匯總,像大事記等都可以采用此方式。二是方式創新。人工智能和虛擬現實的發展,豐富檔案編研形式,使得展覽素材更加逼真,例如,該技術能夠對老照片進行色彩還原,結合歷史背景使得人物鮮活生動,增強虛擬現實的體驗,使虛擬環境更加智能和真實。同時,該技術在展覽效果上突破了時空限制,通過虛擬現實參觀主題展覽、體驗檔案文化,提高了教育效果和參與度。三是智能推送。人工智能能夠以語義分析利用者的需求,對關聯內容進行推送,提升利用者的查詢效率。同時,也可基于海量檔案語言模型,對檔案內容的事件抽取、文本摘要抽取,建立后臺事件數據庫和摘要數據庫,為檔案編研利用進行內容創新服務。
檔案審核劃控是人工智能應用最廣泛的領域,通過OCR 技術提取檔案全文,然后使用NLP 技術進行語義分析,優化訓練一種基于規則和語義驅動的開放審核模型,對關鍵檔案信息進行識別標注,并動態更新關鍵詞庫和自動分類,有效解決了審核數量多和人員少的結構性矛盾。比如,福建省檔案館設計訓練了深度神經網絡輔助開放審核算法模型,編制了檔案開放審核關鍵詞表,提出了檔案開放審核工作流程,對規范檔案開放審核工作,提升檔案開放審核工作效率。人工智能在審核中應加強人工抽檢力度,因為人工智能系統需要大量的數據進行訓練和學習,但系統常出現“數據偏見”,如果這種重復出現“偏見”,就造成某一模塊審核準確率較低。比如,在部分手寫稿或者繁體文檔中,對部分詞語識別準確率較低,造成審核結果失真,會影響整體審核質量。
人工智能技術已經涵蓋了檔案物理層、網絡層、傳輸層和載體層的全方位安全保護與控制,具體而言主要有:一是智能庫房。人工智能建立環境監測系統、中央空調系統、通風設備、中央除塵系統、消防報警及聯動控制系統、視頻監控系統組成的一體化復合型智慧庫房管理模式,實現了庫房建設的更新迭代。目前,人工智能已實現全過程機器值守操作,減少人工干預。比如,上海靜安區檔案館建立數字孿生技術、三維建模,構建技防與人防相結合、軟硬件同步發展的檔案實體安全管理體系,打造采用機器人實現檔案拿取功能的無人值守庫房。二是信息安全。人工智能可設置安全權限,利用人員只能查看安全權限以內的信息;同時,系統的安全風險感知、監測預警、實時阻斷、追蹤溯源能力提升,防入侵技術有顯著提升,防火墻、防水墻的安全防護指數增強,用技術進步解決了安全風險難題。三是傳輸安全。人工智能通過計算機系統和人工智能的算法優化信息存儲的方式,實現電子檔案的在線存儲、傳輸和備份,將檔案資料從一個地點傳輸到另一個地點,以及進行檔案的跟蹤、審計和管理等全流程安全保管。四是載體安全。人工智能與云計算技術,可以提供一個高效、安全和可靠的載體存儲環境,使得檔案信息可以更加安全、可靠地存儲和管理。同時,也可以提供靈活的服務擴展能力,滿足檔案工作中不斷增長的數據存儲和管理需求。
結合《云平臺人工智能建模系統框架及功能要求》(DB14/T 2527-2022)要求,人工智能在資源建設方面的優勢主要體現在檔案收集、整理和數據庫建設方面。從收集上來看,通過搭建全方位的數據采集系統,對文字、聲音、視頻、自媒體進行收集,實現了檔案資源建設的準、全、多樣的要求。從整理上來看,人工智能技術通過預設的分類規則和方案,利用智能分類模型、文字處理技術、模式識別技術等手段,對檔案整理流程進行智慧化改造,形成融合智慧化、自主性、一鍵式功能的整理體系。從數據庫建設來看,人工智能推動數字檔案館向智慧館轉變,將全域檔案數據轉化為結構化的數據,打破了不同數據類型檔案之間的信息壁壘,完成了全域檔案數據的知識融合。
人工智能的融合路徑需要建立完善的推進措施,形成較為完備的要素支撐體系,實現檔案服務的智能化標準化。
作為最熱門的新技術之一,早在2017 年,國務院就發布了《新一代人工智能發展規劃》,提出了面向2030 年我國新一代人工智能發展的指導思想、戰略目標、重點任務和保障措施。隨著深度學習、自然語言處理、計算機視覺等技術持續創新,人工智能將更加準確地識別和理解人類語言、行為和情感,并能夠自主地進行決策和學習,能夠拓展檔案管理應用的場景和任務,為檔案管理帶來了更多創新。因此,要緊緊把握時代發展潮流,抓住人工智能發展的戰略機遇期,以“智能+技術”賦能檔案管理,逐步培育具有鮮明特色、自主可控的人工智能治理新業態。一是加強人工智能技術創新。聚焦深度學習、模擬計算、模態分析、認知推理等實施創新專項和關鍵核心技術攻關項目,形成具有檔案特色的人工智能新技術。二是實施人工智能場景拓展計劃。打造智能技術與解決方案供給體系,圍繞開發利用、編研、整理鑒定、安全等智能化升級需求,提供自主可控的智能制造“檔案方案”。三是加強智慧數字化治理提升。完善檔案大腦中樞平臺功能,重點圍繞數據推送、交互平臺等,提升利用的便捷性和人民群眾幸福感。
人工智能需要進行深度知識學習,其中就涉及個人的隱私問題,如果這些信息被泄露,就會對社會產生負面影響;人工智能依靠對數據的計算和訓練,如果存在技術偏好將產生不公平現象,同時,人工智能系統也面臨著網絡黑客的攻擊。因此,在推進人工智能的同時認真思考如何管理其潛在的負面風險,并采取適當的措施來保護個人和社會的利益。一是高位推動。采取措施加強監管,以確保公眾利益和安全,加速建立形成通行、共識的人工智能治理規則和體系。建立多方參與機制,協力促進人工智能良性發展。二是技術突破。要加大技術攻關,圍繞實時監測、數據篩選、數據保護、網絡安全等方面進行研究,構建更為公平和包容的技術安全環境。三是明確規范。加強人工智能法律機制建設,規范技術標準,通過有效的技術創新、有效的流程管理和有效的風險防范來構筑人工智能治理的生態底座。
新技術的發展為檔案管理帶來了新的機遇與挑戰,檔案部門要加速推動檔案管理與人工智能深度融合。一是創新投入機制。充分發揮政府投入的主渠道作用,完善以財政投入為主,企業、社會廣泛參與的經費保障機制,加大人工智能經費投入力度,加強對政策支持力度,為推進人工智能提供良好的政策環境和發展空間。二是加強宣傳引導。堅持典型引路的推進機制,總結提煉先進經驗與典型案例。通過組織現場觀摩會、舉辦講座等方式,廣泛宣傳經驗成效,發揮輻射引導效應。開展選樹先進典型,發揮示范引領作用,激發人工智能引用的積極性。要按照《人工智能從業人員能力要求》(SJ/T 11805-2022 )要求,加強專業化隊伍建設。三是加強資源配置。重點圍繞人民群眾關心的服務媒介、資源建設、開發利用等方面,加強智慧檔案館、遠程利用的資源和政策供給,提高人工智能應用效能。
人工智能技術的發展已經成為了科技領域的熱點話題,已不再是一個遙遠的概念,而是滲透到生活的每一個角落,成為推動人類文明進步的重要力量。未來人工智能將會變得更加智慧化,應用場景將會更加廣泛,發展方向也會更加多樣化,為社會發展帶來更多的機遇和挑戰。站在新的歷史節點上,檔案工作者要加強運用人工智能技術的能力和水平,加強科技創新和交流合作,培養高技能人才,推動人工智能健康、可持續的發展,讓智能技術更好地服務于檔案事業發展。