人工智能尤其是生成式人工智能,憑借其強大的學習、生成能力,在檔案智能分類、深度檢索、文本生成等方面展現出其強大優勢。將人工智能技術應用于檔案管理領域,推動檔案管理從傳統向智能化加速演進,提升檔案管理效率,增強檔案服務質量。《“十四五”全國檔案事業發展規劃》中就“十四五”時期,我國檔案面臨的形勢與挑戰分析時指出,新一代信息技術廣泛應用,檔案工作環境、對象、內容發生巨大變化,迫切要求創新檔案工作理念,加快全面智能升級。但人工智能技術應用也在算法歧視、隱私保護、知識產權、檔案泄露、倫理合規等方面給檔案管理帶來全新挑戰。本文分析了人工智能技術在檔案管理中的應用及其面臨的倫理風險,提出了健全倫理治理機制,保障數據安全、遵守倫理規范的路徑措施等,保障人工智能技術應用的安全。
1人工智能在檔案領域應用場景分析
機器學習、知識圖譜、語言處理等人工智能技術應用于檔案采集、整理、保管、利用等環節,通過檔案語義關聯構建,字符識別、全文建庫及檔案內容深度理解、檢索,有效提高檔案管理智能化水平。人工智能均可在檔案管理收集、整理、保管、利用等環節場景中得到深度應用。
1.1檔案收集
收集是指檔案館(室)接收及征集檔案和其他有關文獻的活動,是檔案工作的起點和基礎。數智時代,隨著辦公自動化OA系統、HIS智慧醫療系統等業務應用成為常態,電子文件、音視頻資料、電子郵件等非結構化、碎片化數據越來越多,傳統檔案收集模式難以適應。通過應用人工智能技術,例如OCR技術、 Ωt -SNT算法、DFA搜索算法、語義分析、自然語言處理等技術[2],能夠識別敏感詞、判讀片段信息相似性等,抽取碎片化、非結構化數據中的檔案特征信息(如主題、關鍵詞、人名、地名等),形成結構化、語義化的檔案知識單元,運用本體模型將知識單元組織為知識圖譜,使其符合檔案收集要求。
1.2檔案整理
檔案收集后,需要按照來源、全宗、事由等原則對檔案實體進行分類、組合、排列、編號及編目,使之有序化。機器學習中文本分類算法人工智能技術的應用,訓練檔案分類模型,實現檔案自動分類。包括樸素貝葉斯等監督學習算法,以及聚類算法、主題模型等無監督學習算法,通過分類模型的反復應用,運用知識圖譜技術,建立基于檔案資源內在聯系的語義網絡。如以醫院人事檔案為例,通過實體命名識別抽取醫院員工姓名、學歷、職稱等基礎信息,再利用關聯關系抽取技術獲取該員工上下級、從業簡歷等關系,構建醫院完整的人事知識圖譜,借助圖譜鏈接預測等算法,形成圍繞該名員工的知識圖譜。又如輔助人工智能技術提取時長、類型、題名等音視頻檔案條目著錄項,經結構化數據標簽、副本解析抽取至檔案著錄頁面,完成人工智能技術應用于音視頻檔案的自動著錄。
1.3檔案存儲
檔案管理部門根據《歸檔范圍和保管期限表》,綜合社會、歷史、時間等綜合因素,將具有保存價值的檔案存儲于檔案館(室)。由于人的主觀立場、觀點不同,判斷檔案價值也會因人而異,直接影響檔案價值判斷的客觀性,最終影響檔案存儲工作的質量。此外,隨著信息技術的應用,電子檔案數量和規模呈現出大幅增長趨勢,碎片化、非結構化、海量化檔案數據、檔案知識需要對其進行集中統一、分層分級存儲。應用人工智能技術的語義分析,判斷其存儲歸檔年限范圍,增強了檔案價值的客觀性。此外,利用Hadoop、Spark等大數據框架,將分散于系統中的結構化、非結構化檔案數據進行ETL處理,實現檔案數據集中存儲、集成融合。
1.4檔案利用
檔案具有存史資政育人功能,檔案利用的目的包括編研、展覽、鑒證、憑據等。人工智能技術應用于檔案管理,通過智能檢索、知識圖譜、個性化推薦等,在信息處理效率及個性化利用服務方面發揮著重要作用。尤其是生成式人工智能技術應用,通過生成模型、擴散模型等訓練,滿足檔案編研及敘事需求,還可提供可視化、多模態、多感官的體驗形式,如音視頻自動解說播放、無障礙AI機器人等,為用戶提供沉浸式的服務體驗。此外,生成式人工智能技術應用讓檔案利用者能夠直接參與其中,實現檔案資源共享、產品共創、文化共建等4。尤其是AR、VR、三維可視化技術的應用,讓檔案利用更具交互式、沉浸式,持續釋放檔案利用的活力。
2檔案管理倫理風險挑戰
2.1社會層面
人工智能技術是在特定背景下開發、設計、訓練,并隨著技術迭代、數據集的變化及檔案管理領域的行業變革。人工智能技術應用表現出的算法歧視、偏見影響檔案“存史資政育人”社會功能的發揮。此外,人工智能技術作為一項前沿科技,在檔案管理領域的應用還處于探索完善階段,社會層普通公眾在檔案利用過程中應用人工智能技術的認可度、接納度還較低。即人工智能技術應用于檔案管理領域面臨著的算法偏見、算法歧視等問題,挑戰社會公平正義。
2.2經濟層面
人工智能技術及其應用成本高,檔案管理中引人人工智能技術,要發揮人工智能技術優勢,離不開大量檔案數據信息及先進的人工智能技術,這都需要一定的物質做基礎。人工智能技術先進性及經費高投入的特性,使其在檔案管理中的應用及推廣受到制約,尤其是人員較少、經費保障較低的檔案管理部門難以突破現實窠白。此外,AI模型訓練及運行高能耗,也是對“雙碳”目標及可持續發展理念的現實挑戰。
2.3技術層面
人工智能技術應用于檔案管理面臨著技術倫理風險,主要表現在:一方面是技術高度依賴與技術不信任之間的矛盾。人工智能技術廣泛應用于檔案收集、整理、存儲及利用全過程、各環節,檔案管理對人工智能技術的依賴性越來越深。但由于人工智能缺乏檔案管理的合規標準評價,易導致檔案信息丟失,技術應用不能解決檔案管理中所有現實問題。另一方面是程序透明要求與解釋之間缺乏有效兼顧。人工智能技術算法“黑箱”,影響檔案管理可信、公正,管理結果缺乏可解釋性。此外,算法歸檔與保存也存在倫理風險。人工智能算法依賴于特定運行環境、訓練數據集及技術支持,人工智能技術迭代、檔案管理標準變化都會導致算法無法在未來環境中正常運行,導致檔案無法識別、讀取等。
2.4法律層面
人工智能技術應用于檔案管理,易造成數據隱私、版權、所有權、權責歸屬等方面的倫理風險。主要表現在:人工智能技術接觸大量敏感數據信息,技術本身易成為攻擊對象,導致敏感數據隱私被泄露,威脅檔案安全。人工智能應用于檔案輔助管理生成的原生電子檔案,其原生性派生出“原創性”,涉及電子檔案版權及歸屬問題。此外,人工智能技術應用于檔案管理系統,易出現責任不明,尤其是辦公自動化、業務應用系統處理檔案信息時,對于檔案管理出現信息缺失、數據錯誤歸責于算法本身、檔案工作者還是技術提供者存在較大爭議。
3檔案管理倫理風險原因
3.1工具理性與價值理性的內在張力關系
工具理性偏重追求技術效能最大化,而價值理性則更強調符合人文倫理,二者既有矛盾又相互依存。人工智能技術作為應用于檔案管理的輔助工具,是檔案管理者基于人工智能技術輔助的工具價值理性分析,對工具應用產生價值期許,達到檔案管理的預期目的或效果。而價值理性則是檔案管理者有意識地對檔案管理行為的無條件、固有價值的純粹信仰,如電子檔案“四性”目標等。人工智能技術應用于檔案管理,工具理性是用,價值理性是本,工具理性服務于價值理性,并通過價值理性來實現或評價工具理性。但在此過程中人工智能技術迭代升級,檔案人員的價值理性未必能與工具理性相耦合,存在滯后于工具理性,導致人工智能技術各種風險的發生。
3.2算法黑箱與技術不確定性的內在因素
從人工智能技術應用于檔案管理所引起的倫理風險內部因素分析來看,主要是算法黑箱及技術自身不確定性所致。前者,主要是指人工智能技術應用越來越具有類人屬性,且算法的自主性更強,算法隱層的存在勢必會出現“算法黑箱”,所帶來的直接影響便是技術應用的不可預測性、不可解釋性,增加了技術應用的倫理風險。后者,主要表現為人工智能技術的現實應用和未來發展為人類增加很多不確定性,即技術迭代升級帶來不確定性,將其應用到檔案管理,也會產生不確定性信息,基于這些不確定性信息做出的分析、評估,同樣會導致檔案知識信息自身的不確定性。
3.了感知倫理風險與應對不足的外在原因
人工智能技術應用于檔案管理存在倫理風險,可甄別出的倫理風險感知影響因素有個體自主論、文化塑造論、資源分配論、社會信任論5,基于檔案管理者知識體系及其認知差異,所感知到的人工智能技術應用倫理風險也有差異,或淪為“工具人”,對人工智能技術全盤接受,忽視技術應用背后的倫理風險。此外,檔案管理部門缺乏有效應對倫理風險的機制,一旦引發檔案管理倫理風險,就會成為風險的制造者和承受著。
4人工智能應用下檔案管理倫理風險的應對
4.1制度:健全檔案安全標準體系
人工智能應用于檔案管理,使檔案管理內外部安全形勢發生巨大變化,需要從制度層面規避倫理風險。圍繞《國家新一代人工智能標準體系建設指南》《生成式人工智能服務管理暫行辦法》等人工智能方面的政策文件,結合《檔案法》《檔案法實施條例》等法律法規,進一步健全檔案安全管理行業標準、規范體系,明確人工智能應用于檔案收集、整理、存儲與利用場景的標準規范,如生成式人工智能檔案管理規則,制定人工智能倫理風險監管制度等,確保全生命周期倫理風險得到有效應對。
4.2技術:夯實檔案安全技術屏障
人工智能技術應用改變了傳統檔案的管理模式,也使其在社會、經濟、技術及法律等層面面臨全新的倫理風險挑戰。針對人工智能應用的特點及規律,引入區塊鏈、數字孿生技術、可信時間戳、非對稱加密技術等前沿科技,為檔案管理加把“安全鎖”。此外,要注重各種先進技術的集成應用,融合應用智能合約與共識機制,確保檔案數據具有可追溯性。密切關注人工智能技術的迭代升級,實時做好技術應對。運用實時感知技術、數據監測技術及可追溯技術,為檔案高效管理及智能安全決策提供技術支持。
4.3管理:重視檔案安全柔性治理
人機失衡是倫理風險發生的根本原因,解決人工智能技術應用背景下檔案管理倫理風險,就要注重做好價值引領,既不唯“人工智能技術”馬首是瞻,也不望“人工智能技術”而卻步,避免人工智能技術應用于檔案管理的極端化,堅持“技術適當”的比例原則,從“技術本位”向“人之本位”的“以人為本”轉變,避免過度依賴人工智能技術,同時也要防止技術過當使用。強化檔案管理部門及人員的安全責任意識,增強解決人工智能技術“算法黑箱”問題的自覺性、主動性,適當增加檔案訓練數據集,通過清洗、標注等,使檔案數據格式及質量滿足檔案管理標準和要求。
4.4監督:強化檔案安全多方監管
三分建,七分管。要構建人工智能應用背景下檔案管理倫理風險多方協同監管機制,切實降低檔案收集、整理、存儲及利用全鏈條的倫理風險。作為檔案管理部門,應主動加強與人工智能技術企業的聯系,邀請第三方監管機構及人工智能領域專家等,重點圍繞人工智能技術應用于檔案管理各個環節的監管,共同織密檔案管理安全風險防線。同時,要制定人工智能應用于檔案管理領域倫理風險責任清單,嚴格落實責任制,確保檔案倫理風險防范責任到部門、到人,增強檔案安全倫理風險防范的自覺性、主動性。
4.5人員:提高檔案安全素質能力
人工智能技術應用是檔案管理智能化轉型發展的必然選擇,檔案管理人員要積極應用人工智能技術,不斷提高安全風險應對處置的能力和水平。既要圍繞深度學習、語義分析、數據挖掘、信息檢索等人工智能技術的學習應用,也要注重做好數據安全、隱私保護領域的法律法規、行業標準、人工智能技術的學習,不斷提高檔案管理人員安全風險應對的素質能力。同時,還要做好各種安全風險應急處置演練,提高實戰能力。
參考文獻
[1]杜霞.人工智能技術在企業檔案管理中的應用場景、模式創新與未來展望[J].山西檔案,2024(5):152-155.
[2]李財富,王碩.人工智能技術賦能檔案館的應用前景研究—基于信息生命周期視角[J].山西檔案,2024(1):108-115.
[3]林空,李衍.人工智能技術在音視頻檔案整理利用中的應用研究[J].中國檔案,2023(7):62-63.
[4]張笑瑋,吳建華.生成式人工智能賦能檔案館服務質量的優化路徑研究[J].檔案與建設,2025(2):62-70.
[5]蒲曉紅,趙海棠.互聯網使用對公眾風險感知的影響機制—基于政府回應視角[J].中國行政管理,2021(5):146-154.
作者簡介:李艷誠(1979.9—),碩士學位,濱州醫學院館員,主要從事檔案信息管理研究。