999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

可解釋人工智能在檔案領域的應用初探

2025-04-03 00:00:00李思藝王振杰陳子憶
檔案與建設 2025年3期

摘 要:隨著人工智能的飛速發展和廣泛應用,技術在展現其強大功能的同時,與之相伴的應用風險也在不斷凸顯,令關于算法透明度及其衍生技術的可解釋人工智能漸入研究視野。文章梳理了可解釋人工智能的發展脈絡,分析其應用于檔案領域的可行性與必要性,并在理論分析的基礎上,嘗試提出三類可解釋人工智能在檔案領域的應用場景,即檔案資政、檔案開放審核、檔案數據治理,以期豐富檔案領域的技術研究視角。

關鍵詞:可解釋人工智能;檔案資政;檔案開放審核;檔案數據治理

分類號:G271

Exploring the Application of Explainable Artificial Intelligence in Archival Field

Li Siyi, Wang Zhenjie, Chen Ziyi

( School of Cultural Heritage and Information Management, Shanghai University, Shanghai, 200444 )

Abstract: As artificial intelligence rapidly develops and finds widespread applications, it demonstrates powerful capabilities while also presenting significant risks. These concerns have brought algorithm transparency and explainable AI into the research spotlight. This paper traces the development of explainable AI and analyzes its feasibility and necessity in the archival field. Based on theoretical analysis, we propose three application scenarios for explainable AI in archival management: archives for political and public decision-making, open archive reviewing, and archival data governance. These scenarios aim to expand the technological applications within the archival field from new research perspectives.

Keywords: Explainable Artificial Intelligence; Archives for Political and Public Decision-making; Open Archive Reviewing; Archival Data Governance

人工智能已成為全球科技創新的前沿陣地,其應用場景在各領域持續擴展。各行業深入探索人工智能,不斷尋找融合創新機遇,借技術之力推動行業蓬勃發展,現已取得眾多令人矚目的成果。以檔案領域為例,自20世紀中期起,國際檔案界便前瞻性地探討將人工智能技術融入檔案工作的可能性。進入21世紀,隨著AI技術取得突破性進展,國際檔案界對人工智能在檔案工作中的應用實踐邁入嶄新階段。[1]澳大利亞維多利亞州的Poc項目使用eDiscovery和Nuix的機器學習工具輔助檔案鑒定[2];新南威爾士州檔案館通過測試scikit-learn開源和機器學習軟件輔助檔案鑒定,該工具有著專家系統、統計模型和深度學習算法[3];意大利羅馬特雷大學的研究人員將機器視覺(Machine Vision)技術運用于梵蒂岡秘密檔案的轉錄工作[4];韓國翻譯機構也應用人工智能翻譯本國的經典文獻,極大提高了工作效率。[5]

就我國而言,1991年,中央檔案館率先邁出實踐步伐,采用人工智能模擬編目檢索算法,成功設計出“中型計算機檔案資料智能軟件歷史檔案目錄數據庫”[6],顯著提升了檔案檢索的精確度和全面性。隨后,我國檔案實踐領域不斷涌現出人工智能的應用實例,為檔案工作的智能化發展注入了強大動力。北京市市場監督管理局將檔案圖像識別技術、內容識別技術與專家系統結合,研發出頁面公開級別的智能鑒定工具,對檔案圖像頁面的公開級別進行批量識別并處理,大幅提高了鑒定效率。[7]河南省數字檔案館基于館藏資源建成智能檢索系統,挖掘大量結構化和非結構化數據,實現信息、數據的關聯,進而形成知識圖譜和檔案知識庫,提高了檔案管理的效率和質量。[8]云南稅務部門采用自然語言處理技術識別檔案中的文字,采用模式識別技術抽取音像內容,從而實現稅務執法音像檔案的數字化和數據化。[9]國能大渡河流域水電開發有限公司結合自然語言處理技術、光學字符識別技術和機器學習技術,構建出管理類檔案智能分類模型,有效提升了檔案分類與整理效率和質量。[10]

然而,此類檔案實踐都只聚焦于人工智能技術的應用,對于其應用的風險性考量卻少之又少,如人工智能介入管理過程所生成的決策和結果是否可信、誰來負責,其算法是否透明等。就人工智能自身的研究而言,對于其可解釋性的探究也缺乏一個系統科學的理論范式。可解釋性對于人工智能而言是至關重要的一部分,只有當人工智能的所有活動都有據可依、有跡可循,才能廣泛應用于整個社會。國內檔案學界有少量研究涉及可解釋人工智能,可分為兩類:一類是對國際檔案專家學者觀點的引入,如在可解釋人工智能框架下,檔案工作人員既需要存儲結果文件,也需要存儲大量的算法材料[11];從文件管理的角度解決人工智能的可解釋性。[12]另一類是在數智背景下探討檔案管理相關問題,例如可解釋人工智能是監管算法隱蔽行為的方式,可以緩解檔案技術應用下的隱私侵害風險[13];檔案工作者作為組織與公眾的中介,是可解釋人工智能的關鍵。[14]本文嘗試探索可解釋人工智能在檔案領域的應用,對其可行性與必要性進行分析,并提出三類應用場景,以確保數智環境下的檔案工作更加穩健、可靠地開展。

1 可解釋人工智能及其發展

可解釋人工智能的概念起源可以追溯到1983年,William R. Swartout提出Xplain系統,通過使用自動編程器充分解釋程序行為,以解決代碼合理性問題。[15]1991年,Garson等從敏感性分析的角度,首次提出要對機器學習模型的預測結果進行解釋。[16]同年,Richard W. Southwick區分了兩類解釋路徑,分別是作為解決問題過程的闡釋和解釋推理過程的闡釋。他認為闡釋的有用性取決于用戶的期望,而用戶的期望又與系統環境有關,因此系統必須具備向用戶解釋其推理過程的能力。[17]隨后,學術界逐漸關注人工智能的可解釋力,并于2004年首次提出了可解釋人工智能(Explainable Artificial Intelligence,XAI)[18]的概念。至此,學界對于可解釋人工智能有了相對一致并且較為清晰的認知,標志著可解釋人工智能概念的正式誕生。然而,人工智能在21世紀初處于被各行業領域狂熱追逐與力捧的浪潮中,產業界對于人工智能的熱衷程度大大超越了學界對其安全性的警示。

2016年,美國國防部高級研究計劃局(Defense Advanced Research Projects Agency,DARPA)啟動了“可解釋人工智能”[19]項目,嘗試研發可解釋模型,該模型的生成能夠使用戶理解機器決策過程和邏輯,從而改進或創新人工智能技術,并提出此方式能將在“第三波”人工智能技術的發展和應用中實現。美國計算機協會、美國公共政策委員會在2017年發布的《算法透明性和可問責性聲明》中提出了七項基本原則,其中包含著對人工智能可解釋的要求,督促使用算法決策的系統和機構要主動對算法的過程和決策提供解釋。[20]此外,人工智能在智慧醫療、智能駕駛等前沿業務場景中的應用也展示出對可解釋性的強烈需求。至此,業界逐漸將目光投向可解釋人工智能,學界關于可解釋人工智能的研究也在2016年迎來了一波高潮。此階段對可解釋人工智能的研究不僅停留在對概念的探討,而且陸續開始討論可解釋人工智能的類型、解釋程度、解釋范圍、分類依據等。

2016年以來,許多國家的人工智能主管部門將“可解釋”納入人工智能倫理的治理框架。從這個意義上講,人工智能的可信性、透明性、安全性等倫理要求,都能夠通過可解釋人工智能實現。自2019年以來,歐盟、聯合國等區域及國際組織紛紛出臺人工智能倫理相關文件,其中明確提及算法透明度和可解釋性是人工智能規范的重要原則和可信人工智能的核心要求。[21-22]2023年11月,全球人工智能安全峰會上28國共同簽署的《布萊切利公園宣言》[23]更是直擊人工智能治理要害,即人工智能泛在使用所帶來的人權、隱私、偏見、數據安全等風險,這些風險一部分來源于技術本身,包括其透明度、可解釋性、公平性等問題,“以人為本、可信和可問責”的人工智能是重點關注方向。由此,可信人工智能(Trustworthy AI)是人工智能社會化應用的倫理框架,可問責人工智能(Responsible AI)是人工智能泛在使用的監管要求,二者的實現需要技術、制度、法律共同發力,而可解釋人工智能則是可信人工智能技術實現的關鍵步驟。隨著人工智能倫理漸入視野,各行業對可解釋人工智能的需求愈發強烈。目前,可解釋人工智能已經開始應用于醫療、教育、交通、金融、軍事等多個領域。

可解釋人工智能是可信人工智能的技術實現方式,其核心在于對決策過程和決策結果的闡釋。需要指出的是,可解釋人工智能并非指單一技術,而是通過一系列流程和方法使用戶能夠理解并信任機器學習算法輸出結果的技術集合,包括代理模型(LIME,SHAP)、特征重要性評分、可視化技術、因果推斷、規則提取、透明度優化等。這些技術可以根據不同的應用場景,基于可解釋性程度和范圍等需求進行選擇和組合,做出具有適應性的技術部署。

2 可解釋人工智能應用于檔案領域的必要性

2.1 “熱”人工智能下的“冷”思考:打破“黑箱”

單從技術起源來論,深度學習和神經網絡是推動人工智能發展的核心技術,而關于神經網絡方面的研究可以追溯到幾十年前,因此,人工智能并非一項嶄新的技術。在2012年ImageNet大規模視覺識別挑戰賽(ILSVRC)中,一個使用卷積神經網絡的系統在分類準確率上以超越其他競爭對手41%的成績勝出時,神經網絡首次成為主流,深度學習開始迅速發展。[24]此后數年,人工智能呈鼎沸發展態勢,掀起了各行業、全領域的應用熱潮。這股人工智能“熱”不僅席卷行業,更是獲得了各國政府層面的大力支持。根據經濟合作與發展組織人工智能論壇(OECD.AI)統計結果,截至2024年5月31日,全球共有69個國家、地區發布了超過1000項人工智能政策或倡議,其中有370項關于人工智能指導與監管、705項關于人工智能治理、352項關于資金投入與財政支持等。[25]這股人工智能“熱”在各國戰略的加持下迅速蔓延到各個領域。

近年來,檔案領域應用人工智能的熱度只增不減。各國檔案主管部門紛紛出臺政策或實施“人工智能+檔案”的項目。我國《“十四五”全國檔案事業發展規劃》明確指出“要積極探索人工智能技術在檔案信息深層加工和利用中的應用,加強大數據、人工智能等新一代信息技術在數字檔案館(室)建設中的應用,推動數字檔案館(室)建設優化升級”[26]。瑞典檔案管理者協會2024年6月發布了《檔案中的機器學習:深度索引為檔案利用服務》白皮書,從檔案利用的角度,以自動深度索引為重點,總結了當前數字技術環境下檔案管理實踐的機遇和風險,重點介紹了三種應用環境:文本識別、文本語言處理(如自動索引或聚類)以及電影、聲音或圖像索引。[27]綜合而言,國內外檔案界正在積極探索并推進人工智能在檔案領域的實踐,并產生了豐富的應用場景。從主要功能來看,大概分為兩類:一類是應用于檔案業務的具體環節,如分類[28-29]、鑒定[30-31]、檢索[32-34]、處理敏感信息[35-37]、內容提取和編制索引[38-39]、修復[40]等;另一類是應用于檔案信息服務,如智能檔案咨詢[41]、檔案文獻智能解讀[42]、檔案信息智能推送[43]等。在科研方面,國際文件管理領域歷時最久、涉及研究人員最多的國際合作項目InterPARES(電子系統中文件真實性永久保障)也將第五階段的項目命名為“Trust AI”。由此可見,人工智能在檔案領域受到了廣泛的關注。

然而,如此熱度之下也存在安全與倫理的隱患,人工智能發展及其所使用模型的不透明性日益增加,這個情況引起了產業界的關注,如過度強調智能化或個性化服務而忽視算法歧視、注重決策結果而疏于考慮因果相關性等。在此背景下,可解釋人工智能作為人工智能研究的新領域漸入學界的視野。在機器學習國際會議(2016)、神經信息處理系統年度會議(2016)、神經網絡國際聯合會議(2017)和人工智能國際聯合會議(2017)上,都舉行了關于可解釋人工智能的研討會。2019年,Rolan等對檔案館應用的人工智能作了分類,主要包括基于規則的系統、基于統計模型的系統和基于深度學習的系統,該分類強調的一個重要變量是系統是否透明。[44]與基于規則的系統和基于統計模型的系統相比,基于深度學習模型的系統會產生難以解釋的“黑箱”。可解釋人工智能的發展與應用正是破解“黑箱”的重要工具。基于此,可解釋人工智能是可靠人工智能、道德人工智能、安全人工智能的重要保障,凡是應用人工智能技術的領域,都應當考慮其可解釋性和解釋力,檔案領域亦不例外。

2.2 檔案信任的雙重維度:制度與技術

數字環境下,維系社會信任并非易事。虛假信息、虛假新聞層出不窮,帶來了不容忽視的信任危機。檔案信任是社會信任的重要構件,檔案和檔案機構憑借其獨有的信任機制參與到社會信任治理之中。檔案信任是一個由制度信任和技術信任共同構建的機制框架,制度信任是對規則體系與專家系統的信任,技術信任是因新一代數字技術應用而出現的新形態。目前,該形態下的信任機制主要體現為通過技術確保文件檔案的“四性”,這種技術信任是“檔案用戶對技術進步而產生的普遍信任”[45]。然而,隨著技術不斷成熟且廣泛應用,技術本身的不確定性帶入應用場域會引起新一輪信任機制的重構。就人工智能而言,其面臨的技術超前而倫理滯后的現狀是難以突破的信任困境,這也是近年來國際和各國人工智能相關法規和標準出臺的重要動因。有學者提出“唯有算法信任,才是信任機制的終結模式”[46],而算法信任的核心在于其透明度是否足夠。無論在技術發展或是民主政治進程中,透明度與信任都是高度綁定的兩個概念,透明是信任的必要前提,信任是透明的衍生條件。由此,對人工智能的技術信任更多取決于其算法的透明度,可解釋性與解釋力是算法透明的核心指標,可解釋人工智能是建立可信人工智能的核心解決方案。

在人工智能倫理、安全、可問責等要求的推動下,檔案信任中的技術信任或將從對技術的普遍信任轉變為算法信任。在檔案技術信任變遷的過渡期,檔案領域需要將目光投向可解釋人工智能。換句話說,在人工智能廣泛應用的技術背景下,實現檔案信任需要將可解釋人工智能引入檔案領域。如前所述,制度與技術是檔案信任的雙重維度。從制度信任來看,可解釋性之于人工智能正如可問責性之于檔案管理,信任建立的核心在于對檔案自身屬性與管理合規性的認可,即檔案本身具備解釋力(檔案是反映業務活動情況的原始憑證),以及檔案管理能夠滿足可解釋性(檔案管理確保檔案的真實性、可靠性),這些認可來源于悠久的檔案保管歷史傳統與科學規范的檔案管理制度。檔案機構作為聯結政府與公眾以滿足社會問責需求的中介,其公共服務屬性更是加固了檔案制度信任機制。從技術信任來看,檔案信任機制或將由無意識的普遍信任轉向有條件的算法信任,可解釋是衡量技術可信性的重要指標。因此,無論是制度信任或技術信任,檔案領域應用人工智能技術都需要將可解釋性與解釋力納入考量范圍。

3 可解釋人工智能應用于檔案領域的可行性

3.1 技術可行性

可解釋人工智能技術的逐步成熟為其在檔案領域的應用奠定了技術基礎。隨著人工智能廣泛應用而帶來的信任危機、監管缺位、算法歧視等問題的出現,在技術層面應對這些問題的可解釋人工智能研究受到了廣泛關注,其在算法優化、工具開發方面取得了顯著進展,并廣泛應用于司法審判、醫療診斷、工業制造、礦產預測等行業領域。在算法優化方面,相關研究以提高基礎大模型的可解釋性為目標,揭示算法背后的邏輯和決策依據,取得了多項突破。這包括基于特定模型的解釋方法、事后解釋等關鍵技術,來減少模型的復雜性,優化模型的解釋力,如基于決策樹、線性和邏輯回歸的簡單模型保障算法透明度;LIME、SHAP等事后方法則可以在不修改原始模型的基礎上,對模型如何做出預測進行解釋。[47]在工具開發方面,可解釋人工智能領域已經涌現出了一批高效、易用、功能強大的開源工具,提供了生成解釋和可視化模型行為的接口,如美國KitWare公司的Xaitk-Saliency、微軟公司的InterpretML、IBM公司的aix360系統、Google公司的What-If工具等。[48]這些工具能夠幫助開發人員實施XAI技術,揭示模型在不同輸入條件下的行為模式。

可解釋人工智能技術的核心優勢在于,能夠解釋人工智能模型的決策過程并使其可視化,這使得復雜的人工智能模型不再是難以理解的“黑箱”,而是一個透明、可被追溯行為的系統。全球范圍內已有多個項目驗證了XAI技術的廣泛適用性。檔案領域也有探索,英國國家檔案館牽頭的Deep Discoveries項目應用計算機視覺技術和深度學習模型,結合可解釋性方法開發了跨檔案館的視覺搜索工具。這些工具利用視覺特征識別和模式匹配技術,實現了檔案圖像的自動化分類與跨平臺搜索,下一階段將進一步探索新的XAI技術,通過可視化工具(例如熱圖)來解釋每個搜索結果中哪些區域與查詢圖像相匹配,向用戶解釋模型的決策依據。[49]此外,斯科特·卡梅倫等根據可解釋人工智能領域的相關發展,設計出在檔案環境中的Paradata框架,在不同歸檔流程中記錄人工智能的應用,以確保檔案管理可問責。[50]Paradata被用來記錄和分析人工智能在檔案處理中的具體行為,使得這些行為能夠被有效地記錄和分析,包括人工智能在數據處理中的輸入、輸出以及決策背后的邏輯過程,這對于理解和評價人工智能在檔案管理中的角色定位、作用等至關重要。這些實踐案例表明,可解釋人工智能技術已初步具備在檔案領域應用的技術環境。

3.2 政策可行性

目前國內外眾多國家和地區出臺了一系列與人工智能可解釋性問題相關的倫理原則和指南,為可解釋人工智能技術在檔案領域的應用提供了政策支撐。在國際上,聯合國發布首份人工智能倫理全球協議《人工智能倫理建議書》,提出要提高AI系統在其整個生命周期中的可解釋性。[51]歐盟出臺的《通用數據保護條例》(GDPR)提到用戶在受算法決策影響后“獲得解釋的權利”,進而減少由“黑箱”造成的侵犯用戶隱私等風險問題。[52]2019年,歐盟發布的《可信任人工智能道德準則》指出,可解釋性對于建立和維護用戶對人工智能系統的信任至關重要,并提出借助可解釋人工智能(XAI)來解決這一問題,以便更好地理解系統的底層機制。[53]在國內,我國政府高度重視人工智能的發展與治理,將其視為推動數字經濟發展的重要抓手。國務院印發的《新一代人工智能發展規劃》(2017年)指出要“重點突破自適應學習、自主學習等理論方法,實現具備高可解釋性、強泛化能力的人工智能”。[54]中國信息通信研究院發布的《人工智能白皮書》(2022年)指出建立適當的可視化機制嘗試評估和解釋模型的中間狀態、使用簡單的可解釋模型等路徑來增強人工智能系統的可解釋性。[55]2023年12月,中國信息通信研究院發布的《人工智能倫理治理研究報告(2023年)》認為,生成式人工智能技術引發了偏見歧視、隱私侵犯、責任不明等倫理問題,有待強化生成式人工智能技術的可解釋性和可信任性。[56]人工智能的倫理和治理框架為可解釋人工智能技術在檔案領域的應用提供了政策保障,尤其在保障公共數據隱私和提升檔案系統透明度方面具有重要指導意義。在人工智能治理的政策框架內,檔案管理的服務性決定了可解釋人工智能技術的應用空間,檔案管理對象的公共性確保了可解釋人工智能技術的應用價值。

4 可解釋人工智能應用場景展望

4.1 數據驅動模式下的檔案資政

檔案資政是指在充分開發檔案信息的前提下,利用所開發的檔案信息成果服務政府部門、輔助政府部門決策的過程。[57]隨著新一代信息技術的發展,人工智能廣泛應用于檔案信息的分析和決策支持。這些決策可能涉及復雜的社會經濟問題和廣泛的利益相關者,如何確保人工智能輔助決策的可解釋性是實現科學決策、增進公眾信任的關鍵。可從人工智能可解釋性的形成邏輯出發,從“為什么解釋”“向誰解釋”“怎么解釋”[58]三個方面展望可解釋人工智能在檔案資政服務領域的應用。

《“十四五”全國檔案事業發展規劃》強調,提升檔案資政服務能力是檔案事業發展的重要目標。[59]檔案資政所涉及的決策范圍包括政策制定、社會發展規劃、資源配置等關系國計民生、政府治理等關鍵領域,其廣泛且深入的影響力對決策的可問責性提出了極高要求。因此,人工智能在檔案資政中的應用需要具備高水平的可解釋性,才能夠保證決策者能夠理解和信任系統的輸出,并向公眾提供決策說明。無論是對決策過程的合理性、合規性,還是對外部利益的考量,可解釋人工智能都是確保決策透明、可追溯的重要手段。在檔案資政中引入可解釋人工智能,決策者能夠理解決策的背景和邏輯,進而確保決策過程的合理性和科學性,避免“黑箱”效應產生的負面影響。

為了保證人工智能決策的透明性,要根據不同的目標人群來調整解釋的焦點。[60]檔案資政的決策涉及多個利益相關方:一是檔案機構,即決策資源提供方,利用人工智能分析公共決策需求,有效配置檔案資政服務資源。二是政府部門,即決策主體,需要理解人工智能如何分析檔案數據以及決策的邏輯,以確保模型的預測和決策符合社會的整體利益。三是企事業單位與社會公眾,即決策直接受益者或受影響者,作為社會參與的實體對決策制定過程與依據有迫切需求。四是人工智能研究者和專家,即決策技術提供方,可能會需要了解算法運行過程,幫助優化系統的應用效果。需要指出的是,隨著公民權利意識在數字環境下不斷強化,公眾作為受決策直接影響的群體,對于決策背后的依據和邏輯解釋有更為迫切的現實需求。在這種多方利益的平衡與博弈中,人工智能應用于檔案資政所產生的決策成果需要對利益相關方和公眾提供必要的解釋,以提升決策透明度,確保可問責性。

根據算法解釋對象的不同,可解釋人工智能分為局部解釋(以主題為中心的解釋)和全局解釋(以模型為中心的解釋)。[61]局部解釋聚焦某一主題的決策過程,幫助理解模型為什么做出某個特定區域的判斷或預測。在人工智能技術應用于檔案資政的過程中,可能會抽取不同檔案資料對決策提出建議,局部解釋可以揭示哪些特定數據或檔案信息對結果產生了影響并給出影響力賦值。對于政策制定者而言,局部解釋能夠幫助他們理解每個決策背后的具體依據、是否符合實際情況,以及該決策能否達到預期的效果。全局解釋則聚焦整體模型的行為和規律,展示模型如何整體運作以及如何根據數據做出決策。人工智能基于檔案信息輔助分析政策的長期影響,展示不同檔案數據對預測結果的影響程度。全局解釋有助于政策制定者把握模型如何根據不同時間段的數據變化來預測政策的效果,避免過度依賴個別數據。

4.2 可問責的檔案開放審核

檔案開放審核是檔案開放利用的前置機制,也是實現檔案價值的關鍵環節。[62]隨著信息技術的快速發展,不少檔案部門開始利用人工智能輔助檔案開放審核工作。而目前基于深度學習的人工智能模型,其決策過程多基于大規模數據集的模式識別,而非依賴明確的規則或邏輯推理,其決策機制不能為用戶所理解[63],這種“AI黑箱”使得智能開放審核結果的可信度存疑。而可解釋人工智能具備一定的解釋能力,在檔案開放審核中具有廣泛的應用前景,能夠有效提升審核過程的透明度,進而增強利益相關方對于審核結果的信任度。

在技術實現方面,可解釋人工智能可以輔助設計和檢驗檔案開放審核模型,利用機器學習算法對檔案內容進行分類、標注和敏感性分析。通過人工智能模型的應用,審核人員能夠快速識別出檔案中可能存在的敏感信息、歷史遺留問題或合規性隱患,從而提高審核的效率和準確性。這一過程中,可解釋人工智能可以揭示模型的判斷依據和決策路徑,幫助審核人員理解模型的決策過程,驗證審核結果是否符合實際情況,并在必要時進行一定的人工干預,以應對復雜多變的檔案開放審核工作任務。[64]可解釋人工智能使得檔案開放審核模型的輸出不僅是一個結果,而是可以被用戶理解的一個過程。通過對數據和決策過程的全面審查,確保檔案開放審核模型的結果符合預定的規則和倫理標準。

在實踐認知方面,可解釋人工智能可以輔助審核人員理解系統。從這一層面上看,系統不僅是進行單個任務的決策,還需要提供對整個過程的輔助解釋,包括關于輸入特征、模型行為以及決策邏輯的詳細說明,幫助審核人員做出更加合理的判斷。此外,可解釋人工智能可以基于檔案信息的公共價值、社會影響等維度,自動計算檔案開放的合規性評分,并在此基礎上有效支持智能審核的決策過程,提高審核質量。通過可解釋的人工智能模型,審核人員可以更全面地掌握檔案背后的歷史信息和涉及個人數據隱私等問題,避免開放不當或遺漏重要檔案。

可解釋人工智能的應用將使檔案開放審核不再局限于單一主題,而是在更廣泛的框架內提供全局性審核決策支持。人工智能模型基于歷史背景、數據價值、公共需求等多個因素來分析海量的檔案信息,為決策者提供檔案開放審核的戰略性建議。全局解釋可以幫助決策者理解決策結果如何影響整個檔案開放政策的實施,提供長遠的戰略思考。此外,可解釋人工智能可以為監管機構、行業專家以及政策制定者提供強有力的支持,幫助他們更好地理解和評估大規模的檔案數據集,及時發現審核決策的潛在問題、風險或合規性問題。基于可解釋人工智能的檔案開放審核工作模式能夠有效減少智能決策的錯誤和偏差,實現檔案開放與隱私信息保護之間的動態平衡。

4.3 符合倫理規范的檔案數據治理

隨著數字技術的快速發展、數據價值不斷凸顯,檔案數據治理逐漸成為檔案學界與業界的重點關注領域。在數字治理環境下,數據量的激增以及數據權屬、數據壁壘、數據倫理等問題越發突出[65],如何高效且合規地管控數據、釋放數據要素價值潛能已然成為亟須解決的問題。檔案數據治理面臨同樣的挑戰:如何完成檔案數據資源化、資本化、資產化的路徑轉換,即通過變現實現檔案數據的市場價值,以及怎樣推動檔案數據賦能社會治理,即通過參與治理實現檔案數據的公共價值。可解釋人工智能在檔案數據治理中具有廣泛的應用前景,在檔案數據治理的決策制定、流程優化和場域重塑中都可以發揮作用,從而有效提高檔案數據治理的效率,并確保治理透明及合規。

在檔案數據治理決策制定方面,可解釋人工智能在技術上確保決策過程的透明與可問責。數智時代的檔案數據治理是一個人智協同發展的決策系統,可解釋人工智能的嵌入可以揭示AI模型的決策邏輯和過程,幫助決策者理解輸入與輸出的因果關系,從而理解決策過程并進一步優化決策內容。例如,通過引入全局解釋方法,決策者可以洞察人工智能如何優化整個檔案數據治理流程,包括如何選擇最合適的檔案數據存儲方案、設置檔案數據訪問權限、制定檔案數據共享策略等。可解釋人工智能不僅為決策者提供切實可行的、具有前瞻性的決策支持,還幫助其預測不同治理策略的長期效果與潛在風險,確保檔案數據治理結果的合理性與可持續性。

在檔案數據治理流程優化方面,可解釋人工智能的嵌入能夠形成關于數據處理環境的解釋框架。內容、背景、結構是確保檔案“四性”的核心維度,也是檔案數據區別于其他數據的重要特征,更是文件檔案管理領域的前端控制與全程管理理論的邏輯起點。與非檔案數據相比,檔案數據質量不僅體現在技術可用性上,更多的是法律憑證效力,因此檔案數據的生成與利用對前端業務環境與數據管理流程有更高的要求。數字時代的業務環境下,人工智能被廣泛應用于各類業務活動中,就數據處理方面而言,最為普遍的用法是通過語義識別等技術分析數據,識別其中的錯誤、冗余信息,并進行相應的清理、優化。這一過程中,應用可解釋人工智能技術可以幫助管理人員透視數據清洗過程并掌握判斷依據。這種可解釋性能夠展示模型對每一條數據的處理行為,并揭示出背后的邏輯和規則。通過這種方式可以形成關于數據處理環境的解釋框架,有效避免人工智能對數據的“黑箱操作”,確保數據處理過程的可問責性,進而保障檔案數據的質量與合規性。

在檔案數據治理場域重塑方面,可解釋人工智能的應用能夠拓展檔案數據的價值發揮空間。檔案數據往往涉及大量個人信息或隱私數據,然而,參與治理的檔案數據則需要隱匿其中的私人和秘密屬性,使其公共性最大化。換句話說,參與治理的數據公共性與檔案數據私密性之間的矛盾,即數據安全與隱私保護成為制約檔案數據價值發揮的重要因素,導致檔案數據治理場域并未延展至更廣闊的社會公共空間。人工智能模型可以通過隱私保護算法對敏感數據進行匿名化處理,防止在利用數據的過程中泄露隱私。在此過程中,應用可解釋人工智能技術可以說明算法如何對檔案數據進行隱私保護的操作,以確保利益相關方能夠理解和信任檔案數據保護的處理方式。可解釋人工智能技術的應用在提升檔案數據處理效率的基礎上,加強對檔案數據安全的監管與審查,進而在合法合規的框架下充分挖掘檔案信息資源以釋放數據價值。

5 結 語

處于泛人工智能時代的人們浸染在大語言模型所營造的信息世界中,經過精心制作的真假信息突破個人知識盲區進入學習范疇,作為學習內容的假信息經過公開渠道反饋后又被新的大語言模型所采用,成為規劃、決策、投票的新基礎。在熱衷于推崇人工智能技術應用的社會環境中,算法之下的數據失控、信息繭房等問題[66]往往會被忽視。正如梅宏院士在以“跨越邊界的科技倫理”為主題的第二屆中國科技倫理高峰論壇上的發言:“人工智能泡沫太大,喧囂埋沒理性,需要一個冷靜期。”[67]類似的反思促使各國陸續關注人工智能倫理、風險等與治理相關的議題并制定相應政策與白皮書。與這些制度相對應,可解釋人工智能作為重要的技術治理工具也逐漸被應用于若干領域。本研究從算法信任、社會透明度等倫理角度展開檔案領域應用人工智能的思考,在技術主導的實踐趨勢中嘗試引入可解釋人工智能技術,探討其應用于檔案領域的理論基礎及可行場景,旨在拓展倫理視閾下檔案領域應用人工智能技術的新視角。

*本文系國家社科基金青年項目“面向數字政府建設的數字檔案資源優化配置研究”(項目編號:23CTQ033)階段性研究成果。

作者貢獻說明

李思藝:確定論文框架,撰寫、修改與審定論文;王振杰:案例收集;陳子憶:撰寫與修改論文。

注釋與參考文獻

[1][12]潘未梅,馬林青.國際檔案領域人工智能研究進展分析及啟示[J].浙江檔案,2024(4):21-27.

[2][11]程妍妍,宋瑩,鄭伽.國外檔案工作與人工智能:潛力和挑戰[J].中國檔案,2022(8):78-80.

[3]代林序,張玉潔.機器學習在檔案管理中的應用與挑戰——基于新南威爾士州檔案館機器學習實驗的調查與啟示[J].檔案與建設,2021(5):42-47.

[4]ISACA.Using the Digital Trust Ecosystem Framework to Achieve Trustworthy Al[EB/OL].[2024-06-07].https://www.isaca.org/resources/ white-papers/2024/using-dtef-to-achievetrustworthy-ai.

[5]黃霄羽,管清瀠.新聞視角評析近期國外檔案工作技術應用的特點[J].中國檔案,2018(7):71-73.

[6]蘇玉文.1991年度國家檔案局科技進步獎評審揭曉[J].檔案工作,1992(1):12.

[7]陳會明,史愛麗,王寧,等.人工智能在檔案工作中的應用實踐與挑戰——以北京市市場監督管理局為例[J].檔案與建設,2019(7):53-56.

[8]提升檔案信息化發展水平實現遠程利用社會共享——河南省數字檔案館建設概述[EB/OL].[2024-06-07].https://www.saac.gov.cn/daj/c100226/ 202006/6d0ad86e8a4443e187bbe67908b4ffab.shtml.

[9]云南稅務征管電子文件單套制歸檔試點通過驗收[EB/OL].[2024-06-07].https//www.saac. gov.cn/daj/c100262/202110/4528cbde36e24bea88ce4 57bfb8bae21.shtml.

[10][28]陳功娥.人工智能技術在檔案管理中的應用與實踐[J].四川檔案,2022(3):26-28.

[13]白銀.檔案數字化轉型中隱私保護的理論優化與制度完善[J].檔案學通訊,2024(3):19-28.

[14]陳曉婷,徐擁軍,胡嘯林.人工智能時代下檔案工作的變革:機遇、挑戰與應對策略[J].檔案學研究,2024(5):4-13.

[15]Swartout W.XPLAIN:A System for Creating and Explaining Expert Consulting Programs[J]. Artificial Intelligence,1993,21(3):285-325.

[16]Garson G D.Interpreting neural network connection weights[J].AI Expert,1991,6(4):46-51.

[17]Southwick R.Explaining Reasoning:An Overview of Explanation in Knowledge-Based Systems[J].Knowledge Engineering Review,1991,6(1):1-19.

[18]VanLent M,Fisher W,Mancuso M.An explainable artificial intelligence system for small-unit tactical behavior[C]//Proceedings of 16th Conference on Innovative Applications of Artificial Intelligence. AAAIPress,2004:900-907.

[19]Gunning D,Aha D W.DARPA’s explainable artificial intelligence program[J].AI Magazine,2019,40(2):44-58.

[20]人工智能的倫理問題與治理原則[EB/ OL].[2024-06-07].https://www.sohu.com/ a/347442962_468638.

[21][51]UNESCO.Recommendation on the Ethics of Artificial Intelligence[EB/OL].[2024-06-07]. https://www.unesco.org/en/articles/recommendationethics-artificial-intelligence.

[22]The White House.Executive Order on the Safe,Secure,and Trustworthy Development and Use of Artificial Intelligence[EB/OL].[2024-06-07].https://www.whitehouse.gov/briefing-room/ presidential-actions/2023/10/30/executive-order-onthe-safe-secure-and-trustworthy-development-anduse-of-artificial-intelligence/.

[23]AI Safety Summit.The Bletchley Declaration by Countries Attending the AI Safety Summit[EB/ OL].[2024-06-07].https://www.gov.uk/ government/publications/ai-safety-summit-2023-the-bletchley-declaration/the-bletchley-declarationby-countries-attending-the-ai-safety-summit-1-2-november-2023.

[24]Krizhevsky A,Sutskever I,Hinton G.ImageNet Classification with Deep Convolutional Neural Networks[J].Communications of the ACM,2017,60(6):84-90..

[25]OECD.AI.Policies,data and analysis for trustworthy artificial intelligence[EB/OL].[2024-06-07].https://oecd.ai/en/.

[26][59]中辦國辦印發《“十四五”全國檔案事業發展規劃》[EB/OL].[2024-06-07].https://www. saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2 ca7310eca4.shtml.

[27]VSA-AAS.Machine learning in the archive:depth indexing in the service of access to archives[EB/ OL].[2024-06-07].https://vsa-aas.ch/wpcontent/uploads/2024/08/MachineLearning_im_Archiv_ Whitepaper_2024-08-08_en.pdf.

[29]Vellino A,Alberts I.Assisting the appraisal of e-mail records with automatic classification[J].Records management journal,2016,26(3):293-313.

[30]曲晶瑤.人工智能在我國檔案領域的應用實踐落地研究[J].黑龍江檔案,2021(2):52-53.

[31]Lee C A.Computer-Assisted Appraisal and Selection of Archival Materials[C]//2018 IEEE International Conference on Big Data (Big Data).IEEE,2018:2721-2724.

[32]陳會明,史愛麗,王寧,等.人工智能技術在檔案工作中的應用與發展芻議[J].中國檔案,2020(3):72-74.

[33]陳亮.人工智能技術在智慧檔案館建設中的應用初探——以太倉市檔案館為例[J].檔案與建設,2016(7):80-82.

[34]Lee B C G.Machine learning,template matching,and the International Tracing Service digital archive:Automating the retrieval of death certificate reference cards from 40 million document scans[J]. Digital Scholarship in the Humanities,2019,34(3):513–535.

[35]Schneider J,Adams C,Debauche S,et al.Appraising,processing,and providing access to email in contemporary literary archives[J].Archives and manuscripts,2019,47(3):305-326.

[36]Souza R R,Coelho F C,Shah R,et al.Using Artificial Intelligence to Identify State Secrets[EB/OL].[2024-10-22].https://arxiv.org/abs/1611.00356.

[37]Hutchinson T.Protecting Privacy in the Archives:Supervised Machine Learning and BornDigital Records[C]//2018 IEEE International Conference on Big Data(Big Data).IEEE,2018:2696-2701.

[38]Binmakhashen G M,Mahmoud S A.Document Layout Analysis: A Comprehensive Survey[J].ACM Computing Surveys,2019,52(6):1-36.

[39]Muehlberger G,Seaward L,Terras M,et al.Transforming Scholarship in the Archives Through Handwritten Text Recognition: Transkribus as a Case Study[J].Journal of Documentation,2019,75(5):954-976.

[40]周子晴.人工智能視域下影音檔案修復與傳播路徑探討——以百年前北京影像修復為例[J].北京檔案,2021(6):28-30.

[41]何文麗.人工智能背景下檔案信息服務的應用研究[J].黑龍江檔案,2021(2):30-31.

[42]劉珂.人工智能在檔案管理中的應用探析[J].蘭臺世界,2019(2):19-23.

[43]胡國強,楊彥榮,李高峰.基于信息鏈角度分析人工智能在檔案館的應用前景[J].北京檔案,2019(2):34-36.

[44]Rolan G,Humphries G,Jeffrey L,et al.More human than human Artificial intelligence in the archive[J]. Archives and Manuscripts,2019,47(2):179-203.

[45]于英香,張期勇.從制度信任到技術信任:檔案信任機制的變遷與發展[J].浙江檔案,2022(12):30-33.

[46]郭彬,于飛,陳勁.區塊鏈技術與信任世界的構建[J].企業管理,2016(11):110-113.

[47]廖勇,韓小金,劉金林,等.可解釋性人工智能研究進展[J/OL].計算機工程,1-28[2024-11-26].https://doi.org/10.19678/j.issn.1000-3428.0069925.

[48]王梓屹,簡萌,李彬,等.2023年可解釋人工智能技術主要發展動向分析[J].無人系統技術,2024(2):113-120.

[40]Lora Angelova,The National Archives,UK.Deep Discoveries[EB/OL].[2024-11-26]. https://www.nationalcollection.org.uk/FoundationProjects.

[50]Cameron S,Franks P,Hamidzadeh B.Positioning Paradata:A Conceptual Frame for AI Processual Documentation in Archives and Recordkeeping Contexts[J].ACM Journal on Computing and Cultural Heritage,2023,16(4):1-19.

[52]European Union.General Data Protection Regulation[EB/OL].[2024-11-26].https://gdprinfo.eu/.

[53]The High-Level Expert Group on AI.Ethics guidelines for trustworthy AI[EB/OL].[2024-11-26]. https://ec.europa.eu/digital-single-market/en/news/ ethics-guidelines-trustworthy-ai.

[54]國務院關于印發新一代人工智能發展規劃的通知[EB/OL].[2024-11-26].https://www.gov. cn/zhengce/zhengceku/2017-07/20/content_5211996. htm.

[55]人工智能白皮書(2022年)[EB/OL].[2024-11-26].https://www.scdsjzx.cn/scdsjzx/ ziliaoxiazai/2022/4/18/d03a2d33b67d4c398ddfca504cf41 0ab/files/43b00b8feccd423ea2e2a4014e9d672a.pdf.

[56]中國信息通信研究院.人工智能倫理治理研究報告(2023年)[EB/OL].[2024-11-26]. http://www.caict.ac.cn/kxyj/qwfb/ztbg/202312/ P020240103531660935078.pdf.

[57]牛力,王鈺涵.面向政府的檔案信息資源開發利用研究綜述[J].檔案學研究,2016(2):60-66.

[58][60]呂雯瑜,曹康康.走向道德人工智能(AI)——賦予人工智能系統道德人格和構建可解釋人工智能[J].學術探索,2023(12):24-34.

[61]楊志航.算法透明實現的另一種可能:可解釋人工智能[J].行政法學研究,2024(3):154-163.

[62]劉子聰.《中華人民共和國檔案法實施條例》的功能定位、缺憾檢視與優化路徑[J].檔案學研究,2024(5):64-70.

[63]VON ESCHENBACH W J.Transparency and the black box problem: Why we do not trust AI[J]. PhilosophyTechnology,2021,34(4):1607-1622.

[64]劉越男,張茜雅,楊建梁.大語言模型在檔案開放審核中的應用框架與路徑探究[J/OL].檔案學通訊,1-15[2024-11-28].https://doi.org/10.16113/ j.cnki.daxtx.20240923.001.

[65]金波,楊鵬.檔案數據治理賦能的思維意象與行動具象[J].檔案學研究,2024(3):4-12.

[66]王敏芝.算法之下:“透明社會”的技術與觀念[J].探索與爭鳴,2021(3):29-31.

[67]第二屆中國科技倫理高峰論壇舉辦[EB/ OL].[2024-11-26].https://news.sciencenet.cn/ sbhtmlnews/2024/11/382150.shtm.

(責任編輯:馮婧愷 張 帆)

主站蜘蛛池模板: 欧美在线网| 男女男免费视频网站国产| 黄色一级视频欧美| 亚洲欧美成人网| 手机在线国产精品| AV无码无在线观看免费| 午夜福利在线观看入口| 国产午夜在线观看视频| 久久国产乱子伦视频无卡顿| 中字无码精油按摩中出视频| 国产亚洲精品自在线| 一级毛片基地| 亚洲性一区| 国产成+人+综合+亚洲欧美 | 国产精品免费p区| 操操操综合网| 国产91九色在线播放| 亚洲AV无码久久精品色欲| 亚洲乱码在线视频| 日韩在线永久免费播放| 嫩草国产在线| 国产精品七七在线播放| av在线无码浏览| 久久久精品无码一二三区| 亚瑟天堂久久一区二区影院| 国产黑人在线| 露脸真实国语乱在线观看| 久久黄色影院| 亚洲人成色77777在线观看| 欧美成人a∨视频免费观看 | 国产成人乱无码视频| 国产午夜在线观看视频| 日韩小视频在线观看| 呦视频在线一区二区三区| 国内丰满少妇猛烈精品播| 99久久99视频| 国产网友愉拍精品视频| 不卡网亚洲无码| 国产小视频在线高清播放| 成人小视频在线观看免费| 国产成人艳妇AA视频在线| 亚洲国产清纯| 精品视频第一页| 亚洲品质国产精品无码| 国产高清无码麻豆精品| 国产精品成人久久| 久久五月天综合| a毛片在线| 一级毛片免费观看久| 看你懂的巨臀中文字幕一区二区| 亚洲a免费| 美女被操91视频| 国产欧美在线观看一区| 久久99国产乱子伦精品免| 婷婷亚洲综合五月天在线| 国产肉感大码AV无码| 高清无码不卡视频| 精品無碼一區在線觀看 | 免费看a毛片| 亚洲91在线精品| 国产va视频| 无码粉嫩虎白一线天在线观看| 精品一区二区三区自慰喷水| 综合色88| 日韩精品无码免费一区二区三区 | 一级香蕉视频在线观看| 国产成人久久综合777777麻豆| 少妇精品久久久一区二区三区| 亚洲a级在线观看| 国产精品蜜臀| 国产综合网站| 毛片久久网站小视频| 激情无码视频在线看| 欧美 亚洲 日韩 国产| 欧美成人午夜视频| 亚洲精品视频在线观看视频| 在线亚洲精品自拍| 韩国v欧美v亚洲v日本v| 性色生活片在线观看| 狠狠ⅴ日韩v欧美v天堂| 亚洲精品天堂在线观看| 免费一极毛片|