趙 躍/四川大學公共管理學院 段先娥/四川電力設計咨詢有限責任公司
公共檔案館是檔案館發展到一定階段的產物,在提升行政效率、表達公民意識、追求經濟效益等方面發揮著不可替代的作用[1]。隨著數字轉型的縱深,國內外檔案界開始思考公共檔案館的未來方向,國際檔案理事會2019年年會的主題為“設計21世紀的檔案館”,表現出了對公共檔案館發展的關注。很多國家也圍繞公共檔案館的未來發展進行規劃和探索,澳大利亞國家檔案館(National Archives of Australia,NAA)制定了“2020年發展愿景:成為數字時代世界領先的檔案館”[2];美國國家檔案與文件署(National Archives and Records Administration,NARA)制定的“2018—2022年戰略規劃”明確了未來檔案館發展的戰略目標和具體策略[3];英國國家檔案館(The National Archives,TNA)在2015—2019年戰略規劃總結中重申了其在檔案領域的領導地位,并表示未來需要建立新的學術和研究合作伙伴關系,與新的受眾群體建立聯系,建立21世紀的檔案館[4]。以上規劃都體現出國外公共檔案館在發展理念和發展方式上的新趨勢和新方向。本文主要以上述文本為研究對象,結合國外一些典型公共檔案館的發展實踐,對國外公共檔案發展趨勢進行解讀與分析,以期在“十三五”規劃的收官之年和“十四五”規劃研究的關鍵時間節點上,為國內公共檔案館的發展提供一些啟發。
為了做好檔案開放和公眾獲取工作,各國檔案館從多個方面進行了努力,包括加速檔案資源的處理、拓寬公眾獲取檔案資源的渠道、加強檔案開放過程中的安全保障等。
首先,檔案資源處理包括檔案數字化、整理、錄入和維護等,處理后的檔案在利用及時性和便捷性方面具備優勢。NARA已對78%的傳統(模擬)文件進行了數字化,對89%的電子文件進行了整理,并計劃到2024財年完成5億頁文件的數字化[5]。澳大利亞政府向NAA提供了1000萬澳元經費,用于在未來四年內將二戰的服務文件數字化。確保澳大利亞人更輕松地訪問相關檔案,了解二戰時期的故事[6],此外NAA 還建立了電子文件與檔案管理系統(EDRMS)和數字檔案在線描述工具[7]。通過上述努力,NAA開放期檔案向公眾開放比例總體已達到了98%[8]。
其次,經過數字化處理后的檔案資源需要借助一定的渠道才能為公眾獲取利用,很多檔案館都在探索公眾獲取平臺的改進和創新。如NAA數字檔案館中正在建設一個多功能平臺,讓所有的澳大利亞人都可以獲取檔案服務、活動和展覽[9];NARA升級了國家檔案館的目錄,以解決可擴展性問題[10],還建立了創新中心,負責開發檔案共享工具,方便社會各界進行數字獲取和檔案研究[11]。
此外,在開放獲取過程中,對檔案內容和公眾隱私的安全保障是不可忽視的部分。國外檔案館既通過制度來保障檔案安全,如美國《信息自由法》《私人信息法》《陽光政府法》等規定了檔案的開放期限和利用限制,英國《公共檔案法》《信息自由法》規定了檔案公開的豁免時限,澳大利亞《澳大利亞聯邦檔案法》《隱私法》強調檔案公開過程中公民隱私保護等。同時,利用技術對開放獲取中的數據安全進行保障,如ARCHANGEL通過區塊鏈技術保障公共檔案中數字文檔的完整性和透明度,創建了一個去中心化的內容證據存儲庫,通過對區塊鏈的共識檢查對檔案庫進行統一維護[12][13],還有學者探索基于貝葉斯方法建立檔案安全風險預測模型[14]。
隨著海量的、非結構化的檔案數據持續增加,檔案的分類、整理、著錄、鑒定、檢索等工作變得更加復雜,尋求新技術來支持檔案工作的正常運行已成為迫切需求,自動化、智能化成為公共檔案館的新目標,其中人工智能在檔案工作中的運用成為關注焦點。當前,國外公共檔案館中人工智能的應用主要集中于檔案整理、檢索和服務方面[15]。
首先,人工智能技術可以通過自然語言處理和機器學習將數據資源按照一定標準進行分類,保證檔案的準確有序。澳大利亞新南威爾士州檔案館借助內部試點項目,利用機器學習技術,解決了州政府部門大量非結構化數據集的分類問題[16]。澳大利亞維多利亞公共檔案館基于Proof of Concept(PoC)項目,運用機器學習實現了對維多利亞州政府大量非結構化電子郵件的鑒定、處置和敏感性審查;而NAA的團隊研究了實體和自動元數據提取、語義分析、分類法、本體構建以及關聯數據方法,并建立了檔案館處置授權的概念模型和語義分析模型。下一步將在機器學習和人工智能專家的建議下,評估各類機器學習的創建和實施,包括自動分類、聚類和索引工具。預計這一階段將成為所有文件管理機構未來數字方法的試點[17]。
其次,人工智能技術在運用于檔案檢索過程中出現了對古老的手寫檔案識別精度不夠的問題,為此,各檔案館開始尋求對其的升級改造,其中梵蒂岡秘密檔案館就嘗試與高校及社會力量合作,創建了一個新項目In Codice Ratio,結合使用人工智能和OCR軟件搜索文本并提供結果,它不僅更準確,而且轉錄速度快。其創新之處在于拼圖分割,將單詞分解成更接近每個筆劃的東西,也就是通過將每個單詞分成一系列垂直和水平帶并尋找局部最小值來達到對古老的手寫檔案更精準快速識別和檢索的目的,成功后該技術將在所有的檔案館中被通用[18]。
最后,隨著公眾對個性化服務和用戶體驗的要求持續提高,檔案館通過自然語言處理技術、智能代理檢索技術、專家系統、智能機器人等來提供檔案個性化定制系統[19]。還有檔案館用語音指令來簡化搜索,可謂是對視力障礙者的特別關照,極大改善了用戶使用體驗[20]。當然,正如安西婭·賽勒斯所言,機器學習有其固有的局限,無法完全達到人類對檔案數據理解分析的精確性,需要檔案人員在進行人工智能與檔案工作融合測試時注意測量精度,調整算法,確保檔案工作自動化系統算法透明[21]。基于此,TNA對人工智能與機器學習系統進行測試,認為檔案行業需要修訂相應規范和準則應對可能存在的風險。同時發揮人與機器的不同優勢,以人的主觀能動性克服人工智能和機器學習的局限性[22]。并提出進一步保存人工智能分析過程中的數據和記錄,以保證人工智能技術下檔案的真實性[23]。NAA也提出,要使技術增強檔案信息的描述性和互操作性,需要更改檔案過程本身[24]。
英、美、澳等國家檔案館都將“加強與公眾的聯系”作為未來幾年的發展目標,一方面是各國構建開放政府、透明政府的需要,另一方面也是加強公眾對檔案工作參與度的重要手段。當前這種聯系的加強主要通過檔案館自上而下改善檔案服務方式和公眾自下而上參與檔案館建設兩種途徑進行。
首先,檔案館主動調查公眾對自身服務的滿意度,并根據反饋加以改進。NARA在其工作計劃中將未來發展目標進行明確和量化:到2020年,逐步滿足93%的用戶的不同要求,同時在博物館、外展、教育和公共項目活動中獲得90%的滿意度。并為此目標的實現制定新的標準以及時有效地響應用戶的需求[25]。NAA也表示要增加滿意客戶和訪客的數量[26]。此外,很多檔案館通過改進服務方式來擴大服務的受眾范圍和影響力,如NAA建立新的體驗式檔案網站,提供全國性的展覽巡回節目和引人入勝的公共節目來增加訪客和公眾滿意度。NARA推出“銘刻印跡:簽名里的故事”展覽,通過“簽名”將美國歷史上的重要事件直觀地呈現給觀眾。這些體驗活動都增加了檔案館與公眾的互動,吸引了更多關注[27]。
其次,鼓勵公眾轉變角色,將自己從“接受者”變成“參與者”是當前更為普遍的趨勢[28]。其中公眾參與又以公眾自發性參與和檔案眾包兩種模式為主。前一種模式表現為公眾通過網站主動地進行意見反饋,如公眾通過TNA網站首頁的用戶調研問卷,表達自身的訪問需求,推動檔案館服務質量的提升[29]。這種參與模式對公眾的專業性要求不高,可以根據自身利用情況進行反饋或是根據興趣愛好參與檔案館建設,公眾參與門檻較低。
而眾包模式更具專業性,它的核心理念是檔案館在互聯網平臺發布有關任務,公眾自由自愿地承接。最終通過匯聚公眾的力量與智慧完成檔案收集、文本轉錄、著錄、標引等工作[30]。近幾年隨著眾包項目普遍發展。NARA、NAA等將其作為加強檔案館與公眾聯系的重要策略寫入工作計劃中:NARA通過向在線國家檔案目錄提供獨特的內容,鼓勵公眾添加“標簽”并抄錄文件,以改善搜索結果;到2025財年,公民對國家檔案目錄的貢獻使手寫或難以閱讀的文字可供更廣泛的受眾使用。澳大利亞作為檔案眾包發展最為迅猛的國家,諸如“目的地:澳大利亞——分享我們的戰后移民故事”項目;“強制收養”歷史項目;“發現米爾登霍爾的堪培拉”項目;“蜂巢”轉錄等項目正在如火如荼進行。當前國外公共檔案館的眾包模式呈現出了以下特點:一是依托于多樣的技術和平臺,既有通過檔案機構網站也有通過社交平臺發起的眾包項目。有檔案館開發搜索工具,不僅向用戶呈現的描述性信息,還允許用戶創建和分享標記和虛擬列表集合[31],還有檔案館通過與其他聯邦機構,私營部門和公眾合作,將諸如檔案館、圖書館、博物館等機構的數據源進行連接,以提高數據的可檢索性和可用性[32];二是類型多樣且貫穿于檔案管理工作的全過程,從檔案資源眾包、檔案整理與組織眾包、檔案鑒定眾包到檔案利用與傳播眾包,公眾得以更全面地參與整個檔案工作中;三是檔案工作者自身定位的轉變,由之前的信息提供者變成了公眾參與的指導者、系統者和監督者,檔案管理員也在努力以開放的態度承擔新角色[33]。
改革開放以來,我國在檔案開放和公眾對檔案的利用服務中已經進行了卓有成效的探索。2019年《政府信息公開條例》的重新修訂,對檔案開放以支持政府治理提出了更高要求。2020年6月20日新修訂檔案法不僅將檔案開放期限從30年改為25年,還要求檔案館通過其網站或者其他方式定期公布開放檔案的目錄,為檔案的利用提供便利。目前,我國在檔案開放和公眾獲取過程中仍存在一些問題:檔案工作人員害怕擔責,“重藏輕用”意識依舊強烈;檔案服務渠道單一,法律制度中有關開放期限界定和利用之間存在矛盾[34]。要想解決上述問題需要從以下方面努力。首先,要樹立政治和文化自信,重新認識檔案開放。嚴格按照新修訂檔案法對檔案開放的新要求,充分尊重公民追求自由、平等獲取信息的權利,做到依法且合規地開放檔案。其次,要做好檔案開放的政策與制度設計。基于新修訂檔案法明確并細化檔案開放政策,改進完善檔案開放制度,使檔案開放工作有據可依。在檔案安全保密責任制、問責制的基礎上,應適當考慮責任豁免的情形,解決好保密與開放之間的矛盾;另外,需要在保障安全與隱私的基礎上改進檔案開放形式,推進檔案開放向檔案數據開放的轉變,探索實現開放目錄、開放元數據到開放內容數據的路徑。
我國公共檔案館運用人工智能技術還處于起步階段[35]。2018年4月,科大訊飛與國家檔案局科學技術研究所簽署了戰略合作協議,重點從檔案的智慧收集、管理、存儲、利用等方面促進人工智能在檔案管理中的應用[36];太倉市檔案館通過智能 Agent 進行檔案檢索,通過人工智能技術模擬人的感官及思維方式,對人臉、聲音、指紋、視網膜、虹膜等信息進行識別和加密,在利用者和實體檔案資源間建立起了一道安全屏障[37]。但相比國外,國內人工智能技術的應用明顯滯后,在檔案管理具體環節的應用探索還需要加強。首先,需要在正確處理人工智能技術和檔案人員參與檔案工作的基礎上,注重與相關技術機構的合作,提高人工智能技術水平,逐步從理論研究向實踐運用的轉換。其次,需要加強人工智能技術在檔案工作中的應用深度,以項目為導向,將人工智能技術運用于檔案整理、檢索和利用等具體的實踐階段,進一步推動檔案管理和服務效率的提高,為智慧檔案館的建設提供技術支持。
近年來,國內公共檔案館在吸收公眾參與方面取得了一定進展。很多檔案館網站都設置了局長信箱、咨詢投訴和網上調查等欄目,還有檔案館通過眾包吸納公眾參與,如沈陽市檔案館建立的家庭檔案網站。其鼓勵公眾上傳分享自己的家庭檔案,具有檔案征集和展示眾包色彩,但仍停留在檔案征集層次,未涉及館藏公共檔案資源的開發利用。今后的公眾參與,首先需要豐富參與類型,提高參與廣度,注重機構間合作。其次,要提升公眾參與深度,檔案人員在過程中作為監督者和指導者,需要對公眾參與進行引導和幫助,以更好幫助公眾發揮潛力和創造性。最后,要讓眾包在國內檔案部門落地,不僅需要技術和平臺的搭建,更關鍵的是敢于開展眾包項目的意識和魄力。如果仍在檔案開放層面“畏首畏尾”,不解放思想,做好安全保障,眾包項目將難以實現。因此,需要進一步完善相關政策法規,保障檔案眾包各方合法權益和檔案信息安全,加強檔案館自身眾包理念、資源和能力建設。