摘 要:共享是集約資源、發揮資源價值的重要手段。高校檔案數字化建設中信息資源整合是共享的前提和基礎,既要圍繞共享目標推動信息資源整合,又要以高質效整合成果滿足共享的預期目標。本文首先探討了檔案數字化、數字檔案資源整合及數字檔案共享等相關理論知識。其次,分析了共享理論下高校檔案數字化建設現狀以及存在的現實問題,提出了共享理論應用于高校檔案數字化信息資源整合的合理性。最后,就高校檔案數字化建設中信息資源整合存在的問題,提出了具體的對策措施,提升高校檔案數字化建設中信息資源整合的質量,實現共享的預期目標。
關鍵詞:共享;檔案數字化;信息資源;整合
信息資源共享是檔案館及其他機構利用技術手段實現信息資源共同建設與利用。《“十四五”全國檔案事業發展規劃》(以下簡稱《規劃》)把“檔案共享程度顯著提高”作為“十四五”時期檔案工作的發展目標之一,提出要加強“檔案資源共享服務標準”“推進檔案信息資源共享平臺建設”“推動檔案館與博物館、圖書館等單位在檔案文獻資源共享方面合作”“建設全國檔案信息共享利用體系”等任務內容。新近頒布實施的《檔案法》《檔案法實施條例》分別有2次、5次提及“共享”,其中《檔案法》規定要建設檔案信息資源共享服務平臺,推動檔案數字資源跨區域、跨部門共享利用;《檔案法實施條例》中則規定要進一步推動檔案數字資源“跨層級”的共享利用,這些都是法律法規層面就檔案資源共享做出的具體規定和要求。快速發展的信息時代,信息共享成為時代發展的必然趨勢。
1 相關理論辨析
1.1 檔案數字化
檔案數字化就是將紙質、視音頻等載體的檔案資源轉化為數字化檔案信息,并以數字化形式存儲、網絡化相連,形成有序結構檔案信息庫,便于利用,實現數字檔案信息資源共享。檔案數字化內容包括管理、采集、查閱。《規劃》中有5次提及檔案數字化,并把檔案數字化作為“十四五”時期檔案信息化強基工程,提出到“十四五”末中央和國家機關、央企總部、縣級以上綜合檔案館傳統載體檔案數字化率分別要達到90%、90%、80%。為保障檔案數字化順利進行,國家陸續頒布《檔案法》《檔案法實施條例》《紙質檔案數字化規范》《電子檔案管理辦法》《電子檔案管理系統通用功能要求》《電子文件歸檔與電子檔案管理規范》等一系列法律法規、國家標準、行業標準等,為檔案數字化提供有力保障。
1.2 數字檔案資源整合
《規劃》中有4次提及“整合”。包括加大相關檔案資源跨領域、跨區域、跨層級的整合力度,推進記憶項目建設;有序推動文件級目錄向全國革命史等檔案資料目錄中心整合匯集,為檔案資源整合共享提供必要的基礎條件;整合科技力量,加大重點科研任務攻關力度。通過數字檔案資源整合實現遠程訪問、快速檢索,實現高效利用;推動數字檔案資源整合跨部門、跨層級、跨區域共享,釋放數字檔案資源的利用價值;減少檔案物理接觸、防止篡改丟失,有利于保護檔案原件;大數據、區塊鏈、人工智能技術的創新應用,促進數字檔案技術創新發展。總之,數字檔案資源整合是大數據時代檔案事業發展的重要命題,也是檔案系統搶抓機遇、重塑職業形象的重要內容。
1.3 數字檔案共享
隨著計算機信息技術、數字技術的發展,電子檔案數量和規模呈現出快速增長態勢。根據國家檔案局發布的《2023年度全國檔案主管部門和檔案館基本情況摘要》,截至2023年底,我國各級綜合檔案館館藏電子檔案2289.6TB,館藏檔案數字化成果28849.2TB,通過省級以上檔案主管部門認證的數字檔案館369個。檔案共享就是在標準化、規范化并符合保密要求的基礎上,在不同層次、不同部門、不同區域的信息網絡系統間互聯互通并向社會提供服務的活動。根據《規劃》中先后18次提及“共享”,包括檔案資源共享服務、檔案信息資源共享平臺建設、檔案共享服務標準規范等。數字檔案資源共享對滿足公眾信息需求、提高檔案利用效率、創新服務方式、促進區域協調發展具有重要的現實意義。
2 共享理論下高校檔案數字化建設現狀及問題
2.1 高校檔案數字資源分布呈現碎片化
根據管理權屬關系,高校檔案數字資源與地方檔案館之間尚未建立共享機制,高校檔案數字資源分布于各個高校檔案館,高校與高校、高校與地方檔案館之間的檔案數字資源關聯性弱,高校館藏檔案數字資源獨立性強,呈現出分散式、碎片化分布,跨機構、跨區域共享還沒有實現,高校檔案館中的檔案數字資源尚無法實現整體性跨館際間共享利用。以高校學籍檔案為例,這些重要的檔案數字資源長期分散于高校檔案館,并隨著學生畢業離校,又會流轉到就業地人才中心或組織人事檔案管理部門。高校檔案還包括黨群類、行政類、學生類、教學類、科研類、基建類等,碎片化分布必然會影響跨校際、館際、地域、機構檔案數字資源共享利用效率。
2.2 高校檔案數字資源質量標準不統一
不同機構、不同行業、不同高校、不同院系間的檔案數字化發展進度不一,數字化技術應用的方法也存在較大差異,質量優劣各不相同等。這些因素的存在,必然影響高校檔案數字資源的質量,加之標準的不統一,不同高校間、高校與檔案館之間的數據庫設計理念和方案存在差異,導致高校檔案數字資源之間關聯性不強,難以準確、高效、完整地實現檔案數字資源的檢索、利用。從先前各個高校數字館建設時檢查發現,由于歷史欠賬較多,尚有大量傳統館藏檔案資源沒有完全實現數字化,已經數字化的檔案,還存在著錄項不完整、頁數不準確、分辨率低、錯頁跳號等質量問題[1]。近年來,隨著檔案領域數字化國家標準、行業標準的陸續出臺,檔案數字資源質量標準不統一必然會阻礙跨校際、跨部門共享。
2.3 高校檔案數字資源整合技術滯后性
隨著信息技術、數字技術的快速發展以及迭代升級周期越來越短,為高校檔案數字資源整合提供了先進的技術支撐。如ETL(提取:Extract、轉換:Transform、加載:Load)技術、數據虛擬技術、分布式計算技術(如Apache Hadoop和Apache Spark等)等數據處理與整合技術;云存儲技術、分布式數據庫技術等數據存儲與管理技術;知識圖譜技術、關聯數據技術等數據分析與挖掘技術,以及加密技術、訪問控制技術等數據安全保護技術。但從當前高校檔案數字資源整合技術的應用現狀來看,主要還以檔案數字資源建庫、信息集成管理方面為主,其他先進技術應用緩慢。新技術、前沿科技應用不及時也影響了高校檔案數字資源整合的質量和效率。
2.4 高校檔案數字資源共享平臺未建立
《規劃》中提出各省級綜合檔案館要加強本區域檔案信息資源共享平臺建設,還提出要加大跨區域檔案信息資源共享平臺的建設力度,推動國家、地區檔案信息資源共享平臺一體化發展,實現全國檔案信息共享利用“一網通辦”。平臺是高校檔案數字資源實現共享的重要載體,目前,各個高校檔案館都十分重視信息化建設,紛紛建立了檔案數字資源管理平臺,但主要是各自為戰,獨立開發,導致跨校間檔案數據庫融合性不強,增加了高校檔案數字資源整合的難度。此外,由于各個高校檔案館檔案數字資源來源廣泛,數據格式千差萬別,如電子文件有doc、docx等格式,圖像掃描有jpg、tif格式,一旦數據編碼、元數據定義標準不一致,檔案數據整合時就面臨著數據難以兼容,阻礙高校館藏檔案數據高效流通、共享。
3 共享理論應用于高校檔案數字化信息資源整合的合理性
高校檔案作為記載高校發展重要歷史事實、滿足高校教育交流而存在的載體,其自身具有很強的共享利用內趨動力。共享理論的運用,為高校檔案數字化信息資源整合提供了新視野、新思路和新方法。
3.1 共享客體的完整性實現信息資源整合的全面性
高校檔案數字化信息資源整合的前提和基礎,就是要把分散的數字資源有機整合起來,形成完整數據鏈,確保高校檔案信息的完整性、連續性,破除高校檔案信息“孤島現象”。共享理論的引入和應用,共享客體,即共享對象——完整性是前提,只有確保共享客體的完整性,才能實現共享效果的預期性。可見,從共享理論的內容分析,共享理論的引用及預期目標的實現,就是要把高校檔案信息資源有機整合起來,小至高校個體,大至高校聯盟或整個高校集合體,確保共享客體信息集中、要素齊全,滿足共享預期目標的實現。
3.2 共享技術的先進性保障信息資源整合的現實性
共享,相對于過去封閉而言,跨區域、跨機構、跨層級是其顯著特征,而要實現“三跨”,就需要一系列能夠滿足共享目標實現的先進技術支撐和應用。以存量數字化資源為基礎,檔案數字資源的組織與呈現朝著語義化、主題化、多維度方向發展[2]。例如,ETL、虛擬現實技術、區塊鏈技術應用等,為高校檔案數字化建設信息資源整合提供有效的技術支撐,并使檔案資源整合得以成為現實。又如區塊鏈應用,在滿足檔案資源遠程訪問的同時,其去中心化、不可篡改的特征,又能夠有效保證高校檔案資源的安全性。
3.3 共享平臺的科學性滿足信息資源整合的合理性
共享離不開平臺的支撐。高校檔案數字化信息資源整合的最終效果如何,需要來自實際應用的檢驗和評估。基于共享價值目標引領下的高校檔案數字化信息資源整合,契合了共享的目標價值,利用平臺載體實現高校檔案信息資源跨區域、跨層級、跨機構的交互、共享。一方面,平臺是展示和呈現。如高校利用館藏檔案資源進行編研,并以適當方式在平臺發表,利用平臺實現主動公開,滿足社會利用的需求。另一方面,利用平臺能夠深化檔案資源的內容整合。通過平臺的后臺訪問數據分析,能夠準確把握不同地區、不同行業以及高校不同院系訪問檔案的內容和需求特點,為高校進一步優化整合檔案信息資源提供有力支撐。此外,平臺還具有良好的交互性、友好用戶訪問界面,都能夠為共享利用營造良好的外部條件,提升共享的利用效率和滿意率。
4 共享理論視角下高校檔案數字化信息資源整合策略
根據《規劃》中提出的檔案信息資源整合要求,高校檔案數字化信息資源整合要始終堅持共享理念,把握共享要求,并為共享實現提供技術支撐和保障,為高校檔案實現“三跨”提供多源異構的數字資源。
4.1 以共享為理念,確保檔案數字化信息資源整合的完整性
高校檔案數字化信息資源整合要始終圍繞共享價值目標實現為基本追求,以資源整合的完整性為重點,不斷豐富館藏檔案資源結構、類型。一方面,要樹立“大檔案”理念,把高校檔案數字化信息資源整合納入高校教育事業發展改革大局中謀劃和推動,把檔案資源整合作為一項系統性、基礎性工程,既要做好頂層規劃設計、謀劃推動,又要充分調動高校積極性。另一方面,要按照“增量電子化、存量數字化”原則,加快推進高校館藏檔案資源的數字化進程,同時也要做好新增電子檔案資源的整合。按照全宗管理要求,整合高校檔案數字化信息資源。
4.2 以制度為保障,確保檔案數字化信息資源整合的規范性
制度是高校檔案數字化信息資源整合能否取得預期效果的重要保證。針對高校檔案信息資源分布式存在、分散式存儲的現狀,要進一步建立健全檔案數字化信息資源整合標準規范,具體要涵蓋全面的高校檔案數字化信息資源整合中的數據格式、變慢規則、元數據標準等業務標準規范。也要制定共享利用時的制度規范和要求。包括高校檔案信息資源運維管理、安全防護等利用機制,遠程訪問機制、安全保密制度等,確保信息資源整合共享的實現及安全。如制定檔案信息資源共享平臺的訪問準入準則(見圖1)[3]。

4.3 以技術為支撐,確保檔案數字化信息資源整合的交互性
注重運用現代信息技術手段,為高校檔案數字化信息資源整合提供技術支撐,并實現跨區域、跨機構、跨層級的檔案數字資源統一管理和交互,增強檔案資源整合的利用體驗。例如,通過機器學習、自然語言處理、大模型等AI技術智能化輔助,以及圖像識別、語音識別、語義技術等,構建檔案數字資源網絡,做好數字化信息資源應整合盡整合。同時,也要積極應用區塊鏈技術等,為高校檔案資源共享利用數據安全和隱私保護提供技術保障。
4.4 以平臺為載體,確保檔案數字化信息資源整合的共享性
從頂層到地方分步推進高校檔案信息資源共享平臺建設,最終實現全國檔案信息共享利用“一網通辦”。積極構建高校檔案共享平臺,并做好功能和界面設計,增強平臺的用戶體驗。同時,也要重視平臺訪問控制和權限管理的安全性。利用數據加密、HTTPS協議、VPN虛擬專用網絡、異地備份等技術手段,保障信息資源整合共享傳輸的安全。
參考文獻
[1]馮劍波.高質量推動全國數字檔案館建設[J].中國檔案,2022(4):16-18.
[2]龍家慶.基于數字敘事理論的紅色檔案開發策略研究[J].檔案管理,2023(4):66-68.
[3]劉宇鵬,田野,趙立芳.檔案信息資源跨部門共享模式研究——以北京市朝陽區檔案館婚姻登記檔案共享為例[J].辦公自動化,2016(19):51-56.
作者簡介:石彩紅(1984年2月—),大學學歷,西北大學現代學院助理館員,研究方向:檔案管理數字化、檔案共享。