摘要:隨著大數據和人工智能技術的飛速發展,高校數字檔案館的建設面臨前所未有的機遇。本文深入探討了大數據和人工智能時代高校數字檔案館的建設思路,分析了當前高校檔案館數字化建設的特點和現狀,提出了針對性的建設策略,如多渠道拓展數字資源、應用人工智能技術挖掘大數據、建立數字檔案管理系統,加強智能化、個性化服務、構筑信息安全防護體系等,以有效提升高校數字檔案館的服務水平,為高校的教學、管理、科研提供有力支持,為發展新質生產力、服務經濟社會發展發揮應有的作用。
關鍵詞:大數據和人工智能時代;高校;數字檔案館;策略
高校作為知識和信息的信源地、集散地,其檔案館承載著記錄學校歷史、教學、科研等重要信息的使命,如何構建一個適應大數據時代需求、融合人工智能技術的高校數字檔案館,已經成為各高校信息化建設的重要方面。
一、大數據和人工智能時代高校檔案館建設面臨的機遇
在大數據和AI迅猛發展的背景下,高校檔案館數字化建設和發展面臨一些新的機遇。一是高校檔案數字化建設是落實 “十四五”規劃、實現檔案資源數字轉型的必然要求。中辦、國辦印發的 《“十四五”全國檔案事業發展規劃》明確提出加快檔案資源數字轉型,加強國家檔案數字資源規劃管理,逐步建立以檔案數字資源為主導的檔案資源體系。[1]二是大數據和人工智能技術的發展為高校檔案館建設提供了更廣闊的空間。大數據和人工智能技術的應用可以推動高校檔案建設的數字化轉型,傳統的檔案管理方式、方法已經不能適應信息化建設要求,而通過大數據技術,可以將紙質檔案轉化為電子檔案,實現檔案信息的數字化管理,這不僅可以節省存儲空間、提高管理效率,還方便用戶進行遠程訪問。三是高校檔案館數字化建設是人工智能發展的內在要求,承擔著為 “數字檔案館”向 “智慧檔案館”轉變提供 “海量”數據的任務。大數據技術可以幫助高校檔案館實現數據資源的整合和共享,高校各部門在日常工作中會產生大量的數據資源,這些數據資源對于檔案建設具有重要價值,通過大數據技術,可以將這些分散的數據資源進行整合,實現數據的互通互聯,這些 “海量”的數字資源為人工智能技術應用于檔案數字化建設打下了堅實的基礎。
二、高校檔案館特點和當前數字化建設現狀
(一)高校檔案館特點是館藏檔案資源數量大、種類多但價值密度偏低
高校檔案館大多館藏了建校以來大量的原始實體檔案。以筆者所在的臨沂大學為例,該校庫藏黨群、行政、教學、科研、外事、財會等十大類檔案共計5.7萬余卷 (冊),檔案數據信息達到了3.9TB,隨著紙質檔案數字化加工和檔案館信息化建設進程,檔案數據容量正呈指數級增長。隨著信息技術的快速發展,高校檔案館不再局限于傳統的紙質實體檔案,而是納入了多元數據,不僅包括電子文件、聲像、圖表等,還涵蓋社交媒體數據、系統流程數據等各種形式的信息。這些數據的格式多樣且來源于不同的部門、機構,每個部門都有其獨特的數據生成方式,不同的數據格式也帶來了存儲方式的多樣化。此外,高校檔案館的館藏數量大、數據種類多,意味著數據價值密度的降低,因為反映同一對象的檔案可能分散在不同的數據類型中,需要通過對各種數據進行提取、分析,才能發現其潛在的價值。高校檔案館保存了大量反映高校歷史、教學、科研等方面的珍貴檔案,具有很高的保存價值,對于學校的決策、規劃、育人等方面具有重要的應用價值。以臨沂大學為例,該校始于抗戰時期的抗大一分校,學校館藏了大量抗戰時期師生抗日斗爭的珍貴史料,這些史料對于學校開展愛國主義教育、堅守共產黨人的初心使命具有很高的研究、宣傳價值。然而,正是因為高校檔案中涉及的信息種類多,這些檔案可能存在相互關聯或重復的情況,因此,高校檔案館需要采用有效的技術手段,提高檔案數據的價值密度。[2]
(二)高校檔案館數字化建設現狀
一是材料歸檔方式單一,數據資源收集主動性不強。當前,大多高校僅依靠人工進行數據信息搜集,不僅難以保障信息的準確性、完整性,還大大增加了管理工作的難度。許多高校數字檔案管理缺少與時俱進的制度設計,其原有的管理制度已跟不上數字化發展的需要。[3]尤其缺少各類專門數字檔案管理制度,導致數據檔案的歸檔不全面、不完整、隨機性比較強。沒有實現電子文件 “應歸盡歸”和電子檔案 “應收盡收”。二是部分高校檔案管理系統老化,基礎設備落后、服務效率較低。目前,各高校都在大力推進檔案數字化建設,檔案數字化資源占比逐漸提高,但由于一些高校檔案管理部門投入有限,未配備信息化管理平臺或管理平臺落后,缺少對檔案信息統計、信息數據分析、數據管理等功能的升級和大數據技術的使用,不能完全適應當前檔案管理數字化的發展需要,無法提供簡潔、高效的智能化服務。三是檔案管理和服務觀念還較為傳統和保守。目前,各高校檔案還是以紙質檔案為主,隨著高校檔案數字化建設的發展,檔案管理人員轉變傳統檔案管理和服務觀念勢在必行,將 “重藏輕用”的觀念向 “藏用并重”轉變,提升檔案管理人員的業務能力和服務意識。
三、大數據和人工智能時代高校數字檔案館建設思路
(一)多渠道拓展數字資源,為數字檔案館建設“筑底”
高校作為國家重要的人才聚集地,讓科研學術資源、創新成果更好地服務于經濟社會發展,是發展新質生產力的內在要求。沒有大量基礎數據資源的支撐并完成高校檔案數字化,在數字檔案館建設中人工智能技術將無用武之地,所以,拓展數字資源建設是實現數字檔案館的首要任務。以下從三個角度進行分析,首先,從技術角度分析,高校可以利用爬蟲技術、API接口等方式,自動收集數據資源,整合到數字檔案館中,通過大數據分析,對收集到的數字資源進行深入挖掘,提取有價值的信息,然后使用云計算、分布式存儲等技術,實現數字資源的高效管理;其次,從用戶角度分析,充分利用人工智能大模型,通過用戶行為分析等方式,了解用戶對數字資源的需求,為資源建設提供指導,這一過程中要優化檢索界面、增強交互性等,并建立用戶反饋系統,及時收集用戶意見,持續改進數字資源建設和用戶服務體驗;最后,從管理角度分析,要制訂數字資源建設計劃,明確建設目標,并建立數字資源的質量評估標準,確保資源的準確性,此外還要與其他機構建立合作關系,共享、共建數字資源。
(二)應用人工智能技術挖掘大數據,為數字檔案館建設“筑基”
高校數字檔案館收集、歸檔、存儲大量數字資源,目的是充分利用這些資源,開展大數據挖掘、分析、提取工作,以發現隱藏在數據中的有價值的信息。所以,高校數字檔案館需要組建一支具備數據挖掘技能的專業團隊,設計挖掘項目,明確挖掘目標、范圍、標準和要求,除了挖掘本校檔案館內的資源,團隊還需要整合其他來源的數據,多源數據的整合有助于發現更全面的信息。此外,數據挖掘團隊要充分運用人工智能數據挖掘技術,幫助團隊從海量數據中提取出有效信息,不斷加強機器學習,優化挖掘策略,以提高挖掘結果的準確性。[4]在智能分類檔案信息時,AI技術可以按照不同的檔案介質,運用相應的關鍵技術對其進行智能化分類。數字檔案館可以運用人工智能技術來智能挖掘檔案信息,運用數據挖掘技術進行檔案價值的智能鑒定。最終的挖掘結果要以易于理解的方式呈現給用戶,所以團隊需要使用數據可視化工具,將挖掘結果以圖表、報告、語音等形式展示出來,并解釋其含義和應用價值。
(三)多體系支撐為數字檔案館建設“筑路”
1.數字檔案管理系統
高校數字檔案館的建設要注重系統的整合性和功能性,建立數字檔案管理系統,是實現這一目標的關鍵。明確數字檔案管理系統的整體架構和技術路線,通過調研,深入了解用戶對數字檔案管理的具體需求,根據需求分析結果設計系統的各個模塊,確保系統能夠滿足用戶的需求。選擇合適的技術,進行系統的開發工作,高校可以采用模塊化的設計思想,提高系統的可擴展性。將高校數字檔案館現有的數字資源進行整合,確保它們能夠無縫地集成到新的數字檔案管理系統中,并將舊系統中的數據遷移到新系統中,確保數據的完整性,充分利用AI技術,根據用戶需求,實現數據分析、個性化推薦等高級功能,提升系統的使用價值。[5]
2.檔案資源數據庫
高校數字檔案館要構建一個全面、靈活的檔案資源數據庫,以滿足日益增長的數據存儲、檢索和利用需求。要分析高校檔案資源的種類、存儲需求等,明確數據庫的建設目標,根據需求分析結果,設計數據庫的邏輯結構和物理結構,通過自動化工具、人工錄入等方式,構建多主體參與、多渠道供給、多形式服務的數字檔案資源供給體系,收集高校內部的各類檔案資源,充分發揮數字化 “工具箱”作用,構建穩定、可靠的數據庫管理系統。
(四)以人工智能技術為支撐,為數字檔案館實現智慧服務“筑智”
1.建立用戶需求感知引擎和智能化人機交互系統
檔案工作者要緊密關注用戶需求,并據此不斷優化服務內容,建立用戶需求感知引擎和智能化人機交互系統。要明確需求感知引擎的主要目標,并通過用戶調查等多種渠道,收集用戶的訪問記錄、反饋意見等數據。人工智能促使人機交互從傳統的 “由輸入到反饋”循環轉變為智能的 “由推薦到選擇”循環,在此基礎上,數字檔案館可以建立智能檔案信息利用服務系統,通過該系統與利用者進行語音交互、視覺交互以及觸覺交互,從而向利用者提供個性化的智能服務。利用系統分析工具對交互數據進行分析,發現用戶的訪問規律、檢索頻率、常用服務、興趣偏好等,根據數據分析結果,建立用戶需求感知模型,這一模型能夠識別用戶的顯性需求和隱性需求,并為用戶提供個性化的服務推薦。此外,要建立實時響應機制,確保需求感知引擎能夠在第一時間捕捉到用戶的需求變化,向用戶提供更高品質的個性化、智慧化服務。
2.提升遠程服務智能和效能
高校數字檔案館不僅需要滿足校內師生的需求,還要積極向校外用戶提供服務,而當前大多數檔案館的查檔方式還是實地查檔,所以,提升遠程服務能力是非常重要的。一是要將人工智能大模型運用到高校數字檔案館建設之中,利用基于AI的自動化處理引擎,進一步降本增效;二是要積極運用、優化遠程智能訪問界面,設計簡潔的用戶界面和交互語言,確保校外用戶能夠輕松訪問檔案資源;三是要加強宣傳和用戶在線智能服務,積極運用官網、微信公眾號等宣傳媒介積極宣傳、推廣數字檔案館的遠程智能服務,提高校外用戶的認知度和使用率,幫助用戶更好地了解和使用遠程智能服務。
(五)加強信息安全防護體系建設,為數字檔案館建設“筑墻”
在大數據和人工智能時代,數字檔案館在為我們帶來便捷高效服務的同時也面臨更加嚴峻的安全挑戰,構筑高效的信息安全防護體系尤為重要。一是要制定信息安全政策,明確數字檔案館的信息安全要求,并定期對政策進行審查,確保其適應不斷變化的安全威脅;二是要對數字檔案館的硬件設施進行加固,防止未經授權訪問,并部署高性能的防火墻和入侵檢測系統,防止惡意軟件的入侵,設計合理的訪問控制策略,確保只有授權用戶能夠訪問特定的數字檔案資源;三是要定期對數字檔案數據進行備份,制訂應急響應計劃,以便在發生安全事故時迅速恢復數據;四是嚴格落實數據檔案安全工作責任制,開展數據安全監測預警、應急演練、專項檢查,提升對數據檔案安全的態勢感知、應急處置和追蹤溯源能力。
四、結束語
當前,高校數字檔案館建設機遇與挑戰并存,通過多渠道拓展數字資源、應用人工智能技術挖掘大數據、建立數字檔案管理系統和數據庫、構筑信息安全防護體系等策略,可以構建一個智能、安全、綠色、高效的數字檔案館,這不僅有利于提升高校檔案服務效率,還能為高校的科研和管理提供數據支持。推進檔案事業數字化、智能化是一個系統性、長期性、漸進性的過程,檔案工作人員還需要不斷加強理論探索和實踐創新,以適應高校信息化發展需求,開創高校檔案數字化、智能化服務體系建設的新局面。
參考文獻:
[1] 中辦國辦印發 《“十四五”全國檔案事業發展規劃》[EB/OL]. [2024-03-20].https://www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.
[2] 余子丹.大數據時代高校數字檔案館建設思路[J].蘭臺世界,2018(12):50-53.
[3] 志偉.基于SWOT分析方法的高校數字檔案館建設思路探討[J].蘭臺世界,2023(07):59-63.
[4] 羅家靖.新 《檔案法》背景下高校數字檔案館建設突破路徑:以深圳大學數字檔案館建設為例[J].黑龍江檔案,2023(02):311-313.
[5] 李倩.人工智能對高校數字檔案館建設的影響與挑戰[J].辦公室業務,2023(11):183-185+189.