文/上海財經大學檔案館(校史館、博物館) 李倩
高校是人才培養和學術研究的重要場所,其所產生的大量文獻和資料有著巨大的歷史和文化價值。為了更好地保護和利用這些珍貴的文獻和資料,高校數字檔案館建設已經成為一項重要的任務。數字檔案館的建設,不僅可以保護珍貴文獻和資料,還可以為后人提供文獻查詢和學術研究的便利。本文將分析人工智能對高校數字化檔案建設的影響與挑戰,并提出一些解決方案。
人工智能是一種模擬人類智能的技術,包括機器學習、自然語言處理、計算機視覺等多個領域。近年來,隨著計算機科學技術水平的不斷提高和算法的不斷優化,人工智能技術已經在各個領域得到廣泛應用。
(一)機器學習。是人工智能技術的一個重要分支,其主要目的是通過算法讓計算機自動學習并改進自己的性能。機器學習可以應用于語音識別、圖像識別、自然語言處理等多個領域,如谷歌的AlphaGo就是一種基于機器學習的人工智能棋手。
(二)自然語言處理。指計算機能夠理解和處理自然語言的技術。其應用范圍廣泛,包括機器翻譯、情感分析、文本分類等多個領域。如微軟的小冰就是一種基于自然語言處理技術的聊天機器人。
(三)計算機視覺。指讓計算機理解和處理圖像和視頻的技術。其應用范圍廣泛,包括人臉識別、圖像搜索、自動駕駛等多個領域。如谷歌的圖像搜索就是一種基于計算機視覺技術的搜索引擎。
(一)人工智能賦能數字檔案信息化建設。人工智能技術可以有效提升數字檔案信息化建設的效率,可以自動檢測檔案信息,快速準確地進行歸類和分析,大大降低人力成本,提高工作效率。人工智能技術能夠改善數字檔案信息化建設的質量,有效解決檔案信息的檢索、歸類等問題,更好地為用戶提供服務。此外,人工智能技術還能改變數字檔案信息化建設的結構,可以實現檔案信息的自動化處理,大大改變傳統檔案信息處理模式,實現更加高效的管理。
(二)借助人工智能技術建設智能化數字檔案館。在人工智能背景下,數字檔案館可以利用AI技術進行更加智能化和高效的數字化處理、管理和利用,建立云端數字檔案系統,人工智能技術可以幫助高校數字檔案館實現數字化目標。如通過OCR技術將紙質文獻和資料數字化,從而使其能更加方便地存儲、檢索和利用。數字化后的檔案數據可以存儲在網絡云端或者專門的數字化存儲設備中。將歷史檔案數據進行數字化,并存放在學校統一建設的云存儲上,使檔案館的老師能夠隨時隨地訪問和檢索,不僅提高了工作效率,盤活了歷史檔案的價值,還能夠保障歷史檔案數據的存儲安全。
此外,基于AI的自動化處理引擎,通過機器學習算法自動識別文獻和資料的類型和屬性,對數字檔案進行統一的數據標準化處理,包括統一的命名規則、元數據標準、數據格式標準等,能夠減輕人工處理的負擔,提高工作效率,方便管理和利用。
建立檔案數據關聯分析平臺,通過智能分析和模式識別,分析不同歷史檔案的關聯信息,挖掘出檔案內部的潛在聯系,從而實現關聯查詢和模糊查詢功能,可以為檔案利用業務提供更加精準的檔案查詢服務。構建檔案智能審核系統,借助機器學習技術,自動識別檔案中的信息,并基于識別結果進行分類存檔以及檢測檔案中的錯誤等,能有效提高審核效率。構建智能檔案管理系統,建立大數據智能管理系統,能夠有效管理檔案的歸檔、檢索、統計等工作,提高檔案管理效率。
(一)數字檔案館建設內容。上海財經大學檔案館以建設“數字化智慧檔案館”為核心,實現了檔案管理過程的科學化、規范化、自動化,提供了跨部門、跨單位、跨職能、跨組織的檔案智慧管理服務。數字化智慧檔案館建設內容主要包括檔案數字化收集系統、檔案自動歸檔系統、檔案綜合管理系統、數字檔案云存儲系統、檔案利用綜合服務系統、檔案存儲與保護系統以及電子簽章密碼認證系統對數字檔案的鑒定等。
檔案數字化收集系統,對接上財管理信息系統2.0平臺,自動收集來自辦公自動化系統的公文、內請、督辦等電子文檔,教學管理系統、研究生管理系統的學生信息表、成績單、錄取名冊等學生檔案,人事管理系統的干部人事檔案數據,科研項目管理系統中的科研及教學成果,評教系統中的教師評價表,教師培訓管理系統中的教師培訓及發展電子檔案等,實現了電子檔案自動收集的應用場景和目標。
檔案自動歸檔系統的數據來源于電子檔案自動收集的所有數據,自動歸檔系統根據自定義規則,把不同門類的數字化檔案自動分類、編排后,統一建立索引并歸檔保存,以方便后續的檔案利用和檔案管理。
檔案綜合管理系統主要實現檔案登記、檔案編目、檔案分類、檔案存放、檔案查詢、檔案審核以及檔案的安全管理等功能,實現檔案的審批、審核,提高檔案的安全管理效率。
數字檔案云存儲系統實現檔案存放管理、檔案檢索管理的功能。另外,暴露開放的API給檔案綜合管理系統遠程調用,包含檔案的檢索、查詢等功能。
檔案利用綜合服務系統實現了用戶查檔信息登記、館員查檔調閱、復印打印、郵件快遞等信息化管理,實現了檔案利用一站式服務。其通過系統實現數字檔案的共享,方便各部門或組織之間的檔案調用,提高檔案管理效率。
檔案存儲與保護系統主要實現數字檔案的備份、數據的恢復、歷史數據的存檔等功能,可有效保證檔案的安全,防止檔案的意外丟失或損壞。
電子簽章是一種新型的檔案管理工具,借助電子簽章技術建設數字檔案鑒定系統,對查檔用戶進行身份驗證,并準確記錄每次檔案使用的時間、內容以及使用者的身份等信息,以便于館員更好地監督檔案的使用情況。其中,實現檔案的分級存儲,根據檔案的重要性給予不同的權限,以確保檔案的安全。對于日常煩瑣的數字檔案鑒別真偽這項常規工作提供了新的技術手段,用戶只需要自主到系統里去鑒定,無須館員的人工接入,大大減少了工作量,也受到查檔用戶的一致好評。
(二)數字檔案館建設的經驗總結。為了順應數字化轉型的發展趨勢,高校檔案館自2019年啟動并穩步推進數字檔案館的建設,努力建設一套功能完善、管理有序、便捷高效的管理體系,規范學校數字檔案的收集、歸檔、管理、利用、存儲、備份等整套流程,實現了數字檔案收集的自動化、智能化,聲像檔案管理的信息化、規范化,檔案利用的自助化、流程化。其中電子簽章技術應用于檔案鑒定的創新工作思路,簡化了人工鑒定時代煩瑣復雜的工作流程。另外,檔案管理系統可自動收集和統計并生成可視化報表和館領導“駕駛艙儀表盤”,方便館領導從全局科學地掌控檔案工作的全貌,科學輔助領導層做決策。
目前,一期的項目已經完成階段性工作,確定了數字檔案館的功能定位,把握好了數字檔案館的功能結構,制定了符合學校實際的功能定位;建立了學校數字檔案館的數據架構,建立了完善的數據管理機制,制定了相應的數據管理規范,并以此為標準加強數據管理,推動了學校數字檔案館的信息共享,達到了項目的驗收標準,為數字檔案館未來的建設夯實了基礎,也為上海市數字化轉型標桿學校的順利驗收做出了一定的貢獻。今后,我館將繼續推進數字檔案館二期的建設進程,認真總結,及時改進工作,并加強同兄弟院校的交流互訪,使得數字檔案能夠更好地支撐學校的中心工作,讓數字檔案賦能人才培養和學科建設。
(三)數字檔案館的建設路徑。具體如下:
1.制定數字化建設規劃。高校檔案館應先制定數字化建設規劃,明確數字化目標、范圍、標準和要求,確定數字化資源建設和數字化服務的方向和目標。評估高校檔案館的數字化資源現狀和需求,確定數字化的文物資源、目標受眾、數字服務范圍、數字化存儲需求等,為后續數字化工作提供指導。高校檔案館還需確定數字化建設方案,包括數字化流程、數字資源管理系統、數字化存儲設備、數字化服務等,確保數字化工作的高效性、規范性和可持續性。對需要進行數字化建設的工作,包括文物數字化、元數據制作、數字化存儲、數字化管理系統開發等,應建設數字檔案館數字資源庫和數字服務平臺。
2.數字資源管理。高校檔案館需要對數字資源進行分類、編目、檢索、保存、備份、維護等管理工作,確保數字資源的長期保存和服務能力;需要為用戶提供數字化服務,包括數字資源的在線展示、查詢、下載等服務,以滿足不同用戶的需求。數字檔案存儲一般包括本地存儲和云存儲。本地存儲指在本地計算機或服務器中存儲,云存儲指將數字檔案存儲在云端,使用云存儲可以提高數據的可靠性和可訪問性。為了保障數字檔案的安全性和完整性,需要定期進行數據備份。備份可以采用本地備份和云備份的方式,以保證數據在出現故障或者損壞時能夠得到恢復。
3.監測評估。高校檔案館需要對數字檔案館的數字資源、數字服務等方面進行監測和評估,包括數字資源使用情況、用戶滿意度、數字資源保存狀況等,為數字檔案館的后續發展提供參考依據。還要充分考慮數字化資源的特殊性,科學規劃,全面布局,有序推進,創新服務,確保數字化工作的高效性、規范性和可持續性。
(四)人工智能對高校數字檔案館建設的挑戰。一是隱私泄露。在數字化和自動化的過程中,高校數字檔案館可能會涉及用戶的隱私信息,如個人身份信息、社會保障號碼、成績單等。因此,高校數字檔案館需要采取有效的安全措施來防止隱私泄露,如采用加密技術保護用戶隱私信息,建立完善的安全管理機制等。其中使用AI技術進行數據處理和挖掘時需要保障數據的隱私和安全。二是數據質量。高校檔案涵蓋了豐富的歷史文化和知識資料,這些資料需要高質量的數字化轉換以及有效的數據標準化分類。數字化和自動化需要大量的數據支持。因此,高校數字檔案館需要建立完善的數據管理機制來保證數據的質量。如需要對數據進行分類、整合、清洗等處理,確保數據的準確性和完整性。三是高效存儲和檢索。AI技術可以通過語義分析和自然語言處理等技術,實現高效的檔案存儲和檢索,方便學者和研究者快速獲取所需信息,還可通過自然語言理解和智能問答等技術,為學者和研究者提供智能化的問答服務,解答他們的疑問和需求。四是技術壁壘。人工智能技術需要專業的人才和先進的設備來支持。因此,高校數字檔案館要投入大量的人力、物力和財力來建設和維護。此外,人工智能技術的快速發展也要求高校數字檔案館不斷跟進和更新技術,以適應新的需求和挑戰。
高校數字檔案館是高校信息化建設的重要組成部分,具有重要的文化、歷史和教育價值。人工智能技術作為一種新興技術,為高校數字檔案館的建設和發展提供了新的機遇和挑戰。
在數字化、自動化和智能化的過程中,高校數字檔案館需要注意隱私保護、數據質量和技術壁壘等問題。因此,高校數字檔案館要不斷跟進和更新技術,積極探索人工智能技術在數字檔案館建設和服務中的應用,更好地服務于高校的教育和研究工作。
此外,高校數字檔案館也需要加強與其他高校之間的協作和共享,建立數字檔案館聯盟或者平臺,共同促進數字檔案館的建設和發展。同時,數字檔案館也需要與相關部門、機構和企業進行合作,共同推進數字檔案館的普及和應用。
高校數字檔案館的建設和發展離不開人工智能技術的支持和應用。在數字化、自動化和智能化的過程中,數字檔案館需要注意隱私保護、數據質量和技術壁壘等問題。未來,數字檔案館還需要與時俱進,積極探索人工智能技術在數字檔案館建設和服務中的應用,更好地服務于高校的教育和研究工作。