宋雪寧
摘 要:隨著我國智慧檔案館建設縱深發展,數字化背景下檔案服務和檔案利用已經形成了大量數據積淀,為實現檔案數據化管理奠定了基礎。本文從大數據下檔案數據化管理轉型的基礎出發,從檔案服務管理、資源開發和資源利用三個層面論述了大數據下檔案數據化管理轉型的策略。
關鍵詞:大數據;檔案數據化管理;升級轉型;人工智能
隨著信息技術的不斷進步,依托信息技術的各種智能終端的普及,數字化已經在人們的生活中逐漸普及,人們的生活已經全面進入了數據時代。2017年12月27日國家檔案局局長李明華在全國檔案局長館長會議中,明確指出了網絡和信息技術快速發展背景下,我國檔案工作應抓好戰略轉型機遇,逐步實現以信息化為核心的檔案管理現代化。在2019年全國檔案局長館長相關會議中,對于加大檔案科技攻關、加強檔案信息化建設、促進檔案管理現代化發展[1]。隨著數字時代的到來,檔案傳統的技術、記憶功能被數字化記憶打破,信息技術不斷沖擊這檔案傳統載體模式,數字化存儲逐漸被應用在檔案管理與檔案記憶實踐過程中,促進了檔案資源數據化發展。
一、大數據下檔案數據化管理轉型的基礎
當前我們正處在大數據時代,檔案信息形式和檔案存儲資料主要以數字化為主, 檔案管理人員依托多媒體方式和文本形式來實現數字化管理。檔案管理數字化發展為檔案數據化管理轉型奠定了基礎。在當前的分類和整理過程中檔案管理人員主要利用智能技術來進行檢索,比如,自然語言處理等,然而受影響檢索效率的因素是非常多。隨著時代的發展,這種搜索和檢索信息的方式隨著檔案信息數據和形式的日益增多,無法滿足檔案管理的需求。基于此,檔案管理人員可以利用智能化圖片和語言識別方式進行檔案信息搜索,還可以利用機器學習管理模式,對海量的檔案信息資料進行智能化的分類,具體操作為檔案管理人員根據預先設定的方式,對檔案進行分類,并利用人工智能技術收集整理信息。在信息檢索方面,可充分利用人工智能技術的中的檢索功能、普通話處理技術、模式分辨等,篩選檔案信息,確保檔案信息的精準度,同時還可以輸入關鍵詞,借助人工智能技術自動化對一些無利用物價值的信息和數據進行過濾,全面提升檔案管理信息檢索準確性和工作效率的提升[2]。所有的檔案管理和檔案利用數據在數字技術下都將產生對應的“標簽”,為檔案數據化管理轉型奠定了基礎。
二、大數據下檔案數據化管理轉型的策略
(一)檔案服務管理轉型:基礎用戶數據與用戶畫像
利用智能平臺采集檔案用戶數據是實現檔案館精準服務的基礎,把握數據的多維性是做好數據采集工作的基礎。其中,用戶屬性、行為和情景等是檔案用戶數據采集與數據基礎建設的主要類型。檔案用戶屬性數據是檔案用戶在檔案館服務需求時注冊的個人基礎資料,包含了用戶的基礎資料和檔案利用的目的;用戶行為數據是用戶在檔案館檔案利用中產生的數據,主要表現在檔案館網站、檔案館APP后臺等的檔案行為。基于用戶使用所產生的檔案查詢、登錄、閱覽等數據,可以通過數據分析接入檔案服務系統,通過用戶行為反映用戶對檔案的需求和選擇偏好。另外,檔案館工作人員通過隨訪、問卷和觀察等社會調研方式形成的基礎數據也是用戶行為數據范疇;用戶情景數據主要是借助智能技術、RS技術、GPS技術等采集用戶的地理、時間和社交關系等數據,幫助識別用戶所處的實地情況。同時,檔案館在確保用戶數據隱私和信息安全的前提下,與“多為端口”合作,借助爬蟲技術和數據挖掘跟蹤技術跟蹤用戶的數字行為,推動用戶數據共享,滿足檔案利用和服務精準化發展需求。結合用戶行為特征,關聯數據需要挖掘不同用戶的具體行為,做好用戶標簽聚類和相似度計算工作,明確受眾檔案需求結構,為不同用戶和不同群體提供相應的檔案服務,滿足新時期檔案受眾的個性化需求。
(二)檔案資源開發轉型:表征性向數據信息轉型
數字時代檔案資源開發呈現新態勢:對象數字化、工具信息化、主體多元化、過程科學化、目的多樣化。因此,檔案資源開發對象層次不僅局限于信息層面,必須面向多面內容,深入數據層面,獲取細粒度的記憶單元,并且注重記憶數據之間的關聯組織。有序組織是有效開發的前提,從檔案資源開發由表征性向數據信息轉型。一是檔案信息資源開發不斷深化。借助于先進自然語言處理、文本分析和識別、信息分析和抽取等數據分析技術,拆解碎片化的檔案記憶知識內容和數據,獲取出具有碎片化意義的檔案記憶知識單元,“以檔案內容的碎片化增加檔案能量,促進檔案活化,從而可以優先嵌入新的知識建構和創新活動”;二是檔案關聯度加強。利用本體技術,有側重地對核心概念進行本體化處理,如人物、地點、時間、組織機構、事件等,以構建輕量、有機的檔案結構,提高檢索效率與開發靈活度。
(三)檔案資源利用轉型:智能技術助力數據咨詢
毋庸置疑,人工智能集多個學科為一體,智能型公共服務機器人具有引導、講解、人機交互以及自主行走等功能。對此,檔案館可以在館內大廳安排智能機器人,利用機器人接待查閱的檔案的用戶,對其在館藏信息、查閱檔案流程的方面的問題予以解決。同時用戶還可以根據自身查閱檔案信息的需求,輸入關鍵詞后機器人為其快速調取庫房檔案并為用戶提供檔案副本。隨著信息網絡和新媒體日新月異的發展,現階段微信公眾號和官網是每個檔案館所必有的,為了提升檔案服務滿意度,檔案館還可以投入智能系統,充分利用系統線上實時智能功能,及時回答用戶問題,為用戶檔案信息的利用提供方便。對于檔案館而言,同時智能線上與智能服務線下有機結合,一方面為用戶解決了困惑,另一方面還促使自身服務效率的提升。
三、結語
在大數據爆棚式增長的時代,信息、數據、知識是適應時代發展的必然趨勢。在推動檔案數據化管理轉型中,檔案館可以和計算機科學、營銷等領域交流合作,在現有的檔案管理數字化基礎上推動檔案管理數據化發展,從檔案館檔案管理、檔案服務和檔案利用等層面綜合發力,加強大數據在檔案館服務中的理論和實踐探索,促使檔案管理效率的全面提升。
參考文獻
[1] 徐松.數字時代檔案數據化管理問題研究[J].山西檔案,2020(02):142-144+186.
[2] 王曉春.檔案大數據研究的批判性考察[J].山西檔案,2017(04):72-74.