高華
摘要:《中國人工智能行業市場前瞻與投資戰略規劃分析報告》表明,預計2021年我國人工智能市場規模將高達千億元,2023年該市規模將達到2000億元。然而,我國檔案管理行業依然處于起步階段,各地信息化建設程度差異較大,面對人工智能的崛起,檔案管理該如何適應?對此,文章重點論述了人工智能技術在檔案管理信息化中的運用,以此來強化檔案管理能力。
關鍵詞:人工智能技術;檔案管理;信息化
隨著大數據、腦神經科學、互聯網等技術的日益成熟,人工智能技術隨著在各行各業運用。習近平在高質量發展的科技創新工作中提出,人工智能是科技革命與產業變革的主要助推力,悄然間改變著我們的生活與工作,促使我們迎來了人機協同、跨界融合、共創分享的智能時代。新形勢下,作為智能政務、智能社會構建的關鍵點,檔案工作同人工智能技術相融合是必然趨勢。在這一形勢下,檔案工作應積極應對人工智能技術所帶來的機遇與挑戰,積極迎合,深入融合,以此來真正提高檔案管理效率及服務水平。
一、人工智能技術概述
人工智能技術屬于新興研究領域,是借助計算機技術及智能控制技術,通過模擬、延伸及智能拓展,形成對信息的感知、獲取與識別能力,從而獲得優異的計算能力。2017年,李克強總理反復強調“想方設法研發人工智能技術,促使其更上一層樓。”同年7月,國院務印發了《新一代人工智能發展規劃》,進一步對人工智能的發展制定了戰略目標。不僅如此,即便是世界范圍內的優秀互聯網企業,其在人工智能發展領域上也保持了驚人的一致,包括谷歌、微軟、臉譜、百度及英特爾等著名企業。現階段,我國在人工智能領域發展迅猛,已然進入人工智能研究領域第一梯隊,這對于我國行業的發展極為有利。
隨著現代網絡信息技術的發展,我國在該領域取得了喜人成果,針對于前沿科技領域的開發,將實現對國外技術的彎道超車。特別是人工智能領域的發展,必然對各個領域帶來全新的變革,數字出版行業屬于重要的文化領域,與我國文化自信戰略緊密契合,人工智能技術的應用將產生強大推動效能。除此以外,人工智能的應用還包括醫療、教育、金融、安防及國防等領域,據相關統計數據顯示,僅2016年全球在人工智能領域的研發投資就高達50億美元,相較于2012年增長了近十倍,依據當前的發展格局和趨勢,預計到2020年年底,該領域的投資規劃將突破1000億美元大關,年投資增速將超20%,其中我國在人工智能領域的投資也將達到100億規模,增長幅度更達到50%以上。未來,隨著人工智能技術的優化與完善,其發展的重點將以大數據智能、群體智能、跨媒體智能、人機混合為主。可以預見,借助各類現代科技的優勢,將使人工智能得到深度發展,形成體系化的應用格局,并在社會行業的實踐推動下,達到技術的迭代、融合與創新目標,推動社會向高智能化挺進。
二、人工智能技術在檔案管理信息化中的重要價值
對于檔案管理信息化工作,人工智能技術的運用可提高其效率與質量,深入開發其使用價值,對傳統管理方式進行了變革與優化。隨著該技術的廣泛推廣運用,極大的簡化了一些機械性流程,包括信息錄入、信息整理以及信息分類歸檔等,顯著提升了檔案信息的準確性,防止因為人工錄入而導致部分檔案信息的真實性無法得到保證,以及由于人為疏忽而讓部分數據信息丟失。檔案管理工作人力投入越來越少,只需投入信息化人才便可。檔案工作的主要內容就是收集檔案,并根據類別將其整理匯總后存檔保存。傳統管理模式下,檔案管理需其他部門的配合,而應用人工智能技術,則將數據收集、分類、排列和存儲步驟簡化了,但效率卻更高了。另外,用戶也能夠更方便的查詢、調閱檔案。在信息社保終端上,用戶只需輸入關鍵詞,并將所需檔案信息很快查找到,具有較強的智能性特征,且信息數據的傳輸速度非常快,進而迅速滿足了用戶查詢檔案的需求。
三、人工智能技術在檔案管理信息化中的具體運用
現階段,檔案行業正處于信息化、數字化時代,信息化系統已普遍運用于檔案管理過程中,其已成為數字化檔案收集、整理以及利用的一項基礎條件,在部門立卷之時,檔案便可以進行數字化收集又或是再檔案整理階段數字化,并能夠高效獲取所需信息。但歷史檔案的數字化以及以物聯網為基礎的管理系統和庫房自動化系統的對接還是將嚴峻的挑戰帶給了檔案館。不論是在線辦理、移動辦理,還是終端辦理和一站式辦理均對信息系統的更新換代提出了非常高的要求。就現階段檔案信息化的實際情況來說,人工智能技術還有非常大的應用空間,在人工智能時代,檔案管理的智能度更高,便利性更大,進而可更大的挖掘、利用檔案的價值。
(一)檔案資源智能收集
在信息檢索工作中,人工智能技術的運用能夠快速、準確地從大規模原始信息中將用戶需求的信息獲取。例如通過Agent方式的運用,按照與先設定的收集規則智能、自主地從信息源進行檔案的獲取收集。因各個Agent有不同功能,且規則不一致,加之需達到的目標也有差異,所以要以具體的數據源為對象,進行不同規則類型的Agent定義。例如,用于某種具有特定格式文件收集的Agent、用于網頁數據收集的A—gent。收集元素數據時,可進行格式化處理,則是基本格式與簡單排序。如把文字檔案轉換為文本格式,并基于時間進行合理排序,簡化后續工作,提高獲取信息的效率。
(二)檔案資源分類挖掘
檔案收集后,便進入了分類及挖掘環節,而分類應以檔案介質的不同為根據合理進行人工智能技術的選擇。例如,在文本檔案中主要采取的技術隸屬于自然語言處理領域,即命名實體識別技術,能夠自動識別存在于文本中且具備特定意義的專有名詞、地名及人名等。隨后,圍繞文本展開基本標注,標注的內容主要包含時間戳、部門、保管等級等用于分類或管理的信息。將這些關鍵詞提取并標注后,以屬性的不同為根據并在機器學習中的聚類等方法的運用下展開分類,倘若具有充足的數據量,神經網絡技術也相當適用。對于檔案中的圖片,可采取人工智能圖像識別技術,如深度學習技術,可高效率識別圖中物體,對其進行迅速分類。有關檔案信息挖掘方面,則是以檔案內容智能檢索、檔案價值智能鑒定為主。分類中,檔案經人工智能技術處理后,獲得了有序的數字化信息,方便了后續的檔案信息挖掘。具體挖掘中,多以數據挖掘領域人工智能技術為主。在智能檢索檔案內容方面,通過信息檢索、知識圖譜等領域中人工智能技術的應用,全文索引檔案內容,挖掘檔案信息并構建彼此間的關聯性,這樣一來就能查找全文同時完成有關聯性信息的自動獲取,最終智能化運用檔案信息。而在智能鑒定檔案價值方面,則是在分類過程中獲取相關信息,并以此為依據對其保管期限、保密登記進行預設,智能化鑒定其價值。