
摘 要:伴隨檔案信息化進程的發展,電子文件智能歸檔問題的研究逐漸成為我國檔案學者們近年來關注的焦點之一。智能歸檔不僅需要明確歸檔范圍作為制度保障,還需要文本、圖像等相似度算法比對原理和機器學習算法等人工智能技術的支持。本文中所介紹的系統通過對擬歸檔文件進行智慧排查,經過系統內置清單、系統比對、四性檢測合格后智能形成元數據,最終向檔案管理部門辦理移交。智能歸檔與一般電子文件歸檔方式相比,具有智能化、自動化、一體化、網絡化等特點。
關鍵詞:電子文件;歸檔;智能歸檔;文本相似度算法;人工智能;機器學習;四性檢測;元數據
我們所說的智能歸檔是指將人工智能技術運用到文件歸檔的過程中去,賦予業務系統智能化的歸檔功能。目前主要表現為對電子文件進行自動的動態智能排查、分類、比對、整理排序、形成元數據并歸檔,整個歸檔工作全部在線智能化完成,并通過機器學習技術逐步提升智能化水平。
檔案管理智能化是當前檔案管理數字化轉型的重要內涵。檔案智能化管理包括歸檔、驗收、整理、日常管理、利用與開發等各個方面的智能化。其中,歸檔智能化是起點和重要組成部分。對此,筆者采用“研用”結合,以廣西高速公路建設項目電子文件歸檔作為實踐對象,探討公路建設項目電子文件智能歸檔的理論與實踐課題。
1 研究現狀
近些年來,隨著人工智能、大數據、機器學習、數字孿生等新一代信息技術的發展和應用,推動了“智能+”的升級優化,成了各行業發展的主流。智能技術應用于檔案管理不僅是信息時代檔案管理的內在需要,更是信息社會發展的必然要求,數智化已經成了檔案管理的重要趨勢。AI人工智能技術與檔案管理深度融合,檔案行業積極探索應用AI智能技術,提高電子檔案管理的質效。人工智能已經進入到場景應用階段,深入落地到各行各業以解決不同場景的問題,也給檔案工作帶來新的發展機遇。[1]順應時代發展,檔案部門積極利用人工智能技術推進電子檔案歸檔模式的改革,檔案管理實踐中涌現出諸多應用人工智能技術升級優化檔案管理系統的案例。“多智能體”系統具有自主性、分布性、協調性,以及很強的自組織能力。在開展異構對接時,可以使前端“零”改造,實現自主組件,實現歸檔、管理、移交階段四性檢測工作,實施電子文檔一體化流程智能管理。[2]KingCloud智能對象歸檔系統,基于訪問行為的語義采集方法,采用灰盒探測(Probe)的方式收集數據訪問熱度、數據布局等方面的信息,并預測歸檔系統的訪問行為,通過文檔分類技術實現了文本文件的分類,利用圖像識別、視頻關鍵幀提取等技術實現圖片和視頻文件的內容元數據獲取。[3]柯尼卡美能達OPS綜合提案服務,利用OCR光學字符識別技術解決方案,將掃描圖像的文字或符號提取分層加以識別,實現物流單據的智能歸檔。[4]檔案學者們對政務信息、企事業檔案的電子檔案歸檔模式進行了全方面的研究。這些研究包括智能歸檔架構和系統[5,6]、數據歸檔優化策略[7-9]、智能歸檔融入公共協同系統[10]等。
綜上所述,大多數學者立足行業內部需求的微觀視角,構建電子文件智能歸檔系統,鮮有學者從宏觀視角優化電子文件智能歸檔流程及系統。本文立足當前新一代信息技術發展的現狀,以微觀和宏觀相結合的研究視角,基于高速公路建設項目檔案管理系統,提出普適性的、可落地操作的電子文件智能歸檔系統設計實現的優化策略。
2 電子文件智能歸檔系統設計實現的演進邏輯
2.1 歸檔策略:由物理歸檔向在線邏輯歸檔轉變
總體而言,傳統文件歸檔是一種以紙質文件為對象的物理歸檔,智能歸檔則是以電子文件為對象的在線邏輯歸檔。
在《電子文件歸檔與管理規范》中對電子文件的歸檔是這樣解釋的:“電子文件的歸檔,按照鑒定標示進行。電子文件的歸檔可分兩步進行,對實時進行的歸檔先做邏輯歸檔,然后定期完成物理歸檔。”[11]對于電子文件的歸檔,主要是檔案管理系統通過計算機網絡工具與業務系統實現一體化,電子文件的歸檔一般分為邏輯歸檔和物理歸檔兩種形式。其中邏輯歸檔是指:“將電子文件的管理權從網絡上轉移至檔案部門,在歸檔工作中,存儲格式和位置暫時保持不變。”[12]物理歸檔是將電子文件卸載到脫機保存的載體上,向檔案部門移交的過程。
在當前的網絡環境中,通過磁盤陣列來保存電子文件是有效的方法之一,但電子文件載體穩定性較差,容易受到破壞,所以歸檔方式選擇是關鍵。實踐的檢驗證明,采用磁盤等脫機采集數據的介質移交的物理歸檔方式易導致資料丟失。相比較而言,智能歸檔采用單一邏輯歸檔方式,是電子文件歸檔新模式,智能歸檔采用了智能化管理信息系統,整個歸檔過程全部在線完成,實現了單點登錄、數據直達,整個過程不需要人工干預,是真正實現了“智能化”的歸檔方式。電子文件,以方便利用為目標,采用不同的邏輯組卷方式,同時研究建設項目擬歸檔文件的歸檔格式和元數據管理,確保了公司內檔案信息的資源共享。在線邏輯歸檔這種歸檔方式提高了歸檔數據的可訪問性、可用性和可管理性。通過在線邏輯歸檔,可以更加便捷地管理和利用大量的電子數據,提高數據的使用價值。同時,這種方式也能夠降低物理存儲空間的需求,減少數據存儲的成本。
2.2 歸檔主體:由人工向人工智能轉變
《電子文件歸檔與管理規范》(DA/T 25)中規定,機關、團體、企業事業單位和其他組織的電子文件,由各該組織的業務主管部門或其所屬單位負責歸檔,這是國家規定的電子文件歸檔主體。
一般電子文件的文件歸屬明晰,其形成于辦公系統或辦公網站,按照一般電子文件的歸檔原則:誰形成,誰歸檔,文件的所有者就是文件的形成者,文件形成者應該負責歸檔這些文件,是歸檔主體。
智能歸檔的主體是人工與人工智能結合,包括以下幾種形式:利用人工智能技術,識別歸檔主體身份,將電子文件識別為可歸檔的電子文件,并對其進行智能歸類、存儲、歸檔;根據已有的電子文件數據,自動生成具有一定價值的檔案數據;對非結構化的電子文件進行分類、分析和挖掘,發現檔案管理中的問題和規律,自動形成檔案管理建議,為檔案部門提供決策參考;在接收到歸檔主體提交的歸檔申請后,自動完成歸檔,并將電子文件納入檔案系統統一管理。
在傳統檔案歸檔模式下,一系列歸檔工作是由人工進行的,工作效率低且易出錯,不能滿足數字化檔案館(室)對自動化管理的需求。智能歸檔系統通過對紙質文件、電子文件和聲像文件進行智能識別和自動整理,并對不同格式的文件進行自動轉換,使紙質文件和聲像文件達到自動化管理,從而實現將傳統檔案管理模式向信息化檔案管理模式轉變。
2.3 技術運用:由傳統技術向人工智能技術轉變
一般電子文件歸檔與智能歸檔在技術運用方面,實現了由傳統技術利用到自動化的轉變。智能歸檔和一般電子歸檔的主要區別在于,智能歸檔利用人工智能和自然語言處理技術對文件進行自動分類和標記,從而實現更快速、更精準的歸檔和檢索。
一般電子文件歸檔主要是對電子文件的元數據進行管理,建立元數據標準體系,對電子文件的各個環節進行準確記錄和描述,為電子文件歸檔工作提供數據支持;記錄和描述電子文件的生成、傳輸、存儲等各個步驟,以便更好地理解和利用它們,同時保證這些信息能夠安全有效地傳遞和共享;對電子文件的存儲方式進行記錄和描述,同時保證存儲環境安全可靠。電子文件歸檔過程中涉及文件格式、壓縮算法、編碼等技術,需要對元數據進行管理。
智能歸檔則是通過對電子文件生命周期各環節的標準化管理,實現對其全面收集、有效管理、動態維護、安全存儲;系統會根據用戶設置的標準,對所收集到的電子文件進行智能化的組織、管理,并在歸檔時,智能判斷當前所收集到的電子文件是否符合標準;系統會自動進行檔案分類,并根據檔案分類標準自動判斷當前收集到的電子文件是否符合標準,并在相應的規則下進行歸檔。智能歸檔系統會根據所收集到的電子文件形成時間和類型進行智能判斷;如果符合歸檔條件,將會對該電子文件進行智能化組織、管理;如果不符合歸檔條件,將不會進行歸檔。智能歸檔在技術運用方面以管理原理為基礎真正實現了自動化,基于文本、圖像相似度算法比對原理,對歸檔范圍進行機器比對、機器學習,對建設項目電子文件進行序列比較,找出序列的相似性,判別序列的差異性,從而智慧排查歸檔文件的真實性、準確性。
相比之下,一般電子歸檔主要依靠人工進行分類和標記,需要人工投入大量時間和精力,難以做到快速、準確歸檔和檢索。智能歸檔技術在效率和準確性上都具有很大優勢。
3 智能歸檔系統設計實現的優化策略
檔案信息化、智能化管理需要以軟硬件系統作為落地的工具。本部分以廣西高速公路建設項目檔案管理系統為例,主要介紹了智能歸檔系統的設計與實現。
3.1 智能歸檔系統總體框架概述
3.1.1 總體流程
電子文件智能歸檔和通過機器學習智能擴充歸檔范圍的總體流程可以用框圖說明(如圖1所示)。
電子文件智能歸檔系統主要是通過對擬歸檔文件進行智能排查(包括四性檢測、系統內置清單、比對系統),根據標準篩選出需要歸檔的文件進行邏輯歸檔,并將歸檔后的文件移交到應用系統或集成平臺。歸檔模塊按歸檔范圍,建立電子檔案驗收的詳細文件目錄標準要求,在進行電子文件整理歸集時,關聯相關對應目錄。輔助系統建立分析規則,案卷管理組卷前,自動分析出電子檔案文件缺漏項,給出分析報告。
3.1.2 主要功能
智能歸檔的主要功能是基于BLAST和文本相似度算法智能比對、排查擬歸檔文件。
(1)基本要求。《中華人民共和國檔案法》已明確提出“電子檔案與傳統載體檔案具有同等效力,可以以電子形式作為憑證使用”。[13]即電子檔案具有與傳統檔案同等效力,同樣可以作為使用憑證。同時要求“電子檔案應當來源可靠、程序規范、要素合規”。這些要求可以理解為電子文件檔案的真實性、可靠性、完整性及可用性(以下簡稱四性)的保障。關于電子檔案的歸檔時間,不同的單位有不同的要求。“電子文件形成或辦理部門應定期將已收集、積累并經過整理的電子文件及其元數據向檔案部門提交歸檔,歸檔時間最遲不能超過電子文件形成后的第2年6月。”[14]對于項目文件歸檔進行智能排查需要考慮到對建設項目電子文件進行序列比較,找出序列的相似性,判別序列的差異性,從而確保智能排查歸檔文件分類排列的科學性和文件本身的真實性、準確性。根據文本、圖像相似度算法,系統
(2)制定智能排查的規則。系統內置清單。以項目建設期各種業務系統的集成平臺為基礎,將項目建設期的項目文件收集范圍細化到具體文件清單,內置于系統。同時,系統內置各類比對條件。系統對擬歸檔的電子文件實行自動排查,判斷建設期內收集、歸檔的電子文件的完整性、真實性、準確性和系統性。自動判斷文件簽署真實性,自動識別影像文件真偽性。制定項目檔案完整性的相關標準,這些標準主要包括對前期管理文件的完整性、設計文件的完整性、施工技術文件的完整性、監理文件的完整性、設備文件的完整性、聲像文件的完整性、竣工驗收文件的完整性進行評價。
建立與項目檔案準確性有關的標準。這些標準主要包括對歸檔文件材料內容的準確性、竣工圖編制質量是否符合要求、聲像文件質量是否符合要求進行評價。比對文件歸檔規范,鑒定文件的準確性。系統內置公路建設項目歸檔范圍和文件材料歸檔辦法、實施細則,電子文件準確性的判斷條件,分別比對收集的文件內容是否符合標準規范、與客觀事實是否相符,包括文件的內容信賴度、責任者、規范性題名、密級、保管期限、行業標準等。
制定項目檔案系統性的相關標準。這些標準主要包括:能不能體現工程特征與實況;組卷標準及合理性,能否達到國家或行業標準的要求,能否按照文件材料的形成規律、成套性要求進行組卷,卷內文件排列是否有序、科學;檔案目錄能否達到要求;案卷題名簡潔明了,準確無誤;案卷封面、卷內文件目錄和備考表以及案卷目錄的填寫是否詳細屬實,標準是否翔實、規范。
比對文件特征元素,著錄和管理元數據。系統內置建設項目電子文件歸檔范圍及類型族譜、保管期限、密級、元數據項目及要求等標準值,分別比對系統原生文本型、其他業務系統導入型、單個文件錄入系統型、文本數字化型、聲像型等不同類別文件的元素,人工輔助下系統自動完成電子文件元數據著錄和管理。
(3)系統內置清單。課題以公路建設期各種業務系統的集成平臺為基礎,將公路建設期項目文件收集范圍細化到具體文件清單,內置系統。同時,系統內置各類比對條件。系統對擬歸檔的電子文件實行自動排查,判斷建設期電子收集、歸檔文件的完整性、真實性、準確性和系統性。自動判斷文件簽署真實性,自動識別影像文件真偽性。根據單位的實際情況以“以我為主”的檔案思想編制三合一制度表,明確檔案分類方案、歸檔范圍、保管期限等。制定公路建設項目檔案分類方案、公路建設項目文件材料歸檔規范和公路建設項目檔案保管期限表三合一制度,實現系統在歸檔環節的三合一智能歸檔,在一體化系統建設過程中嵌入三合一制度,使系統能夠自動查找并識別文件歸檔范圍、檔案門類及保管期限,實現智慧歸檔。
(4)基于機器學習的歸檔范圍外的增量電子文件智能歸檔。并不是所有歸檔文件都是預定的,會出現一些增量電子文件。對于這些增量電子文件,我們一方面根據增量電子文件的具體情況,繼續完善三合一表;另一方面基于機器學習等技術進行歸檔范圍外的增量電子文件智能歸檔。
基于機器學習算法、圖片EXIF信息盲取技術,對新增的電子文件進行智能判斷,充實和擴充電子文件歸檔邊界。根據數據庫累增的增量數據,不斷修正項目文件收集、歸檔方法與范圍,提升歸檔智能水平。對超越系統內置范圍的電子文件,系統從首個開始,到逐漸新增的、重復的或類似的電子文件進行“學習”,實現智能判斷,逐漸擴大歸檔范圍,實現電子文件“應收盡收”智能歸檔。系統借助實現“互聯網+”電子檔案,實現項目電子檔案異地、遠程監管,改變傳統紙質檔案采用專家驗收的繁瑣性和人為的差異性,為項目建設提供真實、完整和系統的檔案保駕護航。
3.2 智能歸檔系統所使用的主要技術方法
從技術角度來說,為確保歸檔文件的真實性、準確性、完整性和系統性,利用智慧排查比對擬歸檔文件進行四性檢測、自動歸檔,需要BLAST和文本相似度算法相關技術來為實現電子文件智能歸檔提供保障;對于智能歸檔輔助系統的實現,需要基于機器學習算法對歸檔范圍外的增量電子文件進行歸檔,完成輔助軟件系統的建設后,就可以實現識別、分類整理、入庫和歸檔的全自動化操作。應用到的具體技術主要包括:
3.2.1 基于BLAST和文本相似度算法
BLAST全稱BasicLocal Alignment Search Tool,即基于局部序列比對算法的搜索工具。原是由美國國家生物技術信息中心(NationalCenter for Biotechnology Information,NCBI)開發和管理的一套生物大分子一級結構序列比對程序。該系統可將輸入的核酸堿基或蛋白質氨基酸序列與數據庫中已知的來源序列進行比對,輸出序列之間的同源性信息,從而輔助判斷輸入的序列來源或與已知序列的進化關系。該系統的功能可以擴展到其他信息管理領域,網絡版可將輸入序列與龐大的已知來源序列信息庫進行比對,用來確定未知序列的來源,以及尋找不同物種中的同源基因;智能歸檔系統主要是本地版的BLAST系統,它是將輸入序列與本地自行構建的序列信息庫進行比對,比對的針對性更強,用于在未發表基因組數據庫中尋找同源基因信息,不依賴于網絡,安全性和可靠性更高。
相似度算法就是使用計算機系統比較對象間的相似度,常見的相似度計算應用包括數據分析中的相關分析、數據挖掘中的分類聚類算法、機器翻譯、文檔檢測、搜索引擎的對象推薦等,是信息檢索、數據挖掘等的一個基礎性計算方法。現有的相似度計算方法多數是基于向量的,即計算兩個向量之間的距離,距離越近越相似。包括歐氏距離、余弦相似度、編輯距離、杰卡德相似度等算法。用于檔案數據保真的哈希值算法就是相似度算法的一種。相似度算法應用于歸檔主要是文本內容相似度計算。但文本不僅僅是文字,除文字的匹配外,還可以是圖片、音頻等。
3.2.2 基于機器學習算法
“機器學習”在1959年由IBM公司的計算機科學專家亞瑟·塞繆爾(Arthur Samuel)提出,賦予它的定義為:“可以提供計算機能力而無需顯示編程的研究領域”[15]。學習是系統所做的適應性變化,使得系統在下一次完成同樣或類似的任務時更為有效。
當有了上述智能比對功能后,我們需要通過機器學習來不斷改善該功能,即是通過經驗自動改進與提升計算機算法的能力。在智能歸檔工作中引入機器學習工具,可以充分利用機器學習的優勢,根據不斷積累的信息和陸續歸檔機器記憶,系統對有查考利用價值的文件進行反復判定歸檔、監督學習,精準利用。從復雜、多維的數據中掌握擬歸檔文件的內在本質特征,構建歸檔模型,提升對原有范圍內電子文件智能歸檔的準確率,并實現對增量電子文件歸檔的自動識別能力。
完成歸檔工作后,后續相同的歸檔工作,經過機器學習的自我完善和改進后,會更便捷、更完整、更高效地完成。
通過機器學習算法,我們還可以智能化地豐富增量電子文件的范圍,打破文件歸檔邊界,精準檔案利用。基于機器學習算法原理,系統應用機器學習算法語言,從不斷累積的數據庫中智能豐富歸檔有查考利用價值的電子文件,提供精準的檔案利用。
機器學習是人工智能的核心,是使計算機具有智能的根本途徑。機器學習專門研究如何讓計算機具有類人化的學習行為,希望機器能夠自我獲取新的知識或技能,自我重新組織、完善已有的知識結構,不斷提升自身的性能。它的應用已遍及人工智能的各個分支,如專家系統、自然語言理解模式、自動推理、識別計算機視覺等領域,其中以專家系統最為典型。
機器學習算法分為兩大類:監督式學習(supervisedLearning)和非監督式學習(unsupervised Learning)。智能歸檔系統首先使用的是監督式學習,即通過嵌入三合一表等已知答案,讓計算機反向找出解題的邏輯。非監督式學習則是智能歸檔系統進化到較高級階段的機器學習形式。即:機器在沒有類別信息的情況下,通過對歸檔過程中大量的增量文件樣本的數據分析,實現對增量文件樣本進行自動分類的一種數據處理方法。
3 . 2 . 3 數據交換技術
試驗、計量、O A ( O f f i c eAutomation,即自動化辦公系統)、征地拆遷等各類業務系統集成平臺,建立數據交換平臺。建立電子文件信息數據庫和業務系統數據交換平臺中心,研究在線 “隨辦隨歸檔”“誰辦誰歸檔”和“歸檔—驗收”一體化。隨著不斷豐富的海量數據信息,利用機器學習算法,系統智能修正和打破電子文件的歸檔邊界,精準利用檔案。
3.2.4 應用防篡改技術
系統內置不同類型電子文件真實性判斷條件、管理制度,分別比對各類電子文件是否來源可靠,鑒定文件內容在傳輸、存儲、遷移過程中是否發生未經授權未的篡改、利用和隱藏,保證其原始性,判斷其真實性,包括系統原生文本型電子文件記錄的各類數據信息、常用業務系統導入系統的信息、PDF或OFD電子文件信息、聲像文件信息和電子簽章的安全、可靠性。其中,利用電子簽章技術,通過身份認證實施有效的固化措施,有效防止電子檔案被篡改或被保留,從而確保其真實性、完整性。
3 . 2 . 5 計算機視覺判斷聲像文件技術
計算機視覺(computer vision)的主要任務是利用相機或電腦獲取圖片,采用對圖片進行處理和解析數字圖像的方法,從現實世界中提取高維數據,這是將圖片轉化為數據的過程。對于歸檔范圍外的增量電子文件的智能歸檔,就是基于圖片EXIF信息的盲取技術,系統根據圖像辨識物體、場景和活動的真實性和隱含的信息,自動著錄部分元數據和人工校驗、補充元數據,對電子文件進行智能分類。
3.2.6 語音識別指令判斷技術
語音識別技術的運用,可以提升整個系統的智能化水平。運用于智能歸檔的語音識別系統應包含幾個主要操作:用戶注冊、文件檢測和擬歸檔文件在線排查。
通過反復發出語音指令后,系統會根據語音指令,對電子文件進行判斷和智能排查,再一次的排查和判斷對歸檔范圍的擴大提供了可能性。通過建設語音指令系統,提升人機互動質量,提升在線排查檢測擬歸檔文件的內容質量,擴大了歸檔范圍,降低了人工排查的成本。
語音識別系統需要注意的是對間接語音的理解問題,如果說話者說的內容過于口語化,就會出現語音識別系統無法識別的情況。針對這個問題,在技術方面要不斷優化語言庫系統,減少信息來源的差異,可以使用方言檔案數據庫和多語種語音庫對語音識別模型進行訓練,進一步提升模型的識別能力,而對于說話者來說,需要盡量簡潔地使用專業關鍵詞將想要表達的內容說出來。目前語音識別技術對于錄音錄像檔案查全率、查準率的提升作用還不夠顯著,語音識別技術的相關研究更應注重編目和著錄環節。
4 結論
在歸檔環節中,智能歸檔所采用的智能化管理以計算機操作的形式,提高了文件歸檔效率并節省了大量時間成本,還能最大程度確保檔案信息安全。對于歸檔范圍外的增量電子文件,根據數據庫累增數據存量,不斷修正項目文件收集、歸檔方法與范圍,提升歸檔智能水平。本文運用人工智能技術闡述了智能歸檔系統總體框架以及基于機器學習算法、設置內置清單、采取數據交換技術的系統設計亮點。電子文件智能歸檔的研究實現了項目檔案異地、遠程監管,改變了傳統紙質檔案的煩瑣性和人為的差異性,為項目建設提供真實、完整和系統的檔案基礎。電子文件智能歸檔基于本系統可實現電子文件與電子檔案同步管理,與一般電子文件歸檔相比具有更高的效率,作為一種較高級的邏輯歸檔形式,其方便快捷的操作方式,是傳統紙質檔案管理向數字時代轉變的重要體現。
總體上看,現有標準已經能夠有效支撐電子文件歸檔智能化的實踐推進,為各實踐主體的進一步探索提供了基礎條件。同時,電子文檔管理的智能化探索,也有利于現有標準的優化。
本文系2021年度國家檔案局科技項目“公路建設項目電子文件智慧歸檔研究”(項目編號:2021-X-04)階段性成果。
參考文獻:
[1]周楓,呂東偉.基于“智能+”檔案管理初探[J].北京檔案,2019(09):39-41.
[2]康勇,袁敬.“多智能體”技術在政務服務“一網通辦”電子文件歸檔管理中的應用[J].中國檔案,2023(04):64.
[3]繆嘉嘉,付印金,毛捍東.KingCloud:智能對象歸檔系統[J].計算機科學,2016(S2):575-577+596.
[4]“把脈”物流巨頭,柯尼卡美能達OPS綜合提案服務顯效無線傳真智能歸檔[J].辦公自動化,2013(09):35-36.
[5]王爍,穆佳桐,于鯤.基于人工智能技術的智能歸檔與管理模型系統平臺構建研究[J].蘭臺世界,2022(08):55-58.
[6]李芳,范海斌.煤炭企業大數據智能歸檔利用體系建設實踐[J].浙江檔案,2022(07):59-62.
[7]薛四新,黃麗華,楊來青等.大數據環境下政務信息資源歸檔研究的框架體系[J].檔案學研究,2018(04):92-96.
[8]朱令俊.數據驅動下檔案知識發現的路徑研究[J].檔案與建設,2020(02):30-34+13.
[9]施千里,王睿.核電行業電子文件合規性管理體系構建研究[J].山西檔案,2023(03):156-162.
[10]羅蘭.電網企業文檔一體化管理優化策略探究[J].蘭臺內外,2024(01):40-42.
[11]國家檔案局.電子文件歸檔與電子檔案管理規范:GB/T18894-2016[S].北京:中國標準出版社,2016.
[12]國家檔案局.電子文件歸檔與電子檔案管理規范:GB/T18894-2016[S].北京:中國標準出版社,2016.
[13]全國人大常委會.中華人民共和國檔案法[S].北京:中國法治出版社,2020.
[14]國家檔案局.電子文件歸檔與電子檔案管理規范:GB/T18894-2016[S].北京:中國標準出版社,2016.
[15]Samuel·A,”Some Studies in Machine Learning Using the Game of Checkers”,IBM Journal Of Research And Development,3(03):,1959,pp.210-229.
(作者單位:廣西新祥高速公路有限公司 胡文學,董事長,教授級高級工程師;廣西民族大學管理學院 丁海斌,博士,教授,博士生導師;齊魯理工學院 趙婧堯;廣西民族大學科技史與科技文化研究院 羅夏鉆,博士研究生;武漢大學信息管理學院,顏晗,博士研究生來稿日期:2024-02-20)