牟凱旋
摘 要:檔案鑒定雖然有著成熟的理論體系和較為完整的規范,但囿于實踐取向與鑒定者能力的不同,其工作質量與客觀性存有不足。通過知識挖掘,將檔案鑒定中的知識規范化地表述出來,然后以之為基礎,構建并應用檔案初級鑒定系統,能夠以系統的規范化操作來提升檔案鑒定工作的質量與客觀性。
關鍵詞:知識挖掘;檔案鑒定;系統
Abstract: Despite the developed theories and specifications, the quality and objectiveness of the archival appraisal is weakened by the actual situation and the disparity of the operators ability. Based on the formulation of the knowledge in archival appraisal practice by knowledge mining, maybe we can improve the quality and objectiveness of archival appraisal practice by structuring and applying an primary archival appraisal system.
Keywords: Knowledge Mining; Archival Appraisal;System
知識挖掘,是知識管理領域的重要內容,是信息處理方面的新技術。知識挖掘的目標非常明確,那就是對目標對象進行分析處理,進而獲得有實際意義的知識。在信息時代,知識挖掘是非常有益的,因為它有助于從龐大的數據、信息中獲取有用的知識。知識挖掘的知識抽取、分析與聚類整合過程對于目前的檔案鑒定工作有著一定的啟發意義。當前的檔案鑒定工作存在著明顯的主觀性與手動性,其客觀性與工作效率存在著一定的不足。將知識挖掘應用到檔案鑒定工作中,構建有效的檔案初級鑒定系統,對于提高檔案鑒定工作的質量與客觀性大有裨益。
1 知識挖掘概述
1.1 概念。關于知識挖掘的定義較多,其中Usama M.Fayyyad給出的定義:“知識挖掘是從數據集中識別出有效的新穎的潛在有用的以及最終可理解的模式的非平凡過程”,被公認為較為中肯。知識挖掘可根據信息載體的不同分為圖像知識挖掘、數據挖掘和文本挖掘。相比于已經形成較為成熟的程序化技術方法的數據挖掘,知識挖掘領域目前的著眼點主要在于隱性知識的挖掘,尚未形成模式化的技術方法,更注重依據研究對象的特點,有針對性地開展具有一定主觀性的挖掘活動。
1.2 技術方法。雖然上文述及知識挖掘與數據挖掘相比,體現出一定的主觀性,但是知識挖掘涉及數據庫技術、人工智能、統計學等多種學科的技術基礎,這決定了它能夠以現代化的信息技術構建出比傳統的經驗總結更具客觀性和科學性的方法體系。目前常用的知識挖掘的技術方法有聚類分析、神經網絡方法、決策樹方法、遺傳算法、規則推理等方法。統計學方法與人工智能在知識挖掘中有著重要的作用,它們的應用有助于人們通過知識挖掘對抽取出的大量潛在知識進行高效的分析。
1.3 流程。目前對知識挖掘流程的研究尚未成熟,尚未產生公認的知識挖掘流程體系。一套完整的知識挖掘流程應當包含確定應用領域、建立目標數據集、數據預處理、數據轉換、數據挖掘、數據評價這幾個步驟。
2 當前檔案鑒定的主要理論與方法
檔案鑒定理論迄今發展已經較為成熟。早期法國在檔案管理工作中確立的來源原則和普魯士的邁斯奈爾提出的“高齡檔案應當受到保護”的觀點為檔案鑒定提供了初步的框架,這兩條準則至今仍然適用。其后的檔案鑒定方法更為成熟,更為系統,對檔案鑒定工作更具現實的指導意義。波蘭檔案學家卡林斯基提出了“職能鑒定論”,認為檔案的價值取決于其產生機關的職能與地位。這一理論對檔案鑒定實踐具有重要的、突出的意義。英國檔案學家謝拉里·詹金遜根據古典檔案理論,提出檔案工作者只是檔案的保管者、保護者,不宜對檔案進行鑒定,檔案鑒定應當是行政人員的職責。美國的謝倫伯格在總結前人研究成果的基礎上提出了雙重價值鑒定理論,將檔案的價值區分為對其產生機關的第一價值(初始價值)和對其他利用者的第二價值(從屬價值),第二價值又分為證據價值和情報價值。謝倫伯格的理論對檔案價值進行了全新解讀,使得檔案的價值系統地、有層次地展現在人們眼前,對現今的檔案鑒定理論與實踐有著顯著的影響。
以上這些理論形成了檔案鑒定方面的基礎性理論,在此之后的檔案鑒定理論在這些理論之上有了新的發展。社會分析和職能鑒定理論是對卡林斯基職能鑒定理論的繼承與發展,其將檔案鑒定的重心放在了對檔案形成機關職能的系統化分析,區分不同的職能、活動與計劃及其之間的聯系,并依其不同的重要性來對檔案進行鑒定。
總的說來,根據上述理論以及檔案工作實踐,檔案人員在對檔案進行鑒定時主要依據其形成機關的職能地位或檔案本身的價值來進行鑒定。檔案人員通過對鑒定理論的內化,以及在實踐中的探索來對檔案進行鑒定的活動,表明檔案鑒定活動中存在著公認的隱性知識,只有獲得了這種隱性知識的人員才能對檔案進行有效的鑒定。對這種隱性知識進行挖掘有助于我們構建檔案初級鑒定系統。
3 檔案初級鑒定系統構想
筆者所定義的檔案初級鑒定系統,是基于目前的檔案鑒定理論與實踐經驗所構建的一個自動化系統。該系統將此前檔案工作者鑒定檔案時所依賴的知識素養與工作經驗通過知識挖掘整合到其中,進而依據擬定的規則對檔案進行初步的鑒定,輸出鑒定結果,并將未能形成鑒定結論的檔案交由檔案工作者進行鑒定。所謂“初級”,一方面是指這套系統可能尚不成熟,還需不斷完善,提高準確性;另一方面是指這套系統在檔案鑒定工作實踐中,可能只是輔助工具,無法徹底取代人工鑒定。
但是,這套系統也有其積極意義。現行檔案鑒定體系下,檔案形成部門以及檔案管理部門都有可能涉及鑒定工作,而檔案鑒定人員的理論素養與實踐經驗卻是參差不齊的,即使是有著長期檔案鑒定工作經驗的人員,也可能在實際操作中遵循著不同的標準,這樣可能有損檔案鑒定的質量與客觀性。而檔案初級鑒定系統則可以彌補這一不足,同時也能顯著地提高工作效率。
3.1 檔案鑒定知識挖掘。構建檔案初級鑒定系統,首先應當結合鑒定理論,將鑒定實踐經驗顯性化、系統化。檔案鑒定相關的知識非常豐富,包括檔案鑒定理論,檔案鑒定工作標準、規范或細則,檔案保管期限表等顯性知識和檔案鑒定人員的實踐經驗等隱性知識。這些信息的聚集,為知識挖掘提供了條件。檔案鑒定人員經驗相比于其他的信息集,較為零散,但也能夠有效地記錄、組織。在檔案鑒定活動中,無論是從檔案形成機關的職能地位,還是從檔案本身的價值來進行鑒定,檔案鑒定的流程應當是固定的、系統的,從固定流程中的最初環節逐級向下推導,將各個環節所有的可能組合都記錄下來,則能基本總結出檔案鑒定相關的經驗。
在建立包含檔案鑒定相關顯性知識與隱性知識數據庫之后,應當對其中數據進行預處理。數據庫中的數據可能存在冗余、錯誤,必須去粗取精、去偽存真。其間的數據也可能只是量的堆積,而缺乏明確的關系網絡。比如檔案鑒定工作細則中可能存在著一定的行政事務性規范,這些與知識發現的目標相關性較弱,應當降低其重要性,或者直接去除。而來自不同的檔案鑒定人員的經驗記錄可能存在缺乏科學性,甚至相互沖突的內容,應將這些經驗記錄進行規范化的統一表述,然后對其應進行分析比對,謹慎篩選。
檔案鑒定知識挖掘的核心在于將檔案鑒定工作中的隱性知識系統地抽取出來,并以系統能夠理解的方式進行處理與表述。在具體的檔案管理工作實踐中,檔案形成部門與檔案管理部門一般都有較為穩定的業務工作聯系,檔案真偽鑒定較為少見,檔案價值鑒定是檔案鑒定工作的主要內容。在日常的檔案鑒定工作中,檔案鑒定人員通常利用檔案保管期限表來確定檔案價值與保管期限。檔案保管期限表對不同部門、不同具體類型文件的價值與保管期限作了較為明確的規定。不同的部門,其職能輕重有別。同一部門,在處理重要性不同的具體事務時產生的檔案的價值也是有區別的。服務全局的部門產生的檔案、核心部門產生的檔案,其價值較高。輔助性部門、邊緣性部門產生的檔案的價值較低。同一部門內部不同文件,其價值也有不同,譬如機關辦公室,年度工作總結、計劃與一般性的宣傳教育及培訓文件的價值應當是有區別的,在具體的實踐操作中,其保管期限也很有可能是不同的。對于會計、設備等專門性檔案,其檔案保管期限表也對不同來源與類型文件的保管期限做出了規定。通過區分檔案的不同來源與類型能夠對檔案價值進行初步的鑒定。對于涉及多個部門或半獨立部門等檔案來源較為復雜的情況,以及在檔案保管期限表下難以對文件類型進行歸類的情況,則需要檔案鑒定人員以其經驗進行判定。對于某些具體的文件,譬如因應突發性事務而成立的臨時性機構產生的文件,其鑒定則需要鑒定人員對具體文件的內容進行判別,包括為處理該項事務而涉及的領導層級、部門職能與地位、內容是否關乎全局工作或核心工作等幾個方面,從而來對其價值進行鑒定。
不同機構有不同的工作實踐情況,因而其檔案鑒定標準可能是有區別的。但同一行業、同一業務系統,其鑒定標準應該是有共性的,是能夠進行標準化規范的。同一機構內部,檔案管理部門與不同的檔案形成部門,其標準應當統一,并且在實踐中得到切實遵守。對于檔案管理部門來說,進行前端控制,將工作延伸到檔案形成部門的文件管理工作中,必然能提高檔案鑒定工作的質量與效率。但在實際工作中,這很難實現,鮮有先例。設計一套能夠替代或輔助檔案鑒定人員開展鑒定工作的系統能夠提高檔案鑒定工作的質量與效率,保證在某一機構內部或某行業系統內檔案鑒定的規范性與客觀性。
3.2 檔案初級鑒定系統構想。對于檔案初級鑒定系統,本文只是提出一種構想,重點在于其工作模塊與運作邏輯,并未試圖建立完整的技術框架。本文的自動鑒定系統構想,只涉及檔案的價值鑒定,而沒有涉及真偽鑒定,主要適用于紙質檔案。
3.2.1 檔案初級鑒定系統功能分析。檔案初級鑒定系統功能主要有來源與類型定位和內容分析。要實現這兩項功能,需要首先建立兩套數據庫,能夠區分價值層級的來源與類型庫和關鍵詞庫。來源與類型定位,主要是掃描提取檔案的來源與類型信息,并與數據庫中的信息進行比對,確定其來源,以及在某一來源下的具體檔案類型,從而對檔案進行準確的定位,確定其價值。檔案內容分析,包括關鍵詞與文摘的分析。當不能對檔案進行準確定位,無法鑒定其價值時,系統開始進行檔案內容分析。對檔案的關鍵詞與文摘等信息進行掃描提取,與系統關鍵詞庫進行比對,從而確定其保管期限。
3.2.2 檔案初級鑒定系統模塊分析。檔案初級鑒定系統主要包含著錄模塊、鑒定對象描述轉換模塊、檔案來源與類型定位模塊、檔案內容分析模塊、鑒定結果輸出模塊。著錄模塊主要是根據相應著錄規則,將紙質檔案的標題、時間、責任者、文種、檔號、主題詞、關鍵詞,甚至文摘等信息輸入系統中形成可供系統鑒定的基本單元。鑒定對象描述轉換模塊將用戶著錄的檔案信息的語法規范進行審核,并在審核通過后將其轉換成系統能夠識別的形式。檔案來源與類型定位模塊提取檔案的來源與定位等基本信息,根據系統確立的檔案保管期限規則進行定位,從而確定其價值與保管期限。對于不能進行定位的被鑒定對象,將其關鍵詞組合與系統關鍵詞庫進行比對,根據系統關鍵詞庫中不同關鍵詞組合所對應的價值層級,從而對被鑒定對象開展價值鑒定。若系統無法依據來源與類型庫和關鍵詞庫對被鑒定對象進行鑒定,直接將未能鑒定的結果發送到結果輸出模塊。
結果輸出模塊,主要是對輸出檔案鑒定的結果,區分不同檔案的保管期限,將無法鑒定的檔案反饋給用戶,同時輸出鑒定結果統計。檔案初級鑒定系統鑒定流程如圖所示。
檔案初級鑒定系統鑒定流程圖
4 結束語
本文所嘗試構建的檔案初級鑒定系統意在通過系統的規范化操作,盡可能地消除因為實踐取向與鑒定者能力的差異而導致的檔案鑒定工作質量與客觀性不足的問題。檔案鑒定在本質上是一種較為主觀性的活動,因為檔案價值是難以量化認定的。經典的檔案鑒定理論對具體檔案價值的判斷也可能不是完全一致的。對于主觀性活動而言,無論實施主體在能力上是否對等,其結果都有可能因人而異。但是,無論這項工作的主觀性多強,在一個機構中,其長期的檔案鑒定實踐一般都能在不斷的試錯與學習中探索出一套能夠持續運行,且為各方接受的操作方案,盡管可能存在著一些或者能夠及時消除,或者需要不斷完善的誤差。這種方案一般是經驗式的,難以形成知識體系并進行系統的傳承。若能對這種經驗式的知識進行抽取、挖掘,并構建一套以其為基礎的自動鑒定系統,則能消除鑒定工作中的主觀性,保證鑒定工作的質量。當然,筆者深知,一套所謂的鑒定系統并不能一勞永逸地解決鑒定工作中存在的所有問題,但希望這能提供有益的啟發。
(作者單位:武漢理工大學檔案館 來稿日期:2014-04-12)
但是,這套系統也有其積極意義。現行檔案鑒定體系下,檔案形成部門以及檔案管理部門都有可能涉及鑒定工作,而檔案鑒定人員的理論素養與實踐經驗卻是參差不齊的,即使是有著長期檔案鑒定工作經驗的人員,也可能在實際操作中遵循著不同的標準,這樣可能有損檔案鑒定的質量與客觀性。而檔案初級鑒定系統則可以彌補這一不足,同時也能顯著地提高工作效率。
3.1 檔案鑒定知識挖掘。構建檔案初級鑒定系統,首先應當結合鑒定理論,將鑒定實踐經驗顯性化、系統化。檔案鑒定相關的知識非常豐富,包括檔案鑒定理論,檔案鑒定工作標準、規范或細則,檔案保管期限表等顯性知識和檔案鑒定人員的實踐經驗等隱性知識。這些信息的聚集,為知識挖掘提供了條件。檔案鑒定人員經驗相比于其他的信息集,較為零散,但也能夠有效地記錄、組織。在檔案鑒定活動中,無論是從檔案形成機關的職能地位,還是從檔案本身的價值來進行鑒定,檔案鑒定的流程應當是固定的、系統的,從固定流程中的最初環節逐級向下推導,將各個環節所有的可能組合都記錄下來,則能基本總結出檔案鑒定相關的經驗。
在建立包含檔案鑒定相關顯性知識與隱性知識數據庫之后,應當對其中數據進行預處理。數據庫中的數據可能存在冗余、錯誤,必須去粗取精、去偽存真。其間的數據也可能只是量的堆積,而缺乏明確的關系網絡。比如檔案鑒定工作細則中可能存在著一定的行政事務性規范,這些與知識發現的目標相關性較弱,應當降低其重要性,或者直接去除。而來自不同的檔案鑒定人員的經驗記錄可能存在缺乏科學性,甚至相互沖突的內容,應將這些經驗記錄進行規范化的統一表述,然后對其應進行分析比對,謹慎篩選。
檔案鑒定知識挖掘的核心在于將檔案鑒定工作中的隱性知識系統地抽取出來,并以系統能夠理解的方式進行處理與表述。在具體的檔案管理工作實踐中,檔案形成部門與檔案管理部門一般都有較為穩定的業務工作聯系,檔案真偽鑒定較為少見,檔案價值鑒定是檔案鑒定工作的主要內容。在日常的檔案鑒定工作中,檔案鑒定人員通常利用檔案保管期限表來確定檔案價值與保管期限。檔案保管期限表對不同部門、不同具體類型文件的價值與保管期限作了較為明確的規定。不同的部門,其職能輕重有別。同一部門,在處理重要性不同的具體事務時產生的檔案的價值也是有區別的。服務全局的部門產生的檔案、核心部門產生的檔案,其價值較高。輔助性部門、邊緣性部門產生的檔案的價值較低。同一部門內部不同文件,其價值也有不同,譬如機關辦公室,年度工作總結、計劃與一般性的宣傳教育及培訓文件的價值應當是有區別的,在具體的實踐操作中,其保管期限也很有可能是不同的。對于會計、設備等專門性檔案,其檔案保管期限表也對不同來源與類型文件的保管期限做出了規定。通過區分檔案的不同來源與類型能夠對檔案價值進行初步的鑒定。對于涉及多個部門或半獨立部門等檔案來源較為復雜的情況,以及在檔案保管期限表下難以對文件類型進行歸類的情況,則需要檔案鑒定人員以其經驗進行判定。對于某些具體的文件,譬如因應突發性事務而成立的臨時性機構產生的文件,其鑒定則需要鑒定人員對具體文件的內容進行判別,包括為處理該項事務而涉及的領導層級、部門職能與地位、內容是否關乎全局工作或核心工作等幾個方面,從而來對其價值進行鑒定。
不同機構有不同的工作實踐情況,因而其檔案鑒定標準可能是有區別的。但同一行業、同一業務系統,其鑒定標準應該是有共性的,是能夠進行標準化規范的。同一機構內部,檔案管理部門與不同的檔案形成部門,其標準應當統一,并且在實踐中得到切實遵守。對于檔案管理部門來說,進行前端控制,將工作延伸到檔案形成部門的文件管理工作中,必然能提高檔案鑒定工作的質量與效率。但在實際工作中,這很難實現,鮮有先例。設計一套能夠替代或輔助檔案鑒定人員開展鑒定工作的系統能夠提高檔案鑒定工作的質量與效率,保證在某一機構內部或某行業系統內檔案鑒定的規范性與客觀性。
3.2 檔案初級鑒定系統構想。對于檔案初級鑒定系統,本文只是提出一種構想,重點在于其工作模塊與運作邏輯,并未試圖建立完整的技術框架。本文的自動鑒定系統構想,只涉及檔案的價值鑒定,而沒有涉及真偽鑒定,主要適用于紙質檔案。
3.2.1 檔案初級鑒定系統功能分析。檔案初級鑒定系統功能主要有來源與類型定位和內容分析。要實現這兩項功能,需要首先建立兩套數據庫,能夠區分價值層級的來源與類型庫和關鍵詞庫。來源與類型定位,主要是掃描提取檔案的來源與類型信息,并與數據庫中的信息進行比對,確定其來源,以及在某一來源下的具體檔案類型,從而對檔案進行準確的定位,確定其價值。檔案內容分析,包括關鍵詞與文摘的分析。當不能對檔案進行準確定位,無法鑒定其價值時,系統開始進行檔案內容分析。對檔案的關鍵詞與文摘等信息進行掃描提取,與系統關鍵詞庫進行比對,從而確定其保管期限。
3.2.2 檔案初級鑒定系統模塊分析。檔案初級鑒定系統主要包含著錄模塊、鑒定對象描述轉換模塊、檔案來源與類型定位模塊、檔案內容分析模塊、鑒定結果輸出模塊。著錄模塊主要是根據相應著錄規則,將紙質檔案的標題、時間、責任者、文種、檔號、主題詞、關鍵詞,甚至文摘等信息輸入系統中形成可供系統鑒定的基本單元。鑒定對象描述轉換模塊將用戶著錄的檔案信息的語法規范進行審核,并在審核通過后將其轉換成系統能夠識別的形式。檔案來源與類型定位模塊提取檔案的來源與定位等基本信息,根據系統確立的檔案保管期限規則進行定位,從而確定其價值與保管期限。對于不能進行定位的被鑒定對象,將其關鍵詞組合與系統關鍵詞庫進行比對,根據系統關鍵詞庫中不同關鍵詞組合所對應的價值層級,從而對被鑒定對象開展價值鑒定。若系統無法依據來源與類型庫和關鍵詞庫對被鑒定對象進行鑒定,直接將未能鑒定的結果發送到結果輸出模塊。
結果輸出模塊,主要是對輸出檔案鑒定的結果,區分不同檔案的保管期限,將無法鑒定的檔案反饋給用戶,同時輸出鑒定結果統計。檔案初級鑒定系統鑒定流程如圖所示。
檔案初級鑒定系統鑒定流程圖
4 結束語
本文所嘗試構建的檔案初級鑒定系統意在通過系統的規范化操作,盡可能地消除因為實踐取向與鑒定者能力的差異而導致的檔案鑒定工作質量與客觀性不足的問題。檔案鑒定在本質上是一種較為主觀性的活動,因為檔案價值是難以量化認定的。經典的檔案鑒定理論對具體檔案價值的判斷也可能不是完全一致的。對于主觀性活動而言,無論實施主體在能力上是否對等,其結果都有可能因人而異。但是,無論這項工作的主觀性多強,在一個機構中,其長期的檔案鑒定實踐一般都能在不斷的試錯與學習中探索出一套能夠持續運行,且為各方接受的操作方案,盡管可能存在著一些或者能夠及時消除,或者需要不斷完善的誤差。這種方案一般是經驗式的,難以形成知識體系并進行系統的傳承。若能對這種經驗式的知識進行抽取、挖掘,并構建一套以其為基礎的自動鑒定系統,則能消除鑒定工作中的主觀性,保證鑒定工作的質量。當然,筆者深知,一套所謂的鑒定系統并不能一勞永逸地解決鑒定工作中存在的所有問題,但希望這能提供有益的啟發。
(作者單位:武漢理工大學檔案館 來稿日期:2014-04-12)
但是,這套系統也有其積極意義。現行檔案鑒定體系下,檔案形成部門以及檔案管理部門都有可能涉及鑒定工作,而檔案鑒定人員的理論素養與實踐經驗卻是參差不齊的,即使是有著長期檔案鑒定工作經驗的人員,也可能在實際操作中遵循著不同的標準,這樣可能有損檔案鑒定的質量與客觀性。而檔案初級鑒定系統則可以彌補這一不足,同時也能顯著地提高工作效率。
3.1 檔案鑒定知識挖掘。構建檔案初級鑒定系統,首先應當結合鑒定理論,將鑒定實踐經驗顯性化、系統化。檔案鑒定相關的知識非常豐富,包括檔案鑒定理論,檔案鑒定工作標準、規范或細則,檔案保管期限表等顯性知識和檔案鑒定人員的實踐經驗等隱性知識。這些信息的聚集,為知識挖掘提供了條件。檔案鑒定人員經驗相比于其他的信息集,較為零散,但也能夠有效地記錄、組織。在檔案鑒定活動中,無論是從檔案形成機關的職能地位,還是從檔案本身的價值來進行鑒定,檔案鑒定的流程應當是固定的、系統的,從固定流程中的最初環節逐級向下推導,將各個環節所有的可能組合都記錄下來,則能基本總結出檔案鑒定相關的經驗。
在建立包含檔案鑒定相關顯性知識與隱性知識數據庫之后,應當對其中數據進行預處理。數據庫中的數據可能存在冗余、錯誤,必須去粗取精、去偽存真。其間的數據也可能只是量的堆積,而缺乏明確的關系網絡。比如檔案鑒定工作細則中可能存在著一定的行政事務性規范,這些與知識發現的目標相關性較弱,應當降低其重要性,或者直接去除。而來自不同的檔案鑒定人員的經驗記錄可能存在缺乏科學性,甚至相互沖突的內容,應將這些經驗記錄進行規范化的統一表述,然后對其應進行分析比對,謹慎篩選。
檔案鑒定知識挖掘的核心在于將檔案鑒定工作中的隱性知識系統地抽取出來,并以系統能夠理解的方式進行處理與表述。在具體的檔案管理工作實踐中,檔案形成部門與檔案管理部門一般都有較為穩定的業務工作聯系,檔案真偽鑒定較為少見,檔案價值鑒定是檔案鑒定工作的主要內容。在日常的檔案鑒定工作中,檔案鑒定人員通常利用檔案保管期限表來確定檔案價值與保管期限。檔案保管期限表對不同部門、不同具體類型文件的價值與保管期限作了較為明確的規定。不同的部門,其職能輕重有別。同一部門,在處理重要性不同的具體事務時產生的檔案的價值也是有區別的。服務全局的部門產生的檔案、核心部門產生的檔案,其價值較高。輔助性部門、邊緣性部門產生的檔案的價值較低。同一部門內部不同文件,其價值也有不同,譬如機關辦公室,年度工作總結、計劃與一般性的宣傳教育及培訓文件的價值應當是有區別的,在具體的實踐操作中,其保管期限也很有可能是不同的。對于會計、設備等專門性檔案,其檔案保管期限表也對不同來源與類型文件的保管期限做出了規定。通過區分檔案的不同來源與類型能夠對檔案價值進行初步的鑒定。對于涉及多個部門或半獨立部門等檔案來源較為復雜的情況,以及在檔案保管期限表下難以對文件類型進行歸類的情況,則需要檔案鑒定人員以其經驗進行判定。對于某些具體的文件,譬如因應突發性事務而成立的臨時性機構產生的文件,其鑒定則需要鑒定人員對具體文件的內容進行判別,包括為處理該項事務而涉及的領導層級、部門職能與地位、內容是否關乎全局工作或核心工作等幾個方面,從而來對其價值進行鑒定。
不同機構有不同的工作實踐情況,因而其檔案鑒定標準可能是有區別的。但同一行業、同一業務系統,其鑒定標準應該是有共性的,是能夠進行標準化規范的。同一機構內部,檔案管理部門與不同的檔案形成部門,其標準應當統一,并且在實踐中得到切實遵守。對于檔案管理部門來說,進行前端控制,將工作延伸到檔案形成部門的文件管理工作中,必然能提高檔案鑒定工作的質量與效率。但在實際工作中,這很難實現,鮮有先例。設計一套能夠替代或輔助檔案鑒定人員開展鑒定工作的系統能夠提高檔案鑒定工作的質量與效率,保證在某一機構內部或某行業系統內檔案鑒定的規范性與客觀性。
3.2 檔案初級鑒定系統構想。對于檔案初級鑒定系統,本文只是提出一種構想,重點在于其工作模塊與運作邏輯,并未試圖建立完整的技術框架。本文的自動鑒定系統構想,只涉及檔案的價值鑒定,而沒有涉及真偽鑒定,主要適用于紙質檔案。
3.2.1 檔案初級鑒定系統功能分析。檔案初級鑒定系統功能主要有來源與類型定位和內容分析。要實現這兩項功能,需要首先建立兩套數據庫,能夠區分價值層級的來源與類型庫和關鍵詞庫。來源與類型定位,主要是掃描提取檔案的來源與類型信息,并與數據庫中的信息進行比對,確定其來源,以及在某一來源下的具體檔案類型,從而對檔案進行準確的定位,確定其價值。檔案內容分析,包括關鍵詞與文摘的分析。當不能對檔案進行準確定位,無法鑒定其價值時,系統開始進行檔案內容分析。對檔案的關鍵詞與文摘等信息進行掃描提取,與系統關鍵詞庫進行比對,從而確定其保管期限。
3.2.2 檔案初級鑒定系統模塊分析。檔案初級鑒定系統主要包含著錄模塊、鑒定對象描述轉換模塊、檔案來源與類型定位模塊、檔案內容分析模塊、鑒定結果輸出模塊。著錄模塊主要是根據相應著錄規則,將紙質檔案的標題、時間、責任者、文種、檔號、主題詞、關鍵詞,甚至文摘等信息輸入系統中形成可供系統鑒定的基本單元。鑒定對象描述轉換模塊將用戶著錄的檔案信息的語法規范進行審核,并在審核通過后將其轉換成系統能夠識別的形式。檔案來源與類型定位模塊提取檔案的來源與定位等基本信息,根據系統確立的檔案保管期限規則進行定位,從而確定其價值與保管期限。對于不能進行定位的被鑒定對象,將其關鍵詞組合與系統關鍵詞庫進行比對,根據系統關鍵詞庫中不同關鍵詞組合所對應的價值層級,從而對被鑒定對象開展價值鑒定。若系統無法依據來源與類型庫和關鍵詞庫對被鑒定對象進行鑒定,直接將未能鑒定的結果發送到結果輸出模塊。
結果輸出模塊,主要是對輸出檔案鑒定的結果,區分不同檔案的保管期限,將無法鑒定的檔案反饋給用戶,同時輸出鑒定結果統計。檔案初級鑒定系統鑒定流程如圖所示。
檔案初級鑒定系統鑒定流程圖
4 結束語
本文所嘗試構建的檔案初級鑒定系統意在通過系統的規范化操作,盡可能地消除因為實踐取向與鑒定者能力的差異而導致的檔案鑒定工作質量與客觀性不足的問題。檔案鑒定在本質上是一種較為主觀性的活動,因為檔案價值是難以量化認定的。經典的檔案鑒定理論對具體檔案價值的判斷也可能不是完全一致的。對于主觀性活動而言,無論實施主體在能力上是否對等,其結果都有可能因人而異。但是,無論這項工作的主觀性多強,在一個機構中,其長期的檔案鑒定實踐一般都能在不斷的試錯與學習中探索出一套能夠持續運行,且為各方接受的操作方案,盡管可能存在著一些或者能夠及時消除,或者需要不斷完善的誤差。這種方案一般是經驗式的,難以形成知識體系并進行系統的傳承。若能對這種經驗式的知識進行抽取、挖掘,并構建一套以其為基礎的自動鑒定系統,則能消除鑒定工作中的主觀性,保證鑒定工作的質量。當然,筆者深知,一套所謂的鑒定系統并不能一勞永逸地解決鑒定工作中存在的所有問題,但希望這能提供有益的啟發。
(作者單位:武漢理工大學檔案館 來稿日期:2014-04-12)