許振哲/上海理工大學(xué)檔案館
鑒定是檔案工作的重要環(huán)節(jié),正規(guī)的檔案鑒定工作可以追溯至1789年法國(guó)大革命[1]。在這之后的200多年時(shí)間里,世界各國(guó)根據(jù)檔案工作實(shí)際,圍繞檔案鑒定工作展開(kāi)研究,形成了一系列具有代表性的檔案鑒定理論。近年來(lái),隨著科技的迅猛發(fā)展,人類社會(huì)已大踏步邁入人工智能時(shí)代,各行各業(yè)的工作模式正在發(fā)生廣泛而深刻的變革。技術(shù)已不再是桎梏,而是成為實(shí)際工作開(kāi)展的助力因素。新形勢(shì)下,既往的檔案鑒定理論是否能夠適應(yīng)實(shí)際工作的需求?檔案鑒定工作應(yīng)當(dāng)如何順勢(shì)而上?
從20世紀(jì)初開(kāi)始,各種具有代表性的檔案鑒定理論相繼問(wèn)世:1901年邁斯奈爾提出年齡鑒定論,主張尊重高齡案卷;20世紀(jì)20、30年代,卡林斯基提出職能鑒定論,認(rèn)為一個(gè)單位的地位越高,其職能越重要,生成的檔案就越有價(jià)值;詹金遜提出行政官員決定論,主張檔案的鑒定和銷毀應(yīng)由行政官員決定,檔案工作者不宜參與;1956年,謝倫伯格提出文件雙重價(jià)值理論,認(rèn)為檔案具有第一價(jià)值和第二價(jià)值,需要檔案工作者在檔案鑒定工作中發(fā)揮更大的作用;到了20世紀(jì)80年代,隨著電子文件的大量涌現(xiàn),宏觀鑒定理論應(yīng)運(yùn)而生,主要包括布姆斯的社會(huì)分析與職能鑒定理論,塞穆?tīng)査刮墨I(xiàn)戰(zhàn)略以及特里庫(kù)克的宏觀鑒定戰(zhàn)略,主張以更加宏觀的視角全面考量文件的社會(huì)職能。我國(guó)的檔案鑒定理論誕生較晚,始于20世紀(jì)80年代,包括相對(duì)價(jià)值標(biāo)準(zhǔn)理論、價(jià)值鑒定論、本位原則理論等[2]。雖然不同理論具體描述有所差異,但其內(nèi)核仍不可避免地打上了西方檔案鑒定理論烙印,未能跳出既定價(jià)值鑒定框架。
21世紀(jì)隨著人工智能技術(shù)深入發(fā)展,新的檔案鑒定思潮也隨之出現(xiàn)。2015年,周林興、鄧晉芝二人提出“(經(jīng)過(guò)鑒定后)所保存的檔案都是過(guò)濾后的檔案,所反映的不是完整的而是被選擇了的歷史,所呈現(xiàn)給后人的不是原汁原味的而是被強(qiáng)化或弱化了的社會(huì)記憶……因此,基于歷史視域的考量,應(yīng)當(dāng)弱化檔案鑒定”[3]。馬伏秋認(rèn)為“我國(guó)檔案鑒定理論研究與實(shí)際工作嚴(yán)重脫節(jié),檔案鑒定工作缺乏科學(xué)、具體的理論指導(dǎo)……應(yīng)當(dāng)徹底廢止銷毀鑒定”[4]。楊冬權(quán)指出:“檔案的這種多重價(jià)值或多方面價(jià)值就使檔案的‘選擇性管理’漏洞百出,捉襟見(jiàn)肘,無(wú)法應(yīng)付。只有‘全部性管理’才能適應(yīng)檔案價(jià)值多重性的需要,才能滿足未來(lái)利用者的各方面需求……我國(guó)檔案工作面臨著一個(gè)從‘選時(shí)代’到‘全時(shí)代’的全新蛻變和全面改變”[5]。
周林興等人關(guān)于檔案鑒定工作的論述,是對(duì)人工智能時(shí)代檔案工作模式的嘗試與探索,也是對(duì)傳統(tǒng)檔案鑒定理論的挑戰(zhàn)與突破,有學(xué)者將他們的觀點(diǎn)統(tǒng)稱為“檔案鑒定非必要論”[6]。觀點(diǎn)一經(jīng)問(wèn)世,在學(xué)術(shù)界引起軒然大波,引發(fā)無(wú)數(shù)討論。在技術(shù)條件已然成熟的今天,檔案界為何對(duì)檔案鑒定非必要論充滿抵觸與質(zhì)疑?當(dāng)前我國(guó)檔案鑒定工作存在哪些問(wèn)題?弱化鑒定甚至取消鑒定在未來(lái)是否具備實(shí)現(xiàn)的可能性?
關(guān)于檔案應(yīng)由文件形成者還是檔案人員鑒定,檔案界至今爭(zhēng)論不休。我國(guó)采用“檔案人員、業(yè)務(wù)人員和有關(guān)領(lǐng)導(dǎo)三結(jié)合”的鑒定模式,理論上看可以讓文件形成者與檔案人員共同參與到鑒定環(huán)節(jié)中,很好地解決了沖突,實(shí)際則不然。有學(xué)者指出,“我國(guó)所謂的三結(jié)合,實(shí)際只是兩結(jié)合,機(jī)關(guān)或者檔案館的領(lǐng)導(dǎo)并不會(huì)親自參與鑒定工作……鑒定工作由檔案部門和業(yè)務(wù)部門人員共同組成的鑒定小組來(lái)操作,這種組織看似科學(xué),實(shí)際上難以正常開(kāi)展工作和保證質(zhì)量……三結(jié)合只在工作到一定階段時(shí)出面議一議,把把關(guān)[7]。”三結(jié)合鑒定模式的初衷,是“一道程序,三方參與”,保證每一份檔案的價(jià)值能夠被全面充分地認(rèn)知。然而實(shí)際工作中,卻變成了“彼此獨(dú)立,三重過(guò)濾”,歸檔鑒定、檔案室鑒定、檔案館鑒定彼此割裂,不再是一個(gè)綜合性環(huán)節(jié),而是成為三道線性流程。每個(gè)流程的鑒定人員都擁有同時(shí)鑒別檔案第一價(jià)值和第二價(jià)值的權(quán)利。這就導(dǎo)致三結(jié)合的鑒定模式不僅無(wú)法全面綜合地鑒別檔案價(jià)值,反而會(huì)在每個(gè)鑒定環(huán)節(jié)都將一部分有價(jià)值的檔案剔除在外。
歸檔鑒定模式因循守舊還表現(xiàn)為,對(duì)檔案保管期限表和歸檔范圍的全面依賴。當(dāng)前鑒定工作主要依據(jù)國(guó)家檔案局2006年發(fā)布的《機(jī)關(guān)文件材料歸檔范圍和文書檔案保管期限規(guī)定》和2012年發(fā)布的《企業(yè)文件材料歸檔范圍和檔案保管期限規(guī)定》[8]。上述文件發(fā)布至今已有相當(dāng)長(zhǎng)的時(shí)間,很難滿足當(dāng)前形勢(shì)下的檔案鑒定需求,加之保管期限表中往往摻雜大量“重要的”、“一般的”這類模糊不清的字眼,直接影響檔案人員對(duì)檔案價(jià)值的實(shí)際判斷。傅榮校指出:“我國(guó)目前的檔案保管期限表尚無(wú)法充分反映出現(xiàn)有的先進(jìn)的價(jià)值理論和鑒定標(biāo)準(zhǔn),也無(wú)法充分體現(xiàn)出與我國(guó)目前鑒定理論發(fā)展水平相適應(yīng)的內(nèi)容,鑒定理論與檔案保管期限表之間的銜接不力,直接影響了鑒定理論的發(fā)展和更新……可能使那些具有重要第二價(jià)值的文件遭到毀滅性的打擊”[9]。歸檔范圍的局限性對(duì)檔案鑒定工作造成了較大影響,也讓很多檔案進(jìn)入可歸可不歸的灰色地帶,大量非官方背景的社會(huì)記錄未被納入檔案資源對(duì)象范疇,難以進(jìn)入檔案管理的“資源池”,難以保證檔案的齊全完整性[10]。
非官方來(lái)源的檔案不在歸檔范圍,無(wú)法進(jìn)館;官方來(lái)源的檔案經(jīng)過(guò)層層篩選,十不足一。最終呈現(xiàn)給公眾的,都是官方視角、人為選擇、支離破碎的社會(huì)記憶,未來(lái)的研究者從“一家之言”能否窺得歷史的本來(lái)面貌?這是否已然背離了檔案鑒定工作初衷?
有學(xué)者根據(jù)性質(zhì)將檔案鑒定劃分為檔案質(zhì)量鑒定(包括檔案的原始性、真實(shí)性、完整性、準(zhǔn)確性、載體質(zhì)量鑒定)和檔案價(jià)值鑒定,并認(rèn)為檔案價(jià)值鑒定是檔案鑒定的核心[11]。檔案價(jià)值,通俗而言就是檔案對(duì)人類的有用性,不同的價(jià)值體系、不同的判定標(biāo)準(zhǔn),都會(huì)影響人們對(duì)檔案價(jià)值的認(rèn)知。“對(duì)本單位無(wú)用的檔案,可能對(duì)全社會(huì)有用;對(duì)自己無(wú)用的,可能對(duì)別人有用;對(duì)今天無(wú)用的,可能對(duì)明天有用;對(duì)國(guó)家或單位無(wú)用的,可能對(duì)家庭或個(gè)人有用;表面看無(wú)用的,可能實(shí)際上有用”[12]。因此有學(xué)者認(rèn)為檔案價(jià)值具有多重性和不確定性,甚至有人陷入了檔案價(jià)值“不可知論”的泥潭[13]。
人類對(duì)事物的認(rèn)知需要經(jīng)歷一個(gè)由淺入深、螺旋上升的過(guò)程,在這個(gè)過(guò)程中對(duì)于檔案價(jià)值的認(rèn)知,對(duì)鑒定標(biāo)準(zhǔn)的界定亦不可避免地帶有局限性。舉例而言,檔案館是否存在永久保存,但從未被利用過(guò)的檔案呢?答案是肯定的。如果這份檔案從未被利用過(guò),它的價(jià)值從何體現(xiàn)呢?如果它沒(méi)有價(jià)值,為何能夠接收進(jìn)館永久保存呢?也許有人會(huì)說(shuō),檔案現(xiàn)在沒(méi)被利用,不代表未來(lái)沒(méi)有價(jià)值。那么問(wèn)題又來(lái)了,日常工作中,難免碰到需要查詢的檔案沒(méi)有歸檔的情況,這些檔案顯然是具有價(jià)值的,為何在鑒定環(huán)節(jié)沒(méi)有考慮這部分檔案未來(lái)可能存在價(jià)值,而是選擇將其拒之門外呢?由此看來(lái),當(dāng)前檔案價(jià)值鑒定標(biāo)準(zhǔn)在理論與實(shí)際兩端均難以自洽,認(rèn)知的局限決定了人們?cè)谀硞€(gè)特定階段不可能全面認(rèn)清檔案的價(jià)值,由此確立的價(jià)值鑒定標(biāo)準(zhǔn),必然會(huì)導(dǎo)致相當(dāng)數(shù)量有價(jià)值的檔案無(wú)法入庫(kù)、散佚蒙塵。
檔案價(jià)值的多重性和不確定性決定無(wú)論何種價(jià)值鑒定體系都必然存有一定的局限性。那么“形成檔案全歸檔,歸檔檔案全留存”[14]顯然成為給后世留下寶貴檔案遺產(chǎn)的最佳途徑。
根據(jù)流程,可以將檔案鑒定劃分為進(jìn)館鑒定、開(kāi)放鑒定和銷毀鑒定三個(gè)環(huán)節(jié)。不同于進(jìn)館鑒定嚴(yán)苛刻板,銷毀鑒定中“鑒而不銷、銷而不毀”的現(xiàn)象頻頻發(fā)生[15]。檔案在進(jìn)館鑒定環(huán)節(jié)會(huì)被劃定保管期限,理論上保管期滿的檔案對(duì)黨和國(guó)家不再具備有用性。然而在實(shí)際工作中,人們往往傾向于這些檔案在未來(lái)依然具有發(fā)揮價(jià)值的可能,從而將保管期限一再延長(zhǎng)。檔案進(jìn)館鑒定與銷毀鑒定遵循的是同樣的價(jià)值評(píng)判標(biāo)準(zhǔn),為何在進(jìn)館鑒定環(huán)節(jié)可以做到應(yīng)歸盡歸、蹈矩循規(guī),而在銷毀鑒定環(huán)節(jié)卻是態(tài)度曖昧、謹(jǐn)小慎微?
以上這種現(xiàn)象一方面源于當(dāng)前檔案保管期限表?xiàng)l款太少,內(nèi)容過(guò)于概括,保管年限劃分簡(jiǎn)單隨意,只有10年、30年、永久三個(gè)檔次,不足以囊括不同門類的所有檔案。另一方面,檔案銷毀相關(guān)規(guī)范性文件太少、年份太早,且用詞充斥一般的、重要的等模糊字眼,缺乏明確的、可供參考的銷毀依據(jù),很難作為實(shí)際工作的參照。這就導(dǎo)致各級(jí)各類檔案館在期滿鑒定過(guò)程中畏首畏尾,慎之又慎,不敢輕言銷毀,唯恐造成黨和國(guó)家的損失。
現(xiàn)階段檔案銷毀鑒定推進(jìn)不力,還有更深層次的現(xiàn)實(shí)原因:實(shí)際工作中,需要查閱的檔案卻被告知已經(jīng)銷毀的現(xiàn)象并不鮮見(jiàn),銷毀鑒定也因此愈發(fā)舉步維艱。檔案工作者對(duì)進(jìn)館鑒定和銷毀鑒定的雙重標(biāo)準(zhǔn)并非本意,檔案價(jià)值的不可捉摸,決定了銷毀鑒定必然要承擔(dān)相當(dāng)程度的風(fēng)險(xiǎn),正是出于對(duì)檔案事業(yè)的熱忱與責(zé)任,才會(huì)讓對(duì)待進(jìn)館鑒定無(wú)比嚴(yán)苛的檔案工作者在銷毀鑒定時(shí)產(chǎn)生一次又一次的寬容。當(dāng)前形勢(shì)下,唯有廢止銷毀鑒定,才可能在源頭規(guī)避給黨和國(guó)家檔案事業(yè)造成損失的一切可能。
紙質(zhì)檔案時(shí)代檔案保管能力有限,這也是檔案鑒定工作產(chǎn)生的直接原因。人們通過(guò)衡量預(yù)測(cè)檔案對(duì)當(dāng)下以及未來(lái)的有用性,從既有檔案中挑選出一部分加以保存。電子檔案時(shí)代,載體類型發(fā)生變更,檔案存儲(chǔ)密度呈幾何級(jí)提升,已完全能夠承載不斷增長(zhǎng)的館藏?cái)?shù)量,然而電子時(shí)代檔案工作需依賴人類加工,海量的數(shù)字檔案全部進(jìn)館,光憑人力不可能完成,因此檔案鑒定工作依然未能擺脫傳統(tǒng)模式的桎梏。
隨著卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展成熟,深度學(xué)習(xí)技術(shù)的推廣使用,人類社會(huì)開(kāi)始大踏步邁入人工智能時(shí)代。相信在不久的將來(lái),隨著人工智能技術(shù)在檔案領(lǐng)域的深度應(yīng)用,機(jī)器將取代人類,完成各項(xiàng)繁復(fù)的檔案工作。機(jī)器可以根據(jù)人類設(shè)定的算法邏輯進(jìn)行實(shí)時(shí)歸檔、自動(dòng)著錄、動(dòng)態(tài)鑒定,并在此過(guò)程中不斷收集用戶行為數(shù)據(jù),實(shí)現(xiàn)升級(jí)優(yōu)化。人工智能時(shí)代的到來(lái),必將打開(kāi)檔案鑒定工作新局面。
載體形式的升級(jí)為檔案全部性管理提供了充足的存儲(chǔ)空間,人工智能技術(shù)的應(yīng)用則讓全部性管理由理論成為可能。通過(guò)機(jī)器深度學(xué)習(xí),未來(lái)檔案工作可以實(shí)現(xiàn)全過(guò)程自動(dòng)化管理,“形成檔案全歸檔,歸檔檔案全留存”將成為人工智能時(shí)代檔案工作的總體方針。
需要注意的是,全部性管理只是在歸檔環(huán)節(jié)不再對(duì)檔案價(jià)值進(jìn)行判定,并不意味著檔案歸檔鑒定的取消。歸檔鑒定不僅包括檔案價(jià)值鑒定,還包括檔案質(zhì)量鑒定,傳統(tǒng)檔案鑒定工作側(cè)重于價(jià)值鑒定,一定程度上忽視了質(zhì)量鑒定的重要性。人工智能時(shí)代,檔案管理的對(duì)象是電子數(shù)據(jù),這就決定將來(lái)電子文件單軌制運(yùn)行、單套制管理是大勢(shì)所趨。為確保電子檔案的原始性、真實(shí)性、完整性、準(zhǔn)確性,加強(qiáng)檔案質(zhì)量鑒定刻不容緩。人工智能時(shí)代,檔案工作者的職責(zé)不僅沒(méi)有減輕,反而更甚以往。電子檔案元數(shù)據(jù)、電子簽名、時(shí)間戳等元素未來(lái)都將成為檔案質(zhì)量鑒定的對(duì)象。檔案部門可以通過(guò)數(shù)字證書授權(quán)中心核驗(yàn)歸檔人的電子簽名,確保歸檔文件傳輸過(guò)程未經(jīng)篡改,保證其真實(shí)性、準(zhǔn)確性;通過(guò)聯(lián)合信任時(shí)間戳服務(wù)中心核驗(yàn)檔案的時(shí)間戳,確保檔案的原始性;檔案部門還可以保存文件歷次修改的元數(shù)據(jù),為將來(lái)的研究提供多元的視角,傳承更加完整的社會(huì)記憶。
檔案價(jià)值是動(dòng)態(tài)的,會(huì)隨時(shí)間、場(chǎng)合、用戶的變化呈現(xiàn)不同程度的有用性,任何檔案價(jià)值鑒定理論都難以全面衡量檔案的價(jià)值。因此人工智能時(shí)代實(shí)行全部性管理,取消前端歸檔價(jià)值鑒定,可以有效解決進(jìn)館檔案的取舍問(wèn)題。
然而隨著全部性管理進(jìn)程的推進(jìn),檔案館未來(lái)可能面臨館藏?cái)?shù)量繁多、檢索效率低下的困境。傳統(tǒng)鑒定模式下,館藏資源相對(duì)有限,用戶可以根據(jù)檢索結(jié)果逐一閱覽;全部性管理模式下,電子館藏浩如煙海,任意詞條檢索得到的結(jié)果都將是成千上萬(wàn)條,如何從中高效地篩選有用信息將成為困擾用戶的最大問(wèn)題。
為保證用戶的檢索利用效率,提升檔案利用體驗(yàn),檔案部門應(yīng)通過(guò)檔案利用平臺(tái)主動(dòng)抓取用戶行為數(shù)據(jù),利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行關(guān)聯(lián)運(yùn)算,構(gòu)建終端檔案價(jià)值動(dòng)態(tài)鑒定體系。檔案利用平臺(tái)將單位時(shí)間內(nèi)用戶群體的檢索詞條、檔案點(diǎn)擊量、檔案累計(jì)瀏覽時(shí)長(zhǎng)等數(shù)據(jù)進(jìn)行關(guān)聯(lián)并深度運(yùn)算,通過(guò)用戶的行為數(shù)據(jù)來(lái)衡量一段時(shí)間內(nèi)哪些檔案對(duì)用戶更具有用性,并將檢索頻次、檔案利用率等數(shù)據(jù)加權(quán)換算,作為衡量館藏檔案動(dòng)態(tài)價(jià)值的標(biāo)準(zhǔn)。當(dāng)用戶進(jìn)行檢索時(shí),利用平臺(tái)將優(yōu)先把單位時(shí)間內(nèi)加權(quán)檢索分值更高的結(jié)果推送給用戶,免除用戶逐一瀏覽海量信息的困擾。

圖 開(kāi)放檔案智能鑒定數(shù)據(jù)庫(kù)
人工智能背景下的檔案價(jià)值動(dòng)態(tài)鑒定體系,以用戶行為數(shù)據(jù)為依據(jù),將檔案檢索利用率作為價(jià)值鑒定的唯一指標(biāo)。該體系中檔案的價(jià)值并非一成不變而是隨檔案檢索利用頻次的波動(dòng)不斷變化,從而能夠極大地提升用戶檢索利用效率,也可以動(dòng)態(tài)滿足不同時(shí)代不同群體的差異化利用需求。
目前,各地檔案館普遍存在“只進(jìn)不出”或“進(jìn)大于出”的現(xiàn)象,一些保存期限為10年、30年的檔案更是近乎永久保存,檔案銷毀鑒定已然名存實(shí)亡,直接廢止銷毀鑒定可以為實(shí)際工作減去很多不必要的麻煩。
廢止銷毀鑒定意味著所有檔案不再有保管年限的劃分,進(jìn)館檔案都將永久保存,但這并不意味著檔案只要?dú)w檔進(jìn)館就一勞永逸。全部性管理的根本目的是更好地服務(wù)利用,而用戶最終能夠接觸到多少檔案完全取決于檔案開(kāi)放水平。很多地區(qū)的檔案部門秉持謹(jǐn)慎的態(tài)度對(duì)待檔案開(kāi)放鑒定,盡管新版檔案法將檔案開(kāi)放期由30年減少到25年,但一些檔案的開(kāi)放期仍然一再延長(zhǎng),久久未能面世,可謂“養(yǎng)在深閨人未識(shí)”。
檔案開(kāi)放是檔案價(jià)值得以發(fā)揮的必然路徑,但涉及國(guó)家安全或者重大利益以及其他到期不宜開(kāi)放的檔案則有必要進(jìn)行多次開(kāi)放鑒定。想要兼顧用戶的實(shí)際利用體驗(yàn)與信息安全,實(shí)現(xiàn)檔案開(kāi)放利用的長(zhǎng)效機(jī)制,必須構(gòu)建一個(gè)開(kāi)放檔案智能鑒定數(shù)據(jù)庫(kù)維系電子檔案的內(nèi)部運(yùn)轉(zhuǎn)。
如圖所示,館藏紙質(zhì)檔案和歸檔電子文件轉(zhuǎn)化為電子檔案后進(jìn)入開(kāi)放檔案智能鑒定數(shù)據(jù)庫(kù),首先根據(jù)文件的時(shí)間戳鑒定檔案是否形成期滿25年,年限已滿檔案轉(zhuǎn)入檔案開(kāi)放鑒定庫(kù),年限未滿檔案轉(zhuǎn)入待開(kāi)放庫(kù);其次對(duì)開(kāi)放鑒定庫(kù)中的檔案進(jìn)行二次鑒定,經(jīng)濟(jì)、教育、科技、文化等適宜開(kāi)放的檔案轉(zhuǎn)入人工智能訓(xùn)練庫(kù),涉及國(guó)家安全或重大利益的檔案轉(zhuǎn)入加密庫(kù);待開(kāi)放庫(kù)的檔案形成期滿25年后再次轉(zhuǎn)入開(kāi)放鑒定庫(kù),加密庫(kù)檔案自進(jìn)庫(kù)之日起,再次開(kāi)放期滿后轉(zhuǎn)入開(kāi)放鑒定庫(kù),重復(fù)上述開(kāi)放鑒定流程;人工智能訓(xùn)練庫(kù)是數(shù)據(jù)庫(kù)的最后一個(gè)模塊,所有進(jìn)入訓(xùn)練庫(kù)的檔案,可供人工智能直接接觸、深度學(xué)習(xí),并向用戶推送信息、標(biāo)記出處。開(kāi)放檔案智能鑒定數(shù)據(jù)庫(kù)的建成,可以借助人工智能自動(dòng)完成檔案開(kāi)放鑒定,“應(yīng)開(kāi)放盡開(kāi)放”“能公布全公布”,最大程度發(fā)揮檔案的價(jià)值。