周楠

摘 要:通過(guò)新思維、新方式、新資源觀、新能力闡述了大數(shù)據(jù)時(shí)代檔案管理的發(fā)展趨勢(shì)。
關(guān)鍵詞:大數(shù)據(jù);檔案管理;管理趨勢(shì)
大數(shù)據(jù)是一種技術(shù),更是一種理念,它的出現(xiàn)對(duì)各行各業(yè)都產(chǎn)生了巨大影響,推動(dòng)著社會(huì)快速發(fā)展。大數(shù)據(jù)時(shí)代,檔案作為其中一種重要數(shù)據(jù)、企業(yè)信息資源的核心,將給檔案工作帶來(lái)新的發(fā)展的契機(jī),同時(shí)迎來(lái)諸多的挑戰(zhàn)。
一、新思維
大數(shù)據(jù)視角下,檔案作為數(shù)據(jù)中不可缺少的重要組成部分,檔案管理工作面臨著前所未有的變革和挑戰(zhàn)。第一,企業(yè)檔案工作主要負(fù)責(zé)檔案資源的收、藏、管、用,一直以來(lái)重藏輕用,提供簡(jiǎn)單的借閱及編研工作。大數(shù)據(jù)時(shí)代,數(shù)據(jù)的提取、計(jì)算、關(guān)聯(lián)、預(yù)測(cè)等技術(shù)將顛覆傳統(tǒng)的信息開(kāi)發(fā)利用模式,給檔案開(kāi)發(fā)利用工作帶來(lái)更多挖掘的可能性,更廣闊的發(fā)展空間,檔案工作將從關(guān)注保管轉(zhuǎn)向利用服務(wù)。第二,大數(shù)據(jù)給檔案安全保密工作帶來(lái)了巨大挑戰(zhàn),數(shù)據(jù)丟失、更改、失真以及數(shù)據(jù)泄密等安全隱患風(fēng)險(xiǎn)將大大提高,使檔案工作將從關(guān)注檔案保管轉(zhuǎn)向數(shù)據(jù)監(jiān)管、維護(hù)及處置、利用審批。第三,大數(shù)據(jù)與檔案資源的融合,極大提高檔案工作“智能化”,改變了檔案工作傳統(tǒng)管理模式,檔案工作也從技術(shù)含量低端轉(zhuǎn)向高端。第四,有學(xué)者提出檔案工作未來(lái)研究重點(diǎn)是“數(shù)字檔案資源整合與服務(wù)”,著力解決利用服務(wù)的適應(yīng)性問(wèn)題,企業(yè)檔案管理的重點(diǎn)將轉(zhuǎn)向跨專(zhuān)業(yè)、跨部門(mén)、跨系統(tǒng)、跨業(yè)務(wù)的檔案資源整合和服務(wù)的協(xié)同創(chuàng)新與合作。
二、新方式
大數(shù)據(jù)給檔案工作帶來(lái)最大的改變是檔案業(yè)務(wù)環(huán)節(jié)側(cè)重點(diǎn)的變化,以往,檔案工作多關(guān)注于收集,往往為無(wú)法齊全完整的收集到文件材料而想盡各種方法,而大數(shù)據(jù)時(shí)代影響檔案工作卻是信息的隱匿和泛濫,關(guān)注點(diǎn)將轉(zhuǎn)移到數(shù)據(jù)的挖掘以及有效信息的提取。檔案業(yè)務(wù)環(huán)節(jié)變化如下:
從圖表中的比較可以看出,大數(shù)據(jù)時(shí)代給檔案工作方式帶來(lái)了極大變化。首先,收集工作,傳統(tǒng)檔案工作往往會(huì)在收集工作中耗費(fèi)大量精力,運(yùn)用各種方式方法去減少收集工作中的漏洞,被大家所熟知的“三納入、四參加、四同步”的要求,主要目的也是為能夠順利開(kāi)展收集工作,將檔案工作設(shè)立在各個(gè)業(yè)務(wù)關(guān)卡,來(lái)確保檔案的齊全、完整,但由于檔案工作與企業(yè)業(yè)務(wù)工作脫節(jié),很多單位對(duì)此要求的執(zhí)行難以落到實(shí)處,對(duì)于收集工作并未明顯改善。而利用大數(shù)據(jù)技術(shù),使得各類(lèi)數(shù)據(jù)的抓取和捕獲將變得愈加容易,以“流處理”的模式將數(shù)據(jù)閃存,收集成本逐漸降低,檔案收集工作的難題將從根本得到解決。
其次,整理工作,以往檔案工作會(huì)耗費(fèi)大量時(shí)間進(jìn)行整理、裝訂,這些技術(shù)含量低、大量繁重的手工勞動(dòng)占據(jù)了檔案工作者的大部分時(shí)間,使得檔案工作一度被輕視。傳統(tǒng)檔案資源中每份檔案相對(duì)獨(dú)立,檔案資源的整合方式也相對(duì)單一,一般以人工手段按事件、項(xiàng)目、課題歸類(lèi),將零散的文件聚集在一起,物理上使得檔案具有邏輯性,但事件之間、項(xiàng)目之間、課題之間難以建立互通聯(lián)系,難以挖掘更深層次的關(guān)系,對(duì)于提供決策支持顯得力不從心。大數(shù)據(jù)技術(shù)使得互不連通的檔案信息整合為連通的數(shù)據(jù)庫(kù)成為可能,將所有信息數(shù)據(jù)化,包括非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),通過(guò)數(shù)據(jù)尋找關(guān)聯(lián),使檔案的價(jià)值得到成倍增加。
最后,利用工作,長(zhǎng)久以“提出需求-檢索答案-解決問(wèn)題”守株待兔的低層次利用模式,解決問(wèn)題的成功率受制于著錄信息是否完整全面,其效率依賴于檢索工具的科學(xué)性,利用目的多以工作查考為主,利用載體形式單一,以紙質(zhì)原生信息(即檔案)為主,難以提供知識(shí)服務(wù)及決策支持。大數(shù)據(jù)時(shí)代,當(dāng)業(yè)務(wù)系統(tǒng)的海量數(shù)據(jù)集成和融合后,大數(shù)據(jù)分析技術(shù)會(huì)以計(jì)算機(jī)算法和邏輯規(guī)則給出人工難以得出的分析結(jié)果。服務(wù)內(nèi)容,從提供孤立檔案轉(zhuǎn)變?yōu)橹R(shí)服務(wù),基于海量數(shù)據(jù)的關(guān)聯(lián)性分析,大數(shù)據(jù)在趨勢(shì)預(yù)測(cè)和發(fā)現(xiàn)隱性關(guān)聯(lián)方面具備相當(dāng)優(yōu)勢(shì),使得各項(xiàng)業(yè)務(wù)、各專(zhuān)業(yè)、各個(gè)年代之間有機(jī)聯(lián)系在一起,為決策問(wèn)題打開(kāi)局面,為技術(shù)創(chuàng)新提供更多思路。服務(wù)方式,從坐等用戶上門(mén)轉(zhuǎn)變?yōu)橹鲃?dòng)推送,通過(guò)對(duì)用戶特征數(shù)據(jù)、行為數(shù)據(jù)、歷史數(shù)據(jù)、反饋數(shù)據(jù)實(shí)時(shí)分析,跟進(jìn)用戶需求,滿足用戶個(gè)性化利用需求。同時(shí),在處理用戶查詢過(guò)程中系統(tǒng)能夠及時(shí)不斷地提供反饋,根據(jù)反饋結(jié)果更改、調(diào)整、優(yōu)化、完善用戶服務(wù)策略。利用效率,不在局限于實(shí)地查閱借閱,減少用戶與檔案人員的溝通成本,以及信息不對(duì)稱而導(dǎo)致查詢失敗,不再受時(shí)空限制隨時(shí)獲取。
三、新資源觀
傳統(tǒng)檔案資源一般包括文書(shū)檔案、科技檔案、專(zhuān)門(mén)檔案、聲像檔案、實(shí)物檔案,這些檔案只集中收集企業(yè)內(nèi)部的部分信息。大數(shù)據(jù)之所以稱為“大”,包含了傳統(tǒng)的小數(shù)據(jù)和現(xiàn)代的大記錄,小數(shù)據(jù)指有根據(jù)的數(shù)字,大記錄的表現(xiàn)形式是文本、圖片、音頻、視頻等。大數(shù)據(jù)廣泛存在于各個(gè)領(lǐng)域、各個(gè)行業(yè)、各個(gè)學(xué)科,包括企業(yè)管理、科技、生產(chǎn)、采購(gòu)、倉(cāng)儲(chǔ)、營(yíng)銷(xiāo)、運(yùn)輸?shù)雀鱾€(gè)方面產(chǎn)生或采集的各種信息、數(shù)據(jù),企業(yè)檔案資源要運(yùn)用大數(shù)據(jù)技術(shù),企業(yè)檔案就要與企業(yè)其他信息、數(shù)據(jù)一同納入大數(shù)據(jù)資源管理,形成大的資源觀。面向數(shù)據(jù)的管理方式使大量數(shù)據(jù)實(shí)現(xiàn)有效管理,有效打破信息孤島,建立信息共享、開(kāi)放、再利用。
檔案資源角度,從國(guó)家檔案局頒布的十號(hào)令可以看出,檔案管理的范圍覆蓋了企業(yè)所有管理工作中形成的文件材料,檔案的歸檔范圍得到了極大的擴(kuò)充,向“一切歸檔”的終極目標(biāo)更進(jìn)一步。實(shí)現(xiàn)“一切歸檔”的終極目標(biāo),需要企業(yè)檔案管理平臺(tái)實(shí)現(xiàn)與各個(gè)業(yè)務(wù)系統(tǒng)廣泛連接和實(shí)時(shí)交互。“將檔案系統(tǒng)融入企業(yè)其他信息系統(tǒng),不僅要讓各系統(tǒng)中生成有價(jià)值的文件、數(shù)據(jù)能直接在線歸檔,還要提供與領(lǐng)域業(yè)務(wù)流程及數(shù)據(jù)應(yīng)用需求深度融合的解決方案,讓檔案資源隨時(shí)在各系統(tǒng)的運(yùn)行環(huán)節(jié)發(fā)揮作用”。
信息資源角度,具有信息資源屬性的圖書(shū)、情報(bào)、檔案是企業(yè)信息資源的核心組成部分,這三類(lèi)信息資源具備很多共性,有著類(lèi)似的工作內(nèi)容和目標(biāo),均涉及保存和提供利用工作,大數(shù)據(jù)技術(shù)給圖書(shū)、情報(bào)、檔案一體化帶來(lái)了良好的發(fā)展機(jī)遇,可以將三類(lèi)信息資源相互融合,構(gòu)成三位一體的信息資源數(shù)據(jù)庫(kù)。
四、新能力
1.檔案數(shù)據(jù)安全
數(shù)據(jù)全生命周期、全過(guò)程、全面質(zhì)量管理、風(fēng)險(xiǎn)管控的理論和技術(shù)條件日趨完善,同時(shí),企業(yè)對(duì)于檔案工作數(shù)字服務(wù)的需求日趨強(qiáng)烈,電子文件亟待從雙套雙軌制走向無(wú)紙化單軌制,與大數(shù)據(jù)行動(dòng)融合。檔案的原始記錄性、憑證性是檔案工作者在大數(shù)據(jù)時(shí)代關(guān)注和探究的重點(diǎn),檔案的原始記錄性一旦無(wú)法保證,將會(huì)帶來(lái)連續(xù)性錯(cuò)誤,錯(cuò)誤的存儲(chǔ)、分析、計(jì)算導(dǎo)致錯(cuò)誤的結(jié)果及決策。因此,要建立全面的數(shù)據(jù)信息安全保障體系,確保檔案的真實(shí)完整、安全利用、可追溯。
2.檔案信息保密
檔案資源的開(kāi)放與保密一定程度上存在著矛盾,大數(shù)據(jù)時(shí)代下,急需在檔案的開(kāi)放與保密中找到解決之策。人們常常容易陷入到兩種誤區(qū)中,一部分認(rèn)為,現(xiàn)在已無(wú)密可保,有密難保,只注重檔案的服務(wù)利用,而忽視了其保密要求,一部分認(rèn)為,為避免泄密,將檔案束之高閣,脫離現(xiàn)實(shí)服務(wù)需求,兩種誤區(qū)都將阻礙檔案工作的健康發(fā)展。因此,對(duì)一些涉密及關(guān)鍵重要檔案數(shù)據(jù)在文件形成時(shí)甚至之前就進(jìn)行有效識(shí)別,運(yùn)用技術(shù)手段確保檔案數(shù)據(jù)源頭及其全生命周期的安全。在檔案數(shù)據(jù)的保密性得到有效保障的同時(shí),充分發(fā)揮可公開(kāi)檔案數(shù)據(jù)的服務(wù)功能。在盡可能降低檔案信息安全風(fēng)險(xiǎn)的同時(shí),最大限度的開(kāi)放服務(wù)中尋找平衡。
3.檔案管理技術(shù)
首先,大數(shù)據(jù)包含很多方案、技術(shù)、模塊,企業(yè)信息系統(tǒng)需要前期論證和不斷嘗試,找到適合企業(yè)的功能模型,兼具安全性、操作性、適用性。其次,大數(shù)據(jù)的其中一個(gè)特點(diǎn)便是數(shù)據(jù)量大,在數(shù)據(jù)量足夠大時(shí)才能發(fā)揮出預(yù)測(cè)趨勢(shì)、尋找關(guān)聯(lián)的功能,企業(yè)如何獲取足夠的數(shù)據(jù),獲取多大量的數(shù)據(jù),以及數(shù)據(jù)的選擇才能支持大數(shù)據(jù)技術(shù)的發(fā)揮。再次,大數(shù)據(jù)包含結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)便于數(shù)據(jù)的提取處理,而非結(jié)構(gòu)化數(shù)據(jù)的提取處理還需要更加便捷高效的處理方式。最后,大數(shù)據(jù)的關(guān)鍵技術(shù)提取和挖掘工作,需要在企業(yè)信息系統(tǒng)中建立固定模型,并不斷挖掘新算法,對(duì)雜亂的數(shù)據(jù)進(jìn)行萃取、提煉、分析。
在大數(shù)據(jù)環(huán)境下,檔案工作迎來(lái)了新的機(jī)遇和挑戰(zhàn),引入大數(shù)據(jù)管理理念是檔案工作發(fā)展的重要方向,檔案部門(mén)應(yīng)積極探索,創(chuàng)新檔案工作管理模式,更新對(duì)檔案工作的傳統(tǒng)認(rèn)識(shí),有效提升檔案服務(wù)能力。
參考文獻(xiàn):
[1]安小米.大數(shù)據(jù)時(shí)代數(shù)字檔案資源整合與服務(wù)的機(jī)遇與挑戰(zhàn)[J].檔案學(xué)通訊,2017(06):57-62
[2]王 波,郭紅玲.基于信息生態(tài)的企業(yè)檔案融合利用研究[J].航空檔案,2019(02):46-49.
[3]張 茵.軍工科研院所檔案管理平臺(tái)面向數(shù)據(jù)管理的應(yīng)用創(chuàng)新思考[J].航空檔案,2019(02):50-54.
[4]徐子沛.數(shù)據(jù)之巔[M]中信出版集團(tuán),2017:255-287
[5]張 玲.大數(shù)據(jù)2.0時(shí)代文獻(xiàn)資源融合與共享利用研究——以圖書(shū)、情報(bào)、檔案文獻(xiàn)信息資源為例.檔案管理[J],2015:36-37