楊加勇
【摘要】:大數(shù)據(jù)是繼云計(jì)算之后近年來(lái)信息技術(shù)領(lǐng)域最熱門的話題之一。檔案部門在大數(shù)據(jù)的背景下,將是未來(lái)的發(fā)展趨勢(shì),是值得思考和重視的新問(wèn)題。這里結(jié)合工作實(shí)際,粗淺談?wù)劥髷?shù)據(jù)背景下的檔案館建設(shè)。
【關(guān)鍵詞】:大數(shù)據(jù);檔案館;建設(shè)
一、大數(shù)據(jù)是價(jià)值觀、方法論和通往未來(lái)的鑰匙
社會(huì)已經(jīng)處于互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)時(shí)代,數(shù)以百億計(jì)的機(jī)器、機(jī)關(guān)、團(tuán)體、企業(yè)、個(gè)人都會(huì)隨時(shí)隨地通過(guò)網(wǎng)絡(luò)獲取信息,并成為信息的制造者和傳播者。在這個(gè)時(shí)代,不僅數(shù)據(jù)量呈現(xiàn)爆炸式增長(zhǎng),同時(shí)種類繁多。對(duì)于這些數(shù)據(jù)的收集、存儲(chǔ)、挖掘,既是時(shí)代難題,也是時(shí)代機(jī)遇。
二、大數(shù)據(jù)時(shí)代來(lái)臨對(duì)于檔案館的沖擊
“檔案館”顧名思義是管檔案、用檔案的地方。檔案館的核心是檔案載體所承載的信息。如果把檔案所承載的信息換算成數(shù)據(jù),在大數(shù)據(jù)時(shí)代來(lái)臨的背景下,值得關(guān)注的問(wèn)題很多,沖擊將是不可避免的,也是巨大而全面的。
首先是思想觀和思維方式。傳統(tǒng)檔案館習(xí)慣于大門緊閉、坐等上門、被動(dòng)服務(wù)、檔案要少而精,在大數(shù)據(jù)時(shí)代顯然不合時(shí)宜。大數(shù)據(jù)時(shí)代對(duì)于以“守”為主的傳統(tǒng)檔案思想觀和思維方式的敲打?qū)⑹嵌嘟嵌取⑸顚哟蔚摹?/p>
其次是目標(biāo)定位。在大數(shù)據(jù)時(shí)代來(lái)臨的背景下,原有的目標(biāo)定位不能停止不動(dòng),而應(yīng)該水漲船高。區(qū)別的分水嶺是坐守外部推動(dòng),還是主動(dòng)內(nèi)部發(fā)力。宏觀的謀劃、微觀的切入與主觀的態(tài)度,都需要有一個(gè)精確的算計(jì)和考量。力量應(yīng)該來(lái)源于思辨的透徹、實(shí)踐的提煉與技術(shù)的整合應(yīng)用。
其三是發(fā)展路徑。建設(shè)適應(yīng)大數(shù)據(jù)背景下的第四代檔案館,路要一步步走,基礎(chǔ)很重要。進(jìn)入21世紀(jì)以后的頭十幾年,面對(duì)社會(huì)信息化的浪潮,中國(guó)檔案部門的思維焦點(diǎn)主要是檔案信息化、檔案數(shù)字化、電子檔案管理和數(shù)字檔案室、數(shù)字檔案館建設(shè)。其發(fā)展的速度快,成績(jī)大,效果顯著。檔案館也不能僅僅滿足于現(xiàn)有技術(shù)條件下的檔案信息化、檔案數(shù)字化和數(shù)字檔案館,而應(yīng)該在新技術(shù)的基礎(chǔ)上尋找新的出路與航程。總體上,大數(shù)據(jù)時(shí)代的來(lái)臨已經(jīng)和正在對(duì)社會(huì)方方面面產(chǎn)生深刻而持久的影響,檔案部門對(duì)此應(yīng)該保持高度的清醒和警覺(jué),并學(xué)習(xí)應(yīng)用大數(shù)據(jù)的預(yù)測(cè)工具和方法,及早提出應(yīng)對(duì)的思路和策略,部署新的規(guī)劃和措施,最大限度地爭(zhēng)取主動(dòng),避免陷入“猝不及防”的邊緣化風(fēng)險(xiǎn)。
三、智慧檔案館是適應(yīng)大數(shù)據(jù)時(shí)代要求的檔案館
檔案館建設(shè)的實(shí)踐脈路大體可以分為4個(gè)不同的階段。一是實(shí)體檔案館。檔案館作為一種社會(huì)實(shí)體,存在的歷史由來(lái)已久。實(shí)體檔案館以檔案館建筑實(shí)體為標(biāo)志,側(cè)重于傳統(tǒng)檔案的實(shí)體管理。二是智能檔案館。20世紀(jì)80年代,建筑界提出了智能建筑的新概念。它是現(xiàn)代計(jì)算機(jī)技術(shù)、通信技術(shù)、控制技術(shù)發(fā)展和相互滲透的結(jié)晶。所謂智能建筑,是指將計(jì)算機(jī)、通信、辦公自動(dòng)化、保安監(jiān)控、防火等技術(shù)有機(jī)整合在一起的高新技術(shù)建筑綜合體。只要是按現(xiàn)代管理方式運(yùn)作的行業(yè),它的建筑都有智能建筑的要求。智能檔案館是現(xiàn)代智能建筑的伴生產(chǎn)物。由此可見(jiàn),所謂智能檔案館,側(cè)重于建筑硬件的智能化、自動(dòng)化、集成化,是對(duì)傳統(tǒng)實(shí)體檔案館的一種現(xiàn)代化升級(jí)。智能檔案館比傳統(tǒng)實(shí)體檔案館的高明之處在于融入了現(xiàn)代建筑思想,突出了技術(shù)進(jìn)步對(duì)于檔案館建筑設(shè)計(jì)的巨大貢獻(xiàn)。但并沒(méi)有脫離傳統(tǒng)實(shí)體檔案館的窠臼。三是數(shù)字檔案館。數(shù)字檔案館,也可以稱為虛擬檔案館,是與實(shí)體檔案館的一種對(duì)稱,所謂數(shù)字檔案館,是指以實(shí)體檔案館為基本依托,以智能檔案館為基本支撐,以電子檔案為基本對(duì)象的一種新型檔案館形式,是基于電子檔案產(chǎn)生而帶來(lái)的檔案管理與服務(wù)的大變革,是檔案館事業(yè)發(fā)展一個(gè)新時(shí)代的跨越與標(biāo)識(shí)。四是智慧檔案館。智慧檔案館是適應(yīng)大數(shù)據(jù)背景下的第四代檔案館,是繼數(shù)字檔案館之后檔案信息化發(fā)展的高級(jí)形態(tài)。智慧檔案館借鑒了智慧地球、智慧城市的理念。智慧檔案館的目標(biāo)則是應(yīng)用新一代信息技術(shù)及相關(guān)工具和方法,最大限度地提高檔案資源的整合建設(shè)能力和開(kāi)發(fā)服務(wù)能力。
四、智慧檔案館的最好解釋與關(guān)鍵節(jié)點(diǎn)
智慧檔案館的最好解釋是“聰明”。“聰明”的標(biāo)識(shí)是不僅能讓機(jī)器“說(shuō)話”,而且能夠通過(guò)機(jī)器的深度學(xué)習(xí)聽(tīng)懂人的語(yǔ)言,看清人的手勢(shì),理解人的意圖,并恰如其分地提供令人滿意的服務(wù)。
智慧檔案館的關(guān)鍵節(jié)點(diǎn)主要包括以下幾個(gè)方面:一是大數(shù)據(jù)的來(lái)源。二是大數(shù)據(jù)特征的認(rèn)知。首先是數(shù)據(jù)量要大,同時(shí)要注重?cái)?shù)據(jù)的完整性。三是大數(shù)據(jù)技術(shù)的運(yùn)用。大數(shù)據(jù)應(yīng)用的領(lǐng)域非常廣闊,前景也十分光明。但目前大數(shù)據(jù)技術(shù)的運(yùn)用仍存在一些困難與挑戰(zhàn),主要體現(xiàn)在大數(shù)據(jù)挖掘的四個(gè)環(huán)節(jié)中。首先是大數(shù)據(jù)的收集。要對(duì)來(lái)自網(wǎng)絡(luò)包括物聯(lián)網(wǎng)和機(jī)構(gòu)信息系統(tǒng)的數(shù)據(jù)附上時(shí)空標(biāo)志,去偽存真,盡可能收集異源甚至是異構(gòu)的數(shù)據(jù),必要時(shí)還可與歷史數(shù)據(jù)對(duì)照,多角度驗(yàn)證數(shù)據(jù)的全面性和可信性。其次是數(shù)據(jù)存儲(chǔ)。要達(dá)到低成本、低能耗、高可靠性目標(biāo),通常要用到冗余配置、分布化和云計(jì)算技術(shù),在存儲(chǔ)時(shí)要按照一定規(guī)則對(duì)數(shù)據(jù)進(jìn)行分類,通過(guò)過(guò)濾和去重,減少存儲(chǔ)量,同時(shí)加入日后檢索的標(biāo)簽。第三是數(shù)據(jù)處理。有些行業(yè)的數(shù)據(jù)涉及上百個(gè)參數(shù),其復(fù)雜性不僅體現(xiàn)在數(shù)據(jù)樣本本身,更體現(xiàn)在多源異構(gòu)、多實(shí)體和多空間之間的交互動(dòng)態(tài)性,難以用傳統(tǒng)的方法描述與度量,處理的復(fù)雜度很大,需要將高維圖像等多媒體數(shù)據(jù)降維后度量與處理,利用上下文關(guān)聯(lián)進(jìn)行語(yǔ)義分析,從大量動(dòng)態(tài)而且可能是模棱兩可的數(shù)據(jù)中綜合信息,并導(dǎo)出可理解的內(nèi)容。第四是結(jié)果的可視化呈現(xiàn),使結(jié)果更直觀以便于洞察。現(xiàn)有的數(shù)據(jù)挖掘算法在不同行業(yè)中難以通用。這些困難與挑戰(zhàn)在智慧檔案館的建設(shè)進(jìn)程中將會(huì)顯得更加突出和集中。
參考文獻(xiàn):
[1]鄭燃,唐義,戴艷清.基于關(guān)聯(lián)數(shù)據(jù)的圖書(shū)館、檔案館和博物館數(shù)字資源整合研究[J].《圖書(shū)與情報(bào)》.2012年1期.
[2]周楓.資源·技術(shù)·思維——大數(shù)據(jù)時(shí)代檔案館的三維詮釋[J].《檔案學(xué)研究》.2013年6期.