楊 旭
洮南市司法局,吉林白城 137100
大數(shù)據(jù)時(shí)代數(shù)字檔案資源管理研究現(xiàn)狀與趨勢(shì)
楊 旭
洮南市司法局,吉林白城 137100
本文基于大數(shù)據(jù)應(yīng)用于數(shù)字檔案資源管理研究這一視角,闡述了大數(shù)據(jù)的概念、特點(diǎn)以及對(duì)數(shù)字檔案資源管理的影響,對(duì)大數(shù)據(jù)應(yīng)用于數(shù)字檔案資源管理的歷史現(xiàn)狀進(jìn)行了梳理,并結(jié)合數(shù)字檔案管理及大數(shù)據(jù)應(yīng)用前景,分析了研究發(fā)展方向與趨勢(shì)。
大數(shù)據(jù);檔案管理;研究;現(xiàn)狀;趨勢(shì)
20世紀(jì)末期以來(lái),隨著互聯(lián)網(wǎng)的普及與應(yīng)用,現(xiàn)代信息技術(shù)步入了加速度發(fā)展的時(shí)代。先進(jìn)的現(xiàn)代信息技術(shù)使各項(xiàng)數(shù)據(jù)的采集、統(tǒng)計(jì)、整理、分析和應(yīng)用成為現(xiàn)實(shí),近年來(lái)大數(shù)據(jù)技術(shù)已趨于成熟并廣泛應(yīng)用于生產(chǎn)、流通及生活的各個(gè)領(lǐng)域,為行業(yè)發(fā)展和生活選擇提供了真實(shí)、可靠、并具方向性的科學(xué)依據(jù),為各項(xiàng)事業(yè)的發(fā)展奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。檔案工作作為收集、整理、保存和運(yùn)用信息的工作,其工作的特殊性決定了運(yùn)用大數(shù)據(jù)技術(shù)的重要性。利用大數(shù)據(jù)技術(shù),檔案工作一方面可以豐富、全面地收集信息;同時(shí),也為海量信息的篩選與甄別提供了導(dǎo)向與方法;另外,大數(shù)據(jù)技術(shù)運(yùn)用于數(shù)字檔案資源管理,還有利于檔案的有效保存與運(yùn)用[1]。因此,加強(qiáng)大數(shù)據(jù)技術(shù)應(yīng)用于數(shù)字檔案資源管理的研究,既是時(shí)代的需要,也是檔案工作順應(yīng)科技發(fā)展、更好發(fā)揮作用的需要。
所謂大數(shù)據(jù),一般指大體量、多類別的數(shù)據(jù)的集合。對(duì)于這些數(shù)據(jù),采用傳統(tǒng)的處理手段無(wú)法對(duì)其進(jìn)行特定目的的搜集、整理、分析和運(yùn)用,而必須與新的技術(shù)手段相結(jié)合才能實(shí)現(xiàn)對(duì)數(shù)據(jù)的加工并取得成果。大數(shù)據(jù)技術(shù),起源于21世紀(jì)初期西方經(jīng)濟(jì)研究機(jī)構(gòu)對(duì)海量信息的搜集與分析,由于其結(jié)論的現(xiàn)實(shí)性、科學(xué)性和有效性,引起了信息技術(shù)研究領(lǐng)域等社會(huì)各領(lǐng)域的重視,掀起了大數(shù)據(jù)研究的熱潮。目前,大數(shù)據(jù)技術(shù)日趨成熟,并廣泛應(yīng)用于經(jīng)濟(jì)、社會(huì)、政治等領(lǐng)域,成為了解經(jīng)濟(jì)社會(huì)現(xiàn)狀、分析形勢(shì)、預(yù)判發(fā)展趨勢(shì)、決策參考的重要信息工具和依據(jù)。
大數(shù)據(jù)的特點(diǎn),一是體量大。大數(shù)據(jù)也稱大型數(shù)據(jù)集,其容量一般在10TB左右,在現(xiàn)實(shí)應(yīng)用中,由于往往使用多個(gè)數(shù)據(jù)集,其體量已經(jīng)達(dá)到PB量級(jí);二是類別多。數(shù)據(jù)的采集來(lái)源渠道多樣而廣泛,數(shù)據(jù)的類別、載體、表現(xiàn)形式等越來(lái)越豐富;三是處理速度快。即使數(shù)據(jù)體量非常龐大、類別非常繁雜,但利用大數(shù)據(jù)處理技術(shù),能夠快速得到特定的結(jié)果;四是真實(shí)性強(qiáng)。由于數(shù)據(jù)采集大都基于經(jīng)濟(jì)社會(huì)既已發(fā)生的客觀現(xiàn)實(shí),而且其結(jié)論賴以得出的基數(shù)非常龐大,因此其結(jié)論比傳統(tǒng)的數(shù)據(jù)更具客觀性和真實(shí)性。
國(guó)內(nèi)對(duì)于大數(shù)據(jù)的研究肇始于2005年左右,但此時(shí)的大數(shù)據(jù)研究還附屬于計(jì)算機(jī)技術(shù)的范疇,還不是真正意義上的大數(shù)據(jù)技術(shù)研究。自2010年始,真正意義上的大數(shù)據(jù)研究才初露端倪,到目前已經(jīng)成為研究的熱點(diǎn)?;诖髷?shù)據(jù)技術(shù)的數(shù)字檔案資源研究起源于近三四年間,而且其研究活動(dòng)與成果呈幾何倍數(shù)式的增長(zhǎng)。施永利從企業(yè)檔案管理的角度提出,企業(yè)檔案管理的價(jià)值體現(xiàn)于對(duì)檔案資源“實(shí)用性”的整理與挖掘,通過(guò)運(yùn)用文本和數(shù)據(jù)挖掘技術(shù),找出檔案資源之間的深層次聯(lián)系,從海量檔案資源中分析出經(jīng)濟(jì)活動(dòng)的規(guī)律。
李小晨提出,運(yùn)用大數(shù)據(jù),通過(guò)特定的策略,可以充分挖掘和發(fā)揮政府檔案資源的價(jià)值,使其有效服務(wù)于城市建設(shè)、經(jīng)濟(jì)建設(shè)等方面。陳明潔論述了現(xiàn)代信息技術(shù)對(duì)檔案管理帶來(lái)的巨大沖擊與變化,提出大數(shù)據(jù)不僅對(duì)檔案資源管理產(chǎn)生了技術(shù)方面的影響,而且從管理思維與管理理念上也對(duì)檔案資源管理提出了新的更高的要求。高茂科系統(tǒng)地論述了檔案資源大數(shù)據(jù)的生成、存儲(chǔ)和運(yùn)用等各個(gè)環(huán)節(jié)的技術(shù)問(wèn)題,首次提出建立檔案資源大數(shù)據(jù)信息平臺(tái)的觀點(diǎn),對(duì)其在數(shù)據(jù)搜索、采集、處理、挖掘等多個(gè)方面探討了其現(xiàn)實(shí)性、可行性與應(yīng)用的意義。王衛(wèi)平分析了大數(shù)據(jù)背景下檔案工作面臨的機(jī)遇與挑戰(zhàn),機(jī)遇主要是指大數(shù)據(jù)技術(shù)的應(yīng)用帶動(dòng)了檔案資源管理數(shù)字化的進(jìn)程,為利用大數(shù)據(jù)對(duì)檔案資源進(jìn)行處理奠定了良好基礎(chǔ);挑戰(zhàn)主要指大數(shù)據(jù)不僅是技術(shù)上的革命,更是管理理念的革命,當(dāng)前檔案工作很多方面還不適應(yīng)大數(shù)據(jù)的要求。劉國(guó)華對(duì)大數(shù)據(jù)應(yīng)用于檔案資源管理的系統(tǒng)構(gòu)建進(jìn)行了探討,并提出了具體思路。
總之,當(dāng)前對(duì)大數(shù)據(jù)應(yīng)用于數(shù)字檔案管理的研究,內(nèi)容涉及大數(shù)據(jù)技術(shù)與數(shù)字檔案管理的結(jié)合、數(shù)字檔案管理方式與理念適應(yīng)大數(shù)據(jù)應(yīng)進(jìn)行的改變、數(shù)字檔案利用大數(shù)據(jù)提高服務(wù)能力等多個(gè)方面,顯示出國(guó)內(nèi)學(xué)者已經(jīng)對(duì)大數(shù)據(jù)在檔案管理領(lǐng)域的應(yīng)用十分重視,并在實(shí)踐探索中取得了長(zhǎng)足進(jìn)步[2]。其不足之處也很明顯,如對(duì)理念的論述過(guò)于宏觀籠統(tǒng),對(duì)應(yīng)用技術(shù)的分析思想較為陳舊、缺乏創(chuàng)新,對(duì)為適應(yīng)大數(shù)據(jù)而對(duì)機(jī)構(gòu)改革、管理理念體系的構(gòu)建、政策法律的支持等領(lǐng)域涉獵較少等。
3.1研究對(duì)象更加豐富
當(dāng)前,數(shù)字檔案資源逐漸成為檔案資源的主要形態(tài),首先,對(duì)于傳統(tǒng)的研究對(duì)象來(lái)講,是一個(gè)新的領(lǐng)域和課題;其次,以數(shù)字檔案資源的檔案管理活動(dòng),以及在大數(shù)據(jù)背景下的檔案管理活動(dòng),是傳統(tǒng)檔案研究涉及較少的,而且其活動(dòng)規(guī)律有待探索;再次,大數(shù)據(jù)應(yīng)用于數(shù)字檔案管理,所帶來(lái)的手段、方法、理念、體系的改變巨大而深遠(yuǎn),研究對(duì)象必須向這些方面延伸并深入[3]??傊?,大數(shù)據(jù)技術(shù)的典型特征就是對(duì)象數(shù)據(jù)的大體量和多渠道,而檔案資源管理過(guò)去研究的對(duì)象一般來(lái)源渠道相對(duì)單一而固定,為此,需進(jìn)一步拓寬研究思路,并對(duì)擴(kuò)充了的檔案資源的規(guī)律、特點(diǎn)、變化以及應(yīng)用進(jìn)行研究。
3.2研究方法亟待創(chuàng)新
傳統(tǒng)的檔案資源管理研究,研究方法主要為基于實(shí)證的理論思辨,以經(jīng)驗(yàn)總結(jié)和理論體系構(gòu)建為主,其在嚴(yán)謹(jǐn)性、嚴(yán)密性、客觀性、科學(xué)性等方面存在不足。隨著大數(shù)據(jù)研究的深入,將數(shù)據(jù)引入人文學(xué)科研究,建立起海量的、來(lái)源廣泛的數(shù)據(jù)分析為基礎(chǔ)的人文研究為數(shù)字檔案管理資源研究提供了新的更可靠的方法和手段,推動(dòng)數(shù)字檔案資源管理的研究由以定性為主向以定量為主轉(zhuǎn)變。
3.3理論體系得以突破
在大數(shù)據(jù)背景下,數(shù)字檔案資源研究的對(duì)象和環(huán)境發(fā)生了巨大的改變,這就要求檔案研究理論體系突破原來(lái)的模式,在大數(shù)據(jù)檔案資源管理實(shí)踐的基礎(chǔ)上,對(duì)舊的理論體系進(jìn)行調(diào)整、充實(shí)和創(chuàng)新,從而基于新技術(shù)、新理念構(gòu)建新的理論體系。從另一方面來(lái)講,大數(shù)據(jù)對(duì)檔案資源管理所帶來(lái)的不僅是技術(shù)上的,而且可能是系統(tǒng)性、主導(dǎo)性的,這不僅是傳統(tǒng)的檔案資源管理研究的新課題,也是大數(shù)據(jù)應(yīng)用領(lǐng)域研究的新課題。
大數(shù)據(jù)背景下,數(shù)字檔案管理研究取得了一定進(jìn)展,但還存在理論體系不成熟,創(chuàng)新性不足等方面的問(wèn)題。隨著檔案管理研究和大數(shù)據(jù)自身的發(fā)展,大數(shù)據(jù)時(shí)代數(shù)字檔案資源管理研究對(duì)象將更加豐富,研究方法創(chuàng)新性更強(qiáng),理論體系也將取得突破性進(jìn)展。
[1]周姝莉.大數(shù)據(jù)視角下的檔案數(shù)據(jù)資源管理研究[J].科學(xué)導(dǎo)報(bào),2014(15):167.
[2]林慧玲.信息化背景下的社區(qū)檔案管理研究[J].蘭臺(tái)世界,2013(32):72-73.
[3]王鐵牛.大數(shù)據(jù)檔案學(xué)國(guó)內(nèi)研究現(xiàn)狀及研究方向分析[J].山西檔案,2015(3):107-110.
G2
A
1674-6708(2016)171-0083-02
楊旭,洮南市司法局。