陳薇
摘 要 當今社會已經進入到大數據時代,越來越多的地方會用到大數據處理。本文主要是對大數據時代背景下,大數據對檔案管理有什么作用,它的特征是什么,以及該如何做好大數據檔案管理進行闡述。
【關鍵詞】檔案;大數據;特征
在這個信息化的時代,越來越多人重視數據的挖掘、分析,同時云盤、云技術也在飛速的發展,世界進入了大數據時代。所以對檔案的管理有一個新要求,就是要改變傳統的檔案管理模式,利用計算機,對檔案進行信息化管理,對信息進行高速的處理,以此來創造更大的價值。
1 大數據的相關概述
大數據是在2006年提出來的,但是真正被人們所熟知是在2012年。在提出初期,除了IT業專業人士,沒有人知道它是什么意思,它的作用是什么,隨著搜索引擎的大佬們對數據的重視,越來越多的人明白大數據的意思。它是對數據的分析、整合從而找到他的商用價值。如今,有很多方面都應用了大數據,各國對于大數據的建立也越來越重視了。例如韓國、法國等國家都在大力扶持這一新技術,政府投資,以培養大量的信息資源管理人才。為了適應發展潮流,我國也在加快大數據的建設。檔案館(室)是信息資源的存放基地,其中有許多重要的信息,有很高的使用價值。
目前有很多的搜索引擎企業使用大數據引擎,例如百度,在很早以前就著手建立大數據系統,應用于兩方面,一個是用戶,另一個是應用于搜索。每天的數據處理量都是極大的,一般企業TB級,但是百度的處理量高達PB級,為了數據能更方便的存儲,百度還開發了百度云這個大數據相互作用。
2 大數據檔案應用的特點
在大數據時代,挑戰與機遇并存,大數據檔案有著不同于傳統檔案的特征。將不再設有歸檔范圍和保管期限,不再需要人工鑒定,所有形成的信息都將成為檔案,還原檔案的真實原貌,信息是非常豐富的。
2.1 數據巨大
大數據背景下的檔案管理要存儲的內容極大,每個單位的運營過程中的任何事情都要被記錄下來。例如人事信息,各行各業員工少說也得有上千萬人,每個員工時刻都在制造信息,談話、工作內容等都需要記錄下來,而且這些信息還可能是重復的,據數據統計,所產生的可分析數據已經超過104TB。傳統的檔案是沒有辦法滿足所有信息的存儲的,所以產生了大數據檔案,面對如此大的數據規模,對于數據處理的能力要求極高。
2.2 數據種類多
大數據時代徹底顛覆了傳統檔案的收集整理方式,檔案的來源廣、種類多,它的數據類型既有結構化也有非結構化的,除了包括傳統檔案的音頻視頻,紙質檔案,證件等還包括電腦的瀏覽記錄,微博,網頁,日志,聊天記錄等。檔案工作者必須要打破傳統檔案的局限性,用全新的眼光去了解大數據檔案的種類多樣性,進行分析時需要工作人員有較強的分析能力,對所有的信息進行相關性挖掘,找出你所想要的信息,用全新的審查方式對檔案進行收集整理,提高檔案工作的效率。
2.3 信息可用密度低
電子檔案在大數據時代,以指數級的速度增長,這給傳統的檔案整理模式帶來了沖擊。收集的信息多,并不是意味著數據信息越多,可用價值就越高。可能一萬條信息中沒有一條有用的,要想找到一條有用信息需要經過層層篩選,在篩選過程的任何一個步驟出現錯誤,都可能致使這條數據是無用的或者帶來更嚴重的后果。如果需要找一條需要做決定的相關數據,但是最后的數據是錯誤的,那么可能會導致整個決策失敗。
2.4 復雜性
大數據時代下,數據的產生是多種多樣的,數量以及種類都很多,導致不好分類,顯得格外的混亂,這也使得大數據變得更加復雜,其中不僅有大量可利用的信息,同時也包括一些無用的信息,這會給檔案工作者造成干擾。大數據信息的復雜性,也是有別于傳統檔案的主要原因之一。
3 大數據檔案的作用
建立大數據檔案有很大的實際意義。檔案信息來源將更加廣泛,從數據中找出有利于自身發展的資料,從而助力自身發展。
現階段各單位制定的檔案歸檔范圍有可能忽略掉極具收藏價值的檔案,而在大數據檔案中就可以看到一個單位全面的發展歷程,記錄了它走向輝煌的過程。例如阿里巴巴公司在年會上,對其的發展歷程做了一個展示,從一個小小的網站,變成了現在如此強大的電商公司,圖片的展示,視頻的播放都讓人感到那段時間的艱難,那么那些以往的照片是從哪找的,就是從公司的電子檔案中找的。作為阿里巴巴的創始人,馬云創業初期是極其艱難的,有一個他跑業務被拒的視頻,在網上廣為流傳,當時誰都不知道馬云是否會成功,但是視頻卻從那個年代保存下來了,沒有丟失或是損壞,有可能是無意中保存下來的,卻成了珍貴的資料,得益于檔案的保存得當。大數據檔案可以珍藏著一個企業全部的記憶,也是一個企業從小型變強大的“證據”。
4 結語
檔案工作要跟上大數據時代的步伐,首先領導人要有大數據的意識,重視把大數據應用到檔案管理中去,只有上頭的人重視,下級才會有資金去聘用專門人才,建立大數據檔案;其次建立大數據檔案中心,這需要有專業人才和團隊去建立,這需要提供一切支持,不管是技術還是資金,都必須做到位。進行大數據的處理需要好的計算機,包括計算機的硬件和軟件,如果計算機的硬件太差會可能會帶來數據查找慢,容易出錯,系統奔潰,所以還需要購買較好的計算機和系統。如果數據太過復雜和量多,可以建立云平臺。現在的計算機云都是和大數據連在一起,兩者像是瓶子和瓶蓋的關系,少了誰都是不完整的;最后需要各種信息輸入,把數據信息進行整理分類,并且篩選有用的信息。檔案的工作人員要及時應對新形勢,拓寬自己的視野,及時學習檔案管理的一些新知識,跟上時代的步伐,做好大數據檔案信息的收集整理,擴大檔案的利用渠道,為人們的生活提供一份更全面的生活記錄。
參考文獻
[1]王梅.淺談企業檔案工作如何應對大數據時代[J].山東煤炭科技,2014(11):201-202.
[2]張英奎,王飛,房彥君.大數據時代的企業檔案信息化建設[J].北京化工大學學報(社會科學版),2014(03):32-33.
[3]樊樹娟.大數據時代檔案職業改革與發展研究[D].山東大學,2015(05):10.
[4]侯莉,吳娜.論企業檔案如何直面大數據時代的挑戰[J].機電兵船檔案,2016(03):12-13.