摘 要:人類社會已經進入了大數據時代,相伴而來的是大量的數據資源。大數據技術的發展,必然會對檔案管理工作帶來深遠影響。如何做好大數據背景下的檔案管理工作,成為廣大檔案工作者必須面對的一個問題。本文基于大數據視角,從簡要分析新時代背景下的大數據的內涵與特點入手,說明了加強大數據研究對進一步深化檔案管理工作具有重要意義,進一步指出了大數據背景下檔案管理工作改革需要重點關注三個方面,希望能對進一步強化我國的檔案管理工作有所裨益。
關鍵詞:大數據;檔案管理;關注方向
由于數據經濟的發展,人類社會將經歷巨大的變革,數據將成為世界發展的驅動力,相伴而來的是大量的數據資源。檔案管理工作,無論在政策的制定上、方法的改進上、技術的提升上,還是設備的配置上、人員的結構適應上,都或多或少地受到大數據的影響。如今的檔案使用者對信息的需求呈現出多樣化、個性化、高效化、異地化的特點,檔案管理工作者一邊要面對蜂擁而至的大量數據,一邊又要精準地為利用者提供需要的檔案資料信息。因此,在大數據時代背景下,我國的檔案管理工作需要在新的理念的指導下,以創新的模式不斷改革,更好地適應時代的需求。
1 新時代背景下的大數據的內涵與特點
1.1 大數據概念的淵源
自古以來,人類一直苦于處理各種各樣數量龐大而毫無規律的數據。人們為了解決這些大數據所帶來的困擾可謂是想盡了辦法。19世紀末,美國著名的統計學家赫爾曼·霍爾瑞斯在處理1890年美國人口普查數據的過程中發明了能夠識別卡片的電動機器。這臺機器的發明使得原本需要8年才能夠完成的工作在1年的時間內就被完成了。可以說,這一事件標志著人類社會進入到數據處理的新紀元[1]。后來,計算機的誕生和萬維網的建立,進一步提高了人類處理信息的能力。隨著計算機技術的日新月異,電子存儲設備的功能越來越強大,體積變得越來越小,而加起來的存儲成本卻不到當初的一億分之一,使較低成本地存儲海量數據成為可能[2]。1997年,美國的兩位研究員邁克爾·考克斯和大衛·埃爾斯沃斯為了對超級計算機所產生的超過主存儲器所能存儲的,甚至遠程磁盤都無法承載的信息和數據進行描述,最早地提出了“大數據”這一概念[3]。
信息技術的發展,已經深入到人類生活的方方面面。數據挖掘技術的出現,奠定了大數據時代的技術基礎。與此同時,人們對于數據的分析和使用的技術也日趨成熟起來[4]。與傳統的數據搜集所不同的是,數據挖掘具有實時性。大數據技術出現以前的數據搜集需要人們先擬定出調查問卷,然后逐一發放問卷調查再回收的方式進行采集,最后耗費大量人力對回收的調查問卷進行分析,才能得出調查的結論。此時的結論是否科學合理,是否符合客觀實際是很難保證的。因為有兩個弊端無法完全避免,一是調查問卷設置的合理性和科學性,二是無法及時對所搜集到的信息進行分析、處理。數據挖掘技術對應了大數據具有“數量大、來源廣、實時性”這三大特點,很好地解決了這兩個弊端,因此越來越受到人們的歡迎,成為重要的分析預測工具。根據特定的算法,計算機可以對數量龐大的、毫無聯系的數據進行自動分析,以揭示這些數據之間的聯系,從而判斷出其發展趨勢。也就是說,人們可以通過對大量的數據進行分析,根據數據所體現出的規律和趨勢做出決策判斷[5]。
最初,大數據技術僅僅被應用在國家安全領域,后來隨著超級計算機的發明以及存儲技術更新和算法的日趨成熟,越來越多的領域開始使用大數據[6]。近年來,我國在大數據技術領域發展得比較迅猛。2014年,大數據首次被寫進我國的政府工作報告;2019年,李克強總理將發展大數據、人工智能和高端制造、新能源汽車等提到了同等地位,足見我國對大數據發展重要性的重視程度。
1.2 大數據概念的基本內涵
《大數據:創新、競爭力和生產力的下一個前沿》曾提出一個大數據的概念,得到業內多數人員認可:大數據,通常指大小規格超越傳統數據庫軟件工具抓取、存儲、管理和分析能力的數據群[7]。
1.3 新時代背景下的大數據特點
1.3.1海量化。海量化指的是計算機需要收集并分析的數據量非常的大。僅僅是在過去的3年間,我們就產生出人類在4萬年時間里產生的信息量的總和還要多的信息量[8]。隨著數據量的不斷增大,TB、PB、EB這些計量單位將逐漸被人們所棄用,而以ZB為計量單位的時代正向我們走來。
1.3.2高速度。高速度指的是處理數據流的速度快。
1.3.3精確性。精確性指的是數據的準確性。現實生活中發生的一切都與大數據所能反映出來的內容有著密切的關聯性。數據的真實性和完整性關系到決策的準確性和科學性。數據的可信性、真偽性、來源和信譽、有效性、可審計性都是精確性的體現[9]。
1.3.4多樣化。多樣化指的是大數據的類型多樣。
1.3.5易變性。大數據的生成并不是一成不變的。易變性指的是數據流的變化率高。
1.3.6關聯性。關聯性指的是數據流之間的關聯性。相對于獨立的數據,具有關聯性的數據有著更大的價值。與過去單一強調單個數據流價值所不同的是,大數據強調的是在相互關聯的數據流中發現它們之間的相關關系,而非因果關系[10]。
1.3.7價值大。人們在處理大數據的過程中雖然降低了數據的價值密度,但是數據整體價值因通過數據的交換、整合、分析,從而發現數據之間的關聯性、獲得新的發現而有所提高。大數據對人類社會發展和人們日常生活有著很重要的影響,在工業、政務、教育、健康等領域發揮的作用將會越來越大[11]。
2 加強大數據研究對進一步深化檔案管理工作具有重要意義
加強大數據背景下的檔案管理工作研究,意義重大。第一,隨著大數據技術的進一步發展,必將進一步提高對各種類型的檔案文化資源的保護作用,保證檔案收集工作的完整性,檔案資源體系建設將得到進一步強化。第二,大數據技術可以對檔案業務工作流程進行優化,使檔案業務管理工作能力得到提升。第三,通過對檔案數據的不斷挖掘,使它們得以增值,為社會和經濟創造效益。第四,大數據技術將進一步強化檔案管理機構的職能職責,構建科學的檔案管理體系[12]。
3 大數據背景下檔案管理工作改革的重點方向
大數據環境下,信息技術成為社會發展的主要技術。大數據背景下的檔案管理仍然存在著一些問題[13]。但是,在大數據環境下,隨著整個社會對于信息共享需求的強烈,隨著大數據技術的進步,檔案管理工作必然會迎來進一步的改革。
3.1 利用信息技術實現檔案信息的綜合管理
大數據環境下要求檔案管理工作能夠有效的完成信息價值的開發,同時,現代社會的發展同樣也要求檔案管理工作能夠更多的應用現代信息技術,提高檔案管理效率,保證檔案管理的客觀性。所以說,在未來檔案管理工作的發展中,自然會越來越多的應用現代信息技術,而應用的方向也將逐漸豐富,也就是說,信息技術將會滲入到檔案管理的方方面面[14]。
3.2 合理利用檔案信息的大數據價值
通過上面對大數據的基本理論的分析我們可以發現,大數據最大的優勢就在于將散碎的、頻繁的信息固定下來,形成相對有價值的信息,并能夠科學的運用信息的價值,而檔案管理本身就是對已有信息載體的管理,所以自然涉及大量的流動信息。在大數據環境下,行業的競爭就在于對掌握信息的整合。從這個角度而言,檔案管理具有先天的優勢,所以在大數據環境下,檔案管理將實現合理利用檔案信息的大數據價值。一方面,檔案管理工作更多地應用現代信息技術,那么就可以在云存儲中留下一定量的檔案信息[15];另一方面,在固定的信息庫中,檔案管理工作人員可以通過科學的現代手段對信息進行分析,進而獲得有價值的內容,比如在企業檔案中,可以根據企業內部財務檔案的動態信息流分析出企業的財務走向,在人員檔案中可以分析出企業內部人才的基本組成,特別是對于對企業貢獻大的員工,可以分析其共性,進而在企業之后的招聘中進而針對性的人員引入,為企業節約時間和成本,這同時也合理的利用了檔案信息的大數據價值[16]。綜上,合理利用檔案信息的大數據價值是大數據背景下檔案管理的一個重要發展方向和發展目標[17]。
3.3 實現檔案管理與其它社會工作的融合
我們不斷強調大數據環境下信息的潛在價值,所以能夠有信息聚集的地方,自然就有現代社會的應用價值,而檔案管理本身是對信息的管理,一旦能夠實現利用現代信息技術手段管理檔案工作,實現檔案管理的智能化管理,那么在檔案管理工作中,就會獲得更多的信息。在這樣的情況下,檔案管理工作就會與其它社會工作融合,共同合理利用已有的信息價值,實現社會價值的再創造[18]。實現檔案管理工作與其它社會工作的融合,也將是大數據環境下檔案管理工作的一個發展方向[19]。
結語
檔案管理工作在人類社會已經進入了大數據時代的今天,必須盡快與時俱進,適應時代發展要求[20]。即使是最為保守的檔案工作者也必然已經發現了一個驚人的現象在越來越深刻地影響著檔案管理事業的發展,那就是大數據技術的發展[21]。筆者結合多年檔案工作經驗,以大數據為視角,提醒我們的檔案工作者必須要從大數據的內涵與特點入手,進一步加強對大數據研究,檔案管理工作在大數據背景下要重點關注三個方面,一是利用信息技術實現檔案信息的綜合管理,二是合理利用檔案信息的大數據價值,三是實現檔案管理與其它社會工作的融合。
參考文獻
[1]馮惠玲,連志英,曲春梅,周文泓,潘未梅,徐辛酉,李孟秋,王寧.回顧與前瞻:“十三五”檔案學科發展調查和“十四五”檔案學重點研究領域展望[J].檔案學通訊,2021(01):4-15.DOI:10.16113/j.cnki.daxtx.2021.01.001.
[2]金波,楊鵬.大數據時代檔案數據治理研究[J].檔案學研究,2020(04):29-37.DOI:10.16065/j.cnki.issn1002-1620.2020.04.004.
[3]張斌,楊文.中國檔案學研究熱點與前沿問題探討[J].圖書情報知識,2020(03):28-40+62.DOI:10.13366/j.dik.2020.03.028.
[4]徐擁軍,熊文景.檔案治理現代化:理論內涵、價值追求和實踐路徑[J].檔案學研究,2019(06):12-18.DOI:10.16065/j.cnki.issn1002-1620.2019.06.002.
[5]趙躍.大數據時代檔案數據化的前景展望:意義與困境[J].檔案學研究,2019(05):52-60.DOI:10.16065/j.cnki.issn1002-1620.2019.05.009.
[6]牛力,劉慧琳,曾靜怡,韓小汀.數字時代檔案資源開發利用的重新審視[J].檔案學研究,2019(05):67-71.DOI:10.16065/j.cnki.issn1002-1620.2019.05.011.
[7]金波,晏秦.從檔案管理走向檔案治理[J].檔案學研究,2019(01):46-55.DOI:10.16065/j.cnki.issn1002-1620.2019.01.008.
[8]張麗娜,夏慶利.高校人力資源管理的現實困境與對策——基于大數據思維下高校人事檔案信息化建設的探討[J].學術論壇,2016,39(04):157-161.DOI:10.16524/j.45-1002.2016.04.032.
[9]陳永生,蘇煥寧,楊茜茜,侯衡.電子政務系統中的檔案管理:安全保障[J].檔案學研究,2015(04):29-40.DOI:10.16065/j.cnki.issn1002-1620.2015.04.006.
[10]楊智勇,周楓.試析智慧檔案館的興起與未來發展[J].檔案學通訊,2015(04):45-50.DOI:10.16113/j.cnki.daxtx.2015.04.011.
[11]周耀林,朱倩.大數據時代我國數字檔案館的建設與發展[J].信息資源管理學報,2015,5(02):108-113.DOI:10.13365/j.jirm.2015.02.108.
[12]于英香.檔案大數據研究熱的冷思考[J].檔案學通訊,2015(02):4-8.DOI:10.16113/j.cnki.daxtx.2015.02.002.
[13]崔海莉.“大數據”時代檔案信息安全管理新思考[J].檔案學研究,2015(01):93-96.DOI:10.16065/j.cnki.issn1002-1620.2015.01.018.
[14]陳之常.應用大數據推進政府治理能力現代化——以北京市東城區為例[J].中國行政管理,2015(02):38-42.
[15]李小晨.大數據時代背景下的檔案管理探討[J].云南檔案,2013(06):48-50.DOI:10.14074/j.cnki.yunnan.archives.2013.06.018.
[16][英]邁爾·舍恩伯格,庫克耶著,盛楊燕,周濤譯.大數據時代(生活工作與思維的大變革)[J].浙江人民出版社,2013:23-26.
[17]崔小屹,韓青.用數據說話:大數據時代的管理實踐[M].北京:北京大學出版社,2013.
[18]周子晴.大數據時代檔案數據化生存與發展初探[J].浙江檔案,2022(05):45-48.DOI:10.16033/j.cnki.33-1055/g2.2022.05.012.
[19]謝群.大數據時代背景下檔案利用服務的挑戰與提升路徑[J].教育文化論壇,2022,14(03):121-124.DOI:10.15958/j.cnki.jywhlt.2022.03.019.
[20]李偉.大數據時代背景下醫院檔案管理的改進策略[J].大陸橋視野,2022(05):109-110.
[21]李晶.大數據時代背景下高校檔案管理模式的優化策略[J].蘭臺內外,2022(14):10-12.
作者簡介:逯晶,本科學歷,吉林省通榆縣職業技術學校副研究館員。