侯作龍 吳磊
摘 要:檔案事業作為一項基礎性服務性事業,面臨大數據技術帶來的沖擊和影響。本文通過分析認為,作為檔案工作的從業者,需要深入思考如何與大數據技術融合發展,既要為大數據技術產業發展服務,又要利用大數據技術發展促進自身發展。
關鍵詞:大數據;檔案管理;關注方向
人類進入二十一世紀之后,信息產業技術迅猛發展,特別是大數據技術更是突飛猛進,給人們的生活帶來了普遍影響。時至今日,各個行業都在思考如何利用大數據技術為本行業本產業服務,都在尋找與大數據技術融合的最佳結合點。
檔案事業是基礎性事業,也是服務性事業,同樣面臨大數據技術帶來的沖擊和影響,一樣要思考如何與大數據技術融合發展,既要為大數據技術產業發展服務,又要利用大數據技術發展促進自身發展。
1 大數據技術發展對檔案資源體系建設影響之一:來源更廣了
在人們的固有觀念里,檔案部門收藏的都是一些有關黨和國家的檔案,這就大大地限制了檔案的來源,把檔案的范圍集中在機關和企事業單位。大數據時代背景下,互聯網、社會、大眾生活也應該成為獲取檔案數據的來源。隨著互聯網的普及,越來越多的數據來自互聯網?;ヂ摼W已經成為最大的信息資源生產地。我國的網民數量已經穩居世界各國之首。據中國互聯網絡信息中心官網消息,第49次《中國互聯網絡發展狀況統計報告》(以下簡稱《報告》)2月25日在京發布?!秷蟾妗凤@示,截至2021年12月,我國網民規模達10.32億,互聯網普及率達73.0%,我國網民人均每周上網時長達到28.5個小時。城鄉上網差距繼續縮小,我國農村網民規模已達2.84億,農村地區互聯網普及率為57.6。老年群體加速融入網絡社會,截至2021年12月,我國60歲及以上老年網民規模達1.19億,互聯網普及率達43.2%??梢?,互聯網產生的海量信息已經成為檔案數據的一個重要來源。
同時,加大對民生的關注力度是檔案部門獲取檔案數據來源的又一個大的變化。最近幾年,為了響應國家政策,檔案部門加大了收集與民眾切身利益相關的民生檔案的工作力度。檔案部門還利用國際檔案日對普通公民展開教育,幫助民眾樹立社會檔案意識,喚起人們對我國的檔案事業的關注。[1]當前,為了使我國的檔案管理向生活化、草根化方向發展,家庭檔案和個人檔案的建立正成為一種新的趨勢。
2 大數據技術發展對檔案資源體系建設影響之二:內容更豐富了
信息資源是檔案部門安身立命的根本所在。信息資源數量越是大、門類越是多,檔案的價值才越能夠發揮出來,愈加凸顯檔案部門的社會地位。當信息技術進入大數據時代,檔案部門也意識到自身變革的重要性,開始不斷改變自身[2]。
2.1 檔案數據量幾何級增長
大數據時代背景下,我國檔案數據資源在總量上呈現出快速增長的趨勢[3]。截至2020年底,全國各級綜合檔案館館藏檔案91789.8萬卷、件。其中,中央級2046.6萬卷、件,?。▍^、市)級4666.9萬卷、件,副省級2456.4萬卷、件,地(市、州、盟)級19050.2萬卷、件,縣(區、旗、市)級63569.7萬卷、件。照片檔案2401.0萬張。其中,中央級20.0萬張,?。▍^、市)級285.5萬張,副省級235.5萬張,地(市、州、盟)級607.6萬張,縣(區、旗、市)級1252.4萬張。錄音磁帶、錄像磁帶、影片檔案112.1萬盤。其中,中央級1.8萬盤,?。▍^、市)級26.7萬盤,副省級3.4萬盤,地(市、州、盟)級32.5萬盤,縣(區、旗、市)級47.7萬盤。館藏電子檔案1387.5TB,其中,數碼照片390.2TB,數字錄音、數字錄像523.5TB。館藏檔案數字化成果19588.5TB。2020年度全國各級綜合檔案館共接收檔案8310.1萬卷、件,照片檔案105.3萬張,錄音磁帶、錄像磁帶、影片檔案4.4萬盤。2020年度全國各級綜合檔案館共征集檔案91.7萬卷、件,照片檔案25.6萬張,錄音磁帶、錄像磁帶、影片檔案0.4萬盤。截至2020年底,全國各級綜合檔案館紙質館藏資料4039.4萬冊。其中,中央級213.6萬冊,?。▍^、市)級272.9萬冊,副省級66.8萬冊,地(市、州、盟)級841.6萬冊,縣(區、旗、市)級2644.5萬冊。隨著新一輪各級各類檔案館的改擴建工程的批復與落地,我國檔案館館藏容量必將持續增長,對于存量檔案的數字化處理以及新增檔案的電子化處理將是檔案部門今后一段時間的工作重點,“雙套歸檔制”仍是我國檔案管理的主要制度[4]。而那些經過移交、寄存、撤轉并改的檔案,很容易就會讓檔案館的館藏存儲量由TB級跨越到PB。
2.2 檔案數據類型空前多樣
紙質、聲像、實物是常見的三種傳統檔案類型。隨著信息化的普及,電子檔案也成為檔案的一種類型。此外,檔案部門還要對瀏覽查詢記錄、用戶信息等進行保存。這些信息的載體不同、各自特點突出、結構差異大,因此檔案部門以不同的方式把它們分門別類地保管起來。這樣,即使是同一個信息也會因載體的不同而呈現出不同的數據形式[5]。同樣的道理,同一個數據形式會因載體的不同而呈現出不同的信息。異構數據大集群便由此產生。隨著大數據技術的發展,越來越多的半結構化、非結構化的數據將以表格、文檔、圖像、音頻、視頻、網頁等的形態呈現出來。異構化數據將是未來檔案館藏的重要來源,類型多樣、非結構化的數據將在檔案中占有越來越大的比例[6]。
2.3 檔案數據價值密度大幅下降
與一般的信息資源比起來,檔案能夠真實地記錄歷史,因此有著很高的價值。然而,對于大多數的檔案而言,從它們進入檔案館的那一刻起,便進入了深度睡眠的狀態,少有人問津。相關調查表明,真正具有較大利用價值、利用率較高的檔案在全部館藏中的占比并不是很高[7]。隨著大數據時代的到來,檔案數量也在不斷地增加,檔案價值密度也越來越低,因此有價值的檔案的占比越來越低。
2.4 檔案數據處理速度隨著技術進步不斷加快
信息化技術的普及使得檔案部門對檔案的管理工作,由過去的人工手動管理模式轉變為信息化的、網絡化的收、管、用業務流程管理模式[8]。時效性和便捷性是大數據時代檔案管理工作的兩大特點:第一,互聯網上的信息更新的速度都會很快,特別是那些有用的信息,若無法將它們快速地抓取出來,這些信息便難覓蹤影;第二,為了更好地滿足用戶的需求,檔案員應該快速地從海量的檔案中提取用戶想要的信息。怎樣才能夠快速地提取出用戶想要的信息呢?云計算技術是大數據背景下檔案部門亟須學習和掌握的一項技術[9]。云計算技術基于互聯網技術,利用各種精密的算法,在大幅度提高檔案資源處理速度的同時,提高查找的準確度。
3 大數據技術發展對檔案資源體系建設影響之三:收集方式更多了
在實際工作中,一些單位總是借故拖延或是從未積極主動地把檔案移交給檔案館。修訂后的檔案法賦予了檔案行政管理部門強制執行檔案收集移交的權利,也從法律層面明確了違法違規人員和行為的法律責任。但這依然屬于傳統的檔案收集模式,隨著互聯網技術的發展,大數據技術給檔案管理帶來了新的檔案收集方式:實時捕捉[10]。
互聯網可謂是深入到每個人的日常生活當中,它所蘊含的信息具有數量大、更新快、傳播廣的特點。這給大數據時代下的檔案收集工作提出了新的挑戰。對于檔案員而言,是否能夠捕捉到有價值的信息并將其歸檔,是對檔案員業務能力和操作水平的檢驗[11]。檔案部門應該轉變過去那種“等人送上門”的檔案收集辦法,利用云計算技術,實時抓取互聯網上有用的信息,使檔案資源動態化,不斷提高互聯網信息資源抓取的科學性、準確性[12]。
結語
人類進入二十一世紀之后,人們的生活受到計算機技術的影響越來越大,第三次技術革命之后產生的信息產業技術越來越快發展,技術進步帶來的大數據技術更是突飛猛進。時至今日,信息產業技術特別是計算機技術的影響已經深入經濟社會生活的方方面面,無論是朝陽產業還是夕陽產業,都在寄希望于能夠利用信息產業技術或者計算機技術促進本行業本產業的技術革新,都在思考如何利用大數據技術為本行業本產業服務,都在尋找與大數據技術融合的最佳結合點。檔案事業是基礎性事業,也是服務性事業,檔案工作者要思考如何與大數據技術融合發展,既要發揮檔案事業基礎性工作、服務性工作的特性,為大數據技術產業發展服務,發揮檔案為科學研究科技進步提供基礎數據服務的作用;又要利用大數據技術發展促進自身發展,利用大數據技術促進檔案管理工作提高效率、降低成本,進一步利用大數據技術提高檔案服務工作水平,做到超前服務、精準服務和個性化需求服務。本文從來源、內容和收集三個方面總結了大數據技術發展對檔案資源體系建設具有重大影響,希望能夠引起檔案管理人員的注意,引起大家的共鳴,共同研究大數據技術發展對檔案資源體系建設的意義,揚其所長,避其所短,讓大數據技術為檔案資源體系建設賦能。
參考文獻
[1]陳如明.大數據時代的挑戰:價值與應對策略[J].移動通信,2012(17):14.
[2]劉佳麗.數字時代紅色檔案資源開發利用策略研究[J].檔案天地,2022(05):50-51+14.
[3]于秀.大數據背景下檔案管理“價值鏈”的生成研究[J].文化產業,2022(12):100-102.
[4]董中印.大數據時代檔案信息資源開發芻議[J].黑龍江檔案,2022(02):95-97.
[5]趙卉.大數據指導下對辦公室檔案管理工作的創新研究[J].辦公自動化,2022,27(02):44-46.
[6]舒瓊.探究大數據時代下的檔案管理工作[J].山西青年,2021(24):65-66.
[7]李文瓊.大數據挖掘技術在高校檔案管理中的運用[J].鄭州鐵路職業技術學院學報,2021,33(04):106-107+112.DOI:10.13920/j.cnki.zztlzyjsxyxb.2021.04.032.
[8]董繼紅.大數據背景下檔案管理發展及趨勢分析[J].蘭臺內外,2021(35):10-12.
[9]馮華.大數據時代檔案管理的機遇與挑戰[J].當代工人(C版),2021(05):94-95.
[10]曲晶瑤.大數據視域下檔案信息建設發展研究動態研判[J].蘭臺世界,2021(10):110-114.DOI:10.16565/j.cnki.1006-7744.2021.10.29.
[11]楊爽.淺談大數據時代檔案管理工作存在的問題與對策[J].蘭臺內外,2021(27):64-65.
[12]王迎.基于大數據時代的檔案信息(下接65頁)
(上接62頁)管理研究[J].無線互聯科技,2021,18(18):33-34.
[13]盤活存量 優化增量 做強變量 提升質量 整體推進檔案資源體系建設[J].四川檔案,2022(02):26-27.
[14]加小雙,姚靜.數字人文賦能檔案資源體系建設:機制與路徑[J/OL].山西檔案:1-9[2022-07-10].http://kns.cnki.net/kcms/detail/14.1162.g2.20220227.1215.002.html
[15]張騰華.建立適合鄉村發展的檔案資源管理體系思考[J].黑龍江檔案,2022(01):108-110.
[16]倪代川,蔡麗華.數字檔案資源文化軟實力建設探析[J].山西檔案,2021(06):31-37+14.
[17]李晉.運用大數據技術加強干部人事檔案資源體系建設[J].數據,2021(12):66-67.
[18]劉凱,肖向華,霍艷芳,霍紅霞,馬立偉,李潔.“十四五”時期檔案學專業教材資源體系的構建研究[J].檔案學通訊,2021(06):100-102.DOI:10.16113/j.cnki.daxtx.2021.06.011.
[19]楊帆.國有企業檔案資源體系構建研究[J].浙江檔案,2021(08):28-30.DOI:10.16033/j.cnki.33-1055/g2.2021.08.010.
[20]王麗茹.地方綜合檔案館館藏資源體系建設的思考[J].蘭臺內外,2021(21):44-45.
[21]郭成斌,陳永楠,李珒,杜貞.社會治理視域下高校科技創新檔案資源體系構建[J].浙江檔案,2021(05):57-59.DOI:10.16033/j.cnki.33-1055/g2.2021.05.022.
[22]朱建邦,王巧玲,謝永憲.國家治理時代我國檔案資源整體治理體系構建研究[J].檔案學研究,2021(02):20-25.DOI:10.16065/j.cnki.issn1002-1620.2021.02.003.
[23]劉芳.檔案資源體系建設研究[J].機電兵船檔案,2021(02):39-40.
[24]秦敏.檔案信息化背景下高校檔案資源體系建設[J].辦公自動化,2021,26(02):53-54+47.
[25]宋璇.運用大數據技術加強干部人事檔案資源體系建設[J].辦公室業務,2020(02):161+168.
作者簡介:侯作龍,本科學歷,通榆縣債務管理服務中心館員;吳磊,本科學歷,白山市江源區機關事務服務中心職員。