文/雷 勇
信息技術的迅猛發展,帶來了海量數據的聚集和沉淀,大數據的概念應運而生。我國在“十三五”發展期間,大數據不僅從概念上成為熱門的話題,從檔案管理的現實中更加成為研究的重要課題,它無論在宏觀的社會領域還是微觀的企業個體,都從本質上沖擊著傳統的檔案管理模式。本文將基于大數據的概念和特點,以航空企業為背景,重點研究其對企業檔案管理模式帶來的挑戰和變革
隨著信息技術的不斷發展和互聯網信息的交互使用,海量信息不斷聚集和沉淀,數據的頻繁使用和調用,使得“大數據”的概念被提上日程,被不斷延伸和發展,終成為海量信息的代名詞。在我國“十三五”期間,航空企業幾十年的資源沉淀,“大數據”堆積已經成為企業的普遍現象。企業的信息多以紙質的形式存在,或以電子的形式存在PDM、0A等流程設計和辦公管理系統中。那么大數據和檔案有怎么樣的互聯互通關系,又有怎樣的差異和不同以及它對現有檔案的管理模式會帶來怎樣的變革和挑戰,本文著重進行分析與思考。
為便于分析與研究,筆者首先從大數據概念入手,并厘清其與檔案的關系。
筆者以為,大數據顧名思義是個體數據依靠一定的軟硬件平臺所形成的規?;?,就企業而言,它能夠反映和記錄企業各項工作的發展蹤跡,是企業信息的匯集。
檔案是企業各項生產、經營等活動所形成的具有保存價值的歷史記錄的總和。在形成特征上,大數據與檔案都是企業生產經營活動的原始記錄,具有歷史性和確定性,這是它們的共通之處;在價值利用上,大數據是沒有經過鑒別的數據堆積和聚合,而檔案則是依據一定的鑒定評判標準,進行有針對性的保存和利用。從數據本體而言,大數據是集合,檔案則是集合中的子集。
大數據在形式上是企業各項活動的原始記錄,無論是電子信息,還是紙質等其他載體形式的數據,因為沒有被篩選,其量的積累驚人,造成了現有企業庫房存放面積的嚴重腫脹和飽和。對于企業內部的各單位而言,尤其是機構撤銷的內部機構,歷史形成的數據都在各單位自行保管,由于保管條件的限制,加之有些數據屬于歷史原因形成,鑒別無從著手,又不能輕易處置,因此歸檔成為他們解決此類問題最便捷的途徑,這種潛意識的思維和行為,無疑給檔案部門的工作帶來極大的壓力和挑戰。諸如:
各單位急于歸檔的各類數據,包括文件、圖紙、工資、記錄、各類報表、上報信息等磁介質和紙介質,雖然檔案部門在接收之前,就已經到各單位進行了鑒別、甄選,但是仍然無法剔除太多無用數據資料,只能將各單位積累的大量歷史數據和資料全部接收,暫存于檔案館內,這樣就造成了館藏從量上的驟增,進而庫房面積嚴重緊缺,給檔案管理部門帶來庫房趨緊和人力成本劇增等壓力。
對于檔案工作而言,整理是最基礎的工作,只有整理到位,提供利用才能便捷無誤,但因各單位歸檔的所謂歷史形成的數據群,整無出處,理無依據,給檔案工作的整理、編目造成了諸多不便;加之歸檔的大多數數據年代久遠,價值無從考證,檔案的鑒別工作就如同雞肋一樣,嚼之無味,棄之可惜,造成了檔案工作進退兩難的境地。
館藏的驟増,必然帶來庫房面積的緊缺,對于檔案而言,其保管條件必須做到“八防”,除濕、除塵和溫控都有嚴格的要求,但這種保管條件非一朝一夕之間就可形成;由于量的劇增,現有的庫房無法滿足保管的需要,檔案部門就要以各種請示、報告、閱批件等形式來說服企業領導為這些所謂的歸檔“大數據”另擇佳處,而往往這些“佳處”就是一些無人辦公的偏遠地方,沒人值守,無人管理,一切基礎性設施無從談起,歸檔的數據只能沉睡在冰冷的“庫房”中,成為真正意義上無人知曉的僵尸檔案,慢慢地隨著時間的推移而被人們遺忘,造成了企業歷史數據的流失,似此勢必會給企業帶來了隱性的巨大損失。
大數據從本質上來說,就是各類數據的匯集;而檔案從本質上說是在大數據匯總、統計、分析的基礎上得來的有價值的信息,能為企業帶來價值和變相地產生效益。然而檔案部門所保管的上述“大數據”基本上都是一些難以鑒定的數據堆積,統計、分析受到了時間、事件和經辦人員的限制,難以實現真正意義上的數據分析和數據挖掘,檔案的價值也就難以體現;因為數據的挖掘和分析不僅僅是經驗主義和意識形態的想當然,更多是結合當時的歷史事件所做的信息判斷,將其通過一定的語言組織,形成可以為企業決策所用的有價值的檔案信息,可以為企業創造效益,進而提升檔案部門的服務功能和影響力。
大數據的產生是隨著企業科研生產等各項工作開展而出現的,它對檔案部門帶來的上述沖擊是擺在檔案部門面前的現實問題,如何解決與應對這些壓力和挑戰,筆者認為應從以下幾方面著手:
企業內部應以部門為單位,按照檔案部門管理的制度要求,進行數據的分類管理和定期鑒定,同時檔案部門也應定期做好各單位數據管理的培訓和指導工作,便于各單位數據管理都有一個統一的標準,明確細化歸檔范圍,保證各單位產生的重要價值信息能夠及時被檔案部門收集和集中管理,為后期數據的二次開發奠定基礎,也能對不易鑒別的數據從源頭了解其保管的價值和時限,不至于堆積太多,最終導致無從下手,失去了數據管理的意義。企業內部各單位的數據,有些雖不歸檔,但對于企業來說,在特定的時期內也屬于有效信息,不可隨便處置。因此檔案部門可以每年進行各單位的數據積累情況摸底,有針對性地制定合理可行的風險防范方案,保證“數據中心”有序、合理地運行,達到良性循環的目的。

檔案管理安全是檔案管理工作的重中之重,檔案部門應在館址選擇、面積預估、突發情況等方面制定切實可行的防范措施,例如在數據驟增、面積緊缺、保管條件達不到要求時,檔案部門應如何應對?其實對于企業而言,檔案部門的地位永遠被定性在技術保障的名列之下,如若要被重視,應有所作為,比如在海量數據中尋求規律,發現可以創造效益的有用信息;在數據收集整理前,做好各項工作的前端控制;在突發事件發生后,可以第一時間控制局面,掌握解決問題的主動權;可以利用一切機會,為檔案的保管創造更好的條件,以解決不可預估的突發事件,降低損失。
數據分析是大數據能夠成為檔案最主要的途徑之一,大數據雖然不會說話,但是數據分析會說話,會暴露管理和生產中存在的問題。例如好的統計分析,可以幫助企業的決策者了解什么時段什么樣的人在什么情況下產生的質量問題多,產生的廢品多;比如人員的學歷、專業及成本、效益分析,可以幫助企業在日后人才的引進方向和數量提供參考。但是對于企業的檔案人員而言,并非專業出身,檔案的基礎管理和業務能力相對較弱,對于數據的整理和分類較為熟悉,但是對于數據的統計分析能力卻不擅長,然而數據分析之于企業的職能部門,之于企業管理層面都有著決策的重要作用,因此檔案部門在做好日常整理工作的同時,更要做好和指導好各部門的數據統計和分析的能力,實現跨部門的數據統籌分析,解決分析受限,效益難創的局面。
大數據研發計劃,就是要從檔案管理的方向上實現數據資源的市場化觀念,挖掘數據更深層次的價值,用最小化的數據管理成本實現最大化的效益,解決大數據躺在文件柜中睡大覺的局面,實現通用數據的專用轉化,實現有用信息的共享化管理,實現集數據挖掘、統計分析和推廣為一體的資源庫建設工作,讓大數據資源按照一定的規律自成體系,為企業科研生產經營提供依據和借鑒作用。
通過上述分析與研究可見,大數據不僅僅是概念上的名詞,它更多的應該是一種基于某種規律而自成體系的集合體,要實現這種產生效益的集合體,離不開檔案部門從數據源頭的總體設計和統籌規劃,更離不開檔案管理人員自我提升的意識和恪盡職守、有所作為的心態,只有這樣,基于大數據的檔案管理工作才能緊跟企業發展的實際,才能讓大數據狀況下的檔案管理被認可,有效發揮出檔案管理的真正價值和作用,為企業的發展與進步提供更大的助推力。