薄 洋
(吉林省民政信息中心 吉林 長春 130000)
隨著互聯網與信息技術的飛速發展,數據管理大潮已至。在大數據時代下,各類數據呈現幾何倍數增長。據公開資料顯示,僅僅過去兩年創造的數據總量,就可以占到全球總數據量的90%以上,并以每年超過40%速度高速增長。在這一整體大背景下,掌握數據的實體企業和第三方服務公司也越來越多,數據部門、信息部門和文檔管理部門加速整合,電子文件管理部門職能定位和整體功能也隨之發生變化。同時,隨著大數據技術的不斷創新發展,帶動文件管理技術也實現了新進步,諸如“版本控制”“文檔協作”“自動轉錄”“數據倉庫”“知識圖譜”“數字簽名”“時間戳”等技術都可以逐步探索引入到電子文件管理中[1]。另外,隨著大數據和電子文件的發展,國家也出臺了相關政策法規和行業標準,對其整體統一規劃和管理,促進大數據、電子文件在智慧政務、科技創新、工業輔助、科教文化、各類文件歸檔等方面發揮了積極作用。因此,研究大數據在電子文件管理中的應用,具有廣闊的前景和重要的現實意義。
電子文件是指在計算機等數碼設備或環境中生成,以不同數據格式、不同類型設備載體(包括光盤、硬盤、網絡云盤等),可以在計算機、互聯網環境下進行實時處理并共享傳遞的文件。電子文件有3個基本特征:(1)對設備和環境的依賴。電子文件的操作必須在一定信息設備和軟件環境下進行,包括其制作、形成、存儲、傳輸、應用的全過程。(2)格式多樣性、內容海量與豐富性。隨著計算機存儲技術以及運算能力的發展,電子文件的儲存內容和形式越來越豐富,包括圖片、文字、影視、二維碼信息等,文件形式也包括文檔類的DOC、XLS、TXT、PPT、PDF、MHT等,圖片類的JPG、BMP、GIF(動圖)、PNG、RAW等,數據類的RMVB、AVI、MKV、WMV、HDR等,數據類型的包括DAT、CSV、JSON、ARVO等。(3)載體存儲環境有要求。隨著計算機存儲技術的發展,電子文件儲存載體方式越來越多,容量越來越多,從磁盤、光盤到現在的固態硬盤、云盤、藍光等,對環境適應和承載能力也有所增強,但從整體來說,避光防潮、合適溫濕度、防電磁等還是基本要求。另外,電子元件本身也存在一定的損壞概率。
大數據時代的到來,為電子文件管理的應用層面帶來了新思想和新理念。首先,大數據作為一種全新數據形式,根據大數據本身帶來的計算成果,可以為電子文件管理帶來全新思路和模式。根據大數據統計信息,可以使管理者更清晰明了地熟悉電子文件構成類型、使用頻次、所占儲存空間等各類信息,方便管理者根據實際情況變化隨時調整管理決策。其次,大數據系統的全面介入,也可以為電子文件管理帶來更多的技術支撐和多樣化服務。運營方通過對海量數據的挖掘,可以更加清晰全面地掌握電子文件內容和用途,更有針對性地對電子文件內容進行分類和管理,可以為使用者提供更加多樣和個性化的服務。最后,我國自主研發的OFD電子文件格式得到逐步推廣,不僅更好實現了文件信息保護,促進了共享交流,更帶動大數據匯集和利用,實現了電子文件與大數據的良性互動與共同發展。
隨著大數據不斷介入電子文件管理中,電子文件對政府服務、企業管理、醫療教育等方面支撐作用日益凸顯。首先,在“最多跑一次”改革大背景下,各地為進一步推進政務互聯互通,強化信息共享,各地在電子證照、審批數據文件格式進行了統一,優化了流程,極大改善了營商環境。世界銀行發布報告我國躍升全球31位。其次,隨著電子合同、電子發票、電子保單等在各領域迅速推廣,有效降低了企業成本,對支撐我國數字經濟、分享經濟發揮了巨大作用。各類電子公文、電子郵件、電子文件在機關事業單位、企業中全面應用,提高了日常辦公效率,方便了政企、企業之間溝通協調。最后,電子憑證、電子財務報表在各企業和行政單位財務管理、稅務管理中也發揮了積極作用,通過各類電子憑證,實現各類采購審批、文件會簽、報銷管理的遠程管理,真正實現了利企便民。
大數據應用電子文件管理后,在很多資源管理方面發揮了積極作用。在進出口方面,通過電子報關單的實時生成和歸檔,實現進出口貨物數據的全面歸集。在企業開辦、事項審批、專利申報等方面,實現各類數據自動匯總,提升了管理效果。大數據對推動電子文件存儲利用方面,也發揮了重要價值。國家檔案局開展電子文件單套歸檔和電子檔案單套管理試點工作,探索數字記憶保存全新模式,該技術已在臺州古村落記憶中應用。另外,各地檔案管理部門、企業學校檔案管理部門也積極籌建數字檔案室,實現了雙重備份,保險系數大幅增強。
隨著大數據、電子文件的發展,我國對該領域的立法和管理工作也逐步建立完善起來,國務院出臺了一系列規章制度,各地方政府也結合各地實際出臺相關地方性法規。同時,各類電子文件的標準體系不斷完善,部門配套工程規范相繼出臺,為推動電子文檔良性發展打下了堅實基礎。
隨著大數據不斷發展,電子文件管理與應用的社會共識與影響力持續擴大。特別是電子文件與大數據融合發展,推進國家基礎信息產業的迅速發展,形成廣泛共識,依托于大數據、電子文件為基礎的“政產學研用”良性發展格局已經全面形成。
電子簽名作為當前電子文件廣泛使用的加密手段,主要采取加密數字快形式,但密鑰丟失、無法解密風險依然存在,需要我們統籌考慮。另外,隨著技術發展,三維模型系統數據越來越多,紙質版圖紙數據與電子數據并行,各類數據同質化和相似性很高,如何更好備份與分類儲存管理,也是我們必須考慮的焦點問題。
大數據背景下,電子文件深度開發與管理是各部門、企業都面臨的普遍挑戰。一方面,有關部門、企業在電子文件管理上,特別是介入大數據系統進行組織和選擇上,仍處在摸索和盲區階段;另一方面,在運用大數據對電子文件進行深度數據挖掘、發揮電子文件更多作用等方面,仍面臨很大的挑戰,目前國內成功和典型案例并不多。
DAMA數據管理體系是大數據文檔最常用管理體系。在這一框架下,文件和內容管理只是生命周期管理內使用和增強階段的一個模塊,電子文件管理內容和外延都十分狹小,這對于依托大數據系統,進一步開發電子文件更多價值和應用而言,存在天然的限制和藩籬,如何從技術角度增加其內涵和外延,拓展其價值區間,是需要我們考慮的問題。
一直以來,在電子文件管理中,由于技術和政策法規等方面原因,數據治理還存在缺位現象。2020年,國家檔案館、科技部聯合提出將科學數據列為電子文檔歸集范圍,但從實際工作上來看,開展相關工作的部門和企業并不多,系統管理則更是談不上,未來還有很長的路要走。
長期以來,我國一直實行紙質文件、電子文件雙套制管理模式,但隨著時代發展,特別是大數據時代加快到來,雙軌制已經很難適應工作需要,推行單軌制,充分發揮其管理模式和優勢,可以更好地實現電子文件管理目標,降低電子文件管理成本,更好地實現“分布式管理,集中式利用”,發揮電子文件憑證性、記憶性的“數據守護者”作用。
數據化是電子文件管理系統發展的趨勢和方向。同時電子文件管理對象是動態生長的業務數據體,有相對靈活的組織與展示方式,包括載體要素、功能要素、外觀要素等可舍、可換、可變。因此,對于電子文件,也要探索推行數據動態管理,針對電子文件中不同類型、不同載體采取不同的、隨時可調整的動態管理模式,提高管理效能。比如中國石油數據歸檔為例,管理方式動態靈活,將87個統建業務系統劃分為綜合管理型系統、經營管理型系統、生產運行型系統、連續監測型系統等四大類,對每類系統的數據歸檔范圍、歸檔方式及長久保存模式制定不同方案[1]。
各相關管理部門或企業,進一步強化電子文件歸檔管理與數據共建共享的協同發展,強化技術領域的對話與合作,拓展文件檔案管理工作和檔案學科,夯實內容(非結構化數據)管理的專業基礎,拓寬文件管理寬度與廣度,實現電子文件最大的應用和價值。同時,進一步加強大數據在電子文件管理的技術支撐,進一步推動電子文件管理和應用的發展[2-3]。
各地有關部門要在立法、標準上入手,進一步提升電子文件管理的法制化管理和標準化建設工作,加快建立完善電子文件管理工作體制機制,建立區域乃至全國統一的電子文件標準體系,為行業發展打下良好基礎。強化電子文件管理與大數據技術的融合協同管理機制,建立跨部門聯席會議制度,提高電子文件的綜合管理和開發效果[4]。
各地有關部門和企業要堅持長遠發展觀念,推動電子文件介入更多的領域和部門,發揮好電子證照、電子合同、電子檔案、電子病歷、電子圖紙、電子模型、電子印章、電子票據等作用,推動電子文件更多在國家和企業重大項目、重要工程、重要崗位發揮作用,特別是充分將大數據技術和電子文件管理應用相結合,發掘文件數據最大價值。
充分發揮大數據在電子文件管理應用的作用,理論研究和技術開發是基礎工作,要明確電子文件管理的內涵與外延,發揮電子文件業務憑證價值與信息資產價值。特別是要注重將大數據與電子文件的各自優勢相結合,充分發揮電子文件長期穩定性、安全性、重復利用性,同時探索在電子文件歸檔中融合數據管理,延伸電子文件數據挖掘、數據支撐、數據管理、數據共享等方面的積極作用[5]。
大數據在電子文件應用管理中將扮演更大的角色和使命,但雙方在融合發展、互促共進中,仍然面臨著一些困難與挑戰,要堅實以提升電子文件管理能力為主題,以法制化、規范化管理為保障,深化重點領域改革應用,強化技術理論支撐,推行電子文件管理單軌制,利用大數據提升電子文件管理能力,強化協同拓寬文件管理寬度與廣度,充分發掘和發揮電子文件更大功用和價值,促進經濟社會發展。