胡雁 李媛 朱云燕
摘要:本文針對安全企業電子文檔內容管理(SECM)結合云南省環保行業實際進行應用探討,重點提升環保行業非結構化數據內容管理與使用,提升非結構化數據安全性及內容價值,從而更好服務于環境保護事業。
關鍵詞:電子文件管理;國家戰略;生命周期管理;智能數據管理;SECM;數據挖掘
中圖分類號:TP311.1 文獻標識碼:A 文章編號:1007-9416(2018)07-0212-02
1 環保當前非結構化數據管理模式
隨著《“十三五”國家信息化規劃》、《促進大數據發展行動綱要》、《國家信息化發展戰略綱要》、《生態環境大數據建設總體方案》等政策文件和指導性文件的發行。依托互聯網技術整合信息化系統,實現更加精細、動態的管理和決策,加快“數字化”向“智慧化”的轉變是信息化建設的必然趨勢。當前,環保行業逐步采用“互聯網+”、云計算、大數據技術推動環保數據資源整合,構建“互聯網+”綠色生態,實現生態環境數據互聯互通和開放共享。但在實際工作環境中基礎設施和系統建設分散,應用“煙囪”和數據“孤島”林立,業務協同和信息資源開發利用水平低,綜合支撐和公眾服務能力弱等突出問題,主要體現在:
(1)數據分散:在環保工作開展過程中產生大量數據,例如:環境評測取證圖片、視頻、報告、污染監測信息、工作文檔等海量數據。當前,這些數據均散落在各業務系統、員工辦公終端、文件服務器等環境中,數據處于無序狀態,各自管理和使用;
(2)存儲成本高:目前環保信息系統環境下相同的一份數據存儲在多個業務系統或存儲介質中,數據冗余現象普遍,造成存儲空間浪費增加數據擁有成本;
(3)數據安全難以保障:隨著環保信息化的普及,環境監測、環境執法、區域環境綜合整治等工作依托信息系統技術進行開展,業務系統數據成倍增長,特別是圖片、視頻、評測報告等非結構化數據,數據備份保護時間窗口越來越長。同時,在《政務信息資源共享管理暫行辦法》的推動下,各業務系統、部門之間建立數據共享,數據邊界安全難于保障;
(4)數據孤立、利用率低下:雖然環保信息化采用云計算技術對業務系統進行了集中,但各很多業務系統數據彼此孤立、無序,數據之間無法建立關聯性,數據價值難于發揮。
我們要向“智慧環保”轉型,行業多年積累的海量數據是轉型的關鍵所在,而在全新的信息生態環境下,目前數據管理模式的問題不斷凸顯,這就驅使我們在信息化建設中注重業務數據內容的全生命周期。
2 國內外電子文件管理模式
2.1 國外發展現狀
根據國外Gartner的分析報告,目前企業文檔數據管理,從傳統的以網盤為中心的EFSS向以內容為中心的SECM(安全企業內容管理)方向轉變。
安全企業內容管理(SECM)復合年增長率大約10%。在國外,美國的Box和Dropbox在企業內容管理方面有新的產品推出,主要解決的是企業協同辦公,數據集中存儲,企業社交通信等領域,更多的是提供通用型產品,以提高企業生產效率為目的。
2.2 國內發展現狀
目前,SECM(安全企業內容管理)的概念剛剛引入中國,國內市場中有道云筆記、印象筆記是做內容管理較早的產品,但是這些產品更多的是關注個人免費市場,還沒有大規模的適用于企業級市場中,近年來,國內愛數、聯想、億方云、360企業云盤等開始對非結構化數據的管理、使用和分析進行研究,海量非結構化數據采用分布云存儲技術進行存儲、管理已有一定的積累和驗證。
3 構建環保安全的非結構化數據管理體系
SECM安全企業內容管理涵蓋了企業內部、WEB、企業外部等數據內容的管理。我們將基于SECM(安全企業內容管理)對數據內容全生命周期管理的方法論結合環境保護行業數據安全合規行要求下進行應用探討。
3.1 中心化非結構化數據
環保行業普遍面臨應用系統開發廠商不一、類型多樣、復雜,業務系統數據“孤島”問題凸顯。辦公數據散亂無序,數據格式多種多樣,數據安全難于保障。在實際業務開展過程中業務系統之間、部門之間存在大量的共享、協作。例如:當前云南省環保系統統一部署了全省建設項目環境影響評價管理系統,大量的環評報告采用傳統文件服務器存儲,數據權限、邊界安全難于保障,采用傳統的存儲模式進行匯集,從性能、安全性、擴展性等方面都無法很好適應海量數據的存儲。SECM(安全企業內容管理)提供強有力的性能、整合、擴展能力,將數據內容進行統一聚合,構建非結構化數據中心,為環保大數據挖掘和分析奠定良好基礎。
3.2 重構非結構化數據存儲架構
根據IDC統計企業80%的數據為非結構化數據,而且數據增長速度快,數據從PB向ZB發展,SECM(安全企業內容管理)基于分布式云存儲技術架構,采用多副本技術確保數據高可用性,云存儲易擴展架構特點能幫助環保行業工作開展中環評報告、圖片、視頻等海量非結構化數據的安全存儲,并提供大并發的讀取性能,提供全新的數據存儲模式。
3.3 安全與合規的數據管理
云南省環境信息中心作為政府部門事業單位,數據安全性不言而喻,但在實際工作中對數據的管理、使用、傳播安全意識不足,文件被越權訪問、無意識的拷貝、對文件的誤操作等時常發生。另外,計算機系統容易受到自然災害、供電、病毒、黑客攻擊等各方面的破壞和侵襲,2017年五月勒索病毒的盛行給數據安全敲響警鐘。加之,數據的分散存儲、文件服務器安全性不足,這給數據安全管理工作帶來更大挑戰,我們以全省建設項目環境影響評價管理系統為例,該系統匯聚了全省環境影響評價報告數據,而且報告數據本身有一定的安全要求,采用文件服務器存儲權限劃分不清晰,后端數據監管不力,數據安全邊界模糊,無法滿足安全性和合規性的管理要求。SECM(安全企業內容管理)致力于數據內容的安全管理,從前端細粒度權限控制,存儲端切片加密,應用全面、可視化的審計模式,對所有訪問行為、數據使用情況、訪問地理位置、權限配置合規性等進行全面洞察,形成整個非結構化數據中心安全閉環。
3.4 建立高效、安全共享模式
日常工作中大量的工作需多人共享協作完成,當前行業中均通過郵件、FTP或者聊天軟件進行共享,一方面數據丟失、泄露、損壞等問題難于控制,另一方面冗余數據普遍存儲成本壓力不斷增加。伴隨著國家網絡安全法的實施對企業網絡、數據、IT環境的安全提出了更高的要求,數據共享安全值得我們企業去努力和探討。SECM(安全企業內容管理)的出現為企業數據共享提供了更安全、更高效的模式,在數據共享時實現數據細粒度權限控制,定義數據共享安全邊界,有效防止數據泄露、篡改。
3.5 優化數據檢索
在環保行業中大量的數據查找通過業務系統(如:OA、全省建設項目環境影響評價管理系統)和系統資源管理本地查找方式,面對時間較近的文件可以通過時間條件、文件名稱快速定位,但是對于海量的歷史數據對文件名稱、時間范圍模糊不清的文件,要能準確找到需要的文件猶如“大海撈針”,工作中常常耗費大量的時間去查找某個歷史環境評測項目的相關資料,基于SECM(安全企業內容管理)提供的全文檢索引擎,結合環境保護行業中數據類型(圖片、壓縮文件、視頻等)和結構,通過擴展文件標簽、屬性等優化搜索引擎填補環保行業中歷史數據的查找空缺。
3.6 數據內容分析
數據價值的發揮在于數據內容關聯性的分析挖掘,OA系統、知識管理系統雖然進行了一些文檔數據的統一存儲,但對數據內容無法建立關聯性,單個文件價值無法凸顯,統一非結構數據中心的建設為數據分析奠定良好的基礎,如何建立數據之間關聯性是環保大數據建設的關鍵前提,SECM(安全企業內容管理)核心在于企業數據內容的管理,它通過自身豐富的融合方式,匯聚企業內部各類數據,并對數據內容進行分類管理,建立規范化、標準化數據的管理機制,讓數據從無序變有序,數據源從多點變為統一,讓員工在業務開展過程中不斷優化數據源,提升數據質量,并對存儲數據進行詞頻、詞義進行分析,抽取文檔關鍵性內容,形成基于內容的聚類,加快大數據在環保行業中的落地。
3.7 擴展內外網交換,促進資源共享
近年來,很多安全廠商逐步推出安全隔離交換設備及解決方案,對傳統刻錄光盤交換的方式發起沖擊,隨著政務公開、政務信息共享的推行,傳統的數據交換弊端逐漸凸顯,一方面,光盤刻錄效率低下,成本高昂;另一方面,審計人員工作效率低,數據安全不可控,無法進行良好的審計和追溯。當下一些單位開始采用擺渡式網閘進行隔離交換,但是在交換中如何讓兩端緩存區域安全可控、合規給我們研究提出了新的挑戰。SECM(安全企業內容管理)基于EFSS及底層安全管控機制對交換數據采用權限、密級、加密等安全機制保障數據安全擴展環保行業內外網數據安全交換的探討,將智能數據內容識別過濾,流程化交換模型靈活應用工作中,簡化數據審核機制,釋放審計人員生產力。
4 結語
本文主要針對云南省環境保護行業SECM(安全企業內容管理)的應用探討,結合全省各級環保部門當前工作人員桌面文檔數據、業務系統產生的非結構化數據使用現狀和問題進行探索,SECM(安全企業內容管理)基于分布式云存儲架構定義非結構化數據中心;擴展全文檢索引擎、權限即共享的模式極大提高文件使用、傳輸效率;文件分類思想符合企業數據管理的需要;開放的接口加速業務系統數據的整合;通過應用探討真正實現非結構數據從生成、采集、存儲、使用、洞察、分析等全生命周期管理,當然,目前對SECM(安全企業內容管理)的應用探討還不夠深入,希望在今后的工作開展中不斷深化數據內容的管理與挖掘,讓企業無形的數據發揮蘊含的價值,為我省環境保護事業提供決策性指導意見。
參考文獻
[1]錢毅.電子文件管理系統功能需求規范定位研究[J].北京檔案,2011,(04):24-26.
[2]張玲.國有大型石油企業ECM平臺建設探悉[J].經濟研究導刊,2013,(12):39-40.
[3]齊朝輝.基于跨網閘的安全隔離交換平臺的設計與實現[D].華南理工大學,2009.