楊文忠
(內(nèi)蒙古升騰電子科技有限公司,內(nèi)蒙古 呼和浩特 010010)
檔案管理作為管理工作的重要組成部分,面臨著先進(jìn)網(wǎng)絡(luò)技術(shù)綜合運(yùn)用跨越式發(fā)展的挑戰(zhàn),傳統(tǒng)的檔案管理模式已經(jīng)無法適應(yīng)當(dāng)今世界計(jì)算機(jī)網(wǎng)絡(luò)信息化的發(fā)展潮流[1]。檔案信息化工作是信息化建設(shè)的核心,實(shí)現(xiàn)檔案的信息化管理有利于提高工作效率,有利于避免人工管理導(dǎo)致的諸多疏漏。因此,實(shí)現(xiàn)新形勢(shì)下檔案管理模式的網(wǎng)絡(luò)化越來越受到各領(lǐng)域的關(guān)注,當(dāng)前對(duì)檔案管理與服務(wù)系統(tǒng)的管理手段進(jìn)行創(chuàng)新是建設(shè)現(xiàn)代化檔案管理機(jī)制的必要舉措[2]。
檔案信息化本質(zhì)上是利用相應(yīng)的信息檢索系統(tǒng)實(shí)現(xiàn)檔案數(shù)據(jù)的歸檔、查詢和管理。其一般方式是事先用計(jì)算機(jī)錄入原始檔案材料,之后按照行業(yè)規(guī)則對(duì)檔案數(shù)據(jù)進(jìn)行規(guī)范性編碼,以便于日后的檢索和 管理。在此基礎(chǔ)上可通過建設(shè)相關(guān)的互聯(lián)網(wǎng)門戶網(wǎng)站實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)庫資料的線上查詢和遠(yuǎn)程服務(wù)[3],實(shí)現(xiàn)多種路徑、多種方式、全方位的服務(wù),使得檔案數(shù)據(jù)能以最短路徑進(jìn)行必要的社會(huì)共享,最大程度發(fā)揮其社會(huì)服務(wù)功能。
目前國內(nèi)檔案管理系統(tǒng)仍存在很多不足,如保密性較差、訪問效率較低、可維護(hù)性較差、大量數(shù)據(jù)處于休眠狀態(tài)、無法為使用者提供便捷和低效的訪問途徑等,這些現(xiàn)狀歸根結(jié)底都是因?yàn)閭鹘y(tǒng)的、低效的人工管理方法造成的。
隨著城市化進(jìn)程的加快,人口越來越集中,檔案相關(guān)的數(shù)據(jù)量和需求量也越來越龐大,需求頻次也越來越高,功能是否齊全,訪問是否高效,維護(hù)是否方便已成為衡量檔案管理系統(tǒng)信息化建設(shè)的標(biāo)志性成果[4]。針對(duì)這種現(xiàn)實(shí)需求,越來越多的企業(yè)開始重視這個(gè)問題并不斷嘗試將先進(jìn)的編程框架和技術(shù)運(yùn)用到檔案管理系統(tǒng)的設(shè)計(jì)中,通過對(duì)業(yè)務(wù)流程的不斷磨合,逐步提升相關(guān)軟件對(duì)歷史檔案和現(xiàn)實(shí)業(yè)務(wù)的支持力度,大幅度提高檔案數(shù)據(jù)的利用率。
隨著互聯(lián)網(wǎng)技術(shù)、電子信息技術(shù)在檔案管理上的深入應(yīng)用,任何組織、任何部門都迫切需求建立符合自身特點(diǎn)的檔案管理系統(tǒng)已實(shí)現(xiàn)高效地組織和管理內(nèi)部活動(dòng)以及活動(dòng)過程所產(chǎn)生的各類文獻(xiàn)記錄,筆者所提出的智能檔案管理系統(tǒng)能夠?yàn)楦黝愑脩籼峁┛焖佟⒏咝铱删S護(hù)較優(yōu)的檔案管理模式[5]。
智能檔案管理系統(tǒng)主要包含數(shù)據(jù)處理、數(shù)據(jù)傳遞、數(shù)據(jù)檢索、數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)分析等。其中,檔案數(shù)據(jù)處理主要用于對(duì)檔案數(shù)據(jù)進(jìn)行預(yù)處理,針對(duì)不同的需求使其獲得新的結(jié)構(gòu)形態(tài)甚至產(chǎn)生新的數(shù)據(jù);檔案數(shù)據(jù)傳遞主要用于將數(shù)據(jù)信息在不同的平臺(tái)進(jìn)行傳輸和交互。數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)分析和數(shù)據(jù)檢索等部分則依據(jù)不同的業(yè)務(wù)邏輯用對(duì)應(yīng)的算法實(shí)現(xiàn)對(duì)數(shù)據(jù)的進(jìn)一步處理和展示。該系統(tǒng)利用分析控制決策模型做業(yè)務(wù)邏輯處理,配合不同種類數(shù)據(jù)庫完成機(jī)構(gòu)組織的正常運(yùn)行、管理和決策,系統(tǒng)功能模塊,如圖1所示。

圖1 系統(tǒng)功能模塊
智能檔案管理系統(tǒng)主要采用瀏覽器/服務(wù)器架構(gòu)的模塊化管理方式,不同的用戶可根據(jù)業(yè)務(wù)實(shí)際范圍和規(guī)模選擇適合本單位的管理模塊,系統(tǒng)以標(biāo)準(zhǔn)化的方式進(jìn)行統(tǒng)一管理,在降低成本的基礎(chǔ)上提高工作效率;在流程清晰化,操作簡單化的基礎(chǔ)上實(shí)現(xiàn)數(shù)據(jù)、流程和結(jié)果的可視化,實(shí)現(xiàn)對(duì)智能檔案數(shù)據(jù)的價(jià)值挖掘,為決策者提供決策支持。
1.3.1 數(shù)據(jù)資源管理系統(tǒng)。數(shù)據(jù)資源管理系統(tǒng)是進(jìn)行后續(xù)的數(shù)據(jù)分析和價(jià)值挖掘的前提和基礎(chǔ)。積累大量的檔案數(shù)據(jù)資源并通過數(shù)據(jù)倉庫或數(shù)據(jù)庫進(jìn)行有機(jī)整合,使之成為融會(huì)貫通且相互可讀取、可查詢的大數(shù)據(jù)存儲(chǔ)體系,從而實(shí)現(xiàn)高效的數(shù)據(jù)資源共享,為業(yè)務(wù)系統(tǒng)的功能達(dá)成提供基礎(chǔ)性數(shù)據(jù)支撐。
1.3.2 數(shù)據(jù)分析系統(tǒng)。數(shù)據(jù)分析系統(tǒng)主要包含數(shù)據(jù)聯(lián)機(jī)分析平臺(tái)和數(shù)據(jù)多維分析平臺(tái),其底層采用開源的Python工具包,如Scipy、Numpy以及Pandas等,具有高效、已使用和修改的特性。其中的數(shù)據(jù)聯(lián)機(jī)分析平臺(tái)支持通過聯(lián)系方式橫向擴(kuò)展數(shù)據(jù)接口,具備對(duì)多源異構(gòu)數(shù)據(jù)的實(shí)時(shí)查詢、存取和分析能力。其多維分析平臺(tái)對(duì)超大規(guī)模數(shù)據(jù)的多維特征進(jìn)行有效降維后對(duì)數(shù)據(jù)進(jìn)行二次聚合,實(shí)現(xiàn)包含超級(jí)特征的數(shù)據(jù)的聚攏效應(yīng),對(duì)數(shù)據(jù)進(jìn)行“切塊和切片”,鉆取到細(xì)節(jié)中從而揭開數(shù)據(jù)的關(guān)系。在實(shí)現(xiàn)高速查詢響應(yīng)的同時(shí)能夠?qū)?fù)雜多維特征數(shù)據(jù)的關(guān)鍵信息及關(guān)聯(lián)關(guān)系特征進(jìn)行提純和凈化,保證對(duì)數(shù)據(jù)價(jià)值挖掘的有效性。
1.3.3 數(shù)據(jù)挖掘系統(tǒng)。 數(shù)據(jù)挖掘系統(tǒng)主要針對(duì)大規(guī)模檔案數(shù)據(jù)進(jìn)行智能分析和挖掘,發(fā)現(xiàn)數(shù)據(jù)背后潛在的價(jià)值和規(guī)律,其過程包含對(duì)原始數(shù)據(jù)的預(yù)處理,如清洗、加工、標(biāo)準(zhǔn)化等,之后進(jìn)行分析直到發(fā)現(xiàn)規(guī)律并進(jìn)行價(jià)值析出,最后將分析或統(tǒng)計(jì)結(jié)果進(jìn)行可視化呈現(xiàn)。
該系統(tǒng)中的數(shù)據(jù)挖掘分為3個(gè)階段:數(shù)據(jù)準(zhǔn)備階段、價(jià)值挖掘階段和評(píng)價(jià)篩選階段。
首先,智能檔案信息系統(tǒng)對(duì)無序數(shù)據(jù)進(jìn)行自主篩選并刪除其中重復(fù)的數(shù)據(jù),根據(jù)數(shù)據(jù)的價(jià)值權(quán)重和價(jià)值密度處理缺失值,之后根據(jù)箱線圖法或正態(tài)分布原理對(duì)異常數(shù)據(jù)進(jìn)行處理,主要依據(jù)數(shù)據(jù)自身規(guī)律并考慮異常數(shù)據(jù)出現(xiàn)的原因做進(jìn)一步篩選,最終得到有效精準(zhǔn)的高價(jià)值基礎(chǔ)數(shù)據(jù)。
其次,對(duì)于處理完畢的基礎(chǔ)數(shù)據(jù),本系統(tǒng)通過物理或邏輯方法分析數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,通過線性分析、非線性分析、聚類分析等方法,利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)算法以及深度學(xué)習(xí)模型對(duì)其進(jìn)行訓(xùn)練和分析,挖掘數(shù)據(jù)內(nèi)在聯(lián)系,找出隱藏的價(jià)值和規(guī)律[9]。
1.3.4 3D可視化技術(shù)。 智能檔案管理系統(tǒng)采用旋轉(zhuǎn)陣列形式的LED立體顯示方法實(shí)現(xiàn)檔案數(shù)據(jù)的立體投影顯示。立體顯示的本質(zhì)是基于平面圖像的運(yùn)算及處理,通過左右眼睛的位置差異造成影像的位移,在大腦中形成立體影像。
旋轉(zhuǎn)陣列式LED立體顯示器是利用當(dāng)前成熟的LED發(fā)光材料,通過高速旋轉(zhuǎn)LED組合陣列,形成立體顯示空間。以單根500像素的LED顯示條為例,將其以一端為圓心進(jìn)行高速旋轉(zhuǎn),可以形成面積為785 000像素的圓形單層顯示平面。通過程序控制這單根500像素的LED發(fā)光點(diǎn),能夠形成單層圖像信息的顯示。用多根LED顯示材料旋轉(zhuǎn)可形成立體空間場(chǎng),能夠近似實(shí)現(xiàn)全立體裸眼顯示。
1.3.5 安全保障系統(tǒng)。智能檔案管理系統(tǒng)通過具備完善的安全保障系統(tǒng)來保障數(shù)據(jù)和系統(tǒng)的安全。從保障技術(shù)方面來看,該系統(tǒng)主要采用包含“保護(hù)、檢測(cè)、應(yīng)對(duì)、恢復(fù)”四模態(tài)控制的自適應(yīng)機(jī)制來實(shí)現(xiàn)。運(yùn)用各種安全協(xié)議在協(xié)議層和網(wǎng)絡(luò)結(jié)構(gòu)層上做物理和邏輯層面的保護(hù),通過物理檢測(cè)設(shè)備對(duì)系統(tǒng)安全的薄弱環(huán)節(jié)逐個(gè)進(jìn)行檢測(cè),對(duì)可能的入侵攻擊行為進(jìn)行預(yù)測(cè)和判斷,對(duì)發(fā)現(xiàn)的漏洞及時(shí)打補(bǔ)丁,增強(qiáng)系統(tǒng)的健壯性。同時(shí)通過快速自恢復(fù)機(jī)制保證在遇到惡意攻擊時(shí)能夠及時(shí)消除風(fēng)險(xiǎn),第一時(shí)間從最近的備份點(diǎn)恢復(fù)業(yè)務(wù)。
智能化檔案管理系統(tǒng)實(shí)現(xiàn)了功能模塊化、數(shù)據(jù)處理智能化、統(tǒng)計(jì)和分析結(jié)果可視化,最大程度解決了政府、企事業(yè)單位、公檢法司、教育、醫(yī)療、法律和金融等不同行業(yè)的檔案信息化管理和智能化數(shù)據(jù)挖掘的需求,解決了傳統(tǒng)檔案管理中粗放、低效、不可靠和難以保密的問題。該系統(tǒng)的實(shí)施可使檔案管理工作人員的工作量下降80%~90%,通過對(duì)檔案的深度挖掘可使人才適用率提升50%~60%,檔案系統(tǒng)的工作效率和數(shù)據(jù)利用效果顯著提升。
傳統(tǒng)的檔案管理模式因低效、粗放等原因早已無法適應(yīng)當(dāng)今的信息社會(huì),實(shí)現(xiàn)新形勢(shì)下檔案數(shù)據(jù)的信息化管理和智能挖掘已成為檔案管理革新的必經(jīng)之路。該系統(tǒng)基于這種需求實(shí)現(xiàn)了檔案數(shù)據(jù)管理的模塊化、標(biāo)準(zhǔn)化和規(guī)范化,但依然存在數(shù)據(jù)預(yù)處理不夠智能、數(shù)據(jù)挖掘不夠精細(xì)等問題,該系統(tǒng)將針對(duì)這些問題繼續(xù)改進(jìn)和完善,為檔案管理和價(jià)值挖掘提供更多更好的方案。
內(nèi)蒙古科技與經(jīng)濟(jì)2022年2期