李韜,王紅濤,王富強,趙靜,馮連強
(中國重型機械研究院股份公司, 陜西 西安 710032)
近年來因為信息泄密而造成的一些公司權益受到侵害的情況屢見不鮮,而公司中往往需要頻繁的拷貝文件,這在很大程度上增加信息泄露的可能。為避免內(nèi)部信息泄露事件,對于一個公司來說很需要有一個文件拷貝檢測系統(tǒng)。
一般的拷貝文件,操作人員需要按照清單一個個對比文件內(nèi)容來甄別違規(guī)文件,對于一個或兩個簡單的圖紙文件,這種傳統(tǒng)的文件檢查高效又準確;而當文件過多或者有復雜的圖紙文件時,傳統(tǒng)的人工文件檢查方法就顯得執(zhí)行速度比較慢,并且操作人員容易出現(xiàn)檢查失誤。將拷貝文件中的文件檢查工作交由計算機來處理,將極大提高工作效率及準確性。
本文采用圖像檢索分析的方法對拷貝文件進行檢測,這種方法快捷、準確,自適應地應對各種類型的文件。減少了拷貝過程中消耗的時間,提高了甄別違規(guī)文件的準確性,在很大程度上杜絕了拷貝過程中的信息泄露。
目前對于文件拷貝時文件的檢查分析并沒有統(tǒng)一有效的方法,圖像作為信息的主要載體之一在項目設計中更具直觀性,它包含的信息數(shù)據(jù)較之文本的信息數(shù)據(jù)更難被檢查分析。
本系統(tǒng)采用圖像檢索分析方法檢查分析文件,這種圖像檢索方法將拷貝文件分為通用的圖像類型文件、文檔文件和CAD圖紙文件,分別采用不同的方式進行分析,如圖1所示。對于通用的圖像類型文件,只需要將圖像文件直接顯示;對于文檔文件,文件中可能包含了很多圖紙圖像,需要先將文件中所有的圖像檢索出來,再將圖像依次顯示在交互界面;CAD文件不僅需要將圖紙顯示在交互界面,還需要對圖紙內(nèi)部的信息進行分析,例如一個圖紙文件包含幾個圖紙,圖紙的類型等信息都需要確認。

圖1 圖像檢索分析方法過程圖
需求分析是建立新系統(tǒng)的關鍵環(huán)節(jié),它可以幫助確定系統(tǒng)的需求,描述系統(tǒng)的目的和功能。本系統(tǒng)需求分析階段的主要工作是根據(jù)系統(tǒng)初始要求以及用戶咨詢意見確定系統(tǒng)具體要實現(xiàn)的功能模塊。
本系統(tǒng)實現(xiàn)的初始目標為:
(1)針對AutoCAD軟件產(chǎn)生的DWG文件,能夠判斷是否包含多個圖紙文件及圖幅大??;
(2)針對JPG等圖像文件,能夠產(chǎn)生縮略圖,給用戶提供判斷依據(jù);
(3)針對DOC、EXCEL文件,能夠提取文件中的圖片,并展示給用戶;
(4)針對PDF文件,可以判斷文件包含的頁數(shù),并展現(xiàn)每一頁給用戶以作為判斷依據(jù)。
通過詳細分析文件拷貝檢測系統(tǒng)的初始目標,可將系統(tǒng)的需求分析劃分為:信息需求分析、功能需求分析和方法需求分析。信息需求分析指分析系統(tǒng)中的輸入數(shù)據(jù)和輸出數(shù)據(jù),包含用戶的信息數(shù)據(jù)、拷貝文件的類型數(shù)據(jù)、拷貝文件的檢測分析結(jié)果信息數(shù)據(jù)等。信息需求分析階段對于一個系統(tǒng)的建立很重要,需求分析人員分析信息需求可以幫助系統(tǒng)設計人員更好地設計出系統(tǒng)的整體框架和功能模塊。信息需求分析階段需要對系統(tǒng)的輸入數(shù)據(jù)進行采集,需要采集管理員的用戶信息以及不同用戶可能在系統(tǒng)中需要的信息類別數(shù)據(jù)和拷貝文件涉及到的文件類型數(shù)據(jù),然后進行分析歸納出完整的輸入數(shù)據(jù)。對于搜集和整理過的輸入數(shù)據(jù)需要通過一些方法,例如:過程控制方法、信息交互驗證方法和數(shù)據(jù)應答方法等,處理得到輸出數(shù)據(jù),輸出數(shù)據(jù)包含信息修改結(jié)果數(shù)據(jù)、拷貝文件的檢測分析結(jié)果信息數(shù)據(jù)等。
系統(tǒng)的功能需求分析基于系統(tǒng)的初始目標以及信息需求分析,主要包括用戶驗證、操作交互、基于圖像檢索分析方法的文件分析、文件拷貝、異常事件的診斷處理、操作記錄、信息修改以及系統(tǒng)可視化界面構(gòu)建等,同時需要根據(jù)實際情況添加輔助處理功能。
方法需求分析主要包括界面搭建方法、框架設計方法和數(shù)據(jù)采集整理方法等。系統(tǒng)基于C#編程語言進行界面設計搭建,以Windows應用程序界面的形式與用戶進行交互;系統(tǒng)使用MySQL數(shù)據(jù)庫對系統(tǒng)涉及的數(shù)據(jù)進行管理,其中借助ODBC驅(qū)動實現(xiàn)系統(tǒng)對MySQL數(shù)據(jù)庫的操作;對系統(tǒng)執(zhí)行過程中產(chǎn)生的異常事件采用自動診斷方式;對于多文件檢測分析根據(jù)不同文件對應的檢測方式處理,然后將所有的檢測分析結(jié)果統(tǒng)一輸出。
本系統(tǒng)是一個Windows應用程序,系統(tǒng)的整體結(jié)構(gòu)框圖如圖2所示。系統(tǒng)用戶登錄驗證功能和用戶操作界面,為了方便管理系統(tǒng)的數(shù)據(jù)信息,將用戶分為普通用戶和管理員。普通用戶在拷貝文件外還可以查看個人信息和修改密碼,管理員相比普通用戶可以操作用戶信息和文件拷貝記錄信息。

圖2 系統(tǒng)的整體結(jié)構(gòu)框圖
系統(tǒng)基于圖像檢索分析的方法設計,在拷貝文件前先將要拷貝的文件進行檢索和分析。在文件的分析過程中采取圖1所示的圖像檢索分析方法,對通用的圖像格式文件直接進行界面上的交互預覽;對文檔類型文件需要先檢索出文件包含的所有圖像,然后再進行交互預覽;對CAD圖紙文件在進行交互預覽的同時,還要深度分析圖紙的組成,提取圖紙的規(guī)格等信息。
系統(tǒng)中大量涉及到數(shù)據(jù)的處理,系統(tǒng)通過圖3所示的過程完成與MySQL數(shù)據(jù)庫的交互。系統(tǒng)涉及到的信息通過MySQL數(shù)據(jù)庫存儲,借助ODBC驅(qū)動程序?qū)⑿畔⒌恼埱罂刂葡鬟f給MySQL數(shù)據(jù)庫,然后再由傳遞過程返還相應信息到系統(tǒng)。

圖3 系統(tǒng)和數(shù)據(jù)庫交互過程圖
本文提出的文件拷貝檢測系統(tǒng)以某公司為應用背景,通過搜集文件的信息數(shù)據(jù)來開發(fā)系統(tǒng)?;诠镜膶嶋H情況調(diào)研,設計出系統(tǒng)的整體設計框架,每個用戶都需要交互驗證成功才能登錄,普通用戶和管理員可以使用不同的系統(tǒng)功能來完成相應的工作。操作人員通過與系統(tǒng)完成信息修改查驗和文件檢索分析,系統(tǒng)后臺通過ODBC驅(qū)動程序過程控制對數(shù)據(jù)庫中信息進行控制。由于運行過程復雜,數(shù)據(jù)處理上與界面刷新存在相應延遲,系統(tǒng)采用完成等待的方法來達到時間上的一致,在數(shù)據(jù)處理和界面刷新的同時,系統(tǒng)在可視化界面使用遮擋防止人員操作直至控制結(jié)束。
系統(tǒng)在實現(xiàn)過程中要充分考慮到系統(tǒng)的可維護性和可修改性,便于后期擴充維護,同時還要考慮可視化界面的人性化,在系統(tǒng)初步設計的基礎上將這些因素考慮進去,并且對系統(tǒng)反復測試維護。
在系統(tǒng)的測試階段先將測試條件按照功能模塊進行分類歸納,逐條反復進行測試,同時還要考慮測試條件的交叉干擾情況。在系統(tǒng)的測試中軟件的任務目標和性能指標都符合預期設計。通過系統(tǒng)測試發(fā)現(xiàn),基于圖像檢索分析的文件拷貝檢測系統(tǒng)對于CAD圖紙文件的分析判定更有優(yōu)勢,通過嚴格分析圖紙的內(nèi)部組成,精準地給出判定結(jié)果。經(jīng)由長時間的測試評估,確定系統(tǒng)測試運行結(jié)果良好,滿足使用需求。
本系統(tǒng)的上線投入運行結(jié)果顯示,該系統(tǒng)可預覽和檢測各種涉及到圖像的文件,并記錄下拷貝記錄,方便用戶在拷貝文件前檢查文件及后期的查責,將公司圖形信息泄露的可能性降至最低,充分保證公司圖形信息的安全保密,并配合后期圖形加密技術的應用,將建立了一套事前防護、事中控制、事后追查的完整防護體系,防止了核心數(shù)據(jù)外泄。