◎北京航天長征飛行器研究所 王錦程 楊寧 謝蕾 張弛 劉銘
郵件發送中的知識流失管控模型初探
◎北京航天長征飛行器研究所 王錦程 楊寧 謝蕾 張弛 劉銘

電子文件傳輸以其便捷性與高效性逐漸成為工作中最為主要的文件流轉方式,但在享受這種便捷與高效的同時,也存在著關鍵知識流失的風險。因此,航天企業在郵件系統基本功能的基礎上,增加了統一用戶身份認證及信息傳輸管控環節。
統一用戶身份認證是指通過讀取用戶CA-KEY信息來實現身份鑒別,用戶只能在授權的計算機上使用本人的郵箱,保證了郵箱與用戶的一一對應,在發送郵件的時候能夠清楚地知道知識的傳播對象。信息傳輸管控是指在用戶寫新郵件時需要標明郵件的級別,若有附件上傳則需要標明每個附件的級別,且附件的級別不能高于郵件的級別。信息傳輸管控環節能在用戶發送郵件的時候提醒用戶郵件級別與附件級別的匹配,防止重要知識的流失。此外,針對向外域發送的郵件,還要通過外發審核來防止核心知識的外流。
通過對北京航天長征飛行器研究所2014年上半年的郵件收發記錄分析后得出,信息傳輸管控功能在信息系統知識傳播管理中發揮了較大的作用。圖1為2014年上半年疑似知識流失郵件的數量分布圖,可以看出,知識流失的情況已經變得越來越嚴重。郵件系統中的知識流失主要反應在郵件的“高密低傳”上,即附件名中標注的級別高于郵件級別。
圖2為2014年上半年研究所的郵件收發數量統計,針對如此龐大的郵件收發記錄,通過人工的方法進行知識流失現象識別是一件難以完成的工作。此外,在用戶頻繁使用郵件進行溝通的過程中,不可避免地會出現因誤操作而產生知識流失的現象。為此,筆者提出基于規則的郵件級別匹配模型,一方面根據郵件收發記錄自動生成知識流失集合,對用戶加以提醒;另一方面將此模型應用于郵件系統中,在用戶上傳附件時對附件名進行檢查,避免知識流失現象的發生。

圖1 2014年上半年知識流失郵件數量分布圖

圖2 2014年上半年郵件收發趨勢圖
郵件級別匹配主要是檢查郵件的附件名級別、附件級別以及郵件級別之間的匹配性。其中郵件級別是指發送郵件的級別,只有選定了郵件級別才能夠上傳附件和發送郵件。附件級別是指每個附件上傳后用戶為其選擇的級別,附件級別通過系統界面中的菜單選擇,因此附件級別不高于郵件級別。附件名級別是指附件名稱中標注的級別,由用戶在計算機上對文件名進行標注而產生,附件名級別不受郵件系統控制,因此可以通過附件名級別識別出系統中存在的知識流失現象。
1.附件名與郵件的級別匹配關系
郵件系統能發送“一般”、“重要”與“關鍵”3個級別的信息,而附件名級別由用戶自行標注產生。因此,郵件級別集合取值如下:

為了級別之間具備可比性,對(1)進行量化后產生;Sn={1,2,3}為了更方便地描述郵件級別之間的匹配問題,定義附件名級別為附件級別為郵件級別為
因此,附件名級別與附件級別之間的匹配關系為:

附件名級別與郵件級別之間的匹配關系為:

即,如果一封郵件中的每個附件滿足ana=0,且同時滿足ama≥0,則說明該封郵件符合知識傳播要求,不存在知識流失現象。
2.規則的定義
由于郵件級別可從日志記錄中直接獲取,此處定義的規則主要為識別附件級別和附件名級別。郵件級別的匹配是在附件名均有級別標注的前提下開展的,當附件名未標注級別時,計算機無法自動判斷該附件的級別,在此筆者假定所有郵件的附件名均為已標注級別的合規文件。
通過對日志文件中的附件名字符串分析,對附件名字符串按“;”進行分割可以得到每個附件的附件名及其級別的子字符串;對每個子字符串按“:”進行分割可以得到附件級別與附件名;對附件名進行匹配與判別,可以獲取附件名級別。
因此,可以得出如下規則:
(1)獲取單個附件。若獲取的附件名字符串中不存在“;”,則附件名為單個附件,否則按“;”分割字符串,得到若干個獨立的單個附件。
(2)獲取附件級別與附件名。若單個附件字符串中不存在“:”,則附件字符串不合法,無法獲取附件級別。否則按“:”分割字符串,得到第一個字符串為附件級別,第二個字符串為附件名。
(3)獲取附件名級別。對附件名匹配級別識別正則表達式,獲取附件名級別。
根據以上3條規則,可以得出郵件級別匹配的框架。
3.級別集合的構建
級別集合的構建是指根據郵件日志集,形成附件級別三元組的過程。第一,對每封郵件建立郵件的存儲對象,包括郵件級別、郵件標題、發送時間、附件字符串等屬性。第二,建立附件存儲對象,包括附件級別、附件名、附件名級別等屬性。根據規則(1)獲取郵件的附件存儲對象集合,并根據規則(2)識別出每封附件的附件級別。第三,根據規則(3)獲得每封附件的附件名級別,并完善附件存儲對象的屬性值。第四,產生每封郵件的附件級別三元組集合。
4.匹配關系集合的構建
匹配關系集合是指一封郵件的附件名級別與郵件級別的匹配關系以及附件名與附件級別的匹配關系的集合。通過構建郵件的匹配關系集合能夠判斷出該郵件是否是按保密要求進行發送。第一,根據每封郵件的附件級別三元組集合分別計算附件三元組的匹配關系取值;第二,根據匹配關系取值分別計算附件的兩種匹配關系;第三,計算郵件中每個附件的匹配關系,產生郵件的匹配關系集合。
模型構建完善后,以研究所目前使用的郵件系統為試點,依照級別匹配模型開發關鍵知識檢索模塊,并在實際工作中檢驗模型的實際效果。
1.文件傳輸行為審計
每月的郵件收發數量數以萬計,依靠人工準確高效識別其中的知識流失是一件非常困難的事情。依據級別匹配模型,將日志信息作為輸入條件,制定判別條件與輸出內容,可以將繁雜的行為審計工作交由計算機來完成。這不僅避免了人工判別帶來的誤差,也極大地提高了效率、降低了人力成本,為優化工作模式、提升工作效率帶來極大的幫助。
2.異常傳輸行為阻斷
在用戶發送郵件之前,對郵件的內容、附件名、郵件名稱以及郵件的級別進行識別與匹配,當出現不符合規則的結果時,對用戶進行提醒。提醒的策略有2種,第一種是提醒用戶郵件中有關鍵信息,如果用戶認為該信息符合郵件的級別,則可以繼續發送;第二種是發現與級別不相符的關鍵信息后直接阻斷該郵件發送。
經過3個月的測試發現,采取第一種策略時,系統中仍然有用戶會因為誤操作而導致關鍵知識的流失。而采取第二種策略時,系統中不再出現關鍵知識流失情況,且并未對用戶的使用造成影響。目前,研究所實際采用的是第二種策略,有效地防止了信息系統中關鍵知識的流失。
網絡傳輸的開放性和高效性為信息系統中的知識成果保護工作帶來了新的挑戰,如何做到既發揮網絡的便利性又保護知識成果不會肆意流失,是當前涉密信息系統中知識管理的熱點問題。郵件系統是涉密信息系統中主要的信息傳輸平臺,防止涉密信息通過郵件系統進行“高密低傳”能夠極大地減少知識的流失。因此,北京航天長征飛行器研究所考慮從郵件系統的附件名級別出發,對信息傳播中的知識成果保護起到借鑒作用,也為信息系統中知識保護提供思路。后續將對本模型的思路進一步深化,實現基于內容的檢查與判別模型,為在更多系統中的使用打下基礎。