景陽

摘要:從網(wǎng)絡(luò)報(bào)文中獲取用戶關(guān)注的特定信息,是一項(xiàng)很重要且極具意義的工作。在網(wǎng)絡(luò)信息監(jiān)控、安全防御系統(tǒng)中,經(jīng)常需要從報(bào)文中,按照使用者指定的內(nèi)容提取某些信息。目前這項(xiàng)工作面臨的主要挑戰(zhàn)是:針對不同的用戶需求,需要提取的內(nèi)容及格式不一樣,如何在低耗時(shí)、低開發(fā)成本的情況下,快速、準(zhǔn)確的找到要提取的信息的位置,并用合適的方式提取出來。本文提出了一種基于規(guī)則編寫的報(bào)文特定信息提取方法,可以使報(bào)文分析人員與信息提取人員工作解耦合,并且可以達(dá)到避免大量重復(fù)工作的效果,來快速的相應(yīng)市場需求。
關(guān)鍵字:網(wǎng)絡(luò)安全;報(bào)文特征分析;報(bào)文特定信息提取;賬號信息提取;規(guī)則編制;規(guī)則匹配
引言
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,一方面,維護(hù)網(wǎng)絡(luò)安全變的越來越重要,另一方面,人們對網(wǎng)絡(luò)安全意識也越來越強(qiáng)。所以目前在大多數(shù)局域網(wǎng)、企業(yè)網(wǎng)中,人們越來越注意保護(hù)互聯(lián)網(wǎng)使用者的個(gè)人信息。比如,某些公司從數(shù)據(jù)安全方面考慮,會(huì)希望傳入運(yùn)營商網(wǎng)絡(luò)的數(shù)據(jù)是經(jīng)過重要信息脫敏處理的。信息脫敏指的是,一些私人信息,或者公司層重要的數(shù)據(jù),在傳入外網(wǎng)的時(shí)候被刪除或者打上馬賽克等等。另外,可能還有一些特殊場景下,需要監(jiān)控一些常用軟件的賬號信息,從而關(guān)聯(lián)查找其他下聯(lián)信息等等。上述所有這些類似的用戶需求,抽象出來就是要在網(wǎng)絡(luò)流量中按照使用者需要提取到特定的信息,在提取到這些特定信息的基礎(chǔ)上,再對這些信息做其他處理。……