999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于規則過濾的樸素貝葉斯模型流程實例日志分析

2021-07-02 01:56:58陳浩韓萌萌
現代計算機 2021年13期
關鍵詞:分析模型

陳浩,韓萌萌

(武漢船用電力推進裝置研究所,武漢430000)

0 引言

在傳統的應用中,通常是由專家基于流程執行過程中的日志信息來識別系統漏洞[1]。事實證明,收集流程執行過程中的日志數據并加以分析對于系統問題的診斷和異常檢測非常有效。在這種情況下,我們關注由業務流程執行產生的日志數據[2],通過分析這些日志數據來檢測“不安全”流程實例導致的安全漏洞(例如攻擊、欺詐等)。我們提出使用關聯規則和樸素貝葉斯方法進行流程日志分析的框架,利用“低級”事件而不是“高級”事件完成和流程活動完全無關的面向安全的分類[3-4]。這種混合框架可用作決定過程跟蹤的“安全性”的替代方法,可以充當一種“超級專家”的分類工具,其準確性和效率使其稱為實施面向安全性流程分析的有效工具。

1 介紹

根據系統的行為日志解釋、預測、修復和監控系統的運行是當前大多數系統的重要舉措之一[5]。在這一方面對于流程引擎(BPM)的業務日志分析研究是業界非常關注的解決方案,這些解決方案可以幫助或者代替人類專家對業務流程日志進行安全性分析。通過監控業務流程實例的日志,分析不同類型的安全漏洞,例如欺詐、攻擊、濫用等問題。事實上,不安全的流程實例可能會對組織或者企業造成嚴重損害,從而可能導致企業的形象和聲譽受到嚴重損失。這是最近采用數據挖掘技術對業務過程日志進行安全性分析的主要原因(Accorsi&Stocker,2012;Accorsi,Stocker,&Muller,2013),尤其是作為審核應用程序是否存在風險的核心。

文獻中關于分類的方法,根據相應日志跟蹤中的內容,將流程實例識別為“安全”或“不安全”的問題,可以分為以下兩種模型類別:第一種為示例驅動方法(Bose&van der Aalst,2013;Cuzzocrea,Folino,Guaras?cio,&Pontieri,2016b;Leontjeva,Conforti,Di Francesco?marino,Dumas,&Maggi,2015;Nguyen,Dumas,Rosa,Maggi,&Suriadi,2014):這些方法模型需要一組帶注釋的流程蹤跡樣例ΔAET,注解說明了是否發生已知的某些安全漏洞,然后利用帶注釋的流程示例構建分類模型用于新的流程蹤跡日志分析,可以確定相應的流程示例是否存在安全漏洞風險。第二種為模型驅動的方法(Fazzinga,Flesca,Furfaro,&Pontieri,2018a):這些方法模型是基于安全漏洞模型,即對已知的行為描述信息進行分析判斷安全風險(或者根據由Accorsi&Stocker,2012;中提出的模型),將流程實例分類為“安全”或“不安全”。

與以上介紹的方法不同,我們的方法首先是對流程日志數據進行關聯規則分析過濾,將處理之后的數據作為樸素貝葉斯模型[6-7]的輸入,計算該流程執行過程中存在的安全風險的概率。

2 流程日志模型分析

2.1 規則過濾

在系統使用過程中,流程的執行可以獲得基礎的流程日志數據、軌跡、流程信息、活動以及事件信息等內容,會產生大量的日志數據,其中有很多與安全配置無關的噪音數據產生,這些數據不包含任何信息。噪音的存在會極大程度降低模型分析的準確率。由于日志數據量巨大,我們通過滑動時間窗口的方式獲取部分日志數據用于模型實驗。這里我們假設流程實例w由一系列高級事件組成a11…an。相應的每個活動實例ai生成一個低級事件ei。我們假設存在一個跟蹤系統記錄每個事件的執行情況,將按照順序記錄實例w的執行情況,記為φ=e1…en,φ為軌跡信息,流程軌跡追蹤系統中所有的軌跡集合L稱之為日志。

第一步我們在給定的數據集中創建事件類型的概率分布(FD)[8]。FD的大小等于唯一事件類型的大小,其中每個元素對應于特定事件類型的總條目數。下面顯示實時系統中的FD示例:

在此我們作出一個假設:比其他事件發生更多次數的事件是例行事件。該假設是基于常用幾個事件日志數據集的經驗觀察得到的。因此,通過此假設可以輕松得到事件類型,例如FD的第三(345)和第五(323)是常規事件。它們發生的概率比其他事件更高。我們使用一個標準偏差用于確定一組元素與平均值的偏差[9-10]。低s表示元素更接近均值(μ),而較高的s值表明元素分散,更具有價值。計算公式如下:

其中N表示元素的個數,xi表示第i個元素,xˉ是FD的平均值。由于處理之后的數據集是連續事件流的一部分,因此建議的解決方案是使用樣本標準差來形成較大的總體估計并輸出廣義的結果。

2.2 樸素貝葉斯算法

樸素貝葉斯法是基于貝葉斯定理與特征條件獨立假設的分類方法[11]。設輸入空間X?Rn為n維向量的集合,輸出空間為類標記集合y={c1,c2,…,ck},輸入為特征向量x∈X,輸出為類標記y∈Y。X是定義在輸入空間X上的隨機向量。數據集為:

3 仿真測試與分析

由于現有的日志類型眾多,本文主要以某生產企業的辦公流程日志數據進行仿真實驗,仿真環境為:編輯器PyCharm,Python版本為Python 2.7,計算機配置為64位Windows 10系統,四核2.67GHz、運行內存16G。我們選擇4種不同業務流程的日志數據,包括:財務報銷業務流程、公文審批業務流程、人員信息變更業務流程,每組使用40個流程日志數據作為實驗的基礎數據。我們首先使用規則過濾的方法處理日志數據,過濾噪音。數據處理的流程為:日志數據收集[14]、數據特征提取、規則過濾、模型預測分析[15]。數據維度對數據預測的準確度的影響對例如圖1。

圖1

從實驗圖表中可以看出,隨著樣本維度的增加,模型的分辨率隨之提高,通過數據預處理過濾部分噪音數據模型的正確率得到明顯提升,充分說明了樸素貝葉斯算法在流程日志分析方面有良好的效果。

4 結語

本文提出使用樸素貝葉斯算法模型在無需任何人工干預的情況下對流程日志數據進行分析。該解決方案的主要目的是使用非專家的方式對可能的風險進行專家分析,而無需花費大量的時間和經歷來獲取安全知識。這種方式完全采取自動化的方式識別,可有效提高風險分析的效率,保證系統運行的安全性。

猜你喜歡
分析模型
一半模型
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 九月婷婷亚洲综合在线| 欧美19综合中文字幕| 亚洲日韩精品欧美中文字幕| 热99re99首页精品亚洲五月天| 日韩欧美国产成人| 国产精品男人的天堂| 国产成人精品在线| 91久久偷偷做嫩草影院免费看 | 四虎国产在线观看| 国产jizz| 国产自在线拍| 亚洲精品色AV无码看| 国产青青草视频| 91精品国产综合久久香蕉922| 国产白浆视频| 国产亚洲精品自在久久不卡| 欧美一道本| 亚洲国产av无码综合原创国产| 中文字幕永久在线看| 日韩欧美视频第一区在线观看| 免费无码AV片在线观看国产| 久久性视频| 国产全黄a一级毛片| 国产精品深爱在线| 人妻免费无码不卡视频| 啦啦啦网站在线观看a毛片| 欧美一级高清免费a| 99国产在线视频| 国产日韩欧美在线播放| 精品国产Av电影无码久久久| 制服丝袜一区二区三区在线| 91小视频在线| AⅤ色综合久久天堂AV色综合| 久久精品女人天堂aaa| 国产 日韩 欧美 第二页| 亚洲aaa视频| 欧美精品二区| 青草免费在线观看| 91成人精品视频| 色香蕉网站| 激情六月丁香婷婷| 国产凹凸一区在线观看视频| 亚洲人成人无码www| 国产呦精品一区二区三区下载 | 欧类av怡春院| 亚洲无码91视频| 2021国产乱人伦在线播放| 亚洲第一视频网站| 成人免费视频一区二区三区| A级毛片高清免费视频就| 91丝袜乱伦| 亚洲成人网在线播放| 成人va亚洲va欧美天堂| 福利在线免费视频| 国产精品黄色片| 亚洲精品视频免费观看| 麻豆国产在线不卡一区二区| 日韩a在线观看免费观看| 成人av手机在线观看| 国产黑丝一区| 青青草91视频| 欧美午夜在线视频| 国产美女91视频| 国产又粗又爽视频| 色老二精品视频在线观看| 日韩123欧美字幕| av天堂最新版在线| 国产三区二区| 中文字幕久久亚洲一区| 亚洲无码免费黄色网址| 在线免费无码视频| 国产精品对白刺激| AⅤ色综合久久天堂AV色综合| 99激情网| 国产精品女人呻吟在线观看| 无码精品国产dvd在线观看9久 | 欧美午夜网| 亚洲丝袜中文字幕| 国产成人亚洲精品蜜芽影院| 狠狠五月天中文字幕| a毛片在线| 国产伦片中文免费观看|