999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

日志異常檢測研究現狀及展望

2021-05-24 07:44:19李東昊
電腦知識與技術 2021年12期

李東昊

摘要:隨著金融信息化建設的不斷推進,系統規模與復雜性不斷增長,系統故障已成為金融業發展不可忽視的問題。日志作為唯一系統運行信息的數據源,具有重要利用價值。該文綜述了日志異常檢測的主流方法,并針對存在問題提出對未來發展方向的建議。

關鍵詞: 金融信息化;系統故障; 日志; 異常檢測

中圖分類號:TP391? ? ? ?文獻標識碼:A

文章編號:1009-3044(2021)12-0056-02

Abstract:With the continuous advancement of financia linformation construction, the scale and complexity of the system are growing, system failure has become a problem that cannot be ignored in the development of the financial industry. As the only data source of system operation information, log has important utilization value. This paper summarizes the mainstream methods of log anomaly detection, and puts forward some suggestions for future development.

Key words:financial information construction; system failure; log; anomaly detection

互聯網的出現拉近了人與人間的距離。伴隨著信息技術的發展,近年來,分布式系統頻繁出現在各個領域的信息化建設中,正發揮著極其重要的作用。由廣泛應用的分布式系統故障所造成的損失也日益增加。據統計Microsoft、Facebook、Twitter等互聯網公司每年因分布式系統宕機造成的經濟損失高達過億元[1],信息系統的穩定性與安全性成為人們關注的焦點。系統日志作為系統運行狀態的直接體現,包含著大量的信息,這使得利用日志信息對系統狀態進行診斷成為可能。早期系統運維人員通過使用關鍵字檢索、編寫日志規則,以人工觀察日志信息的方式進行系統巡檢。隨著對功能需求的提升,系統架構日益復雜,分布式系統(如hadoop,spark)每天產生海量的日志信息,傳統的基于經驗規則判斷的日志分析方法受數據量大、數據類型復雜的影響已經不適用于系統故障檢測。

1研究現狀

目前針對日志的異常檢測可分為三類:基于規則的異常檢測方法、基于無監督的異常檢測方法、基于有監督的異常檢測方法。

基于規則的異常檢測方法,基于統計學方法通過統計海量日志中的關鍵字出現頻率,結合專家經驗設計正則表達式,挖掘潛在檢測規則并根據規則匹配程度進行日志異常檢測。如文獻[2]通過定義系統正常行為規則,使用正則表達式識別日志異常信息。文獻[3]基于分析日志事件序列信息創建規則集,能夠有效降低系統誤報率,但是自動化程度低,人工成本大。

基于無監督的異常檢測方法,不需要預先標記的訓練數據,通過判斷待檢測日志序列與正常日志序列的差異檢測異常。主要依賴于機器學習中的聚類質量,通過日志相似性聚類分析,將從日志數據中檢測的離群點標記為異常信息。如文獻[4],作者通過解析原始日志,統計日志中的事件信息,提取日志的事件頻率特征,使用凝聚層次聚類進行異常信息識別。文獻[5],作者在傳統的基于聚類的異常日志檢測方法logcluster上引入滑動窗口的概念,提出了基于滑動窗口聚類的異常日志檢測方法SW-logcluster,滑動窗口豐富了提取的日志事件信息種類,通過實驗表明引入滑動時間窗口能夠有效提升檢測的召回率,豐富了日志特征的多樣性,提升了日志異常檢測的適用性。文獻[6]作者提出了一個完整日志異常檢測框架,基于狀態比向量和消息數向量構造日志特征向量,使用主成分分析(PCA)檢測日志異常,并將檢測結果以決策樹的形式進行可視化分析,在HDFS數據集中體現了較好的性能。文獻[7]提出了一種基于日志不變量的異常檢查方法,通過挖掘日志信息中的線性關系,當日志序列符合不變量定義,為正常日志序列,否則識別為異常日志序列。文獻[8]作者提出了一個完整的基于日志異常檢測的系統框架ADELE,該方法是一種通用領域的日志異常檢測方法。通過離群點檢測計算異常值,最后通過經驗檢驗,用異常區分故障,極大地減少了誤檢率。文獻[9]作者提出了一種基于概率后綴樹的日志異常檢測方法,提取日志源代碼集中的可達圖并關聯日志語義信息挖掘日志執行軌跡序列,最后通過計算異常度檢測異常信息。

基于有監督的異常檢測方法,需要使用帶有標簽的數據訓練模型,通過預訓練的模型進行日志異常檢測。如文獻[10]通過使用決策樹建模帶有標簽的日志信息識別系統故障,與其他分類方法相比具有高可解釋性,已受到網絡運營商的廣泛關注。文獻[11]使用日志事件計數向量訓練logistic回歸模型,通過模型計算日志序列的異常概率。文獻[12]將日志事件計數向量輸入SVM(支持向量機)訓練超平面,判斷檢測日志序列與超平面的位置關系進而判斷是否為異常日志序列。

隨著人們對人工智能領域的深入研究以及深度學習的發展促使一些學者將神經網絡與日志檢測關聯到一起,逐漸出現了一些基于神經網絡的異常日志檢測方法,在實際應用中也取得了較好的效果。文獻[13]依據自然語言處理的技術,將TF-IDF(詞頻-逆文檔頻率)特征引入日志異常檢測中,首次使用LSTM(長短時記憶網絡)挖掘日志序列的長程相關性,較傳統基于監督的日志異常檢查方法檢測質量有了顯著提高。文獻[14]提出一種利用長短時記憶網絡學習正常日志模式的無監督日志異常檢測方法Deeplog,將正常系統日志建模成自然語言序列輸入神經網絡訓練模型并由此檢測異常日志信息。為解決長序列異常日志檢測效率不足的問題,文獻[15]將時間卷積神經網絡引入到異常日志檢測中,使用自適應全局平均池化代替全連接層,有效解決了過擬合問題,同時提升了檢測效率。文獻[16]使用日志事件語義信息,通過Bi-LSTM模型提取日志序列上下文信息,有效提高日志異常檢測的準確率。文獻[17]將日志建模成時間序列進行日志異常檢測,在網絡安全數據挖掘競賽數據集中準確率達到了99.6%。

文獻[18]作者結合日志異常檢測的不同方法,發布了一個高可重用性的開源工具,用戶可以根據日志特性選取不同方法從而達到最優檢測結果,為日志異常檢測的蓬勃發展奠定了基礎。

2存在挑戰

日志異常檢測研究從單機系統發展到今天的分布式系統,受日志采集與解析的限制,檢測質量仍然存在很大的提升空間。受限于日志信息傳輸、存儲與計算的壓力,傳統的異常檢測方法已經不適用于大型分布式系統,因此,提高日志質量,豐富日志特征,依然是日志異常檢測領域的重要挑戰。

(1)目前人們使用的仍是海量日志信息的小部分信息或單來源的信息,多源日志數據(如應用、網絡日志等)仍未被利用,存在信息壁壘的問題

(2)不同故障類型可能引起的日志記錄相同,如何根據日志信息定位系統故障位置,為用戶提供直觀的檢測結果,提升異常的可解釋性是目前需要解決的問題。

(3)系統日志是典型的不平衡數據集,因此如何考慮數據不平衡造成的過擬合問題,提升基于模型的異常檢測方法的魯棒性是應用新檢測方法存在的障礙。

日志特征具有局限性。目前研究使用的日志數據,經過預處理后,變成了由系統事件序列組成的日志模板,在日志轉向模板的過程中,日志中的變量信息通過通配符*代替,這樣使得部分參數信息丟失,從而忽略了一些由系統參數異常導致的系統異常無法被檢測。如何利用日志中包含的參數信息與通用信息,結合當前新技術挖掘更符合系統故障的多源特征仍是值得關注的焦點。

3結束語

目前針對系統日志異常檢測的研究依然是通過數據驅動的,受訓練樣本的影響,日志樣本的多樣性決定了檢測的質量。因此隨著系統的更新與升級,收集全面大量的日志數據并探索行之有效的解析方案,完善日志異常檢測框架流程仍有許多工作。此外,目前研究均在實驗數據集下展開,在現實應用場景中應用較少。為了提升異常檢測的魯棒性,推動學術研究成果早日落地,相應檢測技術的可行性仍需在工業界進行調研。

參考文獻:

[1] 陸杰,李豐,李煉.分布式系統中的日志分析及應用[J].高技術通訊,2019,29(4):303-320.

[2] Prewett J E. Analyzing cluster log files using logsurfer[C]//Proceedings of the 4th Annual Conference on Linux Clusters. Citeseer, 2003.

[3] Rouillard J P. Real-time Log File Analysis Using the Simple Event Correlator[C]//Conference on Systems Administration. DBLP, 2004.

[4] Q . Lin, H. Zhang, J. Lou, Y. Zhang and X. Chen. Log Clustering Based Problem Identification for Online Service Systems[C]//IEEE/ACM 38th International Conference on Software Engineering Companion. 2016: 102-111.

[5] 馮士龍,臺憲青,馬治杰.改進的基于日志聚類的異常檢測方法[J].計算機工程與設計,2020,41(4):1087-1092.

[6] Xu W , Huang L , Fox A , et al. Detecting Large-Scale System Problems by Mining Console Logs[C]//AcmSigops Symposium on Operating Systems Principles. 2010:37-46.

[7] Lou J G, Fu Q, Yang S, et al. Mining Invariants from Console Logs for System Problem Detection[C]//USENIX Annual Technical Conference. 2010: 1-14.

[8] Khatuya S, Ganguly N, Basak J, et al. ADELE: Anomaly Detection from Event Log Empiricism[C]// 2018:2114-2122.

[9] Bao L, Li Q, Lu P, et al. Execution anomaly detection in large-scale systems through console log analysis[J]. Journal of Systems and Software, 2018:172-186.

[10] Chen M, Zheng A X, Lloyd J, et al. Failure diagnosis using decision trees[C]// International Conference on Autonomic Computing. IEEE, 2004.

[11] Peter Bodík, Moisés Goldszmidt, Fox A , et al. Fingerprinting the datacenter: Automated classification of performance crises[C]// European Conference on Computer Systems. ACM,2010: 111-124.

[12] Liang Y, Zhang Y, Xiong H, et al. Failure prediction in ibmbluegene/l event logs[C]//Seventh IEEE International Conference on Data Mining (ICDM 2007). IEEE, 2007: 583-588.

[13] Zhang K, Xu J, Min M R, et al. Automated IT system failure prediction: A deep learning approach[C]// 2016 IEEE International Conference on Big Data. IEEE, 2016: 1291-1300.

[14] Du M, Li F, Zheng G, et al. Deeplog: Anomaly detection and diagnosis from system logs through deep learning[C]//Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security. 2017: 1285-1298.

[15] 楊瑞朋,屈丹,朱少衛,錢葉魁,唐永旺.基于改進時間卷積網絡的日志序列異常檢測[J].計算機工程,2020,46(08):50-57.

[16] Zhang X, Li Z, Chen J, et al. Robust log-based anomaly detection on unstable log data[C]// the 27th ACM Joint Meeting. ACM,2019: 807-817.

[17] Vinayakumar R, Soman K P, Poornachandran P. Long short-term memory based operation log anomaly detection[C]// International Conference on Advances in Computing. 2017:236-242.

[18] He S, Zhu J, He P, et al. Experience Report: System Log Analysis for Anomaly Detection[C]// 2016 IEEE 27th International Symposium on Software Reliability Engineering. IEEE,2016: 207-218.

【通聯編輯:代影】

主站蜘蛛池模板: 一本大道无码日韩精品影视| 这里只有精品在线| 国产亚洲精久久久久久久91| 国产黑人在线| 综合久久久久久久综合网 | 国产中文一区a级毛片视频| 亚洲日本一本dvd高清| 亚洲av无码人妻| 久久天天躁狠狠躁夜夜2020一 | 国产视频a| 91在线播放免费不卡无毒| 免费啪啪网址| 日韩专区欧美| 久久人搡人人玩人妻精品一| 美女高潮全身流白浆福利区| av一区二区无码在线| 在线观看国产网址你懂的| 有专无码视频| 国内丰满少妇猛烈精品播| 刘亦菲一区二区在线观看| 啦啦啦网站在线观看a毛片| 欧美亚洲国产日韩电影在线| 孕妇高潮太爽了在线观看免费| 亚洲无码高清视频在线观看| 亚洲人成网18禁| 欧美国产日韩另类| 中文字幕无码中文字幕有码在线 | 香蕉久人久人青草青草| 亚洲日韩精品欧美中文字幕| 91久久偷偷做嫩草影院电| 在线播放精品一区二区啪视频| 久久特级毛片| 成AV人片一区二区三区久久| 亚洲色婷婷一区二区| 国产精品欧美亚洲韩国日本不卡| 中文字幕欧美日韩高清| 国产主播在线一区| 国产精品自在在线午夜| 亚洲无码熟妇人妻AV在线| 日韩无码一二三区| 国产精品99久久久久久董美香| 久久久无码人妻精品无码| 国产在线高清一级毛片| 国内精自视频品线一二区| 伊人久久福利中文字幕 | 成人午夜久久| 免费A级毛片无码免费视频| 91青青在线视频| 91精品情国产情侣高潮对白蜜| 91口爆吞精国产对白第三集| 午夜视频在线观看区二区| 日韩精品久久无码中文字幕色欲| 精品无码一区二区三区电影| 国产乱人伦偷精品视频AAA| 欧美在线视频不卡第一页| 国产第一页屁屁影院| 色窝窝免费一区二区三区| 亚洲视频免| 成人亚洲国产| 老熟妇喷水一区二区三区| 在线va视频| 国产第一页第二页| 国产又黄又硬又粗| 亚洲成综合人影院在院播放| 女同久久精品国产99国| 亚洲av日韩综合一区尤物| 国产69囗曝护士吞精在线视频| 久久一级电影| 国产亚洲视频免费播放| 色综合天天娱乐综合网| 丁香五月婷婷激情基地| 国产微拍一区| 国产人人射| 丁香六月激情综合| 怡春院欧美一区二区三区免费| 欧美三級片黃色三級片黃色1| 伊人激情综合| 国产精品久久国产精麻豆99网站| 亚洲人成网站在线播放2019| 高清码无在线看| 99热这里只有精品久久免费| 国产在线小视频|