999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

日志異常檢測研究現狀及展望

2021-05-24 07:44:19李東昊
電腦知識與技術 2021年12期

李東昊

摘要:隨著金融信息化建設的不斷推進,系統規模與復雜性不斷增長,系統故障已成為金融業發展不可忽視的問題。日志作為唯一系統運行信息的數據源,具有重要利用價值。該文綜述了日志異常檢測的主流方法,并針對存在問題提出對未來發展方向的建議。

關鍵詞: 金融信息化;系統故障; 日志; 異常檢測

中圖分類號:TP391? ? ? ?文獻標識碼:A

文章編號:1009-3044(2021)12-0056-02

Abstract:With the continuous advancement of financia linformation construction, the scale and complexity of the system are growing, system failure has become a problem that cannot be ignored in the development of the financial industry. As the only data source of system operation information, log has important utilization value. This paper summarizes the mainstream methods of log anomaly detection, and puts forward some suggestions for future development.

Key words:financial information construction; system failure; log; anomaly detection

互聯網的出現拉近了人與人間的距離。伴隨著信息技術的發展,近年來,分布式系統頻繁出現在各個領域的信息化建設中,正發揮著極其重要的作用。由廣泛應用的分布式系統故障所造成的損失也日益增加。據統計Microsoft、Facebook、Twitter等互聯網公司每年因分布式系統宕機造成的經濟損失高達過億元[1],信息系統的穩定性與安全性成為人們關注的焦點。系統日志作為系統運行狀態的直接體現,包含著大量的信息,這使得利用日志信息對系統狀態進行診斷成為可能。早期系統運維人員通過使用關鍵字檢索、編寫日志規則,以人工觀察日志信息的方式進行系統巡檢。隨著對功能需求的提升,系統架構日益復雜,分布式系統(如hadoop,spark)每天產生海量的日志信息,傳統的基于經驗規則判斷的日志分析方法受數據量大、數據類型復雜的影響已經不適用于系統故障檢測。

1研究現狀

目前針對日志的異常檢測可分為三類:基于規則的異常檢測方法、基于無監督的異常檢測方法、基于有監督的異常檢測方法。

基于規則的異常檢測方法,基于統計學方法通過統計海量日志中的關鍵字出現頻率,結合專家經驗設計正則表達式,挖掘潛在檢測規則并根據規則匹配程度進行日志異常檢測。如文獻[2]通過定義系統正常行為規則,使用正則表達式識別日志異常信息。文獻[3]基于分析日志事件序列信息創建規則集,能夠有效降低系統誤報率,但是自動化程度低,人工成本大。

基于無監督的異常檢測方法,不需要預先標記的訓練數據,通過判斷待檢測日志序列與正常日志序列的差異檢測異常。主要依賴于機器學習中的聚類質量,通過日志相似性聚類分析,將從日志數據中檢測的離群點標記為異常信息。如文獻[4],作者通過解析原始日志,統計日志中的事件信息,提取日志的事件頻率特征,使用凝聚層次聚類進行異常信息識別。文獻[5],作者在傳統的基于聚類的異常日志檢測方法logcluster上引入滑動窗口的概念,提出了基于滑動窗口聚類的異常日志檢測方法SW-logcluster,滑動窗口豐富了提取的日志事件信息種類,通過實驗表明引入滑動時間窗口能夠有效提升檢測的召回率,豐富了日志特征的多樣性,提升了日志異常檢測的適用性。文獻[6]作者提出了一個完整日志異常檢測框架,基于狀態比向量和消息數向量構造日志特征向量,使用主成分分析(PCA)檢測日志異常,并將檢測結果以決策樹的形式進行可視化分析,在HDFS數據集中體現了較好的性能。文獻[7]提出了一種基于日志不變量的異常檢查方法,通過挖掘日志信息中的線性關系,當日志序列符合不變量定義,為正常日志序列,否則識別為異常日志序列。文獻[8]作者提出了一個完整的基于日志異常檢測的系統框架ADELE,該方法是一種通用領域的日志異常檢測方法。通過離群點檢測計算異常值,最后通過經驗檢驗,用異常區分故障,極大地減少了誤檢率。文獻[9]作者提出了一種基于概率后綴樹的日志異常檢測方法,提取日志源代碼集中的可達圖并關聯日志語義信息挖掘日志執行軌跡序列,最后通過計算異常度檢測異常信息。

基于有監督的異常檢測方法,需要使用帶有標簽的數據訓練模型,通過預訓練的模型進行日志異常檢測。如文獻[10]通過使用決策樹建模帶有標簽的日志信息識別系統故障,與其他分類方法相比具有高可解釋性,已受到網絡運營商的廣泛關注。文獻[11]使用日志事件計數向量訓練logistic回歸模型,通過模型計算日志序列的異常概率。文獻[12]將日志事件計數向量輸入SVM(支持向量機)訓練超平面,判斷檢測日志序列與超平面的位置關系進而判斷是否為異常日志序列。

隨著人們對人工智能領域的深入研究以及深度學習的發展促使一些學者將神經網絡與日志檢測關聯到一起,逐漸出現了一些基于神經網絡的異常日志檢測方法,在實際應用中也取得了較好的效果。文獻[13]依據自然語言處理的技術,將TF-IDF(詞頻-逆文檔頻率)特征引入日志異常檢測中,首次使用LSTM(長短時記憶網絡)挖掘日志序列的長程相關性,較傳統基于監督的日志異常檢查方法檢測質量有了顯著提高。文獻[14]提出一種利用長短時記憶網絡學習正常日志模式的無監督日志異常檢測方法Deeplog,將正常系統日志建模成自然語言序列輸入神經網絡訓練模型并由此檢測異常日志信息。為解決長序列異常日志檢測效率不足的問題,文獻[15]將時間卷積神經網絡引入到異常日志檢測中,使用自適應全局平均池化代替全連接層,有效解決了過擬合問題,同時提升了檢測效率。文獻[16]使用日志事件語義信息,通過Bi-LSTM模型提取日志序列上下文信息,有效提高日志異常檢測的準確率。文獻[17]將日志建模成時間序列進行日志異常檢測,在網絡安全數據挖掘競賽數據集中準確率達到了99.6%。

文獻[18]作者結合日志異常檢測的不同方法,發布了一個高可重用性的開源工具,用戶可以根據日志特性選取不同方法從而達到最優檢測結果,為日志異常檢測的蓬勃發展奠定了基礎。

2存在挑戰

日志異常檢測研究從單機系統發展到今天的分布式系統,受日志采集與解析的限制,檢測質量仍然存在很大的提升空間。受限于日志信息傳輸、存儲與計算的壓力,傳統的異常檢測方法已經不適用于大型分布式系統,因此,提高日志質量,豐富日志特征,依然是日志異常檢測領域的重要挑戰。

(1)目前人們使用的仍是海量日志信息的小部分信息或單來源的信息,多源日志數據(如應用、網絡日志等)仍未被利用,存在信息壁壘的問題

(2)不同故障類型可能引起的日志記錄相同,如何根據日志信息定位系統故障位置,為用戶提供直觀的檢測結果,提升異常的可解釋性是目前需要解決的問題。

(3)系統日志是典型的不平衡數據集,因此如何考慮數據不平衡造成的過擬合問題,提升基于模型的異常檢測方法的魯棒性是應用新檢測方法存在的障礙。

日志特征具有局限性。目前研究使用的日志數據,經過預處理后,變成了由系統事件序列組成的日志模板,在日志轉向模板的過程中,日志中的變量信息通過通配符*代替,這樣使得部分參數信息丟失,從而忽略了一些由系統參數異常導致的系統異常無法被檢測。如何利用日志中包含的參數信息與通用信息,結合當前新技術挖掘更符合系統故障的多源特征仍是值得關注的焦點。

3結束語

目前針對系統日志異常檢測的研究依然是通過數據驅動的,受訓練樣本的影響,日志樣本的多樣性決定了檢測的質量。因此隨著系統的更新與升級,收集全面大量的日志數據并探索行之有效的解析方案,完善日志異常檢測框架流程仍有許多工作。此外,目前研究均在實驗數據集下展開,在現實應用場景中應用較少。為了提升異常檢測的魯棒性,推動學術研究成果早日落地,相應檢測技術的可行性仍需在工業界進行調研。

參考文獻:

[1] 陸杰,李豐,李煉.分布式系統中的日志分析及應用[J].高技術通訊,2019,29(4):303-320.

[2] Prewett J E. Analyzing cluster log files using logsurfer[C]//Proceedings of the 4th Annual Conference on Linux Clusters. Citeseer, 2003.

[3] Rouillard J P. Real-time Log File Analysis Using the Simple Event Correlator[C]//Conference on Systems Administration. DBLP, 2004.

[4] Q . Lin, H. Zhang, J. Lou, Y. Zhang and X. Chen. Log Clustering Based Problem Identification for Online Service Systems[C]//IEEE/ACM 38th International Conference on Software Engineering Companion. 2016: 102-111.

[5] 馮士龍,臺憲青,馬治杰.改進的基于日志聚類的異常檢測方法[J].計算機工程與設計,2020,41(4):1087-1092.

[6] Xu W , Huang L , Fox A , et al. Detecting Large-Scale System Problems by Mining Console Logs[C]//AcmSigops Symposium on Operating Systems Principles. 2010:37-46.

[7] Lou J G, Fu Q, Yang S, et al. Mining Invariants from Console Logs for System Problem Detection[C]//USENIX Annual Technical Conference. 2010: 1-14.

[8] Khatuya S, Ganguly N, Basak J, et al. ADELE: Anomaly Detection from Event Log Empiricism[C]// 2018:2114-2122.

[9] Bao L, Li Q, Lu P, et al. Execution anomaly detection in large-scale systems through console log analysis[J]. Journal of Systems and Software, 2018:172-186.

[10] Chen M, Zheng A X, Lloyd J, et al. Failure diagnosis using decision trees[C]// International Conference on Autonomic Computing. IEEE, 2004.

[11] Peter Bodík, Moisés Goldszmidt, Fox A , et al. Fingerprinting the datacenter: Automated classification of performance crises[C]// European Conference on Computer Systems. ACM,2010: 111-124.

[12] Liang Y, Zhang Y, Xiong H, et al. Failure prediction in ibmbluegene/l event logs[C]//Seventh IEEE International Conference on Data Mining (ICDM 2007). IEEE, 2007: 583-588.

[13] Zhang K, Xu J, Min M R, et al. Automated IT system failure prediction: A deep learning approach[C]// 2016 IEEE International Conference on Big Data. IEEE, 2016: 1291-1300.

[14] Du M, Li F, Zheng G, et al. Deeplog: Anomaly detection and diagnosis from system logs through deep learning[C]//Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security. 2017: 1285-1298.

[15] 楊瑞朋,屈丹,朱少衛,錢葉魁,唐永旺.基于改進時間卷積網絡的日志序列異常檢測[J].計算機工程,2020,46(08):50-57.

[16] Zhang X, Li Z, Chen J, et al. Robust log-based anomaly detection on unstable log data[C]// the 27th ACM Joint Meeting. ACM,2019: 807-817.

[17] Vinayakumar R, Soman K P, Poornachandran P. Long short-term memory based operation log anomaly detection[C]// International Conference on Advances in Computing. 2017:236-242.

[18] He S, Zhu J, He P, et al. Experience Report: System Log Analysis for Anomaly Detection[C]// 2016 IEEE 27th International Symposium on Software Reliability Engineering. IEEE,2016: 207-218.

【通聯編輯:代影】

主站蜘蛛池模板: 欧美亚洲欧美| 亚洲精品中文字幕午夜| 高清精品美女在线播放| 99久视频| 久久毛片网| 国产啪在线| 婷婷综合色| 亚洲成年网站在线观看| 8090成人午夜精品| 久久一日本道色综合久久| 日韩精品一区二区三区免费在线观看| 久久久噜噜噜| www精品久久| 免费一级全黄少妇性色生活片| 成人午夜久久| 日韩免费视频播播| 72种姿势欧美久久久久大黄蕉| 亚洲天堂视频在线观看免费| 国产凹凸视频在线观看| 台湾AV国片精品女同性| 十八禁美女裸体网站| 国产成人无码综合亚洲日韩不卡| 毛片网站在线看| 国产午夜不卡| 久久免费视频播放| 亚洲成人动漫在线| 99精品高清在线播放| 成人福利在线免费观看| 噜噜噜久久| 国内精品久久久久鸭| 国产欧美日韩va另类在线播放| 成人精品免费视频| 欧洲在线免费视频| 国产一区成人| 无码国产伊人| 亚洲国产中文精品va在线播放| 成人一级黄色毛片| 国产粉嫩粉嫩的18在线播放91| 国产精品久久精品| 国产精品.com| 亚洲香蕉久久| 福利在线不卡一区| 国产在线八区| 亚洲一区二区精品无码久久久| 国产欧美在线观看一区| 欧美国产精品不卡在线观看| 久久一日本道色综合久久| 首页亚洲国产丝袜长腿综合| 亚洲欧州色色免费AV| 久久国产亚洲欧美日韩精品| 国产在线高清一级毛片| 亚洲日韩精品无码专区| 久久午夜影院| 免费全部高H视频无码无遮掩| 国产91全国探花系列在线播放| 亚洲综合香蕉| 亚洲福利视频一区二区| 欧美日韩一区二区在线免费观看| 亚洲欧洲国产成人综合不卡| 91丨九色丨首页在线播放| 国产白浆在线观看| 亚洲黄网在线| 久久公开视频| 18禁影院亚洲专区| 五月天丁香婷婷综合久久| 日韩欧美高清视频| 99久久亚洲精品影院| 国产成人凹凸视频在线| 日韩a级片视频| 久久夜色精品国产嚕嚕亚洲av| 日韩精品亚洲一区中文字幕| 亚洲天堂网视频| 青青青草国产| 凹凸国产分类在线观看| hezyo加勒比一区二区三区| 国产精品一区二区无码免费看片| 亚洲天堂视频网| 日韩区欧美区| 国产成人高精品免费视频| 成年人免费国产视频| 男女男精品视频| 怡春院欧美一区二区三区免费|