郭濤敏
關(guān)鍵詞: 數(shù)據(jù)挖掘; 關(guān)聯(lián)規(guī)則; 安全審計(jì); 云平臺(tái); Apriori算法; 執(zhí)行效率
中圖分類號: TN915.08?34 ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)01?0079?03
Abstract: A security auditing scheme based on association rules technology is proposed to improve the efficiency of data mining in cloud environment, and reduce the operational load of the security auditing system. On the basis of typical architecture of the cloud platform and its security auditing model, the overall architecture of the new cloud platform security auditing system was designed by using Agent and AES symmetric encryption algorithm. The improved association rule algorithm Apriori is used to optimize the association analysis data mining process in the audit information analysis function, which can reduce the connected times of redundant subsets and database. The experimental results show that the proposed security auditing scheme has higher execution efficiency than the security auditing scheme based on traditional Apriori algorithm.
Keywords: data mining; association rule; security auditing; cloud platform; Apriori algorithm; execution efficiency
隨著云計(jì)算技術(shù)的不斷發(fā)展,各個(gè)行業(yè)領(lǐng)域均產(chǎn)生了海量的數(shù)據(jù)信息。這些大量的數(shù)據(jù)信息逐漸演變成IT互聯(lián)網(wǎng)公司的重要資產(chǎn)。眾多研究機(jī)構(gòu)以及研究學(xué)者都已經(jīng)將云計(jì)算作為研究的重點(diǎn)問題[1?2]。通過在云端實(shí)現(xiàn)個(gè)人或者企業(yè)的數(shù)據(jù)計(jì)算和存儲(chǔ)功能,云計(jì)算平臺(tái)大大地降低了企業(yè)用戶和個(gè)人用戶的IT運(yùn)營成本,并且有效提高了運(yùn)算效率。此外,云計(jì)算平臺(tái)同時(shí)為用戶提供個(gè)性化的彈性服務(wù)、按時(shí)收費(fèi)等特色服務(wù)。對中小企業(yè)和個(gè)人用戶來說,通過云計(jì)算平臺(tái)可以有效降低成本投入,提高運(yùn)營收益,從而在激烈的市場競爭中占據(jù)優(yōu)勢地位[3]。
但是,云計(jì)算平臺(tái)所面臨的網(wǎng)絡(luò)安全問題也隨之出現(xiàn)。網(wǎng)絡(luò)安全審計(jì)的概念由Anderson在1980年首次提出,并得到了廣泛的認(rèn)可[4]。網(wǎng)絡(luò)安全審計(jì)是記錄與評估計(jì)算機(jī)用戶網(wǎng)絡(luò)行為的過程,其包含以下五個(gè)主要功能:預(yù)防潛在的入侵者;保障安全策略的穩(wěn)定;實(shí)現(xiàn)問責(zé)機(jī)制; 評估和反饋;尋找系統(tǒng)中尚未被發(fā)現(xiàn)的安全漏洞。文獻(xiàn)[5]對云電子商務(wù)所面對的安全審計(jì)問題進(jìn)行了研究。文獻(xiàn)[6]對云安全審計(jì)中基于日志的用戶行為進(jìn)行系統(tǒng)分析。文獻(xiàn)[7]對云計(jì)算安全審計(jì)技術(shù)所面臨的一些問題進(jìn)行了綜述,其中包括關(guān)聯(lián)分析數(shù)據(jù)挖掘問題。由于數(shù)據(jù)量大、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、數(shù)據(jù)形式多樣等問題,造成云平臺(tái)安全審計(jì)在處理數(shù)據(jù)挖掘相關(guān)任務(wù)時(shí)存在較大的難度。研究人員已經(jīng)提出了多種類型的數(shù)據(jù)挖掘方法。主要包括:回歸分析、聚類、關(guān)聯(lián)規(guī)則和神經(jīng)網(wǎng)絡(luò)等方法。文獻(xiàn)[8]提出一種基于改進(jìn)Apriori算法的審計(jì)日志關(guān)聯(lián)規(guī)則挖掘方法。
因此,為了進(jìn)一步提高系統(tǒng)效率,對傳統(tǒng)Apriori算法進(jìn)行改進(jìn),本文提出一種基于改進(jìn)關(guān)聯(lián)規(guī)則技術(shù)的安全審計(jì)方案。在云平臺(tái)典型架構(gòu)及其安全審計(jì)模型基礎(chǔ)上,采用Agent和AES對稱加密算法設(shè)計(jì)了新的云平臺(tái)安全審計(jì)系統(tǒng)總體架構(gòu)。通過采用改進(jìn)的關(guān)聯(lián)規(guī)則算法Apriori對審計(jì)信息分析功能中的關(guān)聯(lián)分析數(shù)據(jù)挖掘過程進(jìn)行優(yōu)化,減少了冗余的子集和數(shù)據(jù)庫被連接的次數(shù)。
云計(jì)算平臺(tái)常采用大型的并行化計(jì)算為用戶提供相關(guān)IT服務(wù)。云平臺(tái)可以提供跨計(jì)算機(jī)集群的分布式存儲(chǔ)的計(jì)算環(huán)境,并通過標(biāo)準(zhǔn)的API接口以面向?qū)ο蟮哪J綖橄M(fèi)者提供服務(wù)。目前,云計(jì)算平臺(tái)主要有3種服務(wù)內(nèi)容[5],即基礎(chǔ)設(shè)施Server、平臺(tái)Server和軟件Server。云平臺(tái)典型架構(gòu)如圖1所示。

云計(jì)算平臺(tái)在為消費(fèi)者提供服務(wù)的同時(shí)會(huì)生成大規(guī)模的日志相關(guān)數(shù)據(jù)。這些日志相關(guān)數(shù)據(jù)就是云平臺(tái)安全審計(jì)的輸入數(shù)據(jù)。典型的云平臺(tái)安全審計(jì)模型如圖2所示[7]。

基于上述云平臺(tái)典型架構(gòu)及其安全審計(jì)模型,本文設(shè)計(jì)的云平臺(tái)安全審計(jì)系統(tǒng)總體架構(gòu)主要包括4個(gè)層次和1個(gè)數(shù)據(jù)信息來源:用戶層、業(yè)務(wù)層、存儲(chǔ)層、收集層和審計(jì)信息來源。其中,審計(jì)信息來源主要包括網(wǎng)絡(luò)數(shù)據(jù)、主機(jī)信息和日志信息等。用戶層采用云平臺(tái)Agent實(shí)現(xiàn)審計(jì)信息管理、報(bào)警信息管理、規(guī)則信息管理。業(yè)務(wù)層主要按照規(guī)則庫實(shí)現(xiàn)事后審計(jì)工作。存儲(chǔ)層主要負(fù)責(zé)在數(shù)據(jù)庫中通過秘鑰對審計(jì)信息進(jìn)行加密/解密,而本文采用AES對稱加密算法。收集層通過通信接口將采集的數(shù)據(jù)進(jìn)行格式化,并實(shí)現(xiàn)實(shí)時(shí)審計(jì)。



從圖4可以看出,本文算法的執(zhí)行效率更高,從而有效降低了安全審計(jì)系統(tǒng)的運(yùn)行負(fù)荷。
本文提出一種基于改進(jìn)關(guān)聯(lián)規(guī)則技術(shù)的安全審計(jì)方案。在云平臺(tái)典型架構(gòu)及其安全審計(jì)模型的基礎(chǔ)上,采用Agent和AES對稱加密算法設(shè)計(jì)了新的云平臺(tái)安全審計(jì)系統(tǒng)總體架構(gòu)。通過采用改進(jìn)的關(guān)聯(lián)規(guī)則算法Apriori對審計(jì)信息分析功能中的關(guān)聯(lián)分析數(shù)據(jù)挖掘過程進(jìn)行優(yōu)化,減少了冗余的子集和數(shù)據(jù)庫被連接的次數(shù)。實(shí)驗(yàn)結(jié)果顯示,本文算法的執(zhí)行效率更高,從而有效降低了安全審計(jì)系統(tǒng)的運(yùn)行負(fù)荷。
參考文獻(xiàn)
[1] 陳近,文庭孝.基于云計(jì)算的圖書館大數(shù)據(jù)服務(wù)研究[J].圖書館,2016(1):52?56.
CHEN Jin, WEN Tingxiao. Research on library big data service based on cloud computing [J]. Library, 2016(1): 52?56.
[2] LEE Y, LEE Y. Toward scalable internet traffic measurement and analysis with Hadoop [J]. ACM SIGCOMM computer communication review, 2012, 43(1): 5?13.
[3] ADDAIR T G, DODGE D A, WALTER W R, et al. Large?scale seismic signal analysis with Hadoop [J]. Computers & geosciences, 2014, 66(2): 145?154.
[4] LIU S, TANG J, WANG C, et al. A unified cloud platform for autonomous driving [J]. Computer, 2017, 50(12): 42?49.
[5] 劉國城,王躍堂.云電子商務(wù)的安全審計(jì)問題研究[J].蘭州學(xué)刊,2017(5):173?186.
LIU Guocheng, WANG Yuetang. Research on security auditing problem of cloud e?commerce [J]. Lanzhou academic journal, 2017(5): 173?186.
[6] 趙春曄,涂山山,陳昊宇,等.云安全審計(jì)中基于日志的用戶行為分析[J].現(xiàn)代電子技術(shù),2017,40(2):1?5.
ZHAO Chunye, TU Shanshan, CHEN Haoyu, et al. Log?based user behavior analysis in cloud security audit [J]. Modern electronics technique, 2017, 40(2): 1?5.
[7] 王文娟,杜學(xué)繪,王娜,等.云計(jì)算安全審計(jì)技術(shù)研究綜述[J].計(jì)算機(jī)科學(xué),2017,44(7):16?20.
WANG Wenjuan, DU Xuehui, WANG Na, et al. Review of cloud computing security audit technology [J]. Computer science, 2017, 44(7): 16?20.
[8] 徐開勇,龔雪容,成茂才.基于改進(jìn)Apriori算法的審計(jì)日志關(guān)聯(lián)規(guī)則挖掘[J].計(jì)算機(jī)應(yīng)用,2016,36(7):1847?1851.
XU Kaiyong, GONG Xuerong, CHENG Maocai. Auditing association rules mining based on improved Apriori algorithm [J]. Journal of computer applications, 2016, 36(7): 1847?1851.
[9] JIA Y, XIA G, FAN H, et al. An improved Apriori algorithm based on association analysis [J]. Journal of bacteriology, 2012, 15(15): 208?211.