龔建鋒
(茂名職業(yè)技術學院,廣東 茂名 525027)
云安全問題是制約云計算技術發(fā)展的重要因素之一,在面對高度規(guī)模化和開放化的云計算環(huán)境,所涉及的安全問題要比傳統(tǒng)網(wǎng)絡環(huán)境更為復雜,如何能夠準確評估風險成為熱點研究課題。目前,學界在云安全風險屬性定性定量評價和計算方法的研究上取得了一定的成果,但在云安全評估方法的可操作性上仍存在一定的不足,尤其在風險屬性與系統(tǒng)結構之間的信任關系的評估方面研究較少,為此,提出應用數(shù)據(jù)挖掘算法獲取評估證據(jù),并構建基于云安全屬性與體系結構的云安全評估模型,在云安全評估方法上開創(chuàng)新的思路。
數(shù)據(jù)共享是云服務的主要特征之一,其方便了用戶對信息資源的高效利用,減輕了客戶端軟件服務壓力,但同時也增加了信息安全風險。目前,云計算信息共享有兩種共享方式,一是顯式共享,二是隱式共享。顯式共享用戶具有訪問權限的分配權,對于云服務商的安全可控壓力大,因此大多采用隱式共享,由服務商分發(fā)服務實現(xiàn)共享;隱式共享在一定程度上提升了云服務商應對安全風險的能力,但是在面對數(shù)據(jù)共享范圍日益擴大和的局面,服務器攻擊內(nèi)容也花樣百出,云服務器遭受攻擊的風險也隨之增加,應對壓力不斷增大[1]。
云服務商為用戶提供多個服務器或者存儲設備存儲和應用數(shù)據(jù),用戶通過公共虛擬化池提取數(shù)據(jù)進行應用[2]。隨著數(shù)量的不斷增加,云計算的擴展邊界也不斷擴大,這就存在數(shù)據(jù)基數(shù)過大、存儲界限復雜難以區(qū)分的問題。在云服務的過程中,數(shù)據(jù)缺乏有效的隔離保護導致數(shù)據(jù)中包含的很多重要數(shù)據(jù)容易被竊取,甚至存在病毒入侵損壞數(shù)據(jù)的風險。
虛擬化是云計算的主要特色,將硬件資源虛擬化擴大數(shù)據(jù)的存儲能力應對存儲數(shù)據(jù)的增長[3]。但虛擬化技術是將分布在各地的服務器組織起來,由主服務器將網(wǎng)絡資源的調(diào)控分配到各個節(jié)點服務器上,數(shù)據(jù)存儲位置是根據(jù)各節(jié)點的存儲能力調(diào)控的,數(shù)據(jù)存儲位置及轉移不是人工控制,對于數(shù)據(jù)的篩選與隔離很難做出有效判定,這就導致虛擬機的漏洞被暴露在網(wǎng)絡中,成為被攻擊的對象。
針對云服務所存在的安全問題,從風險防護的角度構建云安全評估體系,遵循原則包括以下幾個方面:
(1)系統(tǒng)性原則:對于云安全的評估是以理論與實踐相結合,從整體角度分析、整理相關因素,科學地建立指標體系,增強評估的合理性和可操作性,形成一個整體的、全面的反應實際情況的體系。
(2)獨立性原則:在云安全評估中,評估體系存在層次性,指標之間存在關聯(lián)性,這容易造成評估時產(chǎn)生內(nèi)生性問題,評價時出現(xiàn)重復性設置,影響評估的準確性,所以需要避免評價指標之間的包含關系、交叉關系,盡可能地保證評價指標是一個獨立的個體,能夠準確代表系統(tǒng)的主因素,保證其獨立性。
(3)有效性原則:從不同的角度評估云安全水平可能存在結果上的差異,影響判斷的有效性。因此,在選擇評估環(huán)境、評估視角和評估主體時,要綜合考慮各方面的影響因素,全面性、整體性地進行評估才能夠使反映出的結果真實有效。
(4)可比性原則:由于云安全評估指標屬性不同,無法直觀進行有效的比較,因此在處理云安全時需要對指標進行標準化處理,并依據(jù)指標在整個系統(tǒng)中的權重進行客觀的綜合評價才能準確反映云安全的整體水平。
依據(jù)云安全評估體系的設計原則和云服務內(nèi)容,從主機安全、數(shù)據(jù)安全、物理安全、網(wǎng)絡安全和應用安全五個方面建立評估指標體系,如圖1所示。

圖1 云安全評估指標體系
主機是云服務的“指揮中心”,其安全性關系到整個云系統(tǒng)的安全,評估主機安全設定管理身份鑒別、資源控制、虛擬機防護及主機安全審計四項指標;數(shù)據(jù)是云服務的對象,評估數(shù)據(jù)安全設定數(shù)據(jù)完整性、保密性和可靠性三項指標;物理環(huán)境是云服務的基礎,評估物理安全設定物理位置、物理訪問、供電環(huán)境三項指標;網(wǎng)絡是云服務的“通道”,評估網(wǎng)絡安全設定網(wǎng)絡訪問控制、入侵檢測和網(wǎng)絡安全審計三項指標;應用是云服務的功能,評估應用安全設定應用身份鑒別、資源控制、應用訪問控制和接口與源碼安全四項指標[4-6]。
根據(jù)云安全評估體系構建云安全評估模型,在屬性層包括:主機安全、數(shù)據(jù)安全、物理安全、網(wǎng)絡安全、應用安全五個評估屬性。云安全評估模型如圖2所示。

圖2 云安全評估模型
采用數(shù)據(jù)挖掘方法對評估指標相關的數(shù)據(jù)進行挖掘并轉化為一致性評估證據(jù),用指標權重與評估證據(jù)相乘再相加得出屬性安全評估結果,再與屬性權重相乘再相加得到云安全評估最終結果。
依據(jù)模糊評估理論中的隸屬度的方法對數(shù)據(jù)不全面的云安全評估指標數(shù)據(jù)進行綜合計算[7]。對采集到的原始數(shù)據(jù)進行標準化,設采集到的原始數(shù)據(jù)為X=(x1,x2,…,xp),存在數(shù)據(jù)的缺失,如果指標需要有n個指標樣本xj=(x1j,x2j,…,xnj)T,j=1,2,…,p,n>p,對原始數(shù)據(jù)進行標準化變換:

設標準化矩陣為Z=(zij)n×p,變量相關系數(shù)矩陣為R=(rij)p×p,R=ZTZ。求R 的特征值λ1,λ2,…,λp,λi>0 ,其相應的單位特征向量為a1,a2,…,ap。

計算方差貢獻率和累積貢獻率βi(i=1,2,…,p) ,權重為A=(β1,β2,…,βp)。
設評價指標數(shù)據(jù)挖掘得到結果再轉化后的評估證據(jù)集為X={x1,x2,…,xn} ,各評估證據(jù)對應的權重為W={w1,w2,…,wi},i∈[1,n]。計算云安全屬性評估值:

各屬性再乘以對應的屬性權重后相加得到云安全評估的最終結果。
數(shù)據(jù)挖掘技術應用于云安全評估是在動態(tài)評估云安全所產(chǎn)生的海量數(shù)據(jù)中尋找價值信息。本文以Hadoop云計算平臺MapReduce 框架的兩個函數(shù)模型(Map模型和Reduce模型)進行數(shù)據(jù)挖掘,并基于極限學習機(Extreme Learning Machine,ELM)的數(shù)據(jù)挖掘算法獲取評估證據(jù)[8,9]。
MapReduce 運行機制分為5個階段:(1)Input階段讀取來自指標的數(shù)據(jù)并進行切片,再將其分配給Map 函數(shù);(2)Map階段按照邏輯關系處理數(shù)據(jù)片;(3)Shuffle 階段Map 將中間鍵值運送到Reduce節(jié)點,并進行合并排序;(4)Reduce階段處理數(shù)據(jù);(5)Output階段輸出結果[10]。
根據(jù)MapReduce運行機制在Input階段得到k個不同的云安全指標數(shù)據(jù)訓練集子集樣本,k是并行Map的數(shù)量。在Map階段采用極限學習機訓練算法進行邏輯訓練,得到k個不同的ELM。Shuffle 階段將k個ELM結果傳輸?shù)絉educe階段進行數(shù)據(jù)處理。Output階段輸出評估證據(jù)。
ELM 算法是一種學習速度快的單層神經(jīng)網(wǎng)絡算法,設ELM隱含層神經(jīng)元數(shù)量為L,樣本個數(shù)為N,矩陣形式為:

其中,xj為輸入矩陣,xj=[xj1,xj2,…,xjn]T,tj為輸出矩陣,tj=[tj1,tj2,…,tjm]T。
ELM輸出為:


設;
則公式(6)可表達為:HB=T,H為ELM的隱含層神經(jīng)元的輸出矩陣,xj:h(xj) 為輸入xj的特征映射,其中,h(xj)=[ψ(xj;u1,v1),…,ψ(xj;uL,vL)]。
當N>L時,ELM訓練誤差接近0,此時求ELM近似等價于解B的線性方程組最小二乘解:

結合嶺回歸,運用正則化系數(shù)C改善ELM網(wǎng)絡穩(wěn)定性和泛化能力,B的最小二乘解可表示為:

ELM輸出可表示為:

以Hadoop平臺為基礎,設置32個網(wǎng)絡節(jié)點,每個節(jié)點配置采用Intel i7 處理器,16GB 內(nèi)存服務器,以Windows10 為操作系統(tǒng),選擇KDDCUP99 數(shù)據(jù)作為數(shù)據(jù)挖掘?qū)ο蟆=⒃瓢踩u估等級標準如表1所示。

表1 云安全評估等級標準
基于ELM數(shù)據(jù)挖掘的云安全評估過程如下:
首先,讀取數(shù)據(jù)訓練集,運用MapReduce 框架分割樣本得到k個不同的訓練子集,k為并行Map的數(shù)量;其次,根據(jù)Map函數(shù)的程序邏輯運行數(shù)據(jù)訓練子集,訓練k個不同ELM;最后,通過MapReduce框架的Shuffle階段將k個ELM結果傳輸?shù)絉educe 階段,將權重分配給各Map,綜合評估云安全。
(1)根據(jù)云安全評估模型,對Hadoop云計算平臺中的數(shù)據(jù)進行數(shù)據(jù)挖掘,并經(jīng)過數(shù)據(jù)的轉化得到評估證據(jù)和指標權重,評估證據(jù)值和對應的指標權重如表2所示。

表2 評估證據(jù)值和對應的指標權重
(2)根據(jù)公式(3)計算5 大屬性主機安全、數(shù)據(jù)安全、物理安全、網(wǎng)絡安全、應用安全的評估值和該系統(tǒng)的總評估值如表3所示。

表3 云安全評估結果
由表3可以看出,采用所設計的云安全評估模型得到的評估結果主機安全評估分值為0.720、數(shù)據(jù)安全評估分值為0.850、物理安全評估分值為0.612、網(wǎng)絡安全評估分值為0.950、應用安全評估分值為0.624,總評分值為0.810。總結果該系統(tǒng)具有非常高的安全等級,其中數(shù)據(jù)安全和網(wǎng)絡安全評估等級非常高,物理安全、應用安全和主機安全的評估等級為高。
為提高云計算網(wǎng)絡系統(tǒng)安全評估的效率和準確性,采用了ELM算法進行數(shù)據(jù)挖掘,并經(jīng)過數(shù)值轉化獲得可作為評估依據(jù)的評估證據(jù),采用綜合模型進行評估不僅可以針對云服務系統(tǒng)中的各個屬性部分進行局部的安全評估,還可以從整體性上對系統(tǒng)進行評估,在一定程度上既提高了評估的效率又提高了云安全評估的全面性。