余騫



摘 要: 受異常大數據區域參數波動大的影響,市面上現存的虛擬化網絡異常大數據區域挖掘平臺可應用性和穩定性不高,與虛擬化網絡連接成功率較低。為此,設計新型虛擬化網絡異常大數據區域挖掘平臺。該平臺由虛擬化網絡控制模塊、挖掘模塊和虛擬層組成。虛擬化網絡控制模塊利用SDN控制器對虛擬化網絡進行控制,保證其中的大數據能夠被流暢、安全、穩定地挖掘和傳輸。挖掘模塊先對虛擬化網絡控制模塊傳輸來的大數據進行整流和濾波,再利用報警電路挖掘出其中的異常大數據,進而搭建出異常大數據區域,并對其進行完整存儲。軟件給出虛擬層的功能圖,以及平臺對異常大數據的挖據代碼。經實驗驗證可知,所設計的平臺擁有較高的可應用性和穩定性,且與虛擬化網絡連接的成功率較高。
關鍵詞: 虛擬化網絡; 異常大數據區域; 挖掘平臺; SDN
中圖分類號: TN915?34; TP311 文獻標識碼: A 文章編號: 1004?373X(2017)06?0053?04
Abstract: A new abnormal big data area mining platform in virtualization network was designed due to the big fluctuation of abnormal big data area parameters, low applicability and stability of existing virtualization network abnormal big data area mining platform and low success rate of the virtualization network connection. The platform is composed of virtualization network control module, mining module and virtual layers. SDN controller is used in the virtualization network control module to control the virtualization network to ensure smooth, security and stable mining and transmission of the big data. The mining module is used to rectify and filter the big data coming from the virtualization network control module, and then employs the alarm circuit to excavate the abnormal big data for establishment of the abnormal big data area and their entire storage. The software is adopted to generate the function diagram of the virtual layer and the mining code of the abnormal big data. The verification result from experiment shows that the platform has high applicability, high stability and high success rate of connection with virtualization network.
Keywords: virtualization network; abnormal big data area; mining platform; SDN
0 引 言
虛擬化網絡的出現,使當今社會逐漸成為一個依靠網絡數據生存的社會。虛擬化網絡中各種各樣的數據形成了大數據,大數據的出現更進一步提高了企業的經濟效益和生存能力。然而,虛擬化網絡中異常大數據的存在,為大數據的有效獲取帶來了難度[1?3]。為了解決上述問題,產生了虛擬化網絡異常大數據區域挖掘平臺。怎樣利用該平臺實現異常大數據的有效挖掘,為用戶提供最為有用的大數據,是數據挖掘領域需要重點研究的問題[4?6]。
目前,市面上現存的虛擬化網絡異常大數據區域挖掘平臺,由于受到異常大數據區域參數波動大特質的影響,均都或多或少地存在一些問題,如文獻[7]基于3D技術設計出的虛擬化網絡異常大數據區域挖掘平臺,其通過構建映射3D虛擬大數據區域,并利用計算機軟件設計了挖掘算法,實現了平臺與虛擬化網絡的有效連接,以及對異常大數據的準確挖掘。但3D技術的使用較為復雜,導致整個平臺的可應用性較低。文獻[8]設計了一種使用專業數據處理軟件,進行異常大數據挖掘的虛擬化網絡異常大數據區域挖掘平臺,該平臺的專業數據處理軟件是基于權函數設計的,并通過多種輔助方法對異常大數據進行評估,進而構建異常大數據區域。整個平臺的穩定性較高,但可應用性偏低。文獻[9]設計基于WBT的虛擬化網絡異常大數據區域挖掘平臺,該平臺利用WBT對虛擬化網絡中的大數據進行訓練,并將挖掘出的異常大數據實時更新于數據庫中。該系統與虛擬化網絡連接成功率較高,但穩定性仍需進一步提升。文獻[10]設計基于網絡仿真技術的虛擬化網絡異常大數據區域挖掘平臺,該平臺經由網絡仿真技術實現了對虛擬化網絡中異常大數據準確挖掘,其優勢在于大數據復雜度對平臺的影響不大。但其價格昂貴,對平臺管理人員技術水平的要求也較高,無法實現大規模推廣使用。
以上虛擬化網絡異常大數據區域挖掘平臺的缺陷主要在于:平臺的可應用性和穩定性不高,與虛擬化網絡連接成功率較低。為了改進以上缺陷,設計一種新型的虛擬化網絡異常大數據區域挖掘平臺。
1 虛擬化網絡中的異常大數據區域挖掘平臺設計
所設計的虛擬化網絡異常大數據區域挖掘平臺由虛擬化網絡控制模塊、挖掘模塊和虛擬層組成,其中,虛擬化網絡控制模塊和挖掘模塊是平臺的硬件實現端,虛擬層則為軟件實現端。
1.1 虛擬化網絡控制模塊設計
為了實現對虛擬化網絡異常大數據區域的有效挖掘,首先需要對虛擬化網絡進行控制,保證大數據能夠被流暢、安全、穩定地挖掘和傳輸。為此,虛擬化網絡異常大數據區域挖掘平臺設計了虛擬化網絡控制模塊。
虛擬化網絡控制模塊選取SDN控制器作為其核心控制設備,該設備是一種能夠對虛擬化網絡中大數據進行隔離控制的控制器,其應用OPENFLIW技術,搭建大數據傳輸通道,通過控制大數據傳輸流量,實現對虛擬化網絡的整體控制。SDN控制器的使用,能夠大力增強虛擬化網絡異常大數據區域挖掘平臺與虛擬化網絡的連接成功率。經虛擬化網絡控制模塊控制后的虛擬化網絡,擁有較強的兼容性,并能夠為虛擬化網絡異常大數據區域挖掘平臺提供多種挖掘通道。圖1是虛擬化網絡控制模塊控制原理圖。
由圖1可知,虛擬化網絡控制模塊分為計算端和控制端,計算端和控制端經由固定接口(圖1中的接口1)相連接,保證虛擬化網絡異常大數據區域挖掘平臺的整體連貫性,增強其可應用性。SDN控制器中的控制算法由計算端提供,控制端則與SDN控制器一同直接作用于虛擬化網絡。
控制端對虛擬化網絡的控制表現在參數重置,即為虛擬化網絡注入符合平臺挖掘需求的參數,圖1中的接口2便是平臺專門用來為控制端輸入網絡參數重置標準的;而SDN控制器對虛擬化網絡的控制則表現為參數重置后的大數據流量分流,即將虛擬化網絡中不同類型的大數據區分開,并傳送到挖掘模塊中,便于挖掘模塊實施穩定的異常大數據挖掘工作。
1.2 挖掘模塊設計
挖掘模塊分為預處理端和存儲器端,同時,虛擬化網絡異常大數據區域挖掘平臺還為挖掘模塊設計了報警電路和緩沖電路,用來改進用戶使用體驗、增強平臺穩定性。挖掘模塊的結構圖如圖2所示。
由圖2可知,在虛擬化網絡異常大數據區域挖掘平臺中,挖掘模塊所進行的工作主要包括:異常報警、異常大數據挖掘、異常大數據區域的搭建與存儲。
1.2.1 預處理端設計
當虛擬化網絡中的大數據由虛擬化網絡控制模塊分流傳入挖掘模塊,挖掘模塊隨即調用預處理端進行大數據的預處理,其首先對大數據進行整流和濾波,再利用報警電路篩選其中的異常大數據,進而將虛擬化網絡異常大數據挖掘出來。預處理端的報警電路見圖3。
由圖3可知,當虛擬化網絡中大數據接受整流和濾波操作后,會形成較為清晰的電路信號。把該電路信號依次輸入到報警電路中,電路中的控制器會根據軟件的預設算法對其進行挖掘,若其中存在異常大數據,報警電路便會經由警報器發出警報,警報燈也會同時亮起。此時,挖掘模塊會調用軟件代碼收集異常大數據,并將匯總后的異常大數據傳輸到存儲端。
1.2.2 存儲端設計
存儲端進行異常大數據區域的搭建工作,并對搭建好的異常大數據區域進行完整存儲。為了減弱存儲端的瞬時存儲壓力,挖掘模塊在存儲端內加入了緩沖器,圖4是緩沖器內部電路簡圖。
圖4中的緩沖器電路針對的是簡單虛擬網絡中異常大數據的傳輸緩沖,對復雜虛擬網絡來說,應該額外設計功能更為強大的緩沖電路。基于以上因素,在存儲端的設計中,加入了外設接口,以應對不同的虛擬網絡進行異常大數據挖掘。
存儲器采用先進先出的方式搭建異常大數據區域,最大化地利用了緩沖器功能,所搭建的異常大數據區域較為合理,既縮減了其在存儲器中占用的空間,又能夠有效保護異常大數據不外泄。
2 虛擬化網絡中的異常大數據區域挖掘平臺軟
件設計
2.1 平臺虛擬層功能設計
虛擬層是虛擬化網絡中異常大數據區域挖掘平臺的功能實現層,能夠為用戶提供虛擬化網絡服務。虛擬層功能如圖5所示。
由圖5可知,虛擬層能夠為虛擬化網絡異常大數據區域挖掘平臺提供的功能有:主機管理、虛擬機管理、存儲器管理和網絡層管理。
主機管理是平臺管理者為用戶提供在線平臺管理的一種功能,也是平臺對用戶行為進行監控的有效手段。平臺管理者利用主機管理對用戶可能造成異常大數據的不良行為加以提醒,保障用戶用網安全。
虛擬機管理是指利用虛擬化網路中的特定服務,對所設計的虛擬化網絡異常大數據區域挖掘平臺進行服務補充。在這一功能中,用戶能夠自由下載特定屬性的網絡服務,并將其添加到平臺虛擬層中進行實現。
存儲器管理是一項能夠提高平臺對虛擬化網絡中異常大數據區域挖據效率的功能。當平臺存儲器的內存將滿,或存儲器中存在明顯異常的大數據時,虛擬層將開啟存儲器管理功能,提醒用戶清理存儲器,并自動處理其中的異常大數據。
網絡層管理是一種能夠調出存儲器中的大數據,對其進行異常大數據二次挖掘的功能。二次挖掘的周期可由用戶自行設置。這一功能有效提高了虛擬化網絡異常大數據區域挖掘平臺的穩定性和可應用性。
2.2 異常大數據挖掘代碼設計
軟件所設計的虛擬化網絡異常大數據區域挖掘工作的原理是:先將虛擬化網絡中異常大數據的最大范圍確定出來,將此范圍作為軟件代碼設計中的輸入值輸入到異常大數據區域中,進而產生異常大數據的高頻組合和低頻組合。
高頻組合內的異常大數據主要是警報響起次數較多的大數據,低頻組合則正相反。根據警報響起次數進行挖掘工作的代碼設計,能夠有效縮減代碼復雜度、提高平臺穩定性。所設計的異常大數據挖掘代碼為:
T0={maximum0,range input}
if(i=2;T-1;i++)
M=forecast_information(T,least_gain);
Combination of high frequency and low frequency output;
{
M=aggregate(T,i); %測試挖掘平臺可行性
The implementation of abnormal large data mining;
T++;
}
T={data least_gain}
{
Output0=T;
Void forecast_information(T,least_gain)
{
Dig according to achieve of reaeh;
Range set;
%第一輪挖掘工作結束后,重新設置異常大數據范圍
if(12[0]=13[0])&(1,[1]=13)&(12[i?1]=11[i?1])&(12[i?2]<1:[i?2])
{
x=120 013;
if be_Low frequency_aggregate(x,T++)
Delete non high frequency large data else;
%刪除非高頻大數據
Accede to N; %將異常大數據匯總于區域N
}
Output N; %輸出匯總區域N
}
be_Low frequency_aggregate(T;least_gain)
run up to range set(i=i-1)? replace input of M
output TRUE:
output FALSE:
}
3 實驗驗證
利用實驗對本文所設計的虛擬化網絡異常大數據區域挖掘平臺的相關性能進行驗證。基于設計初衷,實驗主要對本文平臺的可應用性和穩定性,以及其與虛擬化網絡的連接成功率進行驗證。
在虛擬化網絡異常大數據區域挖掘平臺的可應用性驗證實驗中,選取市面上現存的兩種平臺作為實驗的對比量,分別是WBT平臺和網絡仿真技術平臺。利用三種平臺同時對某一綜合性較強的虛擬化網絡進行異常大數據區域挖掘。平臺的可應用性需要經由平臺對異常大數據的挖掘能力(挖掘異常大數據的容量)來驗證。平臺對異常大數據的挖掘能力越強,其硬件與軟件間的契合度就越高,平臺的可應用性就越高。實驗結果如圖6所示。
由圖6可知,在三種平臺中,WBT平臺的挖掘能力最弱,證明其可應用性不高;網絡仿真技術平臺在挖掘時間為120 s之前的挖掘能力較強,但隨著挖掘時間的延長,其挖掘能力并沒有明顯提升,在實驗后期,幾乎沒有異常大數據被挖掘出來,平臺的可應用性仍待提高;本文平臺挖掘出的異常大數據容量始終在平穩上升,并能夠將虛擬網絡中的異常大數據完全挖掘出來,初步驗證了本文平臺擁有較高的可應用性。
然而,由于本文平臺檢測出的異常大數據均高于其他兩平臺,為了確定其挖掘出的大數據是否完全屬于異常大數據,在穩定性驗證實驗中,引入“挖掘準確率”這一概念,進一步驗證本文平臺的可應用性,并同時確定出平臺的穩定性高低。
在虛擬化網絡異常大數據區域挖掘平臺的穩定性驗證實驗中,選取三種差異性較大的虛擬化網絡,利用本文平臺對其進行異常大數據區域挖掘,本文平臺的挖掘準確率曲線如圖7所示。
由圖7可知,本文平臺的三條準確率曲線波動范圍相差不大,且準確率始終維持在[90%,98%]范圍內,證明本文平臺對不同種類虛擬化網絡異常大數據區域的挖掘較高且較為恒定,驗證了本文平臺擁有較高的可應用性和穩定性。虛擬化網絡異常大數據區域挖掘平臺與虛擬化網絡的成功連接,是平臺進行異常大數據準確挖掘的前提條件。連接成功率不佳的平臺,縱使擁有再高的可應用性和穩定性,其設計也是不成功的,因為這種平臺往往存在較大的硬件問題,無法實現用戶的長遠需求。圖8描述的是本文平臺與穩定性實驗中三種虛擬化網絡的連接成功率曲線。
由圖8可知,本文平臺與虛擬化網絡3的連接最為成功;其與虛擬化網絡1的連接波動較大,但仍維持在90%以上;其與虛擬化網絡2的連接,則隨著挖掘時間的增長而增大,最終實現完全成功連接。針對這種情況,可以利用軟件設計給出的網絡層管理功能,對其進行二次挖掘,以提高平臺的各項性能。以上結果能夠驗證,本文平臺與虛擬化網絡的連接成功率較高。
4 結 論
本文設計新型虛擬化網絡異常大數據區域挖掘平臺,該平臺由虛擬化網絡控制模塊、挖掘模塊和虛擬層組成。虛擬化網絡控制模塊利用SDN控制器對虛擬化網絡進行控制,保證其中的大數據能夠被流暢、安全、穩定地挖掘和傳輸。挖掘模塊先對虛擬化網絡控制模塊傳輸來的大數據進行整流和濾波,再利用報警電路挖掘出其中的異常大數據,進而搭建出異常大數據區域,并對其進行完整存儲。軟件給出虛擬層的功能圖,以及平臺對異常大數據的挖據代碼。經實驗驗證可知,所設計的平臺擁有較高的可應用性和穩定性,且與虛擬化網絡連接的成功率較高。
參考文獻
[1] 張帆,毋濤.基于云計算的服裝物料管理系統[J].西安工程大學學報,2015,29(6):740?745.
[2] 嚴英杰,盛戈皞,陳玉峰,等.基于色調分形維數的柑橘糖度和有效酸度檢[J].中國電機工程學報,2015,35(1):52?59.
[3] 吉根林,趙斌.時空軌跡大數據模式挖掘研究進展[J].數據采集與處理,2015,30(1):47?58.
[4] 牟乃夏,張恒才,陳潔,等.軌跡數據挖掘城市應用研究綜述[J].地球信息科學學報,2015,17(10):1136?1142.
[5] 王秀英,張聰聰,王成亮.一種前兆觀測時序特征量的數據挖掘方法[J].大地測量與地球動力學,2015,35(3):533?536.
[6] 呂芳,魏杰,寧靜,等.大數據在動物醫院的應用研究[J].計算機與網絡,2015,41(17):64?67.
[7] 瞿海妮,張鵬飛,凌平,等.基于海量數據的電網需求側用戶行為分析研究[J].華東電力,2014,42(12):2922?2925.
[8] 劉小溪,黃建新.基于新浪微博的異常數據挖掘研究[J].甘肅科技,2014,30(21):12?14.
[9] 付鈺,李洪成,吳曉平,等.基于大數據分析的APT攻擊挖掘研究綜述[J].通信學報,2015,36(11):1?14.
[10] 丁潔,王磊,沈荻帆,等.一種大數據異常檢測系統的研究與實現[J].海南大學學報(自然科學版),2015,33(1):24?27.