張 杰,宋曉霞
(山西大同大學數學與機算機科學學院,山西 大同 037009)
云計算環境下網絡異構數據節點失效概率密度分布計算
張 杰,宋曉霞
(山西大同大學數學與機算機科學學院,山西 大同 037009)
針對傳統的網絡異構數據節點失效概率密度分布計算方法,一直存在計算不準確、效率低的問題,提出云計算環境下的網絡異構數據節點失效概率密度分布計算方法。通過網絡數據節點效能指標、網絡數據節點功率指標、平均失效節點度量指標、網絡數據節點活動時間指標為基準進行失效分析,采用基環變換方法,建立約束模型,引入支持向量機的方法。通過引進一個非線性映射,對網絡異構數據節點的失效概率密度分布進行計算。實驗結果發現,采用改進方法時,其計算精度及計算效果均要優于傳統計算方法,具有一定優勢。
網絡;異構數據;節點;支持向量機;失效;概率密度
云計算方法的出現,影響范圍頗大,產業界和學術界都對此議論紛紛,直到目前為止,其統一定義都未確定[1-2]。云計算使用方法中,最具有代表性的一類具體解析如下:開發者向云計算服務提供商業租用虛擬服務器,幵發者可根據需求隨時處理服務器狀態,使用服務器操作應用程序,同時,服務器還可以根據運行程序中不同操作指令自動匹配對應虛擬服務器數量,以此為云服務提供商結算費用提高依據[3-4]。云計算是互聯網環境下的一種新型計算方法,云計算平臺可實現軟硬件資源和信息共享,可以根據計算機或者其他設備的不同需求,給與相對應信息提供[5-6]。云計算環境覆蓋面逐漸增大,然而在使用過程中,經常會出現偏差等問題,因此對網絡異構數據節點的失效概率密度分布進行計算,在該領域成為了亟待解決的問題,受到廣大學者的關注[7-8]。
文獻[9]提出一種異構存儲節點下的可用性分析框架,以及優化的糾刪碼部署方法。實驗表明,所提出的糾刪碼部署方法的可用性與系統實際可用性的差異小,性能明顯優于現有的相關工作。但是該方法存在計算精度低的問題。文獻[10]提出一種機架間基于任務特性和節點計算能力的數據分配策略.該分配策略提高了對數據局部性的關注,使每個節點都盡可能只訪問本地數據。通過實驗可知,該策略可以有效地縮短作業執行時間,提高時效性;同時提高數據局部性,減少網絡數據傳輸,避免擁塞;最后,該分配策略還具有較好的穩定性。但存在計算精度低、耗時長的問題。
針對上述問題的產生,提出云計算環境下的網絡異構數據節點失效概率密度分布計算方法。實驗結果發現,采用改進的計算方法,可有效的獲取失效概率密度分布情況,且計算耗時短、效率高,相比傳統方法優勢較大。
元件是網絡異構數據節點的最小組成單元,對失效進行分析時,以單個元件作為計量單位。元件壽命長短、不同材質、裝配方式、工作環境等因素都會直接影響元件的可靠性,是一個連續的隨機變量,則其分布函數可表示為:

壽命概率密度函數為:

分布函數與密度函數的關系為:

網絡異構數據節點的效度函數也是一種概率指標,其定義為元件在t前正常的概率,表達式為:

從定義可知:

由分布函數分布規律可知,效度函數取值區域為[0,1]。原件第一次使用并運行時,可取得較高的效度。隨著使用次數增加,元件會逐漸發生磨損甚至伴隨衰老,使用效度就會隨之降低,直到為零。元件效率分析過程中很難獲得元件壽命相關的分布函數,所以元件可靠性指標分析最常采用元件功率函數()tλ[11]。表示元件在時刻t前正常的條件下,t時刻后的條件概率密度函數為:

正常運行的時間概率公式為:

式中:λA為功率,λALj為主節點j的功率,為節點i上的有用功率。分別為網絡異構數據節點的功率。則失效表示為其網絡數據節點效能指標、網絡數據節點功率指標、平均失效節點度量指標、網絡數據節點活動時間指標[12-13]。
(1)網絡數據節點效能指標
網絡數據節點效能指標是指每個用戶在單位時間內的節點效能,表達式為:

式中:iλ為網絡數據節點i的平均效能;iN為網絡數據節i的運行時間。
(2)網絡數據節點功率指標
網絡數據節點功率指標用來表示一個時間段內網絡異構數據所得到的節點運行功率。用下式進行表示:

(3)平均失效節點度量指標
平均失效節點度量指標是指網絡異構數據每個時間段內監測到的與失效節點相關聯信息的次數,計算公式為:

(4)網絡數據節點活動時間指標
網絡數據節點活動時間是網絡數據流在受到外界影響情況下可持續的活動時間,表達式為:

式中:iλ、iU、iN分別表示節點i的平均活動量、平均暫停時間和時間間隔。
云計算環境下網絡異構數據分析采用輻射狀結構,且各節點不存在環網,則其拓撲約束表達式為:

式中: C1-1為節點間不聯系, C1-2為網絡數據流中不存在環網。


式中:SWLΩ、NΩ分別為聯絡節點、數據節點的集合,ijP-、ijQ-分別表示節點i j- 的有功功率和無功功率,wP和wQ分別表示代恢復區域節點q的有功效率和無功效率。在滿足運行約束條件下,通過改變運行時的聯絡節點組合狀態對拓撲結構實行轉換[15-16],在不一樣饋線間轉換節點,從而干擾數據流分布,對運行進行優化,獲取目標優化函數表達式為:

式中:polee表示的有功損耗,N表示節點數,i, j分別表示節點的首末節點號,kb為節點b的離散狀態變量, rb為節點b的阻礙點, Ui為節點b的阻礙幅值,得到失效約束模型表達式為:

式中:cIλ為區域的等效故障概率,iλ、iγ為區域中元件i的平均功率和平均活動時間,ctN 為區域元件數量。
在建立失效概率約束模型的基礎上,采用支持向量機方法,對失效概率密度分布進行計算。
云計算環境下網絡異構數據節點與正常的有所不同,其需要人為的設定一個時間間隔 dx,才能計算出失效概率密度分布值,其分布的定義表達式為:

式中,x為的節點數值, d A( x)為失效的個數,H( x)為失效概率密度。
則網絡異構數據節點總的失效可以表示為:

式中: m ax( x)表示網絡異構數據中最大節點。
假設失效概率主要有兩個獨立的隨機變量Z和W,其中Z服從正態分布,W服從非對稱拉普拉斯分布,具體公式如下所示:

則失效概率密度分布Yf可由Zf和zf的卷積而得到:
對于失效概率密度線性不可分的情況,能采用支持向量機的方法,通過引進一個非線性映射,將失效概率密度不可分問題,轉化為線性可分問題,表達式為:


其中:H是失效概率密度特征集合,對訓練樣本在特征集合中的映射構造線性分類決策函數,此時的分類超平面為:


通過求解可以得到:

為了構造真實函數集的基于支持向量機的失效概率密度分布,使用一種新的損失函數ε增加失效概率密度分布計算的精度,定義如下所示:

則尋找iw和ib,使得在約束的條件下,得到失效概率密度特征為:

假設ξ是一個隨機變量,ξ的概率分布函數,表達式為:

對其進行泛化處理,表達式為:

從概率學的角度來看,能將每個元件看作是一個獨立樣本,則元件的頻率為元件總數,當dx無線微分,失效概率密度函數就趨近與它的頻率分布,表達式為:
綜上所述,在建立失效概率約束模型的基礎上,采用支持向量機方法,可對失效概率密度分布進行計算,需要進行實驗對比分析。
為進一步證明數據節點失效概率密度分布計算方面,改進計算方法的有效性及可行性。采用優化函數值變化情況對節點進行分析,如圖1所示,系統中含有30個節點34個支路。實驗以傳統計算方法與改進方法為對比進行實驗分析,結果如圖 1所述。
從圖1可以看出,采用傳統方法時,從迭代運行0~20次時,出現急劇下降的狀態,但優化函數值下降到0.83時,就開始趨于平穩;采用改進方法時,從迭代運行0~20次時,出現急劇下降的狀態,但優化函數值下降到0.585,才開始穩定,相比傳統方法其優化效果更好。
為了進一步驗證改進方法的有效性及可性能,采用傳統方法與改進方法為對比進行密度分布為對比進行對比分析,結果如圖2所示。

圖1 不同方法下的優化函數值變化情況Fig. 1 Variation of optimal function value under different methods
從圖2可以看出,采用改進方法時,其失效概率密度分布情況與實際的分布情況較為接近,且在21-29之間未出現較大波動。但采用傳統方法時,其失效概率密度分布情況與實際的分布情況相距較遠,且在 21-29之間出現多處波動,由此可知,改進方法相比傳統方法具有一定的優勢,這主要是因為改進方法對云計算環境下網絡異構數據節點的失效概率密度計算時,進行了目標函數優化,獲取失效概率密度特征的原因。
云計算平臺基于虛擬化技術向用戶提供多種類型虛擬資源,大范圍整合物理資源,提高用戶計算能力,網絡異構數據節點在其中擔任著重要作用。針對其失效概率密度分布計算方法存在計算不準確、效率低的問題,提出云計算環境下的網絡異構數據節點失效概率密度分布計算方法。建立失效概率約束模型,在此模型基礎上,采用支持向量機方法,對失效概率密度分布進行計算,從優化函數值變化情況、失效概率密度分布對比兩方面進行實驗對比分析。實驗結果證明,采用改進方法時,其計算結果精確度高,可以有效規避傳統方法存在問題,效果顯著。

圖2 不同方法下失效概率密度分布對比Fig. 2 Comparison of probability density distribution of failure probability under different methods
[1] 向春枝, 范穎. 云計算環境中分布式數據存儲關鍵技術研究[J]. 現代電子技術, 2016(3): 63-67.
[2] 張晉芳, 王清心, 丁家滿, 等. 一種云計算環境下大數據動態遷移策略[J]. 計算機工程, 2016, 42(5): 13-17.
[3] 陳志華. 分布式云計算環境下的海量數據有效查詢方法[J].科技通報, 2015, 31(8): 222-224.
[4] 白亞魯. 云計算環境下大規模數據處理的研究[J]. 軟件,2013, 34(5): 128-129.
[5] 蹇旭. 云計算環境下的海量數據特定特征挖掘技術[J]. 現代電子技術, 2017, 40(13): 178-180.
[6] 馬自堂, 陳鵬, 李兆興. 云計算環境下基于主動預測的節點部署模型研究[J]. 計算機科學, 2015, 42(9): 139-143.
[7] 耿麗麗. 失效網絡中節點可通信性能評估方法研究[J]. 現代電子技術, 2016, 39(22): 27-31.
[8] 毛建旭, 毛建頻, 姚曉玲, 等. 基于等價類的大型數據庫頻繁項集挖掘算法[J]. 新型工業化, 2011, 1(4): 35-44.
[9] 徐利謀, 李長云, 滿君豐. 基于剩余能量和距離信息的異構網絡分簇協議[J]. 計算機應用研究, 2016, 33(9):2763-2766.
[10] 劉波, 劉青鳳. 云計算環境下異構數據節點冗余存儲模式的優化[J]. 計算機應用與軟件, 2015, 32(1): 30-33.
[11] 林常航, 郭文忠, 陳煌寧. 針對Hadoop異構集群節點性能的數據分配策略[J]. 小型微型計算機系統, 2015, 36(1):83-88.
[12] 蔣文賢, 賴超. 一種壓縮感知的異構傳感網絡分簇路由算法[J]. 小型微型計算機系統, 2015, 36(2): 252-256.
[13] 楊明霞, 王萬良, 馬晨明. 面向節能和容錯的異構WSNs數據收集算法[J]. 傳感技術學報, 2016, 29(6): 934-940.
[14] 林常航, 郭文忠, 陳煌寧. 針對Hadoop異構集群節點性能的數據分配策略[J]. 小型微型計算機系統, 2015, 36(1):83-88.
[15] 楊澤民. 數據挖掘中關聯規則算法的研究[J]. 軟件, 2013,34(11): 71-72.
[16] 曹戈, 程玉虎. 基于初始聚類中心選取和數據點劃分的K均值聚類算法[J]. 新型工業化, 2011, 1(5): 90-94.
The Failure Probability Density Distribution of Network Heterogeneous Data Nodes in Cloud Computing Environment is Calculated
ZHANG Jie, SONG Xiao-xia
(School of Mathematics and Computer Science, Shanxi Datong University, Datong Shanxi, 037009, China)
According to the traditional heterogeneous data network node failure probability density distribution calculation method, calculation is not accurate, there has been the problem of low efficiency, the proposed network of heterogeneous data in cloud computing environment the node failure probability density distribution calculation method. Through the network data node, network data node performance index, the average power failure node metrics, data network node time index as a benchmark for failure analysis, using the base ring transformation method,establish the constraint model, the introduction of support vector machine method. By introducing a nonlinear mapping, the probability density distribution of the network heterogeneous data nodes is calculated. The experimental results show that the improved method is better than the traditional method in calculation accuracy and calculation effect, and has some advantages.
Network; Heterogeneous data; Node; Support vector machine; Failure; Probability density
TM711
A
10.3969/j.issn.1003-6970.2017.12.011
本文著錄格式:張杰,宋曉霞. 云計算環境下網絡異構數據節點失效概率密度分布計算[J]. 軟件,2017,38(12):61-65
大同市科技局軟科學項目(2016120);山西省高等學校教學改革創新項目(2015090);大同市工業重點研發計劃項目(2017011);山西省高等學校教學改革創新項目(J2017093)大同市科技局項目(2017127)山西大同大學科研基金項目(2017K12)
張杰(1979-),男,山西大同人,碩士研究生,講師,主要研究方向:網絡安全、物聯網;宋曉霞(1975.5-),山西廣靈人,教授,博士,研究方向:物聯網,壓縮感知。