999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PSO的云計算環境中大數據優化聚類算法

2016-03-01 09:00:16朱亞東高翠芳
計算機技術與發展 2016年9期
關鍵詞:特征提取特征優化

朱亞東,高翠芳

(1.江蘇聯合職業技術學院信息中心,江蘇南京 211135; 2.江南大學理學院,江蘇無錫 214122)

基于PSO的云計算環境中大數據優化聚類算法

朱亞東1,高翠芳2

(1.江蘇聯合職業技術學院信息中心,江蘇南京 211135; 2.江南大學理學院,江蘇無錫 214122)

在云計算環境下,對大數據進行優化聚類是實現數據優化訪問和挖掘的基礎。傳統方法采用模糊C均值聚類算法進行云計算中的大數據聚類,易陷入局部極值,產生聚類偏移,效果不佳。提出一種基于優化粒子群(PSO)算法的大數據聚類算法。分析了云計算環境中的大數據結構模型,計算大數據的離散樣本頻譜特征,實現聚類樣本的特征提取和信息模型構建。由于粒子群在搜索過程中經常會陷入局部最優解,采用混沌映射方法,帶領粒子逃離局部最優解,設計粒子群優化算法進行特征聚類,達到大數據優化聚類的目的。仿真結果表明,采用該算法進行數據聚類,誤分率降低,尋優性能較好,具有較好的應用價值。

粒子群;數據聚類;云計算;大數據

0 引言

各種云計算系統的出現使得信息處理和計算向著云計算方向發展。在云計算系統中,允許開發者將寫好的程序放在“云”里運行,實現云計算系統的程控擴展和智能共享。在云計算環境中,海量的大數據需要進行調度和訪問,達到數據挖掘的目的。實現云計算中大數據挖掘的基礎在于數據聚類,因此研究云計算環境中大數據優化聚類算法具有重要意義。

聚類算法的本質是將海量大數據信息流通過統計信息分析的方法分成若干個層次的子集,提取數據信息流的屬性特征量,調整聚類中心實現數據聚類優化。傳統大數據聚類算法主要有分割聚類算法、融合法和分裂法、層次類別算法以及神經網絡控制算法[1-3]。其中,采用粒子群聚類的聚類粒度分割算法具有典型性,取得了一定的研究成果。文獻[4]提出一種基于K -means算法的云計算環境中的大數據聚類算法,基于互聯網的相關服務的增加、使用和交付模式,實現大數據聚類;但是該算法存在對內存空間需求太大、計算開銷大的缺點。文獻[5]提出一種基于模糊C均值聚類的云計算環境中的大數據聚類算法。算法隨著數據量的增加,數據密度和類別距離大小出現非線性偏移,導致聚類中心不穩定,聚類效果不好。文獻[6]提出基于分數階Fourier變換特征匹配和K-L變換分類的云計算設備中的大數據特征高效分類挖掘算法,實現云計算設備中的大數據特征高效分類挖掘。算法的缺陷在于動態擴展性不好,且對初始聚類中心較為敏感,需要進行改進。

粒子群算法能夠通過各個粒子間的合作和競爭關系尋求最優解,并且其算法結構簡單,易實現,從而在參數優化方面備受關注。于是文中便利用粒子群的特點,并針對上述問題,提出一種基于改進粒子群(Particle Swarm Optimization,PSO)算法的云計算環境中大數據特征提取和大數據聚類算法。首先分析了云計算環境中的大數據結構模型,進行大數據的特征提取和信息模型構建,設計粒子群優化算法進行特征聚類,并采用混沌搜索對粒子群優化算法進行改進,提高其收斂速度和全局尋優能力,達到大數據優化聚類的目的。

1 云計算環境中大數據存儲機制及數據結構分析

1.1 云計算環境中大數據存儲機制體系構架

云計算是通過互聯網來提供動態易擴展的大數據存儲空間和結構模型。為了實現云計算環境中大數據存儲聚類和分類挖掘,需要首先在云計算環境中構建大數據存儲機制體系構架。云計算環境中大數據存儲采用虛擬化存儲池結構,云計算部署依賴于計算機集群,從上到下分別是:I/O虛擬計算機,USB接口層序和磁盤層,企業數據中心通過各種終端獲取應用服務,使計算分布在大量的分布式計算機上[7]。云計算環境中大數據存儲總體架構如圖1所示。

圖1中,當所有的云計算虛擬機都被分配到物理機之后,利用下述公式能夠計算本次聚類中的全局最優解[8],并能根據最優解將全部云計算中的大數據特征聚類中心VM分配到物理機PM上:

對樣本進行分析采集,判斷樣本是否為典型樣本,以此樣本為數據,設大數據庫信數據信息流樣本S=,分別在時間段T1,T2,…,TK進行數據信息采樣。

現在把云計算環境中大數據集合X分為c類,其中1<c<n。把數據的分割轉化為對空間的分割,得到大數據的存儲結構中心矢量為:

其中,Vi為目標聚類特征的第i個矢量(第i個聚類中心矢量)。

模糊劃分矩陣表示為:

對單個數據源進行冗余數據降維處理,在進行多通道QoS需求的虛擬機分簇挖掘的過程中,其輸入部分(為虛擬機和物理機的集合)以及相關參數分別為VMS= {VM,VM,…,VM},PMS= {PM,PM,…,PM},啟12m12n發因子為α,啟發因子的期望值為β,最大挖掘次數為Imax。由此,客戶端上傳的數據塊提供固定大小的數據塊,實現云聚類。通過上述的云計算環境中大數據存儲機制體系構架分析,為進行大數據聚類提供準確的數據基礎[9]。

1.2 大數據信息流模型構建與特征提取

假設云計算環境中的信息流時間序列為{x(t0+ iΔt)},i=0,1,…,N-1。設X和Y為屬性集合,云計算環境下大數據聚類空間狀態矢量表達式為:

式中,x(t)為云計算環境下大數據聚類系統信息流時間序列;J為云計算環境下大數據重構的相空間的時間窗函數;m為目標聚類調節因子;Δt為數據采樣時間間隔。

計算大數據的離散樣本頻譜特征Xp(u ),主特征量為:

其中,sc(t)為大數據的特征標量時間序列;ej2πf0t為大數據聚類數據的離散樣本中心。

數據集為 { X1,X2,…,Xn},( F ,Q)為樣本數據高階貝塞爾函數統計量,確定節點數據包的置信度,確立置信區間,得到的置信度和置信區間分別為:

數據聚類中心的粒子最優解的向量矩陣為:

其中,σr為粒子在k+1時刻的位置;Rr×r則為實矩陣。

對角向量可以表述為粒子距離目標解的遠近,并且滿足:

基于誤差反傳的梯度下降訓練,實現對大數據的特征優化提取,輸入得數據聚類系統,實現模式識別。

2 大數據聚類算法的改進實現

在上述對云計算中的大數據信息流模型進行構建與特征提取的基礎上,進行大數據聚類優化設計與實現。傳統方法采用模糊C均值聚類算法進行云計算中的大數據聚類,易陷入局部極值,產生聚類偏移,效果不好[10]。文中提出一種基于粒子群優化(PSO)算法的大數據聚類算法。粒子群(PSO)優化算法由Kennedy和Eberhart于1995年提出,是一種新型智能優化算法。利用粒子群算法進行云計算中的大數據聚類處理時,由于每個個體有不一樣的特征,適應度高的個體更容易進入下一代,由此可以優化聚類算法的實現效率。

假設在D維大數據聚類搜索空間中,有m個粒子組成一個種群,每個大數據信息特征矢量Xi對應的一個函數為:

其中,fi是Xi模因組適應度函數;Pij(k)表示k時刻第i個粒子的全局優化粒子權值。

設置門限值Nth,當Neff<Nth時,第j個粒子移動的概率為:

其中,xk為第k個動態慣性權重;a為聚類中心的控制參量。

根據不同數據聚類任務[8],調整適應度函數內權重,得到PSO聚類的權重系數為:

其中,α,β{ }為云計算環境下大數據聚類的分集聚斂目標函數,得到優化的PSO聚類目標函數為:

其中,粒子的位置對應樣本數據的k個聚類中心。除了粒子位置外,對粒子的適應度和速度進行編碼。由于樣本數據的屬性向量維數為d,則粒子的位置和速度為k×d維矩陣。

針對粒子群算法容易出現早熟并且收斂速度慢的缺陷[11],文中采用混沌映射方法對其進行優化,帶領粒子逃離局部最優解,加速收斂。混沌搜索表面上顯示出毫無規律的遍歷,然而它是憑借著其內在規則隨機不重復地對系統中所有狀態進行搜索遍歷。混沌方法首先要生成混沌序列,這里采取Logistic映射獲得混沌序列,可以通過如下方程進行描述:

在粒子群不斷進行迭代計算的過程中,超過一定代數,其算法收斂速度便開始降低,于是為了提高粒子群的收斂速度和全局尋優能力,通過生成的混沌序列來擾動全局最優粒子。對于前述的m個粒子,將它們的每一維度一一映射到(0,1)范圍上,于是便能夠得到向量D=(d1,d2,…,dm)。其中,di為粒子第i維,其表達式為:

式中,gbesti為適應度最高粒子的第i維;a和b分別為粒子在任意維度中的取值下限和上限。

利用混沌擾動重新進行迭代計算,得到新序列:

把得到的新序列Z1當成新粒子,并進行適應度計算,如果計算得到Z1適應度高于之前搜索得到的最優解,那么便令Z1為當前最優解。

通過上述處理,在云計算系統的大數據聚類中就代表一個任務調度策略[12]。改進的PSO大數據優化聚類算法流程描述如圖2所示。

3 仿真實驗

為了驗證文中算法在實現云計算環境中大數據優化聚類和數據挖掘中的性能,對其進行仿真實驗。

仿真實驗硬件環境為:處理器Intel(R)Core(TM) 2 Duo CPU主頻2.93 GHz,內存2 GB;操作系統:Windows 7。仿真軟件采用Matlab 7。

實驗中,大數據的采樣頻率fs=4f0=20 kHz。大數據聚類的時間中心t0=15 s,數據量從10 MB到1 GB,以10 MB為單位,粒子群數量N為30 984個,粒子群聚類過程中的相空間搜索維度設置為30,粒子移動的概率為0.34,每次PSO運行迭代5 000次。大數據聚類的算法處理參數設置見表1。

表1 大數據聚類的算法處理參數設置

根據上述仿真環境和參數設定結果,對云計算中的大數據聚類進行仿真,其中大數據的特征分布如圖3所示。

由圖3可見,原始的大數據二維特征分布具有隨機性,在二維空間中難以實現對其規律性的特征提取和分類。采用文中算法進行特征提取和數據聚類處理,進行大數據的特征提取和信息模型構建,設計粒子群優化算法進行特征聚類,得到的特征提取結果如圖4所示。

由圖4可見,文中算法能有效實現對云計算中的大數據的特征提取,波束的聚焦性能較好,為數據優化聚類提供準確的特征依據,以此為基礎實現數據聚類。

采用不同算法分析大數據聚類的尋優性能,得到聚類中心尋優性能曲線如圖5所示。

由圖5可見,文中算法在連續不斷迭代的計算過程中,以穩定的收斂速度向最優解逼近,相比其他算法,具有明顯的全局最優解搜尋優勢和較好的收斂速度,提高了數據聚類的尋優能力[13],從而提高了大數據聚類精度,降低了誤分率。通過定量分析可知,采用文中算法的誤分率比傳統算法降低了13.56%,展示了較好的大數據聚類挖掘能力。

4 結束語

在云計算環境中,海量的大數據需要進行調度和訪問,達到數據挖掘的目的。實現云計算中大數據挖掘的基礎在于數據聚類,文中提出一種基于改進PSO算法的大數據聚類算法。首先分析了云計算環境中的大數據結構模型,進行大數據的特征提取和信息模型構建[14],設計粒子群優化算法進行特征聚類,達到大數據優化聚類的目的。仿真結果表明,文中算法在提高云計算環境中的大數據聚類性能方面表現優異。通過文中算法進行數據聚類,降低了誤分率,具有較好的尋優性能。

[1] 譚鵬許,陳 越,蘭巨龍,等.用于云存儲的安全容錯編碼[J].通信學報,2014,35(3):109-115.

[2] 魏理豪,王 甜,陳 飛,等.基于層次分析法的信息系統實用化評價研究[J].科技通報,2014,30(2):143-145.

[3] 吳 濤,陳黎飛,郭躬德.優化子空間的高維聚類算法[J].計算機應用,2014,34(8):2279-2284.

[4] 辛 宇,楊 靜,湯楚蘅,等.基于局部語義聚類的語義重疊社區發現算法[J].計算機研究與發展,2015,52(7): 1510-1521.

[5] 許成鵬,朱志祥.一種基于云計算平臺的數據庫加密保護系統[J].電子設計工程,2015,23(19):97-100.

[6] 陶新民,宋少宇,曹盼東,等.一種基于流形距離核的譜聚類算法[J].信息與控制,2012,41(3):307-313.

[7] 劉少偉,孔令梅,任開軍,等.云環境下優化科學工作流執行性能的兩階段數據放置與任務調度策略[J].計算機學報,2011,34(11):2121-2130.

[8] 許 丞,劉 洪,譚 良.Hadoop云平臺的一種新的任務調度和監控機制[J].計算機科學,2013,40(1):112-117.

[9] 張 潔.云計算環境下的數據存儲保護機制研究與仿真[J].計算機仿真,2013,30(8):254-257.

[10]張彬橋.云環境下計算資源調度策略與仿真研究[J].計算機仿真,2013,30(11):392-395.

[11]王德政,申山宏,周寧寧.云計算環境下的數據存儲[J].計算機技術與發展,2011,21(4):81-84.

[12] Qin Z R,Wang G Y,Wu L Y,et al.A scalable rough set knowledge reduction algorithm[C]//Proceedings of rough sets and current trends in computing,[s.l.]:[s.n.],2004: 445-454.

[13]Liao Lüchao,Jiang Xinhua,Zou Fumin,et al.A spectral clustering method for big trajectory data mining with latent semantic correlation[J].Chinese Journal of Electronics,2015,43(5): 956-964.

[14]余曉東,雷英杰,岳韶華,等.基于粒子群優化的直覺模糊核聚類算法研究[J].通信學報,2015,36(5):74-80.

Big Data Optimization Clustering Algorithm Based on PSO in Cloud Computing Environment

ZHU Ya-dong1,GAO Cui-fang2
(1.Information Center,Jiangsu Union Technical Institute,Nanjing 211135,China; 2.School of Science,Jiangnan University,Wuxi 214122,China)

In the cloud computing environment,the optimization of big data is the basis for the data optimized access and mining.In the traditional method,the fuzzy C means clustering algorithm is used to cluster the big data in the cloud computing,which is easy to fall into local extremum.A big data clustering algorithm based on Particle Swarm Optimization(PSO)is proposed.The big data structure model in cloud computing environment is analyzed,and the discrete sample spectrum characteristics of big data are calculated,realizing feature extraction and information model construction of clustering sample.The particles are often fallen into local extremum in searching.The chaotic mapping is used to take the particles against the local extremum.The PSO is designed to carry on the feature clustering for the purpose of optimization clustering for big data.Simulation shows that the proposed algorithm is used for data clustering,and the error rate is reduced,and the optimization performance is better,and it has good application value.

particle swarm;data clustering;cloud computing;big data

TP391.9

A

1673-629X(2016)09-0178-05

10.3969/j.issn.1673-629X.2016.09.040

2015-12-07

2016-04-12< class="emphasis_bold">網絡出版時間

時間:2016-08-01

國家自然科學基金青年基金(61402202)

朱亞東(1976-),男,碩士,副教授,研究方向為計算機網絡、信息安全。

http://www.cnki.net/kcms/detail/61.1450.TP.20160801.0907.050.html

猜你喜歡
特征提取特征優化
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
如何表達“特征”
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于MED和循環域解調的多故障特征提取
主站蜘蛛池模板: 国产精品亚洲欧美日韩久久| 91高清在线视频| 国产欧美中文字幕| 特级欧美视频aaaaaa| 亚洲美女AV免费一区| 国内精品久久久久久久久久影视| 秋霞国产在线| 黄色不卡视频| 亚洲国产成人超福利久久精品| 91色在线视频| 亚洲综合日韩精品| 国产激爽大片高清在线观看| 日韩123欧美字幕| 国产精品亚洲专区一区| 国内精自线i品一区202| 国产精品自在自线免费观看| 亚洲欧美自拍视频| 国产福利拍拍拍| 国产午夜福利片在线观看| 高潮爽到爆的喷水女主播视频| 久久77777| 久久6免费视频| 中文字幕首页系列人妻| 四虎精品国产永久在线观看| 99热这里只有精品2| 91综合色区亚洲熟妇p| 在线无码九区| 91久久偷偷做嫩草影院电| 亚洲国产综合自在线另类| 国产免费黄| 波多野结衣第一页| 亚洲AⅤ综合在线欧美一区| 久久香蕉国产线看观看精品蕉| 色视频国产| 亚洲A∨无码精品午夜在线观看| 最新精品国偷自产在线| 欧美日韩精品在线播放| 国产在线高清一级毛片| 国产精品第一区| 国产96在线 | 国产精品99在线观看| 国产丝袜精品| 国产成人综合亚洲欧洲色就色| 国产综合亚洲欧洲区精品无码| 亚洲美女高潮久久久久久久| 99热这里只有精品在线播放| 久草视频中文| 99国产精品免费观看视频| 久久亚洲AⅤ无码精品午夜麻豆| 亚洲欧美另类色图| 亚洲午夜天堂| 国产门事件在线| 久久久久国产一级毛片高清板| 成人蜜桃网| 一区二区三区毛片无码| 久久综合亚洲鲁鲁九月天| 国产一区二区人大臿蕉香蕉| 夜夜操天天摸| 香蕉在线视频网站| 亚洲人成网站18禁动漫无码 | 狠狠亚洲五月天| 久久精品国产电影| 国产爽歪歪免费视频在线观看| 国产精品偷伦视频免费观看国产| 性欧美在线| 欧美中文字幕在线二区| 无码电影在线观看| 欧美一区二区三区不卡免费| 91网址在线播放| 一本色道久久88| 亚洲av色吊丝无码| 91视频首页| 国产91小视频在线观看| 爆乳熟妇一区二区三区| 人妻精品久久无码区| 免费不卡视频| 97国产一区二区精品久久呦| 亚洲日本精品一区二区| 亚洲最大看欧美片网站地址| 久久黄色毛片| 久久精品人人做人人综合试看| 欧美亚洲欧美|