摘 要:網(wǎng)絡(luò)優(yōu)化是指通過對(duì)大量采集的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)進(jìn)行分析、匯總、提煉,獲得網(wǎng)絡(luò)運(yùn)行質(zhì)量的影響因子,從而針對(duì)實(shí)際情況作出相應(yīng)的決策,反饋調(diào)整系統(tǒng)參數(shù)或相關(guān)設(shè)備,讓網(wǎng)絡(luò)運(yùn)行達(dá)到最佳狀態(tài),同時(shí)對(duì)網(wǎng)絡(luò)日后的運(yùn)維和擴(kuò)容等提出有效的決策參考。網(wǎng)絡(luò)優(yōu)化的實(shí)質(zhì)是優(yōu)化網(wǎng)絡(luò)質(zhì)量、提高網(wǎng)絡(luò)品質(zhì),而網(wǎng)絡(luò)質(zhì)量不僅僅是單一因素作用的結(jié)果,而是受多種因素相互制約的,隨著應(yīng)用范圍的不斷增加,工作的不斷深入,其優(yōu)化技術(shù)也得到大幅提升,至使優(yōu)化領(lǐng)域不斷擴(kuò)展,優(yōu)化對(duì)象已突破現(xiàn)有的網(wǎng)絡(luò),擴(kuò)展?jié)B透到運(yùn)營(yíng)市場(chǎng)的商業(yè)預(yù)測(cè),實(shí)施規(guī)劃,運(yùn)行管理、維護(hù)擴(kuò)容等整個(gè)運(yùn)營(yíng)過程的各個(gè)層面。文章主要介紹K-均值聚類算法如何在無(wú)線局域網(wǎng)優(yōu)化及分析中的應(yīng)用。
關(guān)鍵詞:無(wú)線局域網(wǎng);聚類分析算法;網(wǎng)絡(luò)優(yōu)化
聚類(clustering)是將物理的抽象的對(duì)象集合,分成相似的對(duì)象類的過程。簇(cluster)是數(shù)據(jù)對(duì)象的集合,同一簇中的對(duì)象具有相似性,而不同簇中的對(duì)象則具有相異性。聚類分析(Cluster analysis,亦稱為群集分析)是一種重要的人類活動(dòng)。早在孩童時(shí)代,通過不斷地改進(jìn)下意識(shí)的聚類模式來(lái)學(xué)習(xí)如何區(qū)分貓和狗,或動(dòng)物和植物。通過自動(dòng)聚類能夠識(shí)別對(duì)象空間中稠密和稀疏區(qū)域,從而發(fā)現(xiàn)全局分布模式和數(shù)據(jù)屬性之間有趣的相關(guān)。聚類分析已經(jīng)在許多領(lǐng)域受到廣泛應(yīng)用,包括機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,模式識(shí)別,圖像分析以及生物信息。聚類是把相似的對(duì)象通過靜態(tài)分類的方法分成不同的組別或者更多的子集(subset),劃分的原則是在同一個(gè)簇中的對(duì)象之間具有較高的相似度,而不同簇中的對(duì)象差別較大。屬于一種無(wú)指導(dǎo)的學(xué)習(xí)方法。
針對(duì)現(xiàn)存在的一批聚類算法。尚未能提供相對(duì)標(biāo)準(zhǔn)統(tǒng)一的分類。因?yàn)轭悇e可能交叉重疊,有可能出現(xiàn)體現(xiàn)多種特征的分類方法,一般劃分如下。劃分方法(partitioning methods):給定對(duì)象或數(shù)據(jù)元組的數(shù)據(jù)庫(kù),劃分方法構(gòu)建數(shù)據(jù)的劃分,每個(gè)劃分表示一簇。層次方法(hierarchical methods):對(duì)預(yù)設(shè)數(shù)量的數(shù)據(jù)集進(jìn)行層次的分解。按照其分解方式可以將層次方法分類為凝聚的層次聚類和分裂的層次聚類兩種。基于密度的方法(density-based methods):以數(shù)據(jù)集在空間分布上的稠密程度為依據(jù)進(jìn)行聚類。基于網(wǎng)格的方法(grid-based methods):將數(shù)據(jù)空間劃分成為有效單元的網(wǎng)絡(luò)結(jié)構(gòu)。基于模型的方法(model-based methods):給每一個(gè)聚類假定一個(gè)模型,然后去尋找能夠很好的滿足這個(gè)模型的數(shù)據(jù)集。
k-means算法,又叫做k-平均算法或者k-均值算法,應(yīng)用最廣泛的算法之一。它的特征是,取子集內(nèi)的樣本均值,當(dāng)作其代表點(diǎn)。利用迭代的思想,其數(shù)據(jù)集被劃分成不同的類別,這是它的主要思想。以致準(zhǔn)則函數(shù)性能最優(yōu)化,達(dá)到聚類性能評(píng)價(jià)最優(yōu)。產(chǎn)生的每個(gè)聚類特點(diǎn)是:類間獨(dú)立,類內(nèi)緊湊。它的另一特點(diǎn)是:適合于處理連續(xù)型屬性聚類,而不太適宜離散型屬性聚類處理。
在本文中運(yùn)用了k均值聚類算法,利用Oracle來(lái)實(shí)現(xiàn)具體步驟。我們使用5個(gè)Oracle存儲(chǔ)過程來(lái)完成該算法。圖1是每個(gè)存儲(chǔ)過程的作用。
圖2是Oracle存儲(chǔ)過程結(jié)構(gòu)。USP_KMEANS_CLUSTER是聚類的綜合過程,它首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,因此它最先調(diào)用的是USP_KMEANS_NORMALDATA或USP_KMEANS_STANDARDDATA,然后再去計(jì)算預(yù)處理后的數(shù)據(jù)的初始中心,這一步由過程USP_KMEANS_INITIALCENTER來(lái)實(shí)現(xiàn),再去判斷聚類中心點(diǎn)是否發(fā)生了變化,如果變化則再調(diào)用過程USP_KMEANS_MODIFYCENTER,直到聚類中心不再發(fā)生變化。
k-均值聚類算法可以高效的、可伸縮的處理大數(shù)據(jù)集,處理快速、操作簡(jiǎn)單,算法嘗試找出使平方誤差函數(shù)值最小的k個(gè)劃分。若簇之間區(qū)別明顯,結(jié)果簇是密集的,效果較好。依據(jù)以上特點(diǎn),適用于在無(wú)線局域網(wǎng)數(shù)據(jù)包被采集到以后進(jìn)行網(wǎng)絡(luò)優(yōu)化分析。
參考文獻(xiàn)
[1]張卓筠,高功應(yīng),王磊.WLAN與EPC網(wǎng)絡(luò)整合架構(gòu)研究[J].移動(dòng)通信,2012,10:93-96.
[2]陳松喬,任勝兵,王國(guó)軍.現(xiàn)代軟件工程[M].北京:清華大學(xué)出版社,2008:210-350.
[3]George Fairbanks.恰如其分的軟件架構(gòu)[M].湖北:華中科技大學(xué)出版社,2013:340-395.
[4]陳吉平.構(gòu)建0racle高可用環(huán)境:企業(yè)級(jí)高可用數(shù)據(jù)庫(kù)架構(gòu)、實(shí)戰(zhàn)與經(jīng)驗(yàn)總結(jié)[M].北京:電子工業(yè)出版社,2008:245-302.
作者簡(jiǎn)介:魏煥新(1983-),男,湖南長(zhǎng)沙人,碩士研究生,湖南機(jī)電職業(yè)技術(shù)學(xué)院信息工程學(xué)院,研究方向?yàn)橛?jì)算機(jī)應(yīng)用技術(shù)。