999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在移動通信數(shù)據(jù)分析上孤立點(diǎn)檢測的研究與應(yīng)用

2016-10-13 18:17:03
移動信息 2016年10期
關(guān)鍵詞:分析檢測研究

魯 琳

?

在移動通信數(shù)據(jù)分析上孤立點(diǎn)檢測的研究與應(yīng)用

魯 琳

中國聯(lián)合網(wǎng)絡(luò)通信有限公司廣東分公司,廣東 廣州 510627

移動通信數(shù)據(jù)最為凸出的特點(diǎn)便是高維度及大規(guī)模,常規(guī)數(shù)據(jù)分析便具有一定的難度,而異常數(shù)據(jù)分析更為困難。因此,分析了孤立點(diǎn)檢測在移動通信數(shù)據(jù)分析中的研究與應(yīng)用,旨在指導(dǎo)實(shí)踐,逐步提高分析的有效性與準(zhǔn)確性。

移動通信;數(shù)據(jù)分析;孤立點(diǎn)檢測

1 孤立點(diǎn)檢測的概況

國外學(xué)者[1]指出,孤立點(diǎn)是與數(shù)據(jù)集中正常數(shù)據(jù)不同的數(shù)據(jù),從聚類算法角度出發(fā),孤立點(diǎn)為噪音數(shù)據(jù)。通常,它是由各異機(jī)制引起的,具有一定的現(xiàn)實(shí)意義。孤立點(diǎn)檢測方法主要有兩種,一種為基于距離檢測法,主要是對數(shù)據(jù)對象間的距離進(jìn)行計算,以此檢測孤立點(diǎn)。對于任何數(shù)據(jù)對象而言,如果其周圍鄰居較少,則可視為孤立點(diǎn)范圍,具體方法有基于索引、嵌套循環(huán)算法以及基于單元算法。上述檢測法存在一定的不足,其均為0(kN2)復(fù)雜度,與數(shù)據(jù)維數(shù)k與數(shù)據(jù)模型N有一定的關(guān)系,未能滿足大規(guī)模數(shù)據(jù)集分析需求,此外,該方法對用戶有一定要求,需要提供參數(shù)d,但通常情況下,該參數(shù)確定難度較大。另一種為基于密度檢測法,其彌補(bǔ)了基于距離檢測法的不足,通過觀察對象周圍密度實(shí)現(xiàn)的,一旦數(shù)據(jù)對象周圍存在較多的鄰居,則非孤立點(diǎn),而鄰居不足時,則為孤立點(diǎn),為了呈現(xiàn)各數(shù)據(jù)孤立程度,有關(guān)學(xué)者對孤立程度與周圍鄰居偏離程度進(jìn)行了研究,二者保持著緊密聯(lián)系,經(jīng)研究提出了局部孤立因子算法,此外,經(jīng)研究,逐漸提出了基于聚類、神經(jīng)網(wǎng)絡(luò)等方法[2]。

2 在移動通信數(shù)據(jù)分析上孤立點(diǎn)檢測的研究與應(yīng)用

2.1 基于劃分檢測法

根據(jù)移動通信數(shù)據(jù)特點(diǎn),本文提出了基于劃分檢測法,此方法是對原始數(shù)據(jù)進(jìn)行劃分,借助剪枝策略,剪枝各劃分中的非孤立點(diǎn),隨之形成候選孤立點(diǎn)集,再使用孤立點(diǎn)檢測技術(shù)進(jìn)行判斷,經(jīng)計算獲得度量值,明確平衡隸屬度,從而實(shí)現(xiàn)對異常信號數(shù)據(jù)點(diǎn)的檢測。

2.2 孤立點(diǎn)檢測

在實(shí)際分析中對候選孤立點(diǎn)距離進(jìn)行計算,借助相應(yīng)的距離函數(shù)計算公式,獲得數(shù)據(jù)對象的基于距離的局部離群因子(LDOF)值,根據(jù)此數(shù)值的大小進(jìn)行排序,同時充分利用平衡隸屬度,經(jīng)綜合判斷,以此明確是否為孤立點(diǎn)。

在距離函數(shù)方面,使用LDOF度量孤立點(diǎn),通常,LDOF值越大,其越偏離鄰居,其成為孤立點(diǎn)的可能性更大。以數(shù)據(jù)對象p為例,其LDOF公式為:

在實(shí)際應(yīng)用中面對海量數(shù)據(jù),所有數(shù)據(jù)集均要計算LDOF值,在此情況下,計算復(fù)雜度將明顯增加,可達(dá)到0(N2),為了減少計算量,需要使用有效的方法,具體為:剪枝非孤立點(diǎn)對象,再計算候選孤立點(diǎn),從而提高了計算效率,減少了用時。

在平衡隸屬度方面,關(guān)于某一對象的隸屬函數(shù)構(gòu)造尚無統(tǒng)一性,實(shí)踐中僅依賴經(jīng)驗(yàn),即便是同一概念,不同學(xué)者所建立的隸屬函數(shù)各異,主要是因其切入點(diǎn)不同造成的,但對實(shí)際問題的處理效果基本一致。常見的方法如下:統(tǒng)計法、二元對比排序法或者專家評審法,待確定隸屬函數(shù)后,可根據(jù)生活實(shí)踐對其進(jìn)行改進(jìn)與完善。在分析移動通信數(shù)據(jù)過程中,隸屬函數(shù)判斷可依據(jù)信號平衡等級判斷,并根據(jù)通信數(shù)據(jù)具體情況,利用模糊處理法,判斷信號強(qiáng)弱,具體的公式如下:信號強(qiáng)度=下行電平-上行電平-參數(shù)X,經(jīng)計算分析顯示,平衡隸屬度為0.8時為孤立,對其進(jìn)行模糊處理,顯示孤立點(diǎn)判斷具有一定的準(zhǔn)確性。

2.3 實(shí)驗(yàn)研究

為了證實(shí)孤立點(diǎn)檢測法的實(shí)際價值,將其應(yīng)用于移動通信數(shù)據(jù)分析,但其數(shù)據(jù)規(guī)模偏大,并且數(shù)據(jù)呈不均勻分布,從而增加了檢測難度。實(shí)際研究中以偏離程度較大的數(shù)據(jù)為研究對象,根據(jù)數(shù)據(jù)特性,利用剪枝法,獲得了與中心偏離,并且稀疏的數(shù)據(jù),將其視為候選孤立點(diǎn)集,此后計算其LDOF值及平衡隸屬度,并展開了專業(yè)分析,進(jìn)而指導(dǎo)了實(shí)際應(yīng)用,如:用戶投訴問題處理、用戶行為分析等。

2.3.1 選取數(shù)據(jù)

選取某移動通信網(wǎng)絡(luò)公司為研究對象,經(jīng)處理后,保證了數(shù)據(jù)集質(zhì)量,隨機(jī)抽取路測數(shù)據(jù),其均與平均接受電平(RXLEV)有關(guān),具體屬性有兩個,分別為上行鏈路與下行鏈路,參數(shù)取值為-110~-48 dBm,通信信號電平數(shù)值被映射到某個RXLEV值,具體范圍為0~63,在非連續(xù)性發(fā)射環(huán)境下,RXLEV屬性分別FULL與SUB兩種,前者為測量所用載頻所有時隙均值,后者為測量特定通話時隙均值,經(jīng)調(diào)查發(fā)現(xiàn),用戶提交的報告中FULL缺少準(zhǔn)確性。因此,本研究選用了SUB[4]。

2.3.2 分析結(jié)果

孤立點(diǎn)檢測主要考慮檢測時間、檢測準(zhǔn)確性,隨機(jī)抽取6組數(shù)據(jù),數(shù)量呈遞增趨勢,分別為10000,15000,30000,50000,75000與100000,其檢測時間分別為90.43、17.454、25.743、40.432、52.463、78.354s,與傳統(tǒng)檢測法相比,孤立點(diǎn)檢測時間明顯縮短、檢測效率大幅度提高,主要是因?qū)嶒?yàn)中使用剪枝策略,減少了計算量。此外實(shí)驗(yàn)中選取領(lǐng)域中的m個樣本,經(jīng)孤立點(diǎn)檢測發(fā)現(xiàn),5、8、10、13、15的準(zhǔn)確率分別為0.67、0.79、0.87、0.86、0.86,此結(jié)果表明,m為10以后,準(zhǔn)確率基本未變,因此,m確定為10。

3 總結(jié)

綜上所述,移動通信數(shù)據(jù)分析中僅有少部分為信號異常數(shù)據(jù),通過孤立點(diǎn)檢測法展開挖掘分析,提升了檢測水平,為管理決策奠定了堅(jiān)持基礎(chǔ)。日后實(shí)踐中應(yīng)大力推廣孤立點(diǎn)檢測法。

[1]張凱書,李志剛,吳慧芳,等.孤立點(diǎn)檢測在移動通信數(shù)據(jù)分析上的研究與應(yīng)用[J].信息系統(tǒng)工程,2014(11):38.

[2]林國華.時間序列分析法在移動通信數(shù)據(jù)分析中的研究與應(yīng)用[D].廣州:廣東工業(yè)大學(xué),2013.

Research and Application of outlier Detection in Mobile Communication Data Analysis

LuLin

China United Network Communications Limited Guangdong Branch, Guangdong Guangzhou 510627

The most protruding characteristics of mobile communication data is high dimension and large scale, conventional data analysis has a certain degree of difficulty, and abnormal data analysis more difficult. Therefore, this paper analyzes the research and application of outlier detection in mobile communication data analysis, to guide the practice, gradually improve the effectiveness and accuracy of analysis.

mobile communication; data analysis; outlier detection

TP311.13

A

1009-6434(2016)10-0016-02

猜你喜歡
分析檢測研究
FMS與YBT相關(guān)性的實(shí)證研究
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
遼代千人邑研究述論
隱蔽失效適航要求符合性驗(yàn)證分析
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統(tǒng)及其自動化發(fā)展趨勢分析
主站蜘蛛池模板: 国产凹凸视频在线观看| 91精品久久久无码中文字幕vr| 456亚洲人成高清在线| 免费不卡视频| 国内精品视频在线| 在线免费观看AV| 国产经典在线观看一区| 婷婷色婷婷| h视频在线观看网站| 在线观看国产黄色| 9久久伊人精品综合| 国产 日韩 欧美 第二页| 成色7777精品在线| 亚洲人成人无码www| 亚洲无线国产观看| 亚洲欧洲自拍拍偷午夜色| 色综合热无码热国产| 色天天综合久久久久综合片| 777午夜精品电影免费看| 激情综合激情| 亚洲日本一本dvd高清| 免费不卡在线观看av| 暴力调教一区二区三区| 亚洲无码电影| 亚洲一区二区三区香蕉| 免费视频在线2021入口| 欧美激情视频一区| 无码有码中文字幕| 国产欧美日韩18| 91九色视频网| 日韩 欧美 国产 精品 综合| 国内丰满少妇猛烈精品播| 免费日韩在线视频| 免费无遮挡AV| 一级毛片无毒不卡直接观看| 亚洲第一色网站| 国产精品第三页在线看| 久久久久国产一级毛片高清板| 92午夜福利影院一区二区三区| 日韩精品欧美国产在线| 青青草一区| 国产女人综合久久精品视| 六月婷婷激情综合| 天天躁日日躁狠狠躁中文字幕| 国产日产欧美精品| 国产精品yjizz视频网一二区| 久青草免费在线视频| 国产a v无码专区亚洲av| 欧美一级在线看| 亚洲国产看片基地久久1024| 国产成人av一区二区三区| 国产日本视频91| 亚洲无码四虎黄色网站| 亚洲一级毛片免费观看| 久久香蕉国产线看观看精品蕉| 欧美日韩国产精品综合| 国产成人一二三| 2021国产精品自拍| 亚洲国产精品VA在线看黑人| 91视频国产高清| 无码中字出轨中文人妻中文中| 精品人妻系列无码专区久久| 久久久受www免费人成| 亚洲黄色成人| 国产激情国语对白普通话| 国产成人AV男人的天堂| 亚洲av成人无码网站在线观看| 女人毛片a级大学毛片免费| 久久九九热视频| 精品91自产拍在线| 无码免费视频| 久久婷婷国产综合尤物精品| 亚洲综合精品第一页| 欧美精品高清| 99精品一区二区免费视频| 色窝窝免费一区二区三区| 91免费国产高清观看| 国产91视频免费观看| 欧美在线视频不卡第一页| 亚洲a级在线观看| 好久久免费视频高清| 亚洲水蜜桃久久综合网站|