999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進K-Means聚類算法的移動5G手機用戶分類研究

2021-02-27 07:38:04毛建軍
網絡安全技術與應用 2021年2期
關鍵詞:分類特征用戶

◆毛建軍

基于改進K-Means聚類算法的移動5G手機用戶分類研究

◆毛建軍

(云想科技有限公司 江蘇 210000)

;隨著5G時代的來臨,為了對5G手機用戶提供更具有針對性的個性化服務,本文對當前移動5G手機用戶的消費使用情況進行了分析,數據經過清洗處理后,運用K-Means算法對移動5G手機用戶消費情況進行了分類,在科學分類的指導下,為營銷部門開展針對性地營銷提供了理論支持,為客戶提供更全面的服務,節省了服務成本,提升企業競爭力。

K-Means算法;聚類分析;移動5G

1 背景

當前,國內5G通信行業以移動、聯通、電信以及廣電為主要通信經營服務商。在劇烈的競爭現狀的背景下,對移動的服務水平、營銷專業度、服務內容、服務質量等方面提出了更高層次的標準。同時,客戶對通信服務的個性化要求越來越高,用戶的使用場景、通話使用時長,流量用量等多方面都有著較大地差異。本文通過改進K-Means聚類算法分析移動5G手機用戶消費情況從中發現不同用戶之間存在的消費共有特征,然后對同一消費情況特征類別下的5G手機用戶提供定制化服務,滿足用戶需求,降低企業的管理費用,提高企業核心競爭力。

2 數據展示

本文研究數據來自移動公司客戶經營管理數據庫,共提取5000條數據進行分析,通過分析結果指導經營活動評估實際的分類效果,從而應用到日常的數據分析工作中,原始數據的內容如下表1所示:

表1 5G手機用戶消費數據表

由表1可知,原始數據表中共有數據項8個,分別是月套餐費、本地通話費、長途通話費、5G數據流量費、短信費、彩鈴費、寬帶電視費以及訂閱費構成,原始數據中存在一定的不完整、信息缺失的個體樣本,需要對數據進行檢查。同時,在進行聚類分析之前需要數據的預處理。

3 數據處理

通過人工方式進行數據清洗、數據選擇等操作將信息異常的數據進行清除,以免對聚類分析造成分類影響。在對總數5000條樣本的檢查過程中,發現120條數據不符合分類要求,最后進行分析的樣本空間為4880條有效數據。在進行K-Means聚類分析之前,需要對樣本空間的每條數據的特征項做預處理,將無關特征項的影響降到最低。

3.1 數據標準化

通過z-score方法處理后的數據處在同一數量級且沒有單位的數值,此時的數據就可以進行K-means聚類分析。經過標準化處理后的屬性的數據處于同一量級,數據之間具有可比性,標準化處理的數據結果如下表2所示:

表2 標準化后的特征數據

由表2可知,經過標準化處理后的特征項的值,無法直觀的判斷分類情況,此時需要K-Means算法進行下一步的聚類的分析。

4 K-Means算法及分析過程

1967年,James MacQueen 在《Some methods for classification and analysis of multivariate observations》中提出“K-Means”。當前K-Means聚類算法主要應用有:文檔分類器、客戶分類、配合遺傳算法和無人機解決商旅車行車路線問題,乘車數據分析等。

4.1 K-means算法

傳統的K-Means聚類算法流程如下:首先,設置進行聚類的分類個數K,進行數據的初始化,隨機從樣本空間中的所有樣本中選擇K樣本作為聚類的中心;然后分別得到樣本空間中每個樣本到所有聚類中心的距離,將與每個中心最近的樣本歸為該中心的同類中;再次,將同聚類中的所有樣本數據的特征取平均值,將平均后得到的點作為新的聚類中心;最后,重復第上述步驟直到聚類中心不再改變即可。最后得到的分類結果就是最優的。在實際的計算代碼中,K-Means算法的計算樣本與分類中心的距離所使用的方法是歐幾里得距離,如下公式1所示:

其中x1,x2,…,xn是樣本x的n維特征項,c1,c2,…,ck是初始化的K個聚類中心,s1,s2,…,sm是樣本空間中的m個體樣本總數,計算樣本x到所有k個聚類中心的距離然后選取距離最小的中心,將該樣本x歸類為此聚類中心的同類中。但是這種距離計算方式并沒有考慮到樣本的特征維度的權重性,而是將個體樣本中的所有特征都對分類結果有同樣的權重效果,這樣的結果會導致分類結果的不準確性增大,即有的維度對分類結果影響大,有的維度對分類結果影響較小或幾乎沒有影響,對原有算法進行改進就十分有必要,改進的公式2如下所示:

其中rl是特征x的n維的權重向量,取值范圍在0-1之間,權重總和為1。通過對原有的算法的改進,使得原有的算法不支持多維權重的距離公式現在可以支持不同特征項的不同權重的距離公式,增加了算法的實用性和操作性,在面對實際問題時,能夠突出某些樣本中重要特征項的權重,減少弱相關特征項的干擾,保證了K-Means算法聚類分類的準確性。

4.2 K-Means聚類分析過程

原始數據表中共有數據項8個,分別是月套餐費、本地通話費、長途通話費、5G數據流量費、短信費、彩鈴費、寬帶電視費以及訂閱費構成,通過對比數據可知彩鈴費、寬帶電視費以及訂閱費對分類幾乎沒有區分度,設定的權重最小,而5G數據流量、短信費區分度較小,權重設定就大一些,月套餐費、本地通話費、長途通話費是消費主特征,所以權重設置最大,通過對不同的特征項設定不同的特征權重來確保分類的準確度,同時聚類個數K的選擇對聚類的結果有著重要的影響,所以數據的聚類一次無法完成訓練結果,需要根據不同的權重和不同的聚類個數訓練結果進行不斷的調整。本文通過調整權重參數和改變聚類的個數,分別進行了多次K-Means聚類訓練了2-9個聚類情況下,得到的不同的分類結果,利用肘部法則選擇最佳的聚類分類中心個數,如圖1所示:

圖1 K-Means不同聚類個數的情況

由圖1可知,通過對數據進行2-9個聚類的分析得到的肘部法則圖,只有在第4類的差異時較小,所有最佳分類聚類個數為4,同時確定最后的權重系數r=(0.2,0.2,0.2,0.15,0.1,0.05,0.05,0.05)。

4.3 聚類分析結果

選擇聚類個數為4個分類后,得到結果如下表3所示:

表3 K-Means分類結果

由表3可知,用戶總共被分為4類,其中第一類用戶的總數為112,占總樣本空間的2.30%;第二類用戶的總數為202,占總樣本空間的4.14%;第三類用戶的總數為1196,占總樣本空間的24.51%;第四類用戶總數為3370,占總樣本空間的69.06%。第一類用戶占比最少,月消費額最高,而且其月租費、長途通話費在占比中都是最高的,由此判斷該類用戶屬于商務人士且經常出差,是聯通手機用戶中的最優質客戶資源,是營銷人員重點服務對象。第二類用戶占比較一類用戶多,其月消費水平也處于第二位,其5G數據流量費用支出較高,由此推測該類用戶屬于高流量用戶,月流量消費很高,可對其提供偏向流量的套餐服務。

5 總結

本文利用改進的K-Means算法,通過改變算法中計算歐幾里得距離增加維度權重的方法,提升了算法的針對性和適用性,并應用在對移動5G手機用戶消費情況進行了聚類分析,比較不同聚類數量分類情況下的分類效果,成功實現了對當前移動5G手機用戶的分類,為營銷部門開展個性化營銷活動提供了理論支持,在科學分類的有效指導下,可以提高服務的準確度,為客戶提供更全面的服務。

[1]李敏. K-means算法的改進及其在文本聚類中的應用研究[D].江南大學,2018.

[2]李游. 基于校園網的用戶行為分析研究[D].云南大學,2013.

[3]吳斌. 基于數據挖掘技術的學生成績分析評價與研究[D].南昌大學,2009.

[4]Guo Xiaojie,Chen Liang,Zhou Hang,Huang Jun. An Improved K-means Algorithm and Its Application in the Evaluation of Air Quality Levels[A]. 東北大學、IEEE新加坡工業電子分會.第27屆中國控制與決策會議論文集(下冊)[C].東北大學、IEEE新加坡工業電子分會:《控制與決策》編輯部,2015:6.

[5]Youguo Li,Haiyan Wu. A Clustering Method Based on K-Means Algorithm[A]. Information Engineering Research Institute, USA.Proceedings of 2012 International Conference on Solid State Devices and Materials Science(SSDMS 2012 V25)[C].Information Engineering Research Institute, USA:智能信息技術應用學會,2012:6.

[6]史秀嶺. K-means聚類優化算法的研究[D].長沙理工大學,2011.

[7]馮超. K-means聚類算法的研究[D].大連理工大學,2007.

[8]陳敏,李雪峰. 一種選擇了初始聚類中心的改進K-means算法[A]. International Communication Sciences Association, Hong Kong.Proceedings of 2010 International Conference on Broadcast Technology and Multimedia Communication(Volume 2)[C].International Communication Sciences Association, Hong Kong:智能信息技術應用學會,2010:4.

[9]劉玥. 基于改進的K-means算法的銀行客戶聚類研究[D].吉林大學,2016.

[10]黃繼超. k-means算法若干改進和應用[D].中南大學,2013.

[11]Xian Liang,Fuheng Qu,Yong Yang,Hua Cai. A Highly Efficient Fast Global K-Means Clustering Algorithm[A].Information Engineering Research Institute, USA.Proceedings of 2015 2nd International Conference on Civil,Materials and Environmental Sciences(CMES 2015)[C].Information Engineering Research Institute,USA:智能信息技術應用學會,2015:4.

猜你喜歡
分類特征用戶
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 99er这里只有精品| 亚洲最新在线| 欧美亚洲欧美区| 成人午夜免费观看| 国产精品专区第一页在线观看| 日韩在线观看网站| 亚洲天堂首页| 亚洲色成人www在线观看| 成人午夜久久| 五月激情婷婷综合| 国产乱子伦精品视频| 午夜视频www| 亚洲欧美一区二区三区麻豆| 3D动漫精品啪啪一区二区下载| 免费在线不卡视频| 国产美女91呻吟求| 亚洲人成日本在线观看| 欧美日韩成人| 欧洲高清无码在线| 国产在线观看一区精品| 中文字幕永久视频| 国产男女免费视频| 国产主播在线观看| 91国内视频在线观看| 天天爽免费视频| 亚洲av无码久久无遮挡| 国产在线观看精品| 亚洲欧美国产五月天综合| 一区二区三区四区精品视频| 日本午夜影院| 香蕉精品在线| 亚洲国产综合自在线另类| 成人国产精品网站在线看| 国产精品林美惠子在线观看| 婷婷亚洲最大| 喷潮白浆直流在线播放| 国产白浆在线| 在线中文字幕日韩| 亚洲国产欧洲精品路线久久| 五月六月伊人狠狠丁香网| 久久人妻xunleige无码| 国产拍揄自揄精品视频网站| 99精品视频九九精品| 亚洲欧美成人网| 国产福利影院在线观看| 91亚洲精选| 日本91视频| 九色91在线视频| 色AV色 综合网站| 91黄视频在线观看| 狠狠综合久久久久综| 尤物精品视频一区二区三区| 综合人妻久久一区二区精品| 91成人免费观看| 国产精品视频导航| 播五月综合| 92午夜福利影院一区二区三区| 精品久久香蕉国产线看观看gif| 欧洲欧美人成免费全部视频| 国产91无码福利在线| 亚洲日韩精品无码专区97| 亚洲人成网站18禁动漫无码| 国禁国产you女视频网站| 97国内精品久久久久不卡| 伊人色综合久久天天| 黄色免费在线网址| 99这里只有精品6| 午夜精品区| 日韩免费毛片| 国产欧美日韩另类精彩视频| 国产一区二区三区在线观看视频| 亚洲成人手机在线| 亚洲国产黄色| 亚洲日韩精品综合在线一区二区| 日韩在线第三页| 国产精品久久久久久久伊一| 综合天天色| 69精品在线观看| 亚洲成肉网| 欧美黄网站免费观看| 天天综合亚洲| 巨熟乳波霸若妻中文观看免费|