999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

應用于校園網用戶行為分析的K—means聚類算法研究

2018-10-19 16:09:08王磊
科學與財富 2018年27期
關鍵詞:分析

王磊

摘要:校園網的用戶行為指的是在使用網絡的時候,用戶所表現出來的一種規律,在這里,可以使用一些特別的定量表示出來,校園網用戶行為有著比較特殊的特征,這是普通網絡使用群眾無法具備的。在現社會的校園網當中,有著越來越多的挖掘技術,利用這些技術來分析校園網的用戶行為,對寬帶進行合理的分配,有助于提升校園網用戶的使用效率。本文就對應用于校園網用戶行為分析的K-means聚類算法進行敘述,供參考。

關鍵詞:校園網用戶行為;分析;K-means聚類算法

引言:

現社會,不少院校對于校園網的管理都比較欠缺,通常都會采用服務器來進行管理,比如在認證計費和流量監控等方面都會使用進服務器,服務器在服務的過程當中,會產生很多的數據,這些數據都會自動保存在后臺數據庫里面。全部的數據里面,有一些是和校園網有關的,有的數據是和校園網的使用、運行狀態有關的,假如把這些數據進行分析和利用,就可能會對整個校園網起到很好的協助作用。使用K-means聚類算法能夠有效的對整個用戶行為進行分析,并且描述出校園網用戶行為和網絡的運行實時情況,K-means聚類算法在校園網用戶行為特征和使用情況以及校園網的分布等諸多方面有著非常好的作用。

1.K-means聚類算法的概括

K-means聚類算法是一種相對來說比較重要有效的挖掘方式,將物理現象和抽象對象進行了分組的一個過程,相似的對象就分為一組,不同的對象再分為一類,可以把聚類算法分成很多個群體,各個群體內部的對象都有著比較強的相似度,但是,這種相似度在不同的群體之間卻很低,這也是聚類算法的一大特征。可以把聚類算法分成幾種類型:劃分方法、層次方法、基于網格的方法等,每一種方法雖然表面上都沒有多大的聯系,但是卻都有著自己的代表算法。K-means聚類算法就是諸多聚類算法中的一種,它屬于劃分方法的行列,K-means聚類算法有一個很顯著的特點,就是它有著比較好的可伸度和效率,比較適合用在大文檔案的處理過程當中。K-means聚類算法可以把物理對象或抽象對象進行分組,相似的對象分為一組,彼此相似的一組對象組成的集合和不同聚類當中的對象相比,相似度有著一定的差異,而給定的那個數據項之間會有一定的價值存在,這些價值都會導致聚類和同一聚類當中的對象相似度極高,相反,不同劇聚類當中的相似度反而很小。

2.校園網用戶行為分析的K-means聚類算法的數據準備

2.1理解數據

校園網用戶行為產生的數據基本上都是來自認證計費數據庫當中的,日常的數據都會保存在登錄數據庫里面。要想利用K-means聚類算法來分析出校園網的用戶行為,就要先建立一個用戶特征的反映系統,日志數據表當中所提供出來的二十三個字段就是校園網的基礎,在確定了參數之后,還需要確定校園網用戶的特征項。比如,用戶登錄日志的時候記錄的都是第一次登錄的數據,也可以理解成一個用戶有著很多條登錄的信息,這是不具有統一性的。因此,要想在真正意義上實現校園網用戶行為的分析,就必須要根據登錄表當中的IP地址來進行統計,并且,還要對每一個校園網用戶的月使用流量進行分析和統計,從中將使用流量提取出來。

2.2數據處理

數據處理的這個過程需要使用到SQL2005的ETL工具,其能夠有效的對校園網用戶數據進行處理,比如,在日志數據庫當中提取到某個月的數據,假如是2016年8月的數據,這個月校園網用戶登錄日志的量高達215681條。按照數據的生成需求,只需要用到3個字段就可以了。

2.3數據處理過程

專家可以先設計一個數據流,再利用SQLSever2005的SSIS工具將其生成為K-means聚類算法需要的數據,這也就逐漸形成了K-means聚類算法的初始輸入文件,假如登錄表顯示的數量是3381行,那么就證明2016年8月的IP數值達到了3381條,在登錄記錄表當中,K-means聚類算法可以把IP地址當成是文件的關鍵字段。整個數據流的過程都需要采用ETL工具來對數據進行抽取,盡量抽取出一些符合要求或條件的校園網用戶行為數據,在抽取完畢之后,才能通過數據做樣本模型。

3.調整算法參數

3.11Clustering_Method參數

Clustering-Method參數能夠明確的指出哪一種算法決定聚類的組成部分,這種參數的算法總共可以分成四種,首先是可以伸縮的EM算法,其次是較為普通的EM算法,雖然表面上都是EM算法,但是后者是不具有伸縮性的。除此以外,還有可伸縮的K-means算法以及不可伸縮的K-means算法,通常情況下,使用最多的就是可伸縮的K-means算法。

3.2Cluster_Count參數

Cluster-Count參數是K-means聚類算法當中的k值,它能夠算出需要多少個聚類,假如把Cluster-Count參數的值暫定為0,那么K-means聚類算法就會把數據當中的聚類個數估測出來,在經過了對比和調整以后最終選擇K值為3,這種分類也是最具獨立性的。

結束語:

在校園網用戶行為的分析上,使用K-means聚類算法能夠更加有效對數據、K值進行分析,從而更好的分析出用戶行為,并且,這也是一種新的嘗試,聚類結果給校園網管理人員提供了更多的用戶行為,這樣就可以制定出更多的網絡策略。

參考文獻:

[1]李旭.基于聚類技術的校園網絡用戶行為數據分析研究[D].山東師范大學,2016.

[2]楊志忠.基于Hadoop的網絡用戶行為分析[D].蘭州理工大學,2016.

[3]馬仕玉.聚類算法及其在校園網用戶行為分析中的應用[D].重慶交通大學,2015.

[4]黎慧娟.校園網用戶行為的分析與研究[D].廣西大學,2007.

猜你喜歡
分析
禽大腸桿菌病的分析、診斷和防治
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
經濟危機下的均衡與非均衡分析
對計劃生育必要性以及其貫徹實施的分析
現代農業(2016年5期)2016-02-28 18:42:46
GB/T 7714-2015 與GB/T 7714-2005對比分析
出版與印刷(2016年3期)2016-02-02 01:20:11
中西醫結合治療抑郁癥100例分析
偽造有價證券罪立法比較分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 午夜视频日本| 亚洲精品久综合蜜| 亚洲Aⅴ无码专区在线观看q| 欧美视频免费一区二区三区| 日韩午夜福利在线观看| 亚洲AV电影不卡在线观看| 久久99国产乱子伦精品免| 国产在线观看91精品| 日韩欧美亚洲国产成人综合| 成人中文字幕在线| 国产h视频免费观看| 中文字幕中文字字幕码一二区| 国产美女自慰在线观看| 亚洲精品另类| 自偷自拍三级全三级视频 | 欧美人与牲动交a欧美精品 | www.亚洲天堂| 青草娱乐极品免费视频| 999国内精品久久免费视频| 亚洲视频免费播放| 伊人AV天堂| 国产性猛交XXXX免费看| 日韩精品成人网页视频在线| 亚洲国产日韩在线观看| 亚洲有无码中文网| 国产人人射| 亚洲综合狠狠| 爆操波多野结衣| 在线亚洲小视频| 高清大学生毛片一级| 国产精品免费p区| 国产精品久久久久无码网站| 园内精品自拍视频在线播放| 日韩精品免费一线在线观看| 久久精品人人做人人爽电影蜜月| 免费在线一区| 久久窝窝国产精品午夜看片| 岛国精品一区免费视频在线观看| 精品伊人久久大香线蕉网站| 欧美国产日韩在线| 亚洲无码视频图片| 国产高清在线丝袜精品一区| 日韩午夜片| 国产玖玖视频| 国产精品视频第一专区| 国产精品亚洲一区二区在线观看| 国产一区二区精品福利| 毛片久久久| 久久久久88色偷偷| 精品成人一区二区三区电影| 久操线在视频在线观看| 伦精品一区二区三区视频| 久久永久视频| 亚洲乱码精品久久久久..| 亚洲国产午夜精华无码福利| 国产日本欧美在线观看| 亚洲三级a| 免费在线看黄网址| AV无码国产在线看岛国岛| 中国特黄美女一级视频| 天天躁日日躁狠狠躁中文字幕| 国产亚洲欧美在线中文bt天堂| 色综合日本| 国产精品无码在线看| 亚洲无码四虎黄色网站| 亚洲aaa视频| 国产真实乱了在线播放| 国产精品一线天| 日韩免费毛片| 国产精品久久久久婷婷五月| 3344在线观看无码| 精品国产污污免费网站| 精品视频一区二区观看| 日韩人妻无码制服丝袜视频| 黄色污网站在线观看| 中文字幕亚洲综久久2021| 日本三级欧美三级| 欧洲亚洲一区| 伊人久久久久久久| 91精品啪在线观看国产| 亚洲AV一二三区无码AV蜜桃| 久久综合丝袜长腿丝袜|