999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的聚類數據劃分算法的研究

2021-09-26 13:12:57馬宏艷,楊保銀,彭仁杰
電腦知識與技術 2021年20期
關鍵詞:機器學習

馬宏艷,楊保銀,彭仁杰

摘要:聚類算法是一種典型的無監督學習算法。本文分析了樣本度量算法及類間的度量方法,機器學習中的聚類數據劃分算法有k-平均算法、k-中心點算法,分析了兩種算法的優缺點,最后說明算法在scikit-learn中的應用。

關鍵詞:機器學習;聚類;劃分方法

中圖分類號:TP301? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)20-0009-02

Research on Clustering Data Partition Algorithm Based on Machine Learning

MA Hong-yan

(Information Engineering College, Longdong University, Qingyang 745000, China)

Abstract: Clustering Algorithm is a typical unsupervised learning algorithm. This paper analyzes the sample measurement algorithm and the measurement method between classes, The clustering data partition algorithm in machine learning includes k-something average algorithm and k-something central point algorithm. The advantages and disadvantages of the two algorithms are analyzed.

Key words: machine learning; clustering; partition method

機器學習分為四大塊,分別是classification (分類),clustering (聚類), regression (回歸), dimensionality reduction (降維)。對于一個樣本特征x,預測其對應的屬性值y,如果y是離散的,那就是分類,如果y是連續的實數,就是回歸。對于一組樣本特征S={x∈RD},沒有對應的y, 要發掘這組樣本在D維空間的分布,就是聚類問題。如果想用維數更低的子空間來表示原來高維的特征空間, 那么就是降維問題。

聚類分析在市場銷售研究、模式識別、大數據分析以及圖形圖像處理等方面被廣泛應用。在醫療中,聚類能夠幫助醫生分析已有患者病例從中發現不同的患者群;在精準扶貧的大數據中,根據已脫貧人員的實例獲得對有相同致貧原因的貧困人員定制準確的脫貧措施。

聚類是一種重要的人類活動,也是數據挖掘中用來發現數據分布和模式的一項重要技術。將物理或抽象的集合分成相似的對象類的過程稱為聚類[1](Clustering),同一類數據也稱其為簇(Cluster),這些數據對象在簇內相似,簇間相異。

定義:給定一數據集合D={P1,P2,...,Pn},其中Pi(i=1,2,...,n)稱為數據點(或對象),根據數據點間的相似程度將數據集合分成k組Ci(i=1,2,...,k)(也稱為簇)的過程稱為聚類。

1 聚類中樣本度量方法

相異性度量標準的選擇是一個聚類分析質量的關鍵,聚類算法是通過計算樣本特征空間中的距離來衡量兩個樣本間的相異度[2],當兩個樣本相異較?。ㄏ嗨戚^大)時,距離值小,反之則大。

假設a和b是相應的特征向量,m是特征的維數,則計算距離度量常用的函數有幾種:

(1) 明可夫斯基距離

a和b的明可夫斯基距離度量:

[d(a,b)=i=1m|ai-bj|r1r]? ? ? ? ? ? ? ? ? ? ? ? ?(1)

當r=1時,轉化為明可夫斯基距離的絕對值距離:

[d(a,b)=i=1m|ai-bj|]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)

當r=2時,轉化為明可夫斯基距離的歐氏距離:

[d(a,b)=i=1m|ai-bj|212]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)

當r趨向于無窮大時,轉化為切比雪夫距離:

[d(a,b)=max|ai-bi|(1≤i≤n)]? ? ? ? ? ? ? ? ?(4)

在以上三種距離中,經常用的距離是歐氏距離,是因為對坐標系進行平移和旋轉變換之后,其值不變,對象的結構和原來相似。

(2) 二次距離

二次型距離測度的形式:

[d(a,b)=(a-b)TA(a-b)12]? ? ? ? ? ? ? ? ? ? ? ?(5)

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 人妻精品久久无码区| www.精品国产| 伊人中文网| 在线观看国产黄色| 国产高清毛片| 亚洲高清在线播放| 国产精品免费入口视频| 国产美女在线免费观看| 久久久久国产一级毛片高清板| 国产三区二区| 在线观看国产小视频| 全部免费毛片免费播放| 五月婷婷精品| 97视频免费在线观看| 国产三区二区| 2020国产精品视频| 无码不卡的中文字幕视频| 四虎影院国产| 久久国产成人精品国产成人亚洲| 欧美区一区| 国产精品女人呻吟在线观看| 全部免费特黄特色大片视频| 扒开粉嫩的小缝隙喷白浆视频| 最新国产成人剧情在线播放 | 国产尤物在线播放| 国产经典免费播放视频| 国产一区二区三区免费观看| 亚洲国产综合自在线另类| 思思热在线视频精品| 国内精品自在欧美一区| 亚洲综合色婷婷| 久久综合丝袜长腿丝袜| 欧美69视频在线| 国产流白浆视频| 亚洲人妖在线| 国产在线自乱拍播放| 欧美国产视频| 久久semm亚洲国产| 免费观看无遮挡www的小视频| 国产综合精品日本亚洲777| 网友自拍视频精品区| 都市激情亚洲综合久久| 欧美日韩中文国产| 蜜桃视频一区二区| 毛片在线播放a| 91青青草视频在线观看的| 特级aaaaaaaaa毛片免费视频 | 亚洲国产日韩视频观看| 精品国产黑色丝袜高跟鞋| 国产欧美精品一区二区| 国产91久久久久久| 国产乱人伦精品一区二区| 国产精品亚欧美一区二区| 欧美成人午夜影院| 91精品视频在线播放| 沈阳少妇高潮在线| 毛片大全免费观看| 欧美日韩国产在线观看一区二区三区 | 亚洲伊人电影| 欧美视频免费一区二区三区| 色丁丁毛片在线观看| 亚洲一级毛片| 亚洲一区色| 国产精品一老牛影视频| 日韩免费毛片| 在线中文字幕日韩| 中文字幕自拍偷拍| 免费在线国产一区二区三区精品| 97国产精品视频自在拍| 网友自拍视频精品区| 天天综合色网| 免费国产无遮挡又黄又爽| 日韩在线中文| 精品国产香蕉伊思人在线| 国产电话自拍伊人| aⅴ免费在线观看| 国产v精品成人免费视频71pao | 91免费国产高清观看| 亚洲一区二区三区中文字幕5566| 波多野结衣一区二区三区四区| 91色在线观看| 国内精品久久久久鸭|