999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于距離度量的K近鄰基本分類算法研究

2022-03-04 12:51:26張大偉李明艷
科教導刊·電子版 2022年2期
關鍵詞:分類

張大偉 李明艷

(北海職業學院 廣西·北海 536000)

0 引言

K近鄰分類算法(KNN,K-NearestNeighbor)是數據分類技術中最傳統的算法之一,它是由Cover和Hart在1968年提出來的。所謂K最近鄰,就是未知樣本周邊K個最近的鄰居的意思,意為每個未知樣本都可以用它最接近的K個鄰近值來表示,俗語“你的薪水約是你最好的6個朋友的平均薪水”與K近鄰分類算法有異曲同工之妙。K近鄰分類算法以其穩定性好、準確率高等特點廣泛的應用于分類與回歸。[1]

1 距離度量

在數學中,歐幾里得距離(度量)是歐幾里得空間中兩點間“普通”(即直線)距離。歐幾里得距離也稱歐氏距離,在數據分析及挖掘中經常被提及,例如聚類或計算相似度。[2]曼哈頓距離是幾何學用語,由十九世紀的明可夫斯基首先提出,其用來標明兩個點在標準坐標系上的絕對軸距總和。

曼哈頓距離是指在曼哈頓城市中,從一個紅綠燈駕車到另外一個路口的距離,也稱為城市街區距離。圖1中藍色實線是曼哈頓距離,紅色虛線代表歐氏距離,也就是直線距離,而紫色和綠色代表等價的曼哈頓距離。[3]如下所示公式1和公式2分別代表歐氏距離和曼哈頓距離的計算方法,其中a和b代表兩個點。

圖1:曼哈頓距離與歐氏距離

2 K近鄰分類算法

2.1 K近鄰分類算法定義

K近鄰分類算法是對“近朱者赤近墨者黑”這句話的完美詮釋。若要判斷某個未知樣本屬于哪個分類,只需要找到最接近該樣本的K個鄰居,這些鄰居中哪種分類占比最大,K近鄰分類算法就認為該樣本就屬于此分類。[6]如圖2所示在K=3的時候(內圓與綠色有3個最近的圖形,2個紅色三角形)K近鄰分類算法推測綠色的圓形是紅色三角形;同理在K=5的時候(外圓與綠色有5個最近的圖形,3個藍色矩形)K近鄰分類算法將推測綠色圓形為藍色矩形。

圖2:K近鄰分類算法原理

2.2 K近鄰算法的計算過程

K近鄰分類算法本質上是一種統計學習方法,在程序運行時數據集就被加載到內存開始分類,從而無須進行前期訓練。在判斷未知的樣本時,以該樣本為中心尋找與其最接近的K個元素進行判斷,通常K是一個不大的整數,根據實際需要進行限定。[7]

K近鄰分類算法的計算過程:

(1)利用距離算法(如明可夫斯基距離)度量未知樣本與已知樣本之間的距離;

(2)對所有樣本按距離遞增排序;

(3)選取與未知樣本距離最小的K個點;

(4)計算前K個樣本所屬類別的數量;

(5)統計出K個樣本中,出現頻率最高的類別作為未知樣本的預測分類。

2.3 距離的度量方式對K近鄰分類算法的影響

K近鄰分類算法主要任務是基于距離度量,找出與未知(被測)樣本距離最近的K個點,其三個基本要素:K值的選擇、距離度量以及分類決策規則。距離的度量是對訓練樣本與測試樣本相似程度的描述,這個相似程度就是K個樣本選擇的依據,在K近鄰分類算法中,如果特征是連續的,那么距離度量一般用明可夫斯基距算法;如果特征是離散的,一般采用其它的距離度量算法,如漢明距離。[8]運用K近鄰分類算法進行分類預測時,距離的度量算法不同,得到的結果可能不同。因此,在實際應用中需要對數據集的分類結果進行評價(這是評估模型存在的價值),從而采取最優的距離度量算法。[9]

2.4 K值的選擇對分類結果的影響

如果選擇較小的K值,就相當于用較小的領域中的訓練實例進行預測,“學習”的近似誤差會減小,只有與輸入實例較近或相似的訓練實例才會對預測結果起作用,與此同時帶來的問題是“學習”的估計誤差會增大,換句話說,K值的減小就意味著整體模型變得復雜,容易發生過擬合,(偏差小方差大);如果選擇較大的K值,就相當于用較大領域中的訓練實例進行預測,其優點是可以減少學習的估計誤差,但缺點是學習的近似誤差會增大。這時候,與輸入實例較遠(不相似的)訓練實例也會對預測器作用,使預測發生錯誤,且K值的增大就意味著整體的模型變得簡單。[10]

3 結語

K近鄰分類算法優點非常突出,其理論成熟、精度高且簡單易于理解,既可以用于分類又可以用于回歸在機器學習中有著較高的利用;但其缺點與優點一樣突出,其計算復雜度和空間復雜度都較高適用于數值型和標稱型的數據。在實際應用中采取不同的K值或不同的距離度量方法都有可能影響最終的分類結果,良好的評價模型結合實際的情況預估是提高分類有效率的不可或缺的方法。

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 免费观看精品视频999| 在线欧美日韩| 黄色网在线| 一级看片免费视频| 欧美自拍另类欧美综合图区| 欧美啪啪精品| 97国产精品视频自在拍| 真实国产乱子伦视频| 狠狠色综合久久狠狠色综合| 99re这里只有国产中文精品国产精品| 国产午夜福利亚洲第一| 毛片基地视频| 日韩a在线观看免费观看| 99在线视频免费观看| 久久永久免费人妻精品| 日韩精品久久无码中文字幕色欲| 亚洲天堂网2014| 成人福利在线免费观看| 国产亚洲精品精品精品| 免费毛片视频| 精品视频在线观看你懂的一区| 露脸国产精品自产在线播| 亚洲精品午夜天堂网页| 国产在线拍偷自揄拍精品| 国产资源站| 欧美色99| 精品自窥自偷在线看| 在线亚洲小视频| 国产在线观看99| 久久这里只有精品8| 伊人久久综在合线亚洲2019| 国产亚洲美日韩AV中文字幕无码成人| 99久久国产综合精品2020| 亚洲第一视频区| 911亚洲精品| 色屁屁一区二区三区视频国产| a级免费视频| 亚洲国产日韩一区| 国产精品极品美女自在线网站| 国产精品尹人在线观看| 国产精品播放| 国产第八页| 国产亚洲高清在线精品99| 色综合激情网| 激情无码字幕综合| 欧美笫一页| 日本欧美成人免费| 国产午夜精品一区二区三| 在线观看免费人成视频色快速| 四虎永久在线视频| 国产福利免费视频| 国产在线一区视频| 国产精品成| 婷婷伊人久久| 日本精品视频一区二区| 亚洲综合第一页| 欧洲欧美人成免费全部视频| 午夜视频日本| 色偷偷一区二区三区| 91久久天天躁狠狠躁夜夜| 亚洲综合经典在线一区二区| 精品伊人久久久大香线蕉欧美| 美女被操91视频| 国产亚洲精品yxsp| 精品国产欧美精品v| 久久久91人妻无码精品蜜桃HD| 亚洲一区无码在线| 欧美午夜理伦三级在线观看| 亚洲男人在线天堂| 国产精品极品美女自在线看免费一区二区| 久久精品欧美一区二区| 伊人成人在线| 在线欧美a| 黄色网页在线播放| 中文字幕乱码二三区免费| 国产精品久线在线观看| 成人国产三级在线播放| 国产SUV精品一区二区6| 日韩欧美中文在线| 国产十八禁在线观看免费| 九九香蕉视频| 国产日韩欧美黄色片免费观看|