999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于歐式距離的判別分析

2019-03-21 00:32:02唐宇政
現代商貿工業 2019年9期

唐宇政

摘 要:分類判別問題在生活中是一個有著重要應用需求的問題。例如根據患者肺部陰影大小,是否低燒以及其它理化指標來判斷是否為肺結核患者,或是根據郵件的內容或者發件地址來判斷其是否屬于垃圾郵件。在現實生活中,我們希望能夠準確快速的解決這一類問題,往往需要利用歷史數據來建立合理的分類器。因此重點介紹一種常見的基于距離的判別分類方法——歐氏距離判別法 。首先在第二部分詳細介紹這種分類方法以及將其和另外一種常見的基于馬氏距離的判別分類法進行比較。在第三部分,我們將進行實例分析,基于花瓣長度和花瓣寬度利用歐式距離判別法對鳶尾花進行分類。

關鍵詞:分類問題;歐式距離;馬氏距離

中圖分類號:TB 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2019.09.092

1 背景

分類判別是指根據事物的不同點加以區分辨別,確定事物所屬的類別,使具有更多相似點的事物歸入一類,使之在大量事物中可以根據一定規律快速鑒別各個事物的所屬種類。例如國家電網在對居民進行供電時,就可以根據以往的用電量數據對居民的用電情況進行劃分,對用電量大的居民相應地收取更多的費用,從而達到促進節約用電的目的。在解決此類問題的過程中需要準確判別個體樣本所屬的類別,即應該劃分的組別。本文中將介紹的是如何通過數學建模來快速準確完成這個分組判別的過程。本文中,我們將使用鳶尾花數據集,對150個鳶尾花數據樣本進行分類判別,確定樣本屬于三種鳶尾花中的哪一種,來實例說明歐式距離判別法在現實生活中的可行性。

2 分類方法

判別分析法,是在分類確定的條件下,根據某一研究對象的各種特征值判別其類型歸屬問題的一種多變量統計分析方法。常見的判別分析法主要包括基于距離的判別、Fisher判別、Bayes 判別。本文主要研究對象是通俗易懂、應用范圍廣泛的基于距離的判別分析法。

2.1 基于距離的判別分析

距離判別的基本思想是將距離越近的樣本分為一類,距離越大的樣本分為不同類。這里的距離可以理解為樣本之間的相似度,樣本間距離越小越相似,反之亦然。在實際操作中,我們可以計算每一個新樣本點(類別未知)到歷史樣本點(類別已知)的距離,然后將新樣本的類別預測為于其最相似的歷史樣本點的類別。亦或者將新樣本的類別預測為與其最相似的k(k=1,2,…)個歷史樣本點中類別最多那一類。

通常,在構建模型的過程中,我們僅有大量的歷史數據。因此,我們可以隨機將歷史數據分為訓練集和驗證集。訓練集中的數據相當于歷史數據,驗證集的數據相當于新的數據。引入訓練集、驗證集可以在生活中也有一定的應用。例如假如我們需要識別一輛小汽車。那么我們需要有大量的小汽車圖片(訓練數據),當我們有足夠多的數據時,我們就可以對已有的小汽車圖片進行分析,找出其共同點。然后我們建立一個模型,說明這些數據都是小汽車的特征數據,從而知道什么是小汽車,具備哪些特征。這時,我們就可以放入已有的其他圖片(驗證集數據),把這些新圖片與原有的模型中的圖片進行比對,然后告訴我們哪些是小汽車,哪些不是小汽車。

2.2 歐式距離判別法

本文中,我們以歐式距離作為樣本間相似度的度量。歐氏距離是一個通常采用的距離定義,是指在空間中兩個點之間的真實距離,或者向量的自然長度(即該點到原點的距離)。在二維(平面內,用坐標軸來坐標化表示即為x軸、y軸)和三維(立體空間范圍內,用坐標軸來坐標化表示即為x軸、y軸和z軸)的范圍內歐氏距離就是特定的范圍內兩個點之間的實際距離。當將樣本坐標化放入坐標軸中后,即為兩個點之間的連線的長度。例如,樣本點包含n個變量,那么第一個樣本點A=(x1,x2,…,xn)到第二個樣本點B=(y1,y2,…,yn)之間的距離可以表示為:

d(x,y):=

(x1-y1)2+(x2-y2)2+…+(xn-yn)2=

ni=1(xi-yi)2

除了歐氏距離, 另一種常用的距離是馬氏距離。與歐氏距離不同的是,它考慮到各種特性之間的聯系(例如:一條關于身高的信息會帶來一條關于體重的信息,因為兩者是有關聯的),并且是尺度無關的,即獨立于測量尺度。馬氏距離的計算需要用到矩陣和協方差矩陣。盡管歐氏距離簡單有用,但也有明顯的缺點。歐氏距離在代數化過程中忽略了個體的差異,對所有樣本的處理過于類似,這一點有時不能滿足實際要求。例如,在教育研究中,經常遇到對人的分析和判別,個體的不同屬性對于區分個體有著不同的重要性。因此,有時需要采用不同的距離函數。同時,在歐式距離計算中,我們往往忽略了變量間單位的差異。

3 實例應用

3.1 數據介紹

本文中的數據來源于鳶尾花數據集。這個數據集是常用的分類實驗數據集,由Fisher 1936收集整理。是一類多重變量分析的數據集。數據集包含150個數據點,3類鳶尾花:有第一類山鳶尾,第二類雜色鳶尾和第三類維吉尼亞鳶尾,每類50個數據點,每個數據點有4個屬性:花萼長度,花萼寬度,花瓣長度,花瓣寬度。通過這4個屬性預測鳶尾花卉樣本屬于哪一種鳶尾花。我們將建立一個有關變量的坐標系,將樣本以點的形式置于坐標系中。其中橫縱坐標的數值視優劣程度而定,即是否直觀有效。每個樣本點都按照某兩個特征數據放入到坐標軸中。在每個坐標系中,會有已有的135個訓練集樣本點分布在坐標軸中,每一個新放入的驗證集的樣本點(x,y),計算它和訓練集樣本點的距離,選出距離最近的前15個點,則此驗證集的新樣本點認為和這十五個訓練集樣本點的鳶尾花種類一致。由于在Fisher鳶尾花數據集中三種鳶尾花各有50個樣本數據,因此統一編號1-50,每一個號就代表三種鳶尾花的各一個樣本。通過隨機抽樣抽取1-50中的5個數字,得到一共15個樣本組成驗證集,剩余135個樣本為訓練集。通過隨機抽樣得到的驗證集如表1。

3.2 統計分析

我們首先對單一變量進行處理,即僅從一個數據項來看。我們可以得到以下四幅圖表。圖表中全都采用統一的圖例注記。

·山鳶尾 藍色菱形

·雜色鳶尾 橙色正方形

·維吉尼亞鳶 灰色三角形

(1)萼片長度。

由上述四幅圖可以看出,有關萼片的變量對于三種鳶尾花的區分度并不明顯,而與花瓣有關的變量則可以顯著區分出山鳶尾,雜色鳶尾和維吉尼亞鳶尾雖然有少部分重疊,但仍具有較高的區分度。

因此在接下去的分類過程中我們將不采用有關萼片的數據。另外我們提出一種將有關花瓣的兩個數據放入一張圖表中,即以花瓣長度為橫坐標,花瓣寬度為縱坐標,將每個樣本個體以點的形式在圖表中表示出來。這就變成了一個有關花瓣長度和花瓣寬度的二元變量問題。通過作圖可以看到這種方式的區分度高,效果良好。

(5)花瓣雙坐標圖。

3.3 基于距離的分類算法

我們將采用歐式距離判別法。建立一個平面直角坐標系,在此處先以與花瓣有關的兩個變量為例進行判別。在坐標系中橫坐標為花瓣長度,縱坐標為花瓣寬度,每一個樣本根據其長和寬可以在圖中找到相對應的坐標點,并加以顏色區分表示。

下面我們將開始對驗證集內的數據進行驗證。

我們以序號為23 的山鳶尾花為例,其花瓣長為1.0cm,寬為0.2cm。那么在坐標軸中可以表示為點(1.0,0.2)。運用歐式距離公式進行計算。

通過計算可得此測試樣本與樣本集中所有135個樣本數據的距離,總距離為397.315,平均距離為2.921。

我們得到了表2中的數據。

參考文獻

[1]吳孟達.數學建模教程[M].北京:高等教育出版社,2011.

[2]白其崢.數學建模案例分析[M].北京:海洋出版社,2000.

主站蜘蛛池模板: 亚洲大尺码专区影院| 欧美有码在线| 日韩国产高清无码| 日韩小视频在线播放| AV天堂资源福利在线观看| 91在线精品麻豆欧美在线| 国产成人一级| 欧美成人午夜视频| 久久99蜜桃精品久久久久小说| 亚洲AV无码乱码在线观看裸奔| 国产成人久久综合777777麻豆 | 国产丝袜第一页| 亚洲日韩AV无码一区二区三区人| 在线播放精品一区二区啪视频| 高清不卡毛片| 色哟哟国产精品| 国产精品冒白浆免费视频| 五月天久久综合| 欧美区日韩区| 久久特级毛片| 亚洲第一黄片大全| 国产亚洲精久久久久久久91| 欧美一区二区三区欧美日韩亚洲| 米奇精品一区二区三区| 亚洲成年网站在线观看| 久草性视频| 成人日韩视频| 九九久久精品国产av片囯产区 | www精品久久| 国产精品手机在线播放| 国产成人调教在线视频| 2022精品国偷自产免费观看| 女人18毛片一级毛片在线| 欧美精品成人| 亚洲va在线∨a天堂va欧美va| 国产精品无码影视久久久久久久| 91在线精品免费免费播放| 免费无码AV片在线观看国产| 国产日韩欧美黄色片免费观看| 亚洲国产亚综合在线区| 欧美伦理一区| 国产精品综合色区在线观看| 国产亚洲精品无码专| 国产激情无码一区二区免费| 高清免费毛片| 国产爽爽视频| 免费毛片a| 国产乱子伦一区二区=| 久久毛片免费基地| 色综合日本| 欧美高清三区| 国产成人精品午夜视频'| 欧美三级自拍| 久青草免费在线视频| 国产a v无码专区亚洲av| lhav亚洲精品| 久久国产香蕉| 国产jizzjizz视频| 色精品视频| 色老头综合网| 国产精品青青| 国产裸舞福利在线视频合集| 喷潮白浆直流在线播放| h网站在线播放| 人妻无码AⅤ中文字| 国产精品区网红主播在线观看| 天天摸夜夜操| 日韩高清成人| 亚洲,国产,日韩,综合一区| 欧美日韩精品在线播放| 精品国产一区二区三区在线观看| 色综合五月| 亚洲欧美日韩中文字幕一区二区三区| 高潮毛片免费观看| YW尤物AV无码国产在线观看| 国产熟睡乱子伦视频网站| 亚洲第一区在线| 蜜芽国产尤物av尤物在线看| 国模视频一区二区| 亚洲欧美另类久久久精品播放的| 国产毛片不卡| 国产精品刺激对白在线|