999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于最小分類誤差的閾值優(yōu)化方法設計

2018-10-29 11:09:14張夢婷李星野
軟件導刊 2018年8期

張夢婷 李星野

摘要:傳統(tǒng)Fisher線性判別(FLD)的常用閾值對特定數據集的分類精度存在明顯差異。為提高分類精度,通過最小化貝葉斯誤差對二分類問題的FLD閾值進行了優(yōu)化設計。對UCI中的8個數據集進行驗證,將所得的平均分類精度與常用閾值在這些數據集上所得的平均分類精度進行比較。結果表明,所提出的優(yōu)化閾值分類效果顯著,相比于常用閾值,在平均分類精度上有所提升。

關鍵詞:FLD;閾值;數據集;貝葉斯誤差;平均分類精度

DOIDOI:10.11907/rjdk.173205

中圖分類號:TP301

文獻標識碼:A 文章編號:1672-7800(2018)008-0081-04

英文摘要Abstract:The commonly-used thresholds of the traditional Fisher linear discriminant (FLD) have significant differences in the classification accuracy on particular datasets.In order to improve the classification accuracy,an FLD threshold is optimized in this paper for binary classification problems by minimizing the Bayes error,and validated on the eight datasets in UCI.Then,the obtained average classification accuracy is compared with that obtained by the commonly used thresholds on these datasets.The experimental results show that the proposed optimised threshold has significant effect on the classification.Compared with the commonly-used thresholds,the optimised threshold has significant improvement in the average classification accuracy.This verifies the validity and feasibility of the design.

英文關鍵詞Key Words:FLD; threshold; datasets;bayes error; average classification accuracy

0 引言

線性判別分析(Linear Discriminant Analysis,LDA),也稱作Fisher線性判別(Fisher Linear Discriminant,FLD),是模式識別中分類問題的經典算法,基本思想是將高維樣本數據壓縮到低維矢量空間,找到一個最佳投影方向,使不同類別的數據在這個投影方向上獲得最好的分離,以達到提取分類信息和壓縮特征空間維數效果。使用這種方法能保證投影后的樣本數據在新的投影空間中有最小的類內距離和最大的類間距離,即數據在該空間中有最佳可分離性[1]。

FLD作為一種有監(jiān)督的學習算法,應用于醫(yī)學診斷[2]、人臉識別[3]、信號分類[4]等多個領域。但是,該算法在某些樣本數據上的分類效果并不理想,很多學者對算法本身作了一定優(yōu)化。張振平等[5]針對LDA方法中類內計算常常引起錯誤分類的問題,提出了Bayes錯誤率最小的改進型LDA特征選擇方法,在最小化錯誤率原則下,采用迭代算法求解最優(yōu)特征選擇矩陣,取得了比原LDA更好的分類效果。曹玲玲等[6]提出了基于FLD的貝葉斯分類器算法,對測試樣本先進行投影得出新的樣本數據,再利用經典的貝葉斯算法進行分類,使得分類錯誤率最小。覃志祥等[7]和莊哲民等[8]分別從不同角度重新定義樣本類間離散度矩陣,優(yōu)化了傳統(tǒng)的Fisher準則,實現了更好的分類性能。沈虹等[9]依據貝葉斯決策的最小錯誤率確定了割除指紋背景區(qū)域的閾值,明顯提高了指紋分割效果。李伶俐[10]通過對數據挖掘中分類算法的綜合研究,得出貝葉斯算法相比于其它分類算法精確度高,錯誤率最小的結論,為本文研究提供了理論依據。FLD的目標是確定決策平面的法向量而不是確定最終分類平面位置的閾值[11];李艷芳等[12]針對常用閾值對不平衡數據集分類性能差的問題提出了多個經驗閾值,并依據分類精度對閾值做了優(yōu)化,通過大量實驗證明其方法的有效性。由于閾值不同會對分類結果造成一定偏差,甚至會嚴重影響FLD的分類精度,結合上述文獻,本文在最小化貝葉斯分類誤差的基礎上研究找到一個更佳的分類閾值,使不同類別的數據在該閾值確定的決策平面處實現更精確的分離。

1 分類原理

1.1 Fisher分類原理和常用閾值

對應著取得極小值的分類誤差,此時的y0為在最小化分類誤差的基礎上所求得的優(yōu)化閾值。

2 實驗驗證

為檢驗該優(yōu)化閾值的分類效果,從UCI機器學習存儲庫(http://archive.ics.uci.edu/ml)中選擇8個數據集對其進行驗證,數據集如表1所示。

對表1中的每個數據集采取10折交叉驗證并分別進行10次不同的試驗。由于本文提出的優(yōu)化閾值是建立在二分類問題基礎上的,所以對有K>2個類的數據集,采用一對一(OvO)策略進行分類,每次對數據集中的每一對類別進行分類,而忽略其它K-2個類別。因此,要進行K(K-1)/2次分類,并計算所有K(K-1)/2次分類的平均分類精度作為分類的性能指標。

3 實驗結果

通過使用本文提出的優(yōu)化閾值對表1中的8個數據集進行試驗,并與Fisher線性判別常用閾值在這些數據集上的分類結果進行比較。為簡化起見,將由公式(2)、(3)、(4)表示的閾值分類方法分別表示為FLD-1、FLD-2和FLD-3,利用優(yōu)化閾值式(13)進行分類的方法表示為FLD-4,結果如表2所示(最高的平均分類精度用粗體表示)。

從表2可以看出,除了數據集7和8,使用優(yōu)化閾值進行分類的方法在其它數據集上獲得的平均分類精度都明顯高于利用其它3種常用閾值進行分類所得的平均分類精度,說明使用本文提出的優(yōu)化閾值進行分類方法能在大多數數據集上取得更佳的分類效果,提高了數據集分類的平均分類精度。將表2所測的8個數據集的平均分類精度以折線形式表示如圖1所示。

從圖1可以看出,由FLD-4所表示的優(yōu)化閾值分類方法測得的平均分類精度折線圖大多位于其它3種常用閾值分類方法的上方,只有在數據集7和數據集8上的平均分類精度不是最高,但也與最高的平均分類精度相差不大。所以,在線性判別分析中,可使用此優(yōu)化閾值進行分類。另外還可看出,由FLD-4方法分類所得的平均分類精度在上述所有數據集上都高于由FLD-3方法所得的平均分類精度。由此可見,方法FLD-3中的分類閾值(公式(4))雖然考慮了類概率的影響和作用,但對于兩類間樣本數目差別很大的數據集,如數據集3、數據集7和數據集8,FLD-3不適用。

4 結語

本文主要考慮了傳統(tǒng)線性判別分析中常用閾值對數據集分類精度存在明顯差異的情況,在努力提高平均分類精度的基礎上,通過使貝葉斯分類誤差最小對FLD的分類閾值進行優(yōu)化設計。從UCI機器學習存儲庫中選擇8個數據集進行驗證,然后將所得的平均分類精度與利用常用閾值進行分類所得的平均分類精度進行比較。實驗表明,由優(yōu)化閾值進行分類的方法在大多數數據集上都能取得很好的分類效果,能有效提高FLD的平均分類精度,從而證明了該設計的有效性和可行性。

參考文獻:

[1] 李文斌,陳嶷瑛,張娟,等.使用Fisher線性判別方法的提取分類器[J].計算機工程與應用,2010,46(14):132-134.

[2] COOMANS D,M JONCKHEER,DL MASSART ,et al.The application of linear discriminant analysis in the diagnosis of thyroid Dis- eases [J].Analytica Chimica Acta,1978,103(4):409-415.

[3] 謝永林.LDA算法及其在人臉識別中的應用[J].計算機工程與應用,2010,46(19):189-192.

[4] 趙海濱,顏世玉,于清文,等.采用Fisher線性判別分析進行MEG信號的分類[J].東北大學學報:自然科學版,2013,34(12):1695-1698.

[5] 張振平,宣國榮,鄭俊翔,等.一種基于最小分類錯誤率的改進型LDA特征選擇算法[J].微型電腦應用,2005,21(4):4-6.

[6] 曹玲玲,潘建壽.基于Fisher判別分析的貝葉斯分類器[J].計算機工程,2011,37(10):162-164.

[7] 覃志祥,丁立新,簡國強,等.一種改進的線性判別分析法在人臉識別中的應用[J].計算機工程,2006,32(4):211-213.

[8] 莊哲民,張阿妞,李芬蘭.基于優(yōu)化的LDA算法人臉識別研究[J].電子與信息學報,2007,29(9):2047-2049.

[9] 沈虹,汪劍鳴,苗長云.基于貝葉斯最小錯誤率的一種新的指紋分割算法[J].微計算機信息,2006,22(1):208-210.

[10] 李伶俐.數據挖掘中分類算法綜述[J].重慶師范大學學報:自然科學版,2011,28(4):44-47.

[11] GAO D Q,DING J,ZHU C M .Integrated fisher linear discriminates:an empirical study[J].Pattern Recognition,2014,47(2):789-805.

[12] 李艷芳,高大啟.Fisher線性判別式閾值優(yōu)化方法研究[J].計算機應用與軟件,2016,33(6):141-145.

[13] 孫即祥.現代模式識別 [M].第2版.北京:高等教育出版社,2008.

[14] 邊肇祺,張學工.模式識別 [M].第2版.北京:清華大學出版社,1999.

[15] 陳弋蘭,王鳴,孫書誠.樸素貝葉斯分類器的誤差設計[J].安徽工程科技學院學報,2008,23(4):48-51.

[16] 周德全.離散貝葉斯分類算法及分類誤差估計[J].儀器儀表學報,2004,25(4):345-347.

(責任編輯:杜能鋼)

主站蜘蛛池模板: 国产一区二区影院| av尤物免费在线观看| 中文字幕调教一区二区视频| 亚洲人成电影在线播放| 成年片色大黄全免费网站久久| 国产精品高清国产三级囯产AV| 伦伦影院精品一区| 亚洲日韩精品综合在线一区二区| 九九久久精品国产av片囯产区| 米奇精品一区二区三区| 久久精品人人做人人爽电影蜜月 | 日本高清在线看免费观看| 国产农村精品一级毛片视频| 欧美a在线视频| 国产欧美精品专区一区二区| 欧美精品xx| 亚洲男女在线| 欧美日韩在线观看一区二区三区| 呦女亚洲一区精品| 国产精品开放后亚洲| 伦精品一区二区三区视频| 国产黑丝一区| 国产H片无码不卡在线视频| 国产AV无码专区亚洲精品网站| 在线观看欧美国产| 99在线视频免费| 久久久久国色AV免费观看性色| 亚洲黄色视频在线观看一区| 精品日韩亚洲欧美高清a| 国产激爽大片在线播放| 国产日韩AV高潮在线| 国产成人av大片在线播放| 日本国产在线| 久久人体视频| 91香蕉视频下载网站| 色综合网址| 午夜国产在线观看| 免费jjzz在在线播放国产| 国产成人午夜福利免费无码r| 日本人妻一区二区三区不卡影院| 国产精品99一区不卡| 91久久偷偷做嫩草影院免费看 | 久久精品中文字幕免费| 香蕉视频国产精品人| 波多野结衣国产精品| 白浆免费视频国产精品视频| 91高清在线视频| 国产成人久久777777| 国产第二十一页| 久久亚洲黄色视频| 欧美国产日韩一区二区三区精品影视| 久久综合丝袜长腿丝袜| 久久国产精品无码hdav| 欧美日韩精品在线播放| 91小视频在线观看| 毛片视频网| 日韩小视频在线播放| 国产免费网址| 第九色区aⅴ天堂久久香| 亚洲欧美一区二区三区图片| 国产在线拍偷自揄观看视频网站| 人妻精品久久久无码区色视| 欧美无专区| 婷婷成人综合| 欧美精品伊人久久| 欧美色图久久| 99无码中文字幕视频| 不卡无码h在线观看| 国产91久久久久久| 欧美精品二区| 国产白浆一区二区三区视频在线| 成人在线观看不卡| 爱色欧美亚洲综合图区| 91探花在线观看国产最新| www.亚洲国产| 成人免费网站在线观看| 丰满少妇αⅴ无码区| 欧美日韩久久综合| 精品久久国产综合精麻豆| 亚洲精选高清无码| 又大又硬又爽免费视频| A级毛片无码久久精品免费|