999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看

<tfoot id="2g0gg"><noscript id="2g0gg"></noscript></tfoot>

<nav id="2g0gg"><sup id="2g0gg"></sup></nav>

<tfoot id="2g0gg"></tfoot>

?

一種擴充?；男蛄朽徲蚍诸惙椒?/h1>
2021-01-08 03:59:34亓慧楊習貝史穎

山西大學學報(自然科學版) 2020年4期
關鍵詞：分類方法

亓慧,楊習貝,史穎,3
(1.太原師范學院計算機系,山西晉中 030619;2.江蘇科技大學計算機學院,江蘇鎮江 212003;3.山西大學計算機與信息技術學院,山西太原 030006)
0 引言
作為粒計算中的重要手段之一,鄰域粒化[1]無需采用離散化就可對數值型數據直接進行處理,被廣泛應用于屬性約簡、度量學習、圖像識別、多標記學習等領域[2-5]。而其最為直接、重要的應用之一就是鄰域分類器[1]。該分類器的核心機制是對給定的測試樣本進行鄰域的構建,繼而依據所生成鄰域粒中訓練樣本所提供的已知類別標簽信息,最終采用多數投票策略進行測試樣本的預測分類。事實上,鄰域分類器構造手段直觀、粒度表示靈活并且有著不俗的分類表現,因此一經提出就受到了眾多學者的青睞與推廣[6-11]。
面對現實數據的問題,鄰域分類器可能會存在以下兩點不足:1) 當訓練樣本數目不足時,測試樣本對應的鄰域粒中僅包含少量的訓練樣本,因而無法提供足夠的標簽信息,那么該測試樣本的預測將缺乏依據;2) 當訓練樣本區分度不夠時,測試樣本對應的鄰域粒中的標簽信息可能會不適用于多數投票,那么該測試樣本的預測將難免出現偏差[12-18]。
為解決上述兩點問題,在傳統鄰域分類器的基礎之上,本文提出了一種擴充粒化的序列分類方式。主要涵蓋以下兩個模塊。1) 擴充?；?設計合適的樣本度量以評估排列測試樣本的預測可靠性,優先選出最為可靠即排名最為靠前的測試樣本,利用傳統的鄰域分類器對其進行判別并將其加入訓練集中,進而擴充后續待測樣本潛在的鄰域搜索空間。2) 序列分類:迭代地加入,利用不斷豐富的標簽信息,依據待測樣本的可靠性排列,迭代地對待測樣本進行預測,直至完成所有測試樣本的分類。綜合這兩個模塊,我們期望利用新提出的方法改善傳統鄰域分類器的些許不足,并且進一步地提升鄰域?；诜诸悜蒙系男阅鼙憩F。
本文的主要結構安排如下:第1節介紹鄰域?；捌湓卩徲蚍诸惼髦械膽?第2節在鄰域分類器的框架基礎上提出改進的擴充?；蛄朽徲蚍诸惙椒?第3節對所提方法進行相關的對比實驗與分析;第4節總結全文。
1 鄰域分類器
一般而言,給定一組訓練集,可被形式化地描述為形如二元組DTr≤UTr,C∪g0gggggg>的決策系統,其中UTr為非空有限的訓練樣本的集合;C為條件屬性的集合,即特征集合;d為決策屬性。特別地,?x∈UTr,d(x)表示其決策屬性值,亦被稱作標簽。那么利用決策屬性可誘導出一組決策類,任一決策類可以表示為Xdi={x∈UTr:d(x)=di},其中di表示第i個標簽,顯然Xdi是包含所有標簽為di樣本的集合。
N(x)={y∈UTr:ΔB(x,y)≤δ}，
(1)
式(1)中ΔB是一基于特征子集B?C的距離度量函數(本文采用歐式距離),δ是一數值為非負的鄰域半徑參數。
進一步地,Hu等人[1]借助式(1)所示的鄰域概念,就可構造鄰域分類器。具體算法如下。
算法1 鄰域分類器(NEC)輸入:訓練集DTr,待測樣本x,鄰域半徑δ輸出:預測標簽^d(x)① 計算N(x)②For ?Xdi∈UTr/IND(d)do 計算Pr(Xdi,N(x))=|Xdi∩N(x)||N(x)| End③^d(x)=argmaxdiPr(Xdi,N(x))
可以發現,對于算法1所示的傳統鄰域分類器而言,在對測試樣本進行鄰域粒生成時,往往集中且局限于固有的訓練樣本中?？上攵?當鄰域半徑過小或訓練樣本過少時,極有可能造成鄰域粒含有極少量甚至是不含任何有用的標簽信息,最終將致使測試樣本的分類失敗。譬如,在最壞的情況下,當求得的|N(x)|=0其中|·|表示任一集合的基數,此時算法1對于該待測樣本的預測將顯得極為乏力。針對這種情形,基于對鄰域半徑的設置,Hu等人[1]在設計鄰域分類器時已做了充分的考慮,提出了鄰域半徑的max-min標準化方法,但是無法有效地解決第二種訓練樣本過少而致使的一系列問題,故本文將重點圍繞該問題,并提出相應的解決方案。
2 擴充?；蛄朽徲蚍诸惙椒?/h2>
本文提出了一種擴充粒化的序列鄰域分類方法，大體框架見圖1。
圖1 擴充?；蛄朽徲蚍诸惙椒ǖ牧鞒虉DFig.1 The flowchart of expanded granulation basedsequential neighborhood classification method
從圖1可以明顯看出,所提方法核心部分包含：
1) 得分評估。在傳統的鄰域分類器中,測試樣本在被分類時,并無先后順序。在所提方法中,我們將對測試樣本進行合適的得分評估,并對其進行排序賦予不同的分類優先等級。
2) 序列擴充。在傳統的鄰域分類器中,訓練樣本的數目固定,且測試樣本一旦完成分類,對后續任務并無指導或輔助的作用。在所提方法中,我們將利用優先已分類的測試樣本依次地擴大訓練樣本規模,為后續待測樣本提供可靠的參考信息。
3) 信息?；Ｔ趥鹘y的鄰域分類器中,當訓練樣本數目過少時,測試樣本鄰域粒難以提供可借鑒的標簽信息。在所提方法中,我們在上一步驟中對其進行了擴充,力圖改善這樣的不利局面。
4) 標簽預測。在傳統的鄰域分類器中,利用測試樣本的信息粒化結果對其進行多數投票策略。在所提方法中,我們在鄰域粒得以擴展的基礎上,同樣利用該策略進行測試樣本的分類。
不難發現,得分評估作為所提方法的第一環節就顯得尤為重要。為此,我們設計了兩種評估函數。
(2)
(3)
需要注意的是,式(2)、(3)中的關于測試樣本的鄰域粒為N(x)={y∈UTr∪UTe:ΔB(x,y)≤δ}。此舉主要是為了評估待測樣本的預測可靠性。若待測樣本在整個訓練與測試集上的鄰域中包含更多的已知標簽信息,那么樣本被正確分類可能性則更大,這就意味著該樣本被分類的優先級更高,對后續分類任務更具輔助作用。同樣地,鄰域中所含訓練樣本與任一測試樣本的距離也可被引入進行評估?；谶@樣的考慮,式(1)、(2)的評估可被建立起來。
接下來,我們就可給出具體的分類算法。
算法2 擴充?；蛄朽徲蚍诸惼?ESNC) 輸入:訓練集DTr,測試集DTe,鄰域半徑δ輸出:預測標簽集合D^①D^←?② For ?x∈UTe 算score1(x)或score2(x)End③ 對測試樣本排序得到RankTe={y1,y2,…,y|DTe|}④ For m=1:|DTe|do 利用算法1得到^d(ym) UTe←UTe-{ym} UTr←UTr∪{ym} D^←D^∪{d^(ym)}End
如算法2所示,不同于傳統鄰域分類器中的粒化手段,我們期望在更廣闊的可搜索鄰域空間上評估每個待測樣本的可靠性,并將此評估作為其候選的得分選項。顯而易見,得分越高,被預測的優先級別也越高。進一步地,借助那些分類優先級更高的測試樣本,我們試圖擴大測試樣本潛在的鄰域搜索范圍,以期為后續的分類提供數量更充足、信息更廣泛的標簽信息。也正因如此,所提算法2更適用于多個訓練樣本的預測,而當待測樣本的數目為1時,算法2將等同于算法1。另外,由于需要求解各個樣本之間的距離,算法的時間復雜度為O((|DTr|+|DTe|)2)。
3 實驗分析
為了驗證所提ESNC算法的有效性,在6組UCI數據集上進行了相關的對比實驗分析。數據集的基本信息如表1所示。
表1 實驗數據集描述
實驗環境為個人筆記本電腦,參數配置為CPU Intel(R) Core (TM) i7-7700HQ CPU @ 2.80 GHz,內存8.00 GB,系統類型Windows 10 64位,程序開發與運行平臺為MATLAB R2018b。
圖2 分類準確率結果Fig.2 Results of classification accuracies
在具體的實驗運行中,我們對數據集的特征值進行了max-min標準化,并且選取了10組鄰域半徑參數,即δ=0.03,0.06,0.09,…,0.3。此外,我們隨機劃分實驗所用數據集中的10%、20%、30%、40%、50%樣本為訓練集,余下則作為測試集。主要計算統計ESNC1 (基于score1的ESNC)、ESNC2 (基于score2的ESNC)在10個半徑下測試樣本上的平均分類準確率,并將其與傳統鄰域分類器NEC[1]、基于相對距離的鄰域粒分類器NGCR[12]、基于絕對距離的鄰域粒分類器NGCA[12]的準確率比較。具體實驗結果見圖2。
從圖2可以看出:
1) 隨著訓練樣本數目的增多,幾種分類器的準確率大體都是呈上升趨勢,該現象與我們常識一致,即足量可靠的訓練數據對于分類模型性能表現是有提升作用的。
2) 本文設計的兩種得分評估機制所構建的ESNC算法在分類性能上基本沒有多大差異,可見通過個數與距離來評估待測樣本的優先分類級別效果是相近甚至是相同的。
3) 最關鍵也是最重要的一點,不管是利用ESNC1 (基于score1的ESNC)還是ESNC2 (基于score2的ESNC),所得到分類準確率結果都要比所對比的NEC、NGCR以及NGCA要好,充分說明了在訓練樣本規模較小時,所提方法對于解決鄰域分類器的局限是有一定幫助的。
為了進一步驗證所提算法的有效性,利用Wilcoxon秩和檢驗開展了顯著性分析。需要注意的是,考慮到所提的兩種方法分類結果相近,我們采用ESNC1與其他算法進行對比,輸出的p值如表2所示,其中,粗體表示所提算法明顯優于對比方法。
表2 分類準確率的顯著性檢驗結果
從表2可以看出,在大多數情況下,所提ESNC1算法的分類表現明顯優于所對比的算法,尤其是NGCR以及NGCA。
4 結論
為解決訓練樣本規模較小時鄰域分類器的局限性,本文提出了一種擴充?；男蛄朽徲蚍诸惙椒āＴ摲椒ㄖ饕⒂诖郎y樣本標注前的評估排序,以及標注后的擴充?；?。實驗結果表明,本文提出的方法能夠提供較好的分類性能。
在本文工作的基礎上,筆者后續將就以下內容做進一步地探討:1) 提高算法運行效率,擬采用樣本簇的方式對訓練樣本進行擴充。2) 特征空間的優化,擬采用特征選擇的方式選取更具鑒別能力的特征集合構建鄰域粒。

猜你喜歡

分類方法

分類算一算
數學小靈通(1-2年級)(2021年4期)2021-06-09 06:25:56
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
學習方法
兒童故事畫報(2019年5期)2019-05-26 14:26:14
分類討論求坐標
中學生數理化·七年級數學人教版(2019年4期)2019-05-20 10:06:32
數據分析中的分類討論
中學生數理化·七年級數學人教版(2018年6期)2018-06-26 08:36:06
教你一招：數的分類
初中生世界·七年級(2017年9期)2017-10-13 22:27:46
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法教你不再“坐以待病”！
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
小雪花·成長指南(2015年7期)2015-08-11 15:03:12
給塑料分分類吧
少兒科學周刊·少年版(2015年3期)2015-07-07 21:00:00

山西大學學報(自然科學版)2020年4期

山西大學學報(自然科學版)的其它文章
基于預訓練語言模型的中文知識圖譜問答系統
基于遷移學習和集成學習的醫學短文本分類
基于GRU-Attention的無監督多變量時間序列異常檢測
A New Matrix Factorization Model for Novel and Diverse Recommendation
基于PCA圖像粒化的多粒度圖像分類模型研究
面向長答案的機器問答研究

主站蜘蛛池模板：国产夜色视频| 久久一级电影| 亚洲有无码中文网| 91精品啪在线观看国产91| 久久综合AV免费观看| 欧美在线网| 国产呦视频免费视频在线观看| 女人18毛片水真多国产| 成年片色大黄全免费网站久久| Jizz国产色系免费| 国精品91人妻无码一区二区三区| 亚洲无码熟妇人妻AV在线| 精品午夜国产福利观看| 亚洲中文字幕久久精品无码一区 | 国产农村精品一级毛片视频| 91色爱欧美精品www| 亚洲黄色成人| 高清视频一区| 伊人狠狠丁香婷婷综合色| 蜜桃视频一区二区| 国产成人综合亚洲欧洲色就色| 欧美亚洲国产精品久久蜜芽| 亚洲天堂视频在线观看免费| 国产亚洲精品无码专| 亚洲一区第一页| 亚洲最大在线观看| 亚洲人成日本在线观看| 久久久久国产一级毛片高清板| 国产精品不卡永久免费| 热九九精品| 国产精品成人不卡在线观看| 一级毛片不卡片免费观看| 亚洲欧美在线综合一区二区三区 | 久久夜夜视频| 伊人色在线视频| 久久五月天综合| 亚洲人成网7777777国产| 国产一级裸网站| 波多野结衣在线se| 欧美日本激情| 99热在线只有精品| 伊人久久福利中文字幕| 青青青国产免费线在| 国内熟女少妇一线天| 91国语视频| 乱系列中文字幕在线视频| 免费高清毛片| h网址在线观看| 97超碰精品成人国产| 久久国产亚洲欧美日韩精品| 国产在线高清一级毛片| 58av国产精品| 天天综合色网| 日本人妻丰满熟妇区| 欧美精品导航| 国产成人综合在线观看| 99爱在线| 日韩a在线观看免费观看| 91青青草视频| 亚洲中文字幕无码mv| 亚洲国产清纯| 国产91小视频在线观看| 国产91高跟丝袜| www.99在线观看| 啦啦啦网站在线观看a毛片| 免费无码又爽又刺激高| 国产精品欧美日本韩免费一区二区三区不卡 | 国产精品内射视频| 亚洲成人精品在线| 久热精品免费| 伊人久久婷婷五月综合97色 | 国产午夜一级淫片| 91综合色区亚洲熟妇p| 亚洲天堂日韩在线| 99这里只有精品免费视频| 日本午夜视频在线观看| 亚洲高清无码精品| a毛片免费看| 91免费片| 伦伦影院精品一区| 免费无码网站| 久久综合激情网|

<noscript id="ggggg"></noscript>

<small id="ggggg"></small>

<sup id="ggggg"></sup>