摘要:為了有效地利用結(jié)構(gòu)信息,提出了一種新的自學(xué)習(xí)算法,算法中利用聚類方法從自標(biāo)記樣本中選擇可信度高的樣本,同時(shí)用一個(gè)數(shù)據(jù)編輯方法從這些可信度高的樣本中剔除被錯(cuò)標(biāo)的可能性較高的樣本。算法在UCI數(shù)據(jù)上進(jìn)行了驗(yàn)證,效果和收斂速度比對(duì)比算法要好,說明引入聚類選擇候選樣本是有效的。
關(guān)鍵詞:自訓(xùn)練;無標(biāo)簽樣本;聚類;半監(jiān)督學(xué)習(xí)
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2010)09-3341-04