摘 要:多個(gè)相關(guān)任務(wù)同時(shí)學(xué)習(xí)可能比各個(gè)任務(wù)單獨(dú)學(xué)習(xí)具有更好的泛化能力,這是多任務(wù)學(xué)習(xí)(mulIitasklearning)模式的出發(fā)點(diǎn)。受其啟發(fā),研究并開(kāi)發(fā)了一種多層郵件過(guò)濾系統(tǒng)。首先為各用戶建立基本分類器,利用EM算法估計(jì)出基本分類器之間的相關(guān)系數(shù),最終得到該用戶的郵件過(guò)濾判別函數(shù)。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)對(duì)中英文語(yǔ)料都是可靠和有效的,并在樣例較少時(shí)就具有較好的過(guò)濾性能。該過(guò)濾系統(tǒng)的優(yōu)劣最終還取決于相關(guān)系數(shù)先驗(yàn)概率的參數(shù)取值,以及所選擇的基本分類器。關(guān)鍵詞:機(jī)器學(xué)習(xí);相關(guān)系數(shù);郵件過(guò)濾器;基本分類器