999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機(jī)器學(xué)習(xí)之半監(jiān)督學(xué)習(xí)釋義

2019-12-05 05:29:16MartinHellerCharles
計算機(jī)世界 2019年45期
關(guān)鍵詞:監(jiān)督模型

Martin Heller Charles

在2017年寫給亞馬遜股東的信中,Jeff Bezos提到了亞馬遜語音智能助理Alexa的一些有趣之處:

在美國、英國和德國,通過改進(jìn)Alexa的機(jī)器學(xué)習(xí)組件以及使用半監(jiān)督學(xué)習(xí)技術(shù),在過去12個月里我們把Alexa的口語理解能力提高了25%以上。(利用這些半監(jiān)督學(xué)習(xí)技術(shù),實現(xiàn)相同精度所需的標(biāo)記數(shù)據(jù)量減少了40倍!)

鑒于這些結(jié)果,在我們自己的分類問題上嘗試半監(jiān)督學(xué)習(xí)可能會很有趣。那么,什么是半監(jiān)督學(xué)習(xí)呢?它有什么優(yōu)缺點?我們怎樣使用它?

什么是半監(jiān)督學(xué)習(xí)?

顧名思義,半監(jiān)督學(xué)習(xí)介于受監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間。受監(jiān)督學(xué)習(xí)采用帶有正確答案(目標(biāo)值)的標(biāo)記過的訓(xùn)練數(shù)據(jù)。在學(xué)習(xí)過程之后,將得到一個經(jīng)過調(diào)優(yōu)的權(quán)重集的模型,這可以用于預(yù)測尚未標(biāo)記的類似數(shù)據(jù)的答案。

半監(jiān)督學(xué)習(xí)同時使用標(biāo)記和未標(biāo)記的數(shù)據(jù)來擬合模型。在某些情況下,比如Alexa的添加未標(biāo)記的數(shù)據(jù)的確提高了模型的準(zhǔn)確性。在其他情況下,未標(biāo)記的數(shù)據(jù)可能會使模型更差。正如我將在下面所討論的,在不同的數(shù)據(jù)特性條件下,不同的算法會有不同的缺點。

一般來說,標(biāo)記數(shù)據(jù)需要花費金錢和時間。這并不總是問題,因為有些數(shù)據(jù)集已經(jīng)有了標(biāo)記。但是如果您有很多數(shù)據(jù),其中只有一些是標(biāo)記過的,那么半監(jiān)督學(xué)習(xí)這種技術(shù)很值得一試。

半監(jiān)督學(xué)習(xí)算法

半監(jiān)督學(xué)習(xí)至少可以追溯到15年前,甚至更長;威斯康星州大學(xué)的Jerry Zhu在2005年寫了一份文獻(xiàn)調(diào)查。近年來,半監(jiān)督學(xué)習(xí)再次興起(不僅是在亞馬遜),因為它降低了重要基準(zhǔn)的錯誤率。

DeepMind的Sebastian Ruder在2018年4月寫了一篇博文,介紹了一些半監(jiān)督學(xué)習(xí)算法,即創(chuàng)建代理標(biāo)簽的算法:包括自我訓(xùn)練、多視圖學(xué)習(xí)和自我整合。

自我訓(xùn)練使用模型自己對未標(biāo)記數(shù)據(jù)的預(yù)測結(jié)果,將其添加到已標(biāo)記的數(shù)據(jù)集中。實際上,這為預(yù)測的置信水平設(shè)置了一些閾值,通常為0.5甚至更高,高于該閾值時,相信預(yù)測結(jié)果并將其添加到已標(biāo)記的數(shù)據(jù)集中。不斷地重新訓(xùn)練這個模型,直到?jīng)]有更多可信的預(yù)測結(jié)果為止。

這就回避了用于訓(xùn)練的實際模型的問題。和大多數(shù)機(jī)器學(xué)習(xí)一樣,你可能會嘗試每一個合理的候選模型,以期找到一個能很好工作的模型。

自我訓(xùn)練在一定程度上是成功的,可謂是好壞參半。最大的缺點是模型無法糾正自己的錯誤:例如,對異常值高度自信(但錯誤)的預(yù)測可能會破壞整個模型。

多視圖訓(xùn)練在不同的數(shù)據(jù)視圖上訓(xùn)練不同的模型,其中可能包括不同的特征集、不同的模型體系結(jié)構(gòu)和不同的數(shù)據(jù)子集。多視圖訓(xùn)練算法有很多,其中最著名的是三視圖訓(xùn)練。本質(zhì)上,可以創(chuàng)建三個不同的模型;每當(dāng)兩個模型同意一個數(shù)據(jù)點的標(biāo)簽時,該標(biāo)簽就會被添加到第三個模型中。與自我訓(xùn)練一樣,當(dāng)沒有更多的標(biāo)簽被添加到任何一個模型時,就停止了。

自我整合通常使用具有多個不同配置的單個模型。在梯形網(wǎng)絡(luò)方法中,對干凈樣本的預(yù)測結(jié)果被用作隨機(jī)擾動樣本的代理標(biāo)簽,目的是開發(fā)能夠抵制噪聲的特性。

Jerry Zhu在2007年的教程中還考慮了一些其他算法。這包括生成模型(例如,對每一類假設(shè)高斯分布的模型)、半監(jiān)督支持向量機(jī)和基于圖的算法。

云中的半監(jiān)督學(xué)習(xí)

半監(jiān)督學(xué)習(xí)正慢慢進(jìn)入主流的機(jī)器學(xué)習(xí)服務(wù)。例如,Amazon Sagemaker Ground Truth使用Amazon Mechanical Turk對部分圖像集進(jìn)行手動標(biāo)記和邊界確定,并使用神經(jīng)網(wǎng)絡(luò)訓(xùn)練功能對圖像集的其余部分進(jìn)行標(biāo)記。

類似的半監(jiān)督學(xué)習(xí)方法可以用于其他類型的半監(jiān)督學(xué)習(xí),包括自然語言處理、分類和對多種服務(wù)的回歸。但是,你必須為其中的大多數(shù)算法編寫自己的鏈接代碼。

Martin Heller是InfoWorld的特約編輯和審稿人。他曾是一名網(wǎng)絡(luò)和Windows編程顧問,1986年至2010年間開發(fā)過數(shù)據(jù)庫、軟件和網(wǎng)站。

原文網(wǎng)址

https://www.infoworld.com/article/3434618/semi-supervised-learning-explained.html

猜你喜歡
監(jiān)督模型
一半模型
重要模型『一線三等角』
突出“四個注重” 預(yù)算監(jiān)督顯實效
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
監(jiān)督見成效 舊貌換新顏
夯實監(jiān)督之基
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
績效監(jiān)督:從“管住”到“管好”
浙江人大(2014年5期)2014-03-20 16:20:28
監(jiān)督宜“補(bǔ)”不宜“比”
浙江人大(2014年4期)2014-03-20 16:20:16
主站蜘蛛池模板: 无码视频国产精品一区二区| 日韩a在线观看免费观看| 毛片基地视频| 97国产在线播放| 四虎精品黑人视频| 四虎在线观看视频高清无码| 真实国产乱子伦视频 | 99热最新网址| 欧美一级夜夜爽www| 毛片a级毛片免费观看免下载| 国产毛片基地| 亚洲第七页| 91无码网站| 99999久久久久久亚洲| 色哟哟国产精品| 亚洲黄网视频| 粗大猛烈进出高潮视频无码| 青青青草国产| 精品国产三级在线观看| 午夜日b视频| 国产AV毛片| 久草中文网| av无码久久精品| 久久亚洲国产视频| 欧美成人午夜视频免看| 国产亚洲精品在天天在线麻豆| 久久黄色免费电影| 一本久道热中字伊人| 国产剧情一区二区| 色老二精品视频在线观看| 99视频在线免费| 国产亚洲精品无码专| 亚洲美女视频一区| 色哟哟国产精品一区二区| 久草视频中文| 亚洲人成网站观看在线观看| 欧美色丁香| 国产精品成人免费综合| 麻豆精品在线| 欧美黑人欧美精品刺激| 国产成人午夜福利免费无码r| 国产青青草视频| 91久久国产热精品免费| 8090成人午夜精品| 69免费在线视频| 欧美在线伊人| 国产h视频免费观看| 人与鲁专区| 国产青青操| 亚欧美国产综合| 久草热视频在线| 国产精品无码影视久久久久久久| 国产日韩欧美在线视频免费观看 | 午夜毛片免费看| 亚洲区一区| 国产成熟女人性满足视频| 日韩第九页| 午夜影院a级片| 无码中文字幕乱码免费2| 亚洲综合18p| 亚洲欧洲日韩综合| 色综合国产| 久一在线视频| 国产真实乱子伦精品视手机观看| 呦女精品网站| 中文字幕色在线| 亚洲侵犯无码网址在线观看| 永久免费精品视频| 亚洲一级毛片免费观看| 国产成人麻豆精品| 欧美天堂久久| 久久精品视频亚洲| 国产91色在线| 波多野结衣AV无码久久一区| 免费无码网站| 亚洲成人福利网站| 亚洲黄色成人| 亚洲国产成人久久精品软件| 91青青在线视频| a网站在线观看| 久久人妻系列无码一区| 亚洲国产成人综合精品2020|