999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在調優(yōu)NLP模型時使用J-K-fold交叉驗證來減少方差

2019-03-25 08:01:52吉祥飛李明東
電腦知識與技術 2019年3期

吉祥飛 李明東

摘要:K-fold交叉驗證(CV)是估計機器學習模型真實性能的常用方法。CV的過程需要數據的隨機劃分,因此性能評估實際上是隨機的,具有可變性,這對于自然語言處理任務是非常重要的。所以建議使用較少變化的J-K-fold CV,其中J個獨立的K-fold交叉驗證用于評估性能。實驗結果表明,通過重復的J-K-fold交叉驗證進行調優(yōu)能減少方差。

關鍵詞:J-K-fold交叉驗證;自然語言處理;調優(yōu)

中圖分類號:TP393? ? ? ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2019)03-0008-02

近年來,機器學習的主要關注點一直是模型性能。需要精確地預測模型在實際應用時的表現,即預測或泛化誤差;模型從其訓練集中泛化的能力。模型性能的精確估計對于模型之間的選擇和最優(yōu)模型參數的選擇至關重要。對用于訓練模型的相同數據進行預測誤差的估計會導致對預測誤差的嚴重低估,這是不明智的。簡單的替代方法是將數據隨機分成訓練和測試集,或訓練、驗證和測試集,使用訓練集訓練的模型,對驗證集和測試集上的性能進行調優(yōu),以報告擬合模型的性能。更復雜的方法是基于重新采樣和更有效地利用數據;包括bootstrapping[1]和K-fold交叉驗證(CV)[2]。由于bootstrapping具有很高的計算成本,并且容易低估預測誤差,因此通常將CV作為估計預測誤差的默認方法。

每一種評估方法都涉及對數據進行一個或多個隨機分區(qū)。數據的這種隨機分離導致了我們的預測估計值的變化,我們將其定義為內部變化。雖然之前討論過這種內部可變性[3][4],但是對于這個問題的數據集和模型的理解是很差的。由于模型只訓練在一個子集上,所以它不能達到像訪問所有數據那樣的高性能。Zhang和Yang[5]認為,評估性能、模型選擇和參數調優(yōu)對估計量的偏差和方差有不同的要求。特別是,只要偏差在不同的模型/參數之間近似恒定,對所選模型的影響就很小。如果我們估計的方差超過了模型性能的實際差異,我們就不能區(qū)分參數和噪聲之間的差異。降低交叉驗證的內部方差是本文的重點。

1 通過重復的J-K-fold交叉驗證進行調優(yōu)

僅考慮一個分區(qū)不能提供關于性能評估中存在的可變性的數量的信息。我們必須查看由1000個不同分區(qū)選項產生的調優(yōu)模型。這種觀察激發(fā)了重復K-fold CV的使用,也稱為J-K-fold CV;K-fold CV估計值的平均值來自J不同的分區(qū)選擇。實驗證明,重復的CV降低了內部的變異性,從而穩(wěn)定了預測誤差,特別是對于較小的數據集。我們可以單獨考慮K和J的選擇。K增加以減少偏差,而J減少內部變化。有效的參數調優(yōu)對方差比對偏差更敏感。因此,在我們的調優(yōu)能夠從減少的偏差中獲益之前,我們首先需要減少內部的可變性。

我們考慮使用LSTM在Li[6]收集的基準twitter數據集中使用特定于twitter的情緒詞向量來執(zhí)行目標依賴情緒分類。6248個句子中的每一個都帶有一個目標元素,任務是預測該元素的情緒(積極的、消極的或中性的)。在這些實驗中,我們將最大的時間間隔固定為100,當我們發(fā)現5個連續(xù)時間的驗證集性能沒有改善時,就停止訓練。對于每個J?K模型,驗證集是模型訓練數據的隨機20%,因此可以認為只是一個隨機分區(qū)的一部分。我們使用具有默認學習參數的ADAM優(yōu)化器,批處理大小為32。

我們進行了兩個實驗: 在網格{10、20、30、90}中對LSTM層(稱為寬度)的節(jié)點數進行調優(yōu),并分別在{0.00001,0.001,0.1}調優(yōu)輸入和偏差(固定寬度為50)的L2正則化量。如圖1(a)所示,普通1-10-fold CV根本不適合調優(yōu)LSTM的寬度,因為它在30到90之間生成幾乎一致的值。它也沒有一致地為正則化方案選擇單一選項(圖1(b))。相比之下,使用8-5-fold調優(yōu)會產生更一致的選擇,大多數時間選擇70作為最佳寬度(圖1(a)),0.001作為輸入和偏差正則化(圖1(c))。雖然我們所選擇的LSTM參數中的可變性隨著J的增加而減少,但它仍然顯著高于我們的參數網格中的間隙。再加上此調優(yōu)模型的精度估計的相對穩(wěn)定性,這表明8-5-fold CV最常見的選擇之間的性能差異很小。然而,為了持續(xù)地調整模型以適應這種特性,我們需要更大的J而不僅僅是J=8。

2 討論和結論

本文提倡使用J-K-fold CV,擴展到參數調優(yōu)。通過使用來自多重估計的信息,穩(wěn)定了我們的調優(yōu)過程。為了抵消增加J的計算成本,建議降低K的選擇,因為有效的調優(yōu)更依賴于變化性而不是偏差。

雖然已經在NLP示例中展示了一些特定的J和K選項的有效性,但是在選擇它們的最優(yōu)配置方面還有很多工作要做,這是與問題相關的。我們還想分析目前常見的提前停止的做法,這需要對另一保留數據集進行評估,以防止過度擬合。

參考文獻:

[1] Bradley Efron and Robert J Tibshirani. An Introduction to the Bootstrap[M]. CRC press, 1994.

[2] Ron Kohavi. A study of cross-validation and bootstrap for accuracy estimation and model selection[C].International Joint Conference on Artificial Intelligence, 1995(14):1137-1145.

[3] Gaoxia Jiang and Wenjian Wang. Error estimation based on variance analysis of k-fold cross-validation[J].Pattern Recognition, 2017(69):94-106.

[4] YoshuaBengio and Yves Grandvalet. No unbiased estimator of the variance of k-fold cross-validation[J].Journal of Machine Learning Research, 2004(5):1089–1105.

[5] Yongli Zhang and Yuhong Yang. Cross-validation for selecting a model selection procedure[J].Journal of Econometrics, 2015(187):95-112.

[6] Li Dong, Furu Wei, Chuanqi Tan, Duyu Tang, Ming Zhou, Ke Xu. Adaptive recursive neural network for target-dependent twitter sentiment classification[C].Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), 2014(2):49-54.

【通聯(lián)編輯:代影】

主站蜘蛛池模板: 亚洲精品无码在线播放网站| 国产综合在线观看视频| 欧美成人第一页| 国产精品七七在线播放| 国产中文在线亚洲精品官网| 亚洲视频黄| 九九九精品成人免费视频7| 欧美高清日韩| 日本黄色不卡视频| 亚洲欧美精品在线| 亚洲自拍另类| 国产精品亚洲综合久久小说| 免费看一级毛片波多结衣| 最新亚洲人成无码网站欣赏网| 露脸一二三区国语对白| 夜夜爽免费视频| 视频二区欧美| 99无码中文字幕视频| av天堂最新版在线| 色哟哟国产精品一区二区| 97综合久久| 成人蜜桃网| 色偷偷av男人的天堂不卡| 在线国产91| 久久99国产精品成人欧美| 亚洲最新在线| 午夜视频免费试看| 国产微拍一区| 亚洲成人免费在线| 国产区成人精品视频| 亚洲成人在线免费观看| 欧美亚洲另类在线观看| 最新无码专区超级碰碰碰| 2020精品极品国产色在线观看| 亚洲精品天堂自在久久77| 亚洲中文精品久久久久久不卡| 亚洲成AV人手机在线观看网站| 国产精品久久久久鬼色| 国产精品永久久久久| 亚洲欧美成人综合| 在线精品自拍| 99免费视频观看| 欧美日韩国产在线人| 国产一二三区在线| 4虎影视国产在线观看精品| 波多野结衣视频一区二区 | 中国特黄美女一级视频| 夜精品a一区二区三区| 亚洲精品国产日韩无码AV永久免费网 | 亚洲VA中文字幕| 亚洲综合色吧| 久久国产亚洲偷自| 色综合久久88色综合天天提莫| 无码aaa视频| 玖玖免费视频在线观看| 久久国产高潮流白浆免费观看| 欧美中文字幕一区| 亚洲第一区在线| 国产欧美中文字幕| 一区二区三区四区日韩| 毛片视频网址| 亚洲日本中文综合在线| 国产精品亚洲αv天堂无码| 91口爆吞精国产对白第三集| 高清久久精品亚洲日韩Av| 欧美一区二区三区国产精品| 成人无码一区二区三区视频在线观看 | 欧美日韩免费| 日本精品视频一区二区| 色噜噜狠狠色综合网图区| 日韩中文字幕免费在线观看| 无码国产偷倩在线播放老年人| 亚洲无码视频喷水| 国产va在线| 亚洲欧美日韩中文字幕在线| 欧美精品一区在线看| 亚洲精品第一页不卡| 高清无码手机在线观看| 国产玖玖玖精品视频| 女人一级毛片| 国内精品91| 99成人在线观看|