999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用深度學習對托福聽力部分進行機器理解

2021-01-28 03:35:42胡蓉田時宇
微型電腦應用 2021年1期
關鍵詞:模型

胡蓉, 田時宇

(湖南信息學院 通識教育學院, 湖南 長沙 410151)

0 引言

隨著共享視頻、社交網絡和在線課程等的普及,多媒體或音頻內容的數量增長速度遠遠快于人們可以觀看或收聽的內容。用戶可以輕松地瀏覽文本,但音頻內容則不是這樣,因為它們不能直接顯示在屏幕上,因此,訪問大量的多媒體或音頻內容對人類來說是困難和耗時的。因此,利用機器實現自動理解語音內容,并為人類提取甚至可視化關鍵信息是非常必要的。盡管文本和視覺內容的機器理解已經得到了廣泛的研究,但是口語內容的機器理解仍然是一個研究較少的問題[1-2]。因此本文對口語內容的機器理解進行了初步嘗試。

本文以托福考試為研究目標,針對托福考試中的聽力部分,利用深度學習進行機器理解。本研究提出了一種新的框架TAL,利用基于注意力的Tree-LSTM來構造考慮詞序的句子表示[3]。本文利用自然語言的層次結構和注意機制的選擇能力,證明了該模型優于樸素方法和其他基于神經網絡的模型。

1 對聽力的機器理解

1.1 系統架構

TAL網絡架構,如圖1所示。

由圖1可知,模型中有兩個關鍵模塊:第一個是Tree-LSTM[4],它將句子編碼成連續的表示形式,由依賴解析器提供層次結構,而不是簡單的順序結構,因此它利用了人類語言的內在屬性;第二個關鍵模塊是注意模塊(attention module)。在接下來的實驗中,發現將這兩個模塊結合在一起比以前僅使用Tree-LSTM和注意力機制(attention mechanism)更為出色。

模型不同組件的詳細信息如下所示。在圖1的左側,基于Tree-LSTM的句子表示模塊用于根據問題的單詞序列生成問題向量的表示;ASR系統轉錄音頻故事,圖1底部的故事模塊以ASR轉錄本為輸入,將轉錄本中的句子轉換成一個向量序列,每個向量代表一個短語或一個句子;注意力模塊在中間,注意機制可以應用多次。在圖的右側,這四個選項也由句子表示模塊表示為向量。最后,評估答案選擇的置信度得分,并生成答案。系統是端到端學習的,除了ASR模塊。

1.2 句子表征

句子表示模塊的目標是通過捕獲句子語義的向量來表示句子。輸入問題Q和選擇C都是一個單詞組成的序列。在句子表示模塊中,問題Q表示為向量VQ0,選擇C表示為VC。一個問題可以由多個句子Si組成,每個句子首先可以表示為VSi。那么問題向量VQ是問題中所有Si的VSi之和。使用遞歸神經網絡Tree-LSTM獲得句子表示。Tree-LSTM基于其子節點的向量表示為依賴樹中的每個節點生成向量表示。

圖1 TAL網絡架構

1.3 故事表征

故事抄寫是一個很長的單詞序列,有很多句子。故事模塊的目標是將單詞序列表示為一組向量表示O={o1,o2,…,ot},其中ot表示Tree-LSTM的短語或句子。

短語層次:O={o1,o2,…,ot}中,每個ot是句子的Tree-LSTM中節點的隱藏狀態,或者每個ot表示一個短語。因此,t大于故事中的句子數。

句子層次:每一個ot是故事中某個句子上Tree-LSTM的根節點的隱藏狀態,或者每一個ot代表一個句子。在這種情況下,t等于句子數。

1.4 注意力機制

存儲模塊基于從故事模塊獲得的表示來提取故事中與問題VQ相關的信息。設O={o1,o2,…,ot}為故事的向量表示集。集合O中的向量首先由嵌入矩陣W(m)和W(c)轉換成記憶向量M={m1,m2,…,mt}和證據向量C={c1,c2,…,ct},如式(1)。

(1)

(2)

(3)

式中,⊙表示余弦相似性。每個注意權重αt對應于一個證據向量ct。故事向量Vs是以注意力為權重的證據向量ct的加權和,如式(4)。

(4)

式中,Vs可以看作是從音頻故事中提取的與查詢相關的信息。

1.5 多跳

在圖1的左側,首先使用句子表示模塊將輸入問題轉換為問題向量VQ0。該VQ0用于計算注意值αt以獲得故事向量VS1。然后將VQ0和VS1相加形成新的問題向量VQ1。在圖1中,該處理是第一跳(1跳)。第一跳VQ1的輸出可用于計算新的注意以獲得新的故事向量VS1。這可以被看作是機器再次遍歷故事,用一個新的問題向量重新聚焦故事。再次,VQ1和VS1相加形成VQ2(2跳)。在n跳(n是預定義的)之后,最后一跳VQn的輸出將用于下一小節中的答案選擇。

1.6 應答模塊

(5)

2 實驗與評估

2.1 實驗設置

對于聽力評估使用了預訓練的300維GloVe矢量模型[5],以獲得每個單詞的矢量表示。為了減少詞匯量,在這里使用了斯坦福大學自然語言處理小組[6]的工具來對問題選擇和故事抄寫中的單詞進行詞素化。在訓練之前,刪減了故事中的那些話語,這些話語的矢量表示與問題之間的余弦距離很遠,刪減話語的百分比由開發集上模型的性能決定。

2.2 結果與評估

對于前文描述的模型,前向和后向GRU網絡的隱藏層的大小都是128。為了避免過度擬合,模型中的所有雙向GRU網絡和樹LSTM共享同一組參數。使用RmsProp[7],初始學習率為1e-5,動量為0.9。輟學率為0.2。Tree-LSTM的隱藏層大小和內存模塊的嵌入大小均為75。使用AdaGrad[8],初始學習率為0.002。梯度裁剪的閾值為20,批量大小為40,使用開發集將跳數從1調整到3。

使用準確性(正確回答的問題的百分比)作為評估指標。在訓練集的故事和問題/答案的手動轉錄上對模型進行了訓練,并在測試集(Manual)和ASR轉錄(ASR)上進行了測試,為了進行公平的比較,統計了10次運行的平均準確度和標準差,如表1所示。

表1 不同方法比較結果

本文提出的TAL分別用于1跳和2跳的短語/句子級的注意力模型,其準確度比其他方法都要高很多。1跳句子級注意力模型在manual中的平均準確率最高,達到49.2%,顯著高于其他方法的結果;2跳短語級注意模型在ASR結果中的平均準確率最高,達到48.9%,僅略低于1跳。還可以觀察到,增加跳數會提高短語級注意的表現,但不會提高句子級注意的表現,這可能是因為對于短語級推理,模型首先在1跳中選擇關鍵短語,然后在2跳中根據這些關鍵短語改變其注意力。對于句子級推理,在1跳中只選擇了幾個關鍵句子,而更多的跳則無法找到額外的關鍵句子。

令人驚訝的是,ASR錯誤對聽力理解的影響很小。為了進一步分析結果,進行了額外的實驗。在測試階段,用一個概率為34.3%(與WER相同)的隨機詞替換了manual中的每個詞。結果顯示在標有隨機的列中。通過比較ASR和隨即兩欄的結果,我們發現ASR錯誤對聽力理解準確性的影響小于隨即替換,如表2所示。

表2 ASR和隨機的結果

3 總結

在本文中,提出了兩個與語音內容的機器理解有關的目標——托福聽力和口語理解。在托福聽力理解中,提出的TAL框架在樹狀結構的LSTM網絡中結合了多跳注意力機制,其準確性為48.8%;在對口語理解中,利用CNN網絡改進現有的模型,證明了ASR錯誤會大大降低閱讀理解模型的性能,并建議使用不同種類的子字單元來減輕這些錯誤的影響。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 999精品免费视频| 在线精品自拍| 国产精品福利社| 伊人成色综合网| 国产精品30p| 伊人精品成人久久综合| 久久国产精品嫖妓| 中日韩一区二区三区中文免费视频 | 成年A级毛片| 囯产av无码片毛片一级| 国产sm重味一区二区三区| 日韩成人高清无码| 啪啪啪亚洲无码| 国产精品视频猛进猛出| 国产精品久久久久无码网站| 亚洲欧洲日产国产无码AV| 午夜成人在线视频| 综合网久久| 免费人欧美成又黄又爽的视频| 亚洲a免费| 午夜在线不卡| 国产第四页| 婷婷亚洲天堂| 最新精品久久精品| 91视频国产高清| 9999在线视频| 欧美日韩国产精品va| 国产精品亚洲五月天高清| 免费三A级毛片视频| 久久久成年黄色视频| 欧美不卡视频在线观看| 国产精品尤物在线| 香蕉伊思人视频| 中文字幕一区二区视频| 久久久久免费看成人影片| 精品精品国产高清A毛片| 蜜芽国产尤物av尤物在线看| 国内精品免费| 一级成人a做片免费| 久久免费视频6| 亚洲va在线观看| 亚洲第一极品精品无码| 无码精品国产dvd在线观看9久| 超薄丝袜足j国产在线视频| 91国内外精品自在线播放| 成年午夜精品久久精品| 亚洲日韩AV无码一区二区三区人| 国产成人AV综合久久| 免费在线看黄网址| 人人艹人人爽| 国产偷国产偷在线高清| 国产国模一区二区三区四区| 免费Aⅴ片在线观看蜜芽Tⅴ| 日韩精品久久久久久久电影蜜臀| 思思99热精品在线| 国产粉嫩粉嫩的18在线播放91 | 国产第一页亚洲| 国产精品视频猛进猛出| 国产一级特黄aa级特黄裸毛片| 亚洲an第二区国产精品| 免费人成又黄又爽的视频网站| 18禁黄无遮挡免费动漫网站| 久久福利片| 在线欧美日韩国产| 久久五月视频| 国产91全国探花系列在线播放| 97se亚洲综合在线天天| 国产SUV精品一区二区6| 久久精品国产999大香线焦| 国产第二十一页| 国内黄色精品| 青青草国产一区二区三区| 久草热视频在线| 国产成人无码综合亚洲日韩不卡| 亚洲高清在线天堂精品| 中文字幕永久视频| AV不卡国产在线观看| 毛片网站在线看| 日韩av手机在线| 欧美一区中文字幕| 超碰免费91| 激情综合五月网|