999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

卷積神經網絡語言模型研究

2017-03-16 09:48:22田曉艷
科技創新與應用 2017年5期
關鍵詞:分析

田曉艷

摘 要:卷積神經網絡在自然語言處理中的應用是近年的研究熱點。文章通過對幾項典型工作的分析,研究了卷積神經網絡在各項自然語言處理任務中的性能與效果。并對卷積神經網絡語言模型的改進規律進行了總結。

關鍵詞:卷積神經網絡;語言模型;分析

1 卷積神經網絡語言模型

CNN語言模型基本結構包括輸入層、卷積層、池化層及后續的分類層。輸入層是表示語言的矩陣,該矩陣可以是通過Google word2vec或GloVe預訓練得到的詞嵌入表示,也可以是從原始數據重新訓練的語言的向量表示。輸入層之后是通過線性濾波器對輸入矩陣進行卷積操作的卷積層。在NLP問題中,輸入矩陣總是帶有固定順序的結構,因為矩陣的每一行都表示離散的符號,例如單詞或者詞組等。因此,使用等寬的濾波器是非常合理的設置。在這種設置下,僅需要考慮濾波器的高度既可以實現不同尺寸的濾波器做卷積操作。由此可知,在處理NLP問題時,卷積神經網絡的濾波器尺寸一般都是指濾波器的高度。

然后,將卷積層輸出的特征映射輸入池化層,通過池化函數為特征映射進行降維并且減少了待估計參數規模。一般的,CNN池化操作采用1-max池化函數。該函數能夠將輸入的特征映射統一生成維度相同的新映射。通過池化操作,可以將卷積層生成的特征連接成更抽象的高級特征,所得到的高級特征尺寸與輸入的句子不再存在直接關系。

最后,將得到的高級特征輸入softmax分類層進行分類操作。在softmax層,可以選擇應用dropout策略作為正則化手段,該方法是隨機地將向量中的一些值設置為0。另外還可以選擇增加l2范數約束,l2范數約束是指當它超過該值時,將向量的l2范數縮放到指定閾值。在訓練期間,要最小化的目標是分類的交叉熵損失,要估計的參數包括濾波器的權重向量,激活函數中的偏置項以及softmax函數的權重向量。

2 卷積神經網絡語言模型應用分析

CNN語言模型已經廣泛應用于諸如文本分類,關系挖掘以及個性化推薦等NLP任務,下面將對這些應用進行具體的介紹與分析。

2.1 CNN在文本分類中的應用分析

kim提出了利用CNN進行句子分類的方法。該方法涉及了較小規模的參數,并采用靜態通道的CNN實現了效果很優異的句子分類方法。通過對輸入向量的調整,進一步提高了性能實現了包括情感極性分析以及話題分類的任務。在其基礎上為輸入的詞嵌入設計了兩種通道,一種是靜態通道,另一種是動態通道。在卷積層每一個濾波器都通過靜態與動態兩種通道進行計算,然后將計算結果進行拼接。在池化層采用dropout正則化策略,并對權值向量進行l2約束。最后將該算法應用于MR、SST-1與SST-2、Subj、TREC、CR以及MPQA等數據集。MR數據集為電影評論數據集,內容為一句話的電影評論,其分類包括積極情感極性與消極情感極性兩類。SST-1與SST-2數據集為斯坦福情感樹庫是MR數據集的擴展,但該數據集已經劃分好了訓練集、驗證集及測試集并給出了細粒度的標記,標記包括非常積極、積極、中性、消極、非常消極等情感極性。Subj數據集為主觀性數據集,其分類任務是將句子分為主觀句與客觀句兩類。TREC數據集為問題數據集,其分類任務是將所有問題分為六類,例如關于數字、人物或位置等信息的問題。CR數據集為評論數據集,包括客戶對MP3、照相機等數碼產品的評論,其分類任務是將其分為積極評價與消極評價兩類。MPQA數據集是意見極性檢測任務數據集。通過實驗證明,該方法在這幾個典型數據集上都能取得非常優異的效果。

2.2 CNN在關系挖掘中的應用分析

Shen等人提出了一種新的潛在語義模型,以詞序列作為輸入,利用卷積-池化結構為搜索查詢和Web文檔學習低維語義向量表示。為了在網絡查詢或網絡文本中捕捉上下文結構,通過輸入單詞序列上下文時間窗口中的每個單詞來獲取詞匯級的n-gram語法特征,將這些特征聚合成句子級特征向量。最后,應用非線性變換來提取高級語義信息以生成用于全文字符串的連續向量表示。該模型的不同之處在于,輸入層與卷積層之間加入了word-n-gram層與letter-trigram層,它們能夠將輸入的詞序列轉變為letter-trigram表示向量。在卷積層通過上下文特征窗口發現相鄰單詞的位置特征,并變現為n-gram形式。然后通過max池化將word-n-gram特征合并為句子級的高級特征。在池化層之后增加了語義層來提取更高級的語義表示向量。

2.3 CNN在個性化推薦中的應用分析

Weston等人提出了一種能夠利用標簽(hashtag)有監督的學習網絡帖子短文本特征表示的卷積嵌入模型(Convolutional Embedding Model)。該方法利用提出的CNN模型在55億詞的大數據文本上通過預標注的100,000標簽進行訓練。該方法除了標簽預測任務本身能取得好的效果外,學習到的特征對于其它的文本表示任務也能起到非常有效的作用。該模型與其它的詞嵌入模型類似,輸入層為表示文本的矩陣,但是,在用查找表表示輸入文本的同時將標簽也使用查找表來表示。對于給定的文檔利用10萬條最頻繁出現的標簽通過評分函數對任何給定的主題標簽進行排序。

其中,econv(w)表示CNN的輸入文檔,elt(t)是候選標簽t的詞嵌入表示。因此,通過對分數f(w,t)進行排序可以獲取所有候選主題標簽中排序第一的話題進行推薦。實驗數據集采用了兩個大規模語料集,均來自流行的社交網絡文本并帶有標簽。第一個數據集稱作people數據集,包括搜集自社交網絡的2億1000萬條文本,共含有55億單詞。第二個數據集被稱作pages,包括3530萬條社交網絡文本,共含有16億單詞,內容包括企業、名人、品牌或產品。

3 結束語

卷積神經網絡應用于語言模型已經取得了非常大的發展,對于自然語言處理中的各項任務均取得了優異的結果。本文通過對幾項典型工作的分析,探討了不同卷積神經網絡模型結構在不同任務中的表現。通過綜合分析可以得出以下結論。首先,CNN的輸入采用原始數據訓練的向量表示一般效果會優于預訓練的詞嵌入表示;其次,在卷積層濾波器的尺寸一般采用寬度與輸入矩陣寬度相等的設置;最后,為了優化結果可以采用dropout正則化處理。

參考文獻

[1]Graves A, Mohamed A R, Hinton G. Speech recognition with deep recurrent neural networks[J].2013,38(2003):6645-6649.

猜你喜歡
分析
禽大腸桿菌病的分析、診斷和防治
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
經濟危機下的均衡與非均衡分析
對計劃生育必要性以及其貫徹實施的分析
現代農業(2016年5期)2016-02-28 18:42:46
GB/T 7714-2015 與GB/T 7714-2005對比分析
出版與印刷(2016年3期)2016-02-02 01:20:11
中西醫結合治療抑郁癥100例分析
偽造有價證券罪立法比較分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 91精选国产大片| 亚洲三级片在线看| 久久综合一个色综合网| 经典三级久久| 精品亚洲麻豆1区2区3区| 伊人久久精品无码麻豆精品 | 免费一级毛片在线观看| 久久人人97超碰人人澡爱香蕉| 国产91在线|日本| 欧美一级在线| 99re免费视频| 国产精品理论片| jijzzizz老师出水喷水喷出| 女人18一级毛片免费观看| 国产SUV精品一区二区6| 真实国产精品vr专区| 亚洲免费播放| 国产拍揄自揄精品视频网站| 成人国产一区二区三区| 白浆视频在线观看| 国产女人在线| 中文字幕无码av专区久久| 亚洲手机在线| 欧美在线导航| 国产鲁鲁视频在线观看| 毛片久久久| 国产一区二区三区日韩精品| 国产精品欧美激情| 在线播放91| 亚洲无码精品在线播放| 精品人妻AV区| 中文字幕第1页在线播| 自拍中文字幕| 色有码无码视频| 成年片色大黄全免费网站久久| 亚洲欧美日韩精品专区| 亚洲欧美国产视频| 亚洲日本一本dvd高清| 日韩av资源在线| 高清欧美性猛交XXXX黑人猛交| 亚洲日本中文综合在线| 九色综合视频网| yjizz视频最新网站在线| 亚洲永久精品ww47国产| 午夜综合网| a级高清毛片| 精品亚洲欧美中文字幕在线看| 婷婷综合在线观看丁香| 久久综合九九亚洲一区| 国产91av在线| 免费网站成人亚洲| 亚洲国产一成久久精品国产成人综合| 久久国产精品国产自线拍| 亚洲二区视频| 一区二区自拍| 综合久久久久久久综合网| 日韩精品一区二区三区视频免费看| 极品尤物av美乳在线观看| 国产97区一区二区三区无码| 国产99久久亚洲综合精品西瓜tv| 天天摸夜夜操| 第九色区aⅴ天堂久久香| 综合五月天网| 毛片视频网| 成人va亚洲va欧美天堂| 波多野结衣在线一区二区| 国产成人精品2021欧美日韩 | 精品久久高清| 成人午夜网址| 欧美一区二区三区国产精品| 亚洲无码高清一区二区| 久久久久青草大香线综合精品| 54pao国产成人免费视频| 久久久久青草大香线综合精品| 四虎影视无码永久免费观看| 中文字幕无线码一区| 香蕉在线视频网站| 伊人久久婷婷五月综合97色 | 狂欢视频在线观看不卡| 欧美亚洲欧美区| 国产在线视频欧美亚综合| 日韩国产综合精选|