999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Transformer的文本情感分析應用實踐

2021-09-27 02:43:51翟高粵高乾龍
客聯 2021年7期
關鍵詞:深度學習

翟高粵 高乾龍

摘 要:文本情感分析是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。本文先介紹文本情感分析的本質和任務,然后引入Transformer并進行其結構、原理和位置編碼概念介紹;最后對整個項目結構關鍵部分進行模塊分析和功能說明。

關鍵詞:深度學習;Transformer;文本情感分析;多頭注意力機制

自然語言處理NLP的一項重要處理就是情感分析Sentiment Analysis,它在社交內容的分析以及電商評論反饋分析中,都占有很高的分析價值。文本情感分析任務本質是自然語言序列的特征提取和基于特征的分類問題。相比于生成類NLP任務,文本情感分析任務的核心是自然語言特征的提取。文本特征提取一直是NLP主流的研究方向,從RNN到AutoEncoder再到BERT都是在特征提取方法上進行改進的。本文將Transformer的Encoder作為特征提取器,然后接上全連接的神經網絡進行分類擬合,根據擬合結果判斷情感傾向。接下來我們先介紹一下Transformer相關理論知識,以便能夠更好地理解模型結構的設計。

一、Transformer簡介

Transformer結構是谷歌在《Attention is all you need》論文中提出的。論文中提出的transformer這種新的結構,將其應用在機器翻譯的領域上,取得了很好的效果。自從Attention機制在提出之后,加入Attention的Seq2Seq模型在各個任務上都有了提升,所以現在的seq2seq模型指的都是結合rnn和attention的模型。但傳統(tǒng)的基于RNN的Seq2Seq模型難以處理長序列的句子,無法實現并行,并且面臨對齊的問題。

二、Transformer原理

(一)Transformer的基本結構

從設計結構上看,Transformer延續(xù)了Seq2Seq的Encoder-Decoder 結構:對輸入的數據進行Encoder編碼提取特征,然后將Encoder的輸出和標注數據一起輸入Decoder,最后計算字典內每個詞的出現概率,選取最大概率對應的詞作為最終輸出。在Transformer結構中, Feed Forward是前饋神經網絡層,其作用是將Multi-headAttention(多頭注意力)層輸出的數據進行非線性變換后輸出。其結構如圖1所示。

(二)多頭注意力機制

注意力機制由來已久,從結構特點來看大致分為軟注意力(Soft Attention)機制、硬注意力(Hard Attention)機制、全局注意力 (Global Attention)機制、局部注意力(Local Attention)機制和多頭注意力(Multi-head Attention)機制。這里重點介紹和Transformer結構密切相關的多頭注意力機制。

多頭注意力機制是在Attention Is All You Need論文中提出的,多頭注意力是由多個Scaled Dot-Product Attention(放縮點積注意力,點積是我們常用的計算相似度的方法之一,放縮指內積的大小是可控的)堆疊而得到的。與常見的注意力機制相比,放縮點積注意力機制主要是在相似計算和內積調節(jié)控制方面進行了改進。放縮點積注意力的計算過程大概是這樣的:首先計算每個Q與K矩陣的相似度,然后使用softmax對相似度向量進行歸一化處理得到 權重,最后將權重向量與V矩陣加權求和得到最終的attention值。Q與K的相似度計算過程是這樣的:首先使用MatMul函數計算Q和K的相似度(MatMul是一種點積函數)。為了能夠更好地控制計算 的復雜度,使用Scale函數對MatMul的計算結果進行縮放。

多頭注意力其實就是每一次放縮點積注意力的計算結果,那么計算多次就是多頭注意力。在每次計算時Q、K、V使用不同的參數進行線性變換,這樣雖然進行了多次放縮點積注意力的計算,但每次計算的結果是不同的。對輸入數據進行不同的線性變換操作是特征增強的一種手段,因為至少從理論上增加了有效特征,可以提高神經網絡模型的預測效果。

(三)位置編碼

在Transformer結構中沒有使用任何RNN或其變體結構,這樣Transformer就存在一個天然的缺陷:沒有辦法提取序列的位置順序特征。我們知道自然語言的數據是有時序性的,一個詞在句子中出現的 位置不同可以導致整個句子的意思完全不同。為了解決這個缺陷,在Transformer結構中使用了位置編碼(Positional Encoding)來提取各個詞的位置信息,并作為Encoder或Decoder的輸入。Transformer位置編碼的實現方式是:通過正余弦函數交替編碼提取位置信息,然后將所提取的每個詞的位置信息與每個詞的 Embedding輸出相加作為Encoder或Decoder的輸入。正弦函數編碼能夠更好地體現不同詞之間的位置關系,因為對于正弦函數來說,在一定的范圍內變化可以近似于線性變換。

三、項目工程結構設計

整個項目工程結構分為兩部分:文件夾和代碼文件,在編程實踐中建議采用文件夾和代碼文件的方式來設計項目工程結構。所謂的文件夾和代碼文件的方式是指把所有的Python代碼文件放在根目錄下,其他需要存放的靜態(tài)文件、訓練數據文件和模型文件等都放在文件夾中。

本項目分為五個部分:配置工具(getConfig.py)、數據預處理器(data_util.py)、神經網絡模型(textClassiferModel.py)、執(zhí)行器(execute.py)和應用程序(app.py)。配置工具提供通過配置文件來全局配置神經網絡超參數的功能;數據預處理器提供數據加載功能;神經網絡模型是由Transformer的Encoder部分和全連接神經網絡組成的網絡結構;執(zhí)行器提供保存訓練模型、預測模型等功能;應用程序是一個基于Flask的用于人機交互的簡單Web應用程序。在文件夾中,model_data存放訓練導出的模型文件;train_data存放訓練數據;web_templates存放HTML、JS等靜態(tài)文件。

(一)配置工具類實現

在實際的項目中,我們往往需要對參數進行頻繁的調整,因此可以定義一個工具類來讀取配置文件中的配置參數,這樣在調參時只需要對配置文件中的參數進行調整,即可實現對全部參數的調整。

(二)數據預處理實現

數據預處理中需要實現的功能比較多,包括word2num、字典的生成、輸入數據和標簽數據的處理、npz文件的保存等。

(三)神經網絡模型設計

在神經網絡模型實現中,根據實際需要我們只實現了Transformer的Encoder部分,把這部分的輸出作為對文本信息的提取輸入到一個全連接神經網絡中進行文本分類任務的訓練。

(四)執(zhí)行器實現

執(zhí)行器實現的是模型創(chuàng)建、訓練模型保存、模型加載和預測的功能,因此在編程實踐中我們定義了create_model、train和預測函數。

(五)WEB應用實現

Web應用主要完成頁面交互、圖像格式判斷、圖像上傳以及預測結果的返回展示。這里我們使用Flask這個輕量級Web應用框架來實現簡單的頁面交互和預測結果展示功能。

四、結論

Transformer是第一個用純attention搭建的模型,不僅計算速度更快,在翻譯任務上獲得了更好的結果,也為后續(xù)的BERT模型做了鋪墊。但也有一定的缺點,比如有些rnn輕易可以解決的問題transformer沒做到,例如復制string,或者推理時碰到的sequence長度比訓練時更長(因為碰到了沒見過的position embedding),總的來說Transformer結構是一個創(chuàng)新的結構,在大多數NLP處理方面表現非常優(yōu)秀。

參考文獻:

[1] 張冬瑜等.基于Transformer和BERT的名詞隱喻識別[J],數據分析與知識發(fā)現,2020(3).

[2] 張宇等.融入注意力機制的深度學習動作識別方法[J],電訊技術,2021(4).

[3] 閆濤. 深度學習算法實踐 [M]. 電子工業(yè)出版社出版社,2020.

[4] 王宇石等.一種基于卷積神經網絡的違禁品探測系統(tǒng)及部署方法[J],科技創(chuàng)新與應用,2020(7).

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 国产成人综合日韩精品无码不卡 | 欧美a在线看| 亚洲欧美自拍中文| 国产精品太粉嫩高中在线观看| 亚洲IV视频免费在线光看| 亚洲中文无码h在线观看| 午夜性爽视频男人的天堂| 91精品国产自产在线老师啪l| 国产精品无码久久久久久| 日韩性网站| 中文字幕永久视频| 亚洲乱码精品久久久久..| 尤物精品国产福利网站| 亚洲无码免费黄色网址| 欧美yw精品日本国产精品| 福利片91| 久青草国产高清在线视频| 一级毛片中文字幕| 国产极品粉嫩小泬免费看| 国产成人福利在线| 91在线免费公开视频| av尤物免费在线观看| 狠狠色婷婷丁香综合久久韩国 | 91青青视频| 无码精品福利一区二区三区| 国产xx在线观看| 天天干天天色综合网| 欧美a√在线| 天天干天天色综合网| 午夜免费视频网站| 制服丝袜在线视频香蕉| 精品少妇人妻av无码久久| 亚洲av中文无码乱人伦在线r| 国产精品三级专区| 亚洲精品你懂的| 麻豆国产精品| 亚洲手机在线| 欧美在线视频不卡第一页| 一级毛片无毒不卡直接观看| 在线观看亚洲国产| 日韩欧美中文在线| 久久国产精品影院| 毛片手机在线看| 四虎成人免费毛片| 天天摸天天操免费播放小视频| 91精品小视频| 亚洲品质国产精品无码| 欧美亚洲国产视频| 国产成人精品一区二区不卡| 国产成人免费手机在线观看视频| 成人免费黄色小视频| 欧美激情综合一区二区| 欧美亚洲另类在线观看| 丁香五月激情图片| 喷潮白浆直流在线播放| 欧美成人a∨视频免费观看| 色婷婷视频在线| 性喷潮久久久久久久久| 国产香蕉在线视频| 国产99精品视频| 99热亚洲精品6码| 亚洲天堂视频在线观看免费| 亚洲av中文无码乱人伦在线r| 日韩无码黄色| 99ri精品视频在线观看播放| 欧美日韩高清在线| 国产aaaaa一级毛片| 最近最新中文字幕在线第一页| 91青青草视频在线观看的| 欧美色丁香| 亚洲无码高清视频在线观看| 激情成人综合网| 国产精品区视频中文字幕| 亚洲一区二区三区麻豆| 久久国产高清视频| 54pao国产成人免费视频| 国产另类视频| 伊人五月丁香综合AⅤ| 免费在线视频a| 国产一二三区视频| 青青草综合网| 亚洲天堂首页|