999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于生成對抗網絡的情感語義描述與生成*

2022-11-09 07:27:46劉仲民周志亮
艦船電子工程 2022年8期
關鍵詞:語義單詞機制

劉仲民 周志亮

(蘭州理工大學電氣工程與信息工程學院 蘭州 730050)

1 引言

圖像語義描述[1~2]是涉及計算機視覺[3]與自然語言處理[4]的交叉學科,具體任務是指讓計算機識別圖像中包含的信息,并將該信息用文本語言描述出來。該學科是許多重要應用的基礎,如幫助視障人士感知周圍環境,使人機交互更加智能化等。

早期的圖像語義描述主要使用基于檢索的方法和基于模板的方法,主要代表有Ordonez等[5]和Kulkarni等[6]提出的方法。

隨著人工智能的發展,深度學習的優越性也逐漸展現出來,使圖像描述進入一個嶄新的階段。Vinyals等[7]提出了谷歌神經圖像描述模型(Neural Image Caption,NIC)做文本描述,在編碼階段采用Google Net,解碼階段采用長短期記憶模型(Long Short-Term Memory,LSTM),取得了不錯的效果。此后圖像語義描述基本都圍繞編解碼框架展開。后來隨著注意力機制的出現,被廣泛應用在神經網絡之中。在圖像描述中主要代表有Xu等[8]和Li等[9]提出的方法。

雖然編解碼框架被廣泛應用于圖像描述,但是這種方法容易產生梯度爆炸和梯度消失的問題。而且在解碼階段生成語句使用的方法為最大似然估計法,下一個生成的單詞依靠前一個單詞,容易產生偏差,如果前一個單詞產生一個偏差,那么會累積到下一個單詞上,通過不斷累積,那么最后生成的單詞越來越差。而基于生成對抗網絡的圖像語義描述很好的解決了上述問題。Dai等[10]提出Conditional GAN模型,通過對初始化生成器LSTM隱藏層向量方差的控制,對圖像生成多個描述。Shetty等[11]也將Conditional GAN用在圖像描述中,在輸入項中增加了目標檢測的特征,使用。Zhang等[12]提出兩個GAN組成的網絡,其中一個用來繪出背景的分布,產生一個圖像,另外一個用來結合描述語句。

綜上所述,目前對于語義豐富性的研究仍在早期階段,雖然生成對抗網絡已經應用到了圖像描述中,但是豐富性和準確性還有待提升。基于此,本文使用生成對抗網絡來搭建圖像描述模型,為了使生成圖像的語句更加具有豐富性,在其中加入語料庫Senticap[13]來訓練模型;為了使提取圖像特征更加充分,加入注意力機制模型。

2 圖像的語義描述模型

為了建立圖像語義描述模型,采用圖1所示結構,主要包括生成器和判別器兩個部分,其中生成器用來生成描述語句,用來欺騙判別器;判別器用來判斷該描述語句是真實的還是虛假的,同時也會輸出一個0~1之間的評分,該評分還會作為獎勵輸出到生成器,激勵生成器繼續訓練。

圖1 基于生成對抗網絡的結構圖

2.1 生成器部分

生成器部分主要用來生成描述語句,該描述語句會在判別器網絡中進行判別,本文中生成器部分主要包括特征提取部分、注意力機制以及LSTM部分。生成器部分如圖2所示。

圖2 生成器部分

2.1.1 特征提取

目前提取圖像特征最重要的工具之一是深度卷積神經網絡,其中ResNet(Residual Neural Network)在ILSVRC2015比賽中取得冠軍,在top5上的錯誤率僅為3.57%,同時參數量比VGGNet低,效果非常突出。ResNet的結構可以極快的加速神經網絡的訓練,模型的準確率也有較大提升。因此本文使用ResNet101作為圖像的特征提取網絡。

2.1.2 注意力機制

盡管神經網絡在圖像處理方面有很大的優勢,但是在特征提取方面無法區分特別關注點和一般關注點,對于一些需要重點去關注的對象和區域,應該盡可能的去保留其特征。注意力機制很好的解決了該問題,傳統的注意力機制只考慮了通道方面或者空間方面,因此本文使用卷積塊注意力機制模型 (Convolutional Block Attention Module,CBAM),該方法很好地將通道注意力機制和空間注意力機制進行了融合,模型結構如圖3所示。

圖3 注意力機制模型

通道注意力機制如式(1)所示,其中MLP(MultiLayer Perceptron)表示多層感知機,AvgPool表示平均池化,MaxPool表示最大池化,σ表示激活函數,W1和W0表示兩層卷積層??臻g注意力模型如式(2)所示,將通道注意力機制生成的特征圖作為空間注意力模型的輸入,將該特征圖進行平均池化和最大池化,然后進行通道拼接,再經過7*7卷積操作和激活函數激活,最后生成輸出模型。

2.1.3 LSTM部分

經過注意力機制處理后的圖像特征向量如式(3),vi是圖像特征向量中某一位置的圖像特征,其中i={1,2,…,n};n代表圖像特征的個數。

該圖像特征向量將會送到LSTM編碼部分并學習序列之間的相關性,然后在編碼LSTM中運用極大似然估計法,對每個可能出現的單詞的概率進行預測,概率最大的單詞則被索引到下一個LSTM中。計算過程如式(4)和(5)所示。其中c0和h0是初始化的網絡輸入值,finit,c和finit,h為單層感知機計算函數,vi代表圖像的特征,n則代表圖像特征的個數。

在LSTM解碼部分,輸入填充的情感語句并且進行學習,引導LSTM生成帶有情感色彩的描述語句。在LSTM解碼部分將編碼LSTM的輸出、上下文向量、先前生成的單詞等進行相加,最后得到一個關于情感描述語句單詞的輸出。

2.2 判別器部分

判別器部分的主要作用是將生成器部分的生成語句進行判別,并反饋一個獎勵值給生成器,該值介于0~1之間,越接近0,證明生成語句越虛假,越偏離真實語句;越接近1,證明生成語句越接近真實語句,描述效果較好。

目前卷積神經網絡在建模時普遍存在參數多,網絡層數深,缺少局部的等變特性,隨著網絡層數的增多也會出現泛化能力降低的問題,基于此本文在判別器中用膠囊網絡(Capsule Networks)對句子進行重構和概率預測,重構后的句子與圖像在語義上一致,該網絡有助于對特征之間的關系進行編碼。重構完的句子會在判別器的作用下生成獎勵值,并反饋給生成器。

3 實驗設置

3.1 數據集

數據集采用 MS COCO[14]數據集,該數據集的每個圖像至少有五個標題。實驗中,以標簽中最長的語句作為參考,設置句子長度為40,將不夠40的語句用<pad>進行填充,訓練開始語句為<start>,結束語句<end>。

同時添加Senticap語料庫,該語料庫是在MS COCO的基礎上生成的具有客觀描述的情感圖像語句,該語料庫包含1027個正面情緒的形容詞-名詞對,436個負面情緒的形容詞-名詞對。

3.2 評價指標

為了對生成的描述語句進行客觀評價,采用BLEU、ROUGE、CIDEr評價指標。

其中BLEU是一種自動評估機器翻譯,且獨立于語言的方法。計算公式如下:

其中n表示n-gram,wn表示n-gram的權重;BP表示短句子懲罰因子,用r表示最短的參考翻譯的長度,c表示候選翻譯的長度。

ROUGE(Recall-Oriented Understudy for Gisting Evaluation)是一組關于評估自動文摘和機器翻譯的指標,主要是通過自動生成的摘要或者翻譯與人工生成的摘要進行比較并計算出分值,衡量出兩者之間的相似度。

CIDEr是基于共識的評測標準,計算n元語言模型(N-gram)在參考描述句子和模型生成待評測句子的共現概率。

4 實驗結果

本文實驗結果如圖4、圖5、圖6所示,左邊是圖像,右邊是該圖像生成的描述語句,其中包含積極描述和消極描述,可以看到消極描述帶有一些人類的負面情感在里面,比如冰冷的空氣,寒冷的山,孤獨的街道等,都是一些帶有消極的形容詞,而積極描述則有好天氣,繁忙的街道等,有一些中性詞和積極樂觀的形容詞。通過這些描述語句可以看出,本文所提出模型在情感豐富性上有了較大的提升,多了人類的感情色彩在描述語句中。

圖4 用于生成描述語句的示例1

圖5 用于生成描述語句的示例2

圖6 用于生成描述語句的示例3

為了驗證本文方法的正確性和有效性,與原來方法進行對比,結果如表1,可以看出本文方法相比較其他傳統方法,在評價指標上具有較大的優勢,在準確性指標BLUE上面的性能均有所提升,在語義描述的摘要質量ROUGE-L上面也比其他模型更好,在語義豐富程度指標CIDEr上面的指標與其他模型基本保持相似水平。

表1 性能實驗對比

5 結語

利用Senticap語料庫以及CBAM模型,提出了一個基于生成對抗網絡的圖像語義描述框架。通過生成器和判別器的對抗訓練,描述出帶有正面和負面情緒的語句,在生成器部分對圖像特征進行提取,加入CBAM注意力機制,讓模型可以更好地關注到重點視覺區域,充分提取圖像特征并結合Senticap語料庫對生成語句進行訓練,接著在判別器部分對輸入語句的真實性進行判別,輸出一個0~1之間的值,并將該值反饋給生成器部分用以激勵生成器的訓練,最終在生成器和判別器的對抗訓練下,生成近似于真實值的描述語句。實驗結果不僅描述出了圖像中的內容,還帶有一定的感情色彩,包括人的負面和正面情感,可以看出模型在情感豐富性上有很大提升,同時在性能上也得到一定程度的提高。

猜你喜歡
語義單詞機制
語言與語義
單詞連一連
自制力是一種很好的篩選機制
文苑(2018年21期)2018-11-09 01:23:06
看圖填單詞
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
破除舊機制要分步推進
中國衛生(2015年9期)2015-11-10 03:11:12
認知范疇模糊與語義模糊
注重機制的相互配合
中國衛生(2014年3期)2014-11-12 13:18:12
打基礎 抓機制 顯成效
中國火炬(2014年4期)2014-07-24 14:22:19
最難的單詞
主站蜘蛛池模板: 国产成人亚洲无吗淙合青草| 国产一区在线视频观看| 毛片网站在线播放| 第九色区aⅴ天堂久久香| 久久国产V一级毛多内射| 欧美一区二区福利视频| 婷婷开心中文字幕| 毛片在线播放a| 久久精品无码国产一区二区三区| 波多野结衣一区二区三区四区| 亚洲人网站| 狠狠色丁香婷婷| 国产区网址| 国产亚洲欧美在线人成aaaa| 国产第一福利影院| 亚洲人网站| 国产成年女人特黄特色毛片免| av一区二区三区在线观看| 国产一级毛片yw| 久久精品人人做人人爽| 18禁不卡免费网站| 99热这里只有成人精品国产| 在线国产综合一区二区三区| 久久大香香蕉国产免费网站| 视频一本大道香蕉久在线播放| 91福利免费| 久久久亚洲色| 亚洲成人在线免费观看| 国产真实乱了在线播放| 人妻精品全国免费视频| 国国产a国产片免费麻豆| 欧美另类精品一区二区三区 | 久久黄色影院| 青青操视频在线| 久久精品国产亚洲麻豆| 小说区 亚洲 自拍 另类| 国产精品黄色片| 亚洲综合香蕉| 中文字幕人成人乱码亚洲电影| 久久一本日韩精品中文字幕屁孩| 欧美精品1区2区| 亚洲国内精品自在自线官| 国产成人精品亚洲日本对白优播| 四虎免费视频网站| 久久永久免费人妻精品| 91在线精品免费免费播放| 亚洲乱强伦| 国产亚洲精品91| 亚洲AV无码不卡无码| 任我操在线视频| 久久久久国产一级毛片高清板| 91色在线观看| 日韩大片免费观看视频播放| 伊人丁香五月天久久综合 | 国产黄色片在线看| 日韩午夜福利在线观看| 国产精品高清国产三级囯产AV| 国产成人精品在线| 看你懂的巨臀中文字幕一区二区 | 国产自在线拍| 亚洲网综合| 国产成人亚洲毛片| 女人18一级毛片免费观看| 91无码国产视频| 国产精品久久久久久久久久久久| 国产精品露脸视频| 亚洲av成人无码网站在线观看| 国产97视频在线| 亚洲香蕉在线| a级毛片一区二区免费视频| 色综合天天综合中文网| 国产黑丝一区| 中国毛片网| 亚洲精品福利视频| 欧美日韩v| 国产成人精品高清不卡在线| 久久综合九色综合97婷婷| 国产精品jizz在线观看软件| 黄色三级毛片网站| 一级毛片高清| 亚洲女同一区二区| 99精品久久精品|