999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于內嵌偽造機理的多模態協同魯棒偽造信息檢測方法

2023-12-05 09:07:36威,凌
黑龍江科學 2023年22期
關鍵詞:模態文本融合

鄭 威,凌 霞

(中國信息通信研究院,北京 100083)

0 引言

深度偽造信息造成的影響日益凸顯[1],表現為攻擊性損害、信任風險加劇等[2]。隨著生成模型在文本[3]、圖像[4]、音頻[5]及多模態[6]中的深入研究,音頻編輯、視頻編輯、文本生成等應用得到了廣泛使用。傳統的偽造信息檢測方法注重對單一模態的鑒偽[7],此類方法雖然能在某個數據集上取得較好的檢測效果,但無法應對新的偽造手段與技術,即魯棒性不足。本研究提出基于多模態生成模型的內嵌偽造機理,構建主動數據增強方法,以增強檢測模型的魯棒性,利用transformer、圖神經網絡等深度神經網絡對不同模態進行建模并融合,實現多模態協同魯棒偽造信息檢測。

1 研究目的與內容

研究了一種能夠提升偽造檢測魯棒性且具有良好可解釋性的多模態融合偽造檢測方法,即基于內嵌偽造機理的多模態協同魯棒偽造信息檢測方法,主要包括:①研究內嵌偽造機理的理論基礎。分析各個模態生成模型的結構,探索各個結構在生成內容中留下的特征。②設計與實現基于內嵌偽造機理的多模態協同魯棒偽造信息檢測模型。綜合利用語音、圖像、文本模態的生成機理,使用深度神經網絡,提取數據中的內嵌偽造機理特征并進行多模態特征融合,使用分類器對真偽信息進行檢測。③開展實驗評估并分析結果。使用包含真偽兩種信息的數據集進行訓練及測試實驗評估,與其他方法進行性能比對。

2 研究方法

2.1 內嵌偽造機理

內嵌偽造機理是指各個模態偽造方法留下的特征[8]。音頻模態包括但不限于音頻經過合成過程的聲學特征重建痕跡,圖像模態包括但不限于圖像對于照度圖像與反射圖像的還原程度。為實現多模態協同鑒偽,使用負面數據增強方法來模擬各個模態的偽造過程,設計了一種對文本、圖像、音頻3種不同模態提取內嵌偽造機理特征的方法,通過特征融合方式,將神經網絡綜合學習多模態的內嵌偽造機理特征用于判斷輸入數據是否偽造信息。

2.2 負面數據增強方法

負面數據增強方法通過擴充數據集、增加數據多樣性等方法有效提升了模型的穩定性及檢測的魯棒性。針對音頻模態,將音頻輸入預訓練好的語音轉換模型中,得到對應的轉換語音并將其標記為偽造。針對圖像模態,將圖像輸入預訓練好的變分自編碼器模型中,獲得對應重構圖像并將其標記為偽造。針對文本模態,使用通用的預訓練語言模型對文本段落進行較小的擾動,將所得文本輸出標記為偽造。

2.3 基于內嵌偽造機理的多模態協同魯棒偽造信息檢測概述

提出一種基于內嵌偽造機理的多模態協同魯棒偽造信息檢測方法,由負面數據增強、單模態特征提取、音頻-圖片模態融合及分類權重結果融合4個階段組成。

圖1 模型結構Fig.1 Model structure

2.3.1 負面數據增強

留下各個模態數據內嵌偽造機理的痕跡,圖像模態采用預先用圖片數據集訓練好的VAE架構模型。音頻模態采用語音轉換方式,而so-vits模型更為穩定且速度,相較于soft-vc[9]相差無幾。文本模態采用語音識別的方式補充文本模態數據,采用T5模型對文本進行小幅度修改。

2.3.2 單模態特征提取

圖像模態采用自注意力機制對輸入進行編碼操作,使圖片轉換為具有表征能力的向量表示。音頻模態對時域特征進行提取,使用asvspoof2019訓練集預先訓練過的Rawnet2網絡結構直接對音頻波形圖進行特征提取。

2.3.3 音頻-圖片模態融合

多模態融合器(multi-modalaggregator)對原音頻與負面增強后的音頻、原圖像與負面增強后的圖像進行融合,再將音頻與圖像模態表征進行融合,融合器由cross-attention和feed for ward neural net work組成,特征融合完成后連接二分類分類器對真偽進行softmax分類。

2.3.4 分類權重結果融合

基于detectGPT輸出的值與多模態融合器softmax分類值,對文本真偽預測進行加權聯合判斷,將文本預測結果的權重設為0.1。

3 實驗設計與分析

3.1 實驗數據集

收集了大量視頻數據,借助ASR模型補全了部分視頻缺失的文本模態數據,將其作為實驗數據集,對每個模態都進行真偽標簽標注。為保證實驗的可靠性及可比性,對數據各個模態進行與對比方法相同的數據預處理操作,確保模型效果比對不會受到其他變量的影響。將數據集按照7∶2∶1的比例隨機劃分為訓練集、驗證集及測試集,用于模型訓練、參數調整及最終評測。

3.2 實驗指標與評估方法

為評估所提方法的性能,選用EER、Precision及F1值幾個常見指標對模型性能進行評估,進行對比實驗和消融實驗,使用音頻單一模態的偽造檢測模型rawnet2作為比對模型,消融實驗則將模型遞進消融為完整模型(ours)、剔除文本模態(oursw/o text)、剔除文本及圖像模態(oursw/o text&image)。

表1 實驗結果

4 結果分析與討論

純音頻單模態的偽造檢測使用ours w/o text&image,對比rawnet2效果,其在EER、precision及F1的表現上均比rawnet2模型好。在消融實驗上遞進地將文本模態、文本及圖像模態剔除,對模型進行評測,結果顯示,每剔除一個模態,各項指標的表現都會有所下降,說明此方法的多模態融合提升了偽造檢測能力。

文本模態剔除對各項指標的影響并不大,造成這一現象的原因是此方法對文本模態的融合方式及文本語義方面的考慮不夠,導致文本特征對整體偽造檢測效果的提升不如另外兩個模態。

實驗驗證了此方法的有效性,說明此模型架構能較好地捕捉到數據的偽造依據并進行偽造檢測。

5 結束語

提出了一種偽造檢測方法并在自建數據集上進行實驗,證明此方法具有有效性,與常用的單模態偽造信息檢測模型相比具有優越性。此方法在多個指標上表現良好,但還有提升空間。未來,可著重研究文本模態的語義,著眼于多模態之間的融合策略及融合階段,更好地識別偽造數據,完成偽造信息檢測任務。

猜你喜歡
模態文本融合
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
從創新出發,與高考數列相遇、融合
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
國內多模態教學研究回顧與展望
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
計算物理(2014年2期)2014-03-11 17:01:39
主站蜘蛛池模板: 日韩第九页| 中文纯内无码H| 亚洲日韩欧美在线观看| 四虎永久免费地址| 精品成人一区二区三区电影| 国产在线精品香蕉麻豆| jizz国产在线| 国产成人艳妇AA视频在线| 中国美女**毛片录像在线| 免费jizz在线播放| 亚洲第一区欧美国产综合 | 丰满的熟女一区二区三区l| 日韩色图在线观看| 99热这里只有精品2| 丰满少妇αⅴ无码区| 永久免费av网站可以直接看的 | a级毛片在线免费观看| 黄色网在线| 一级福利视频| 久久国产高潮流白浆免费观看| 亚洲青涩在线| 亚洲va在线∨a天堂va欧美va| 成年人视频一区二区| 国产精品太粉嫩高中在线观看 | 自拍欧美亚洲| 精品欧美视频| 无码乱人伦一区二区亚洲一| 成人av手机在线观看| 欧美特级AAAAAA视频免费观看| 日韩小视频在线播放| 在线观看免费人成视频色快速| 欧美有码在线观看| 欧美日韩另类在线| 亚洲一级毛片在线观播放| 国产高清自拍视频| 国产成人无码久久久久毛片| 性色一区| 六月婷婷激情综合| 国产女人18水真多毛片18精品| 亚洲国产日韩欧美在线| 亚洲国产天堂在线观看| 国内精自线i品一区202| 国产成年女人特黄特色毛片免 | 亚洲欧美精品一中文字幕| 亚洲热线99精品视频| 园内精品自拍视频在线播放| jizz国产视频| 丁香婷婷综合激情| 91精品专区国产盗摄| 久久香蕉国产线看精品| 成人在线第一页| 97在线碰| 亚洲swag精品自拍一区| 无码 在线 在线| 国内老司机精品视频在线播出| 国产香蕉国产精品偷在线观看| 国产精品人成在线播放| 97视频精品全国在线观看 | 91欧洲国产日韩在线人成| 国产乱人免费视频| 亚洲成肉网| 在线观看热码亚洲av每日更新| 婷婷开心中文字幕| 久久人妻系列无码一区| 精品自拍视频在线观看| 午夜毛片免费看| 日韩无码白| 欧美一区中文字幕| 亚洲国产日韩视频观看| 九九热在线视频| 99尹人香蕉国产免费天天拍| 伊人丁香五月天久久综合| 国产在线精品99一区不卡| 国产91久久久久久| 伊人蕉久影院| 欧美另类视频一区二区三区| 婷婷亚洲视频| 无码中文字幕精品推荐| 久久亚洲中文字幕精品一区| 日韩成人在线一区二区| 伊人久久大线影院首页| 狼友av永久网站免费观看|