李璨,王讓定,嚴迪群,陳亞楠
(寧波大學信息科學與工程學院,浙江 寧波 315211)
基于相位譜的翻錄語音攻擊檢測算法*
李璨,王讓定,嚴迪群,陳亞楠
(寧波大學信息科學與工程學院,浙江 寧波 315211)
因與原始語音具有高度相似性,經高保真設備回放的翻錄語音常被不法分子用于對說話人認證(ASV)系統進行攻擊,以達到非法認證的目的。為提高系統抵抗翻錄語音攻擊的頑健性,通過研究原始語音與翻錄語音產生的實際過程,發現兩者在頻率域相位上有明顯差異,并在此基礎上提出了一種基于相位譜的翻錄語音檢測方法。分析討論了FFT和不同偷錄、回放設備對翻錄語音檢測率的影響。實驗結果表明,該方法能夠準確地判斷待測語音是否為翻錄語音,其檢測率達到了99.04%。并且,將該算法加載到說話人識別系統中,使系統的等錯誤概率(EER)降低了約22%,有效提高了系統抵抗翻錄語音攻擊的性能。
說話人認證系統;翻錄語音檢測;相位譜
在信息時代,錄音設備(如錄音筆、智能手機等)日趨低價和高保真,回放設備也越來越精準,為錄音造假提供了可能。翻錄語音經錄音設備偷錄、回放設備回放,與原始語音難辨真假,一些說話人認證系統也無法辨別。而且翻錄語音因偷錄設備體積小、易偷錄、成功率高等優勢,已成為攻擊語音認證系統中最易實施的方法。因此,對翻錄語音檢測十分迫切且具有現實意義。
近年來,國內外研究學者對翻錄語音檢測展開研究,并取得了一定的研究成果。其中檢測算法主要分為以下兩類:一是基于語音產生隨機性的檢測算法。Shang W等人[1,2]根據語音的隨機性,提出了一種基于Peak map特性的錄音回放檢測算法,該算法通過計算原始語音與翻錄語音 Peak map特性的相似度,判斷待測語音是否為翻錄語音。若相似度大于設定的閾值,判定為翻錄語音;反之,判定為原始語音。在此基礎上,Jakub G等人[3]對該算法進行了改進,在Peak map特性中加入了各頻率點的位置關系,Wu Z等人[4]加入光譜峰作為檢測特征,但該算法只能針對文本相關的識別系統,且只針對一種偷錄設備,存在較大的局限性。二是基于語音信道的檢測算法。張利鵬等人[5]根據信道模式特征,用語音數據的靜音段對信道建模,檢測待測語音與訓練語音的信道是否相同,從而判斷是否為回放攻擊。王志鋒等人[6,7]根據原始語音與翻錄語音產生的信道不同,提取信道模式噪聲,利用SVM(support vector machine,支持向量機)得到了很好的分類結果。Villalba等人[8,9]依據遠距離的錄音會受到噪聲和混響的影響,提出了針對遠距離偷錄語音的檢測方法。Chen Y N 等人[10]根據設備信道對語音編碼過程的影響,提出基于長窗比例因子的回放語音檢測算法。但該類方法提取的信道模式噪聲并非準確,且錄制語音的設備過于單一,且未對多種不同的偷錄設備及回放設備進行分析與研究。
伴隨著信息化的快速發展,信息安全形勢愈加嚴峻[11,12]。然而,目前針對多種不同偷錄設備與回放設備的翻錄語音檢測的研究關注較少。在現實生活中,各種高質量低價格的高保真錄音設備隨處可見,如錄音筆及各種智能手機。這類偷錄設備攜帶便利且不易察覺,且獲得的翻錄語音與原始語音相似性較高,因此這種錄音設備是目前較為主流的偷錄設備。同時,不同的回放設備對翻錄語音的產生也有較大的影響。但是,由于偷錄設備和回放設備種類繁多,不同的錄音設備中傳感器和信號采集電路存在差異,產生不同的設備信息。這無疑增加了對不同錄音設備的翻錄語音攻擊檢測的難度。
本文通過分析研究原始語音與翻錄語音產生的實際過程,發現翻錄語音經歷了一次偷錄與回放過程后,其相位會發生不同程度的變化,根據相位譜的不同,提出了一種基于相位譜的翻錄語音檢測算法。為提高算法的實用性,彌補現有算法涉及錄制設備單一的問題,本文討論了不同偷錄設備和回放設備對檢測率的影響,并對影響程度作了分析。實驗結果表明,將本文檢測方法加載到目前主流的GMM-UBM和i-vector說話人識別系統中后,系統抵抗翻錄攻擊的性能得到了極大的提高。
原始語音和翻錄語音產生的實際過程如圖 1所示。從說話人處直接得到的語音本文稱為原始語音,也稱為合法語音。將說話人語音用偷錄設備進行偷錄,回放設備進行回放得到的語音稱為翻錄語音。
由圖1可知,翻錄語音比原始語音多經歷了一次高保真音響系統。高保真音響系統原汁原味地還原了原始語音,使得原始語音與翻錄語音具有高相似度,但該系統不可避免地對語音信號進行電平調整、A/D轉換、編解碼等一系列的操作,使得翻錄語音與原始語音還是存在著一定的差異。

圖1 原始語音和翻錄語音產生的實際過程
原始語音和翻錄語音的波形如圖2所示,其中圖2(a)是一段經Aigo R6620錄音筆原始錄制的語音信號的波形圖,該語音信號的具體內容為普通話朗讀的“開窗 關燈 亮度佳 播放音樂”。圖2(b)、圖2(c)、圖2(d)是對應的翻錄語音信號的波形,翻錄過程中的偷錄設備分別為 iPhone6、Mi4和Sony PX440,回放設備則都選擇的是 Huawei AM08。從圖2可以看出,翻錄語音信號較原始語音還是產生了一些失真,只是針對不同的翻錄設備,失真的大小略有區別。例如,在圖2所示的3款偷錄設備中,iPhone6對應的語音信號失真最小,Sony PX440對應的語音信號失真最大。

圖2 原始語音和翻錄語音的波形(Huawei AM08)
圖3、圖4的波形分別與圖2一一對應,其回放設備分別為 Philips DTM3115和 Yamaha TSX-140。由圖2、圖3、圖4可以看出,無論是偷錄還是回放設備,對翻錄語音都有一定的影響,但對翻錄語音有何影響且影響程度如何,需要進一步探索。同時,在時域上很難區分原始語音與翻錄語音,但翻錄語音經過高保真系統的電平調整、A/D轉換、編解碼等一系列的操作,該系統將對不同頻率信號相位產生超前或者滯后的影響,會使得翻錄語音的相位產生較大程度的失真。
相位譜檢測算法主要由語音預處理、相位譜特征提取、特征選擇、分類識別4個部分組成。在特征選擇上,本文將相位統計平均作為檢測特征,并運用 SVM-RFE算法進行特征篩選,采用LIBSVM分類器進行分類識別。為驗證該算法的有效性,本文將該檢測算法加載到了說話人識別系統中,并對該系統防御翻錄語音的攻擊能力進行了檢測。

圖3 原始語音和翻錄語音的波形(Philips DTM3115)

圖4 原始語音和翻錄語音的波形(Yamaha TSX-140)
3.1 特征提取
相位信息對感知有著不可忽視的作用,相位譜反映信號方向隨頻率變化的規律,含有大量的信息[13]。本文算法首先根據待測語音提取相應的相位。設待檢測語音信號為x,將語音信號分幀處理后,對其進行FFT,得到:

其中,k=0,1,2,…, N?1; i=1,2,…,S,S表示總幀數。
對于語音信號第i幀,求其相位 φi( k):

為表征相位譜的變化程度,本文選取均值統計特性。對于第i幀第j頻率點相位 φi,j(k),求其幅值:

然后求其第j頻率點相位的統計平均 ?j(k):

最后,對 ?j(k)進行歸一化處理,得到語音信號相位譜特征。初步分析可知,相較于原始語音,翻錄語音經歷了一次高保真系統,該系統會對不同頻率信號相位產生超前或滯后的影響。另外,受錄音設備的影響,語音在翻錄過程中將會引入一定的設備噪聲,這種噪聲是錄音設備所固有的,會使語音的相位譜產生明顯的失真。
圖5、圖6、圖7分別是3種不同的回放和偷錄設備的原始語音與翻錄語音的相位譜特征圖。圖中FFT采樣點數N為1 024,根據實序列離散傅里葉變換的共軛對稱性,本文選取前512個值。其中圖 5(a)、圖 6(a)、圖 7(a)表示一段由Aigo R6620錄音筆錄制的語音內容為“開窗 關燈亮度佳 播放音樂”的原始語音的相位譜,圖5(b)、圖5(c)、圖5(d)、圖6(b)、圖6(c)、圖6(d)、圖7(b)、圖7(c)、圖7(d)分別是偷錄設備為iPhone6、Mi4和Sony PX440,回放設備為Huawei AM08、Philips DTM3115和Yamaha TSX-140的翻錄語音相位譜。

圖5 原始語音與翻錄語音相位譜特征(Huawei AM08)

圖6 原始語音與翻錄語音相位譜特征(Philips DTM3115)

圖7 原始語音與翻錄語音相位譜特征(Yamaha TSX-140)
由于偷錄設備和回放設備均是翻錄過程的重要設備,它們均會在翻錄語音中留下“痕跡”。當回放設備相同時,圖5、圖6、圖7中的(a)與(b)、(c)、(d)在高頻區有明顯的不同,(b)、(c)、(d)在高頻區相似度較高。當偷錄設備相同時,不同的回放設備其相位譜區分較為明顯。但是總體來看,針對不同的偷錄設備和回放設備的翻錄語音,其相位信息與原始語音具有較大的失真。為了實現更好的性能測試,提高運算效率,選擇有效的特征維數,本文采用SVM-RFE算法進行特征選擇。
SVM-RFE算法[14]的輸出結果是按照特征的重要性對特征進行排序的列表。本文將上述所提取的相位特征進行特征篩選。這里使用的 FFT采樣點數為1 024,樣本數目為14 000(原始語音1 400,翻錄語音12 600)。其中,RANK為最終的排列等級,AVG_RANK為5次交叉驗證RANK結果的平均值,特征索引N為前512維特征。SVM-RFE對特征排序的結果(前20列)見表1。

表1 SVM-RFE特征排序的結果
由表1可知,在前20列特征重要性的排序中,特征索引N為509的特征翻錄語音失真最大。整體來看,特征索引N較大的值所占的比例較高,即翻錄語音較原始語音在高頻區失真較為明顯。因此,為提高檢測效率,選擇RANK≥10的10維特征作為最終的有效特征。
3.2 翻錄語音攻擊檢測
為驗證基于相位譜的翻錄語音檢測算法的有效性,本文將該算法加載到了說話人識別系統中,如圖8所示。

圖8 防翻錄語音攻擊的識別系統流程
具體的操作步驟如下:語音經采集設備采集,同時輸入說話人識別系統和翻錄語音檢測模塊中;在翻錄語音檢測模塊,提取語音信號的相位譜特征,對語音進行分類識別。若輸入的語音為翻錄語音,則判決1為0;否則,判決1為1;說話人識別系統對輸入語音進行判決,若輸入語音為說話人語音,則判決2為1;否則,判決2為0;在判決模塊,結合判決1和判決2的結果,按表2規則對輸入語音進行判斷,輸出最終結果。

表2 判決規則
為了驗證本文方法的有效性,本文構建了一個符合研究目的的語音數據庫。數據庫的具體設置如下:語料庫來源于 863語料庫[15];人員分布為:18男14女;設備選取主要涉及語音采集設備、偷錄設備、回放設備。設備的詳細信息見表3。
實驗庫的構建環境為安靜房間,閱讀內容為語料庫內容,參與者依據自身朗讀習慣用標準普通話進行錄音,并使用采集設備進行語音采集,采集設備距參與者大約20 cm,本文將采集設備此次采集到的語音稱為原始語音。在參與者閱讀以上語料的同時,將偷錄設備同時打開到正常錄制功能下,錄制參與者的語音內容,根據實際情況,將偷錄設備距離說話人大約70 cm。在同樣的環境下,將偷錄設備采集到的語音經音響回放,并使用采集設備錄制該回放語音?;胤乓繇懢嚯x采集設備20 cm左右。將此次采集設備采集到的語音稱為翻錄語音。實驗樣本為14 000個(原始語音1 400個,翻錄語音12 600個)。樣本詳情見表4。

表3 設備信息

表4 原始語音和翻錄語音樣本詳情
實驗中使用 LIBSVM,它是一種監督是學習方法,廣泛地應用于統計分類以及回歸分析。分類過程如下:先根據第3.1節進行特征提取并使用LIBSVM 進行訓練得到模型,將待測語音在LIBSVM模型上進行測試并給出最終判斷結果。本文將根據錄音過程中的影響變量,分別分析其對檢測翻錄語音的影響。
5.1 FFT變換點數的影響
相位譜反映信號方向隨頻率變化的規律,含有大量的信息。不同的FFT采樣點數對相位信息產生較大的影響。隨著采樣點數的增加,語音相位譜所包含的信息越多,翻錄語音經過高保真系統后,其相位失真越來越明顯。為了尋找最佳的檢測效果的采樣點數,討論了基于FFT采樣點數為128、256、512、1 024時的翻錄語音檢測效果。實驗采樣LIBSVM分類器在weka平臺上進行試驗。實驗樣本為原始語音1 400個,翻錄語音12 600個。檢測效果見表5,其中包括真正類率(true positive rate,TPR)、負正類率(false positive rate,FPR)、準確度(accuracy,ACC)等。

表5 翻錄語音檢測率
由實驗結果可以看出,當FFT采樣點數N為1 024時,對翻錄語音有較好的檢測效果,其檢測率達到99.04%。隨著FFT采樣點數的增大,包含的語音相位信息越多,越能較好地反映語音信號的本質特征。綜合考慮,本文選取1 024作為最佳檢測率時的FFT采樣點數。
5.2 不同錄音設備的影響
由第5.1節可知,當FFT采樣點數為1 024時,對翻錄語音檢測效果最優。但不同的偷錄設備與回放設備所含有的固有設備信息不同,它對相位譜的影響也就不同。因此,本節通過實驗揭示不同偷錄設備和不同回放設備對翻錄語音檢測率的影響。檢測結果見表6。

表6 不同偷錄設備與回放設備的翻錄語音檢測
由表 6可以看出,當回放設備為 Huawei AM08時,來源于3種不同偷錄設備的翻錄語音均能被 100%識別;當回放設備為 Yamaha TSX-140時,偷錄設備為Sony PX440和iPhone6的翻錄語音檢測率為100%,偷錄設備為Mi4的翻錄語音檢測率達到了 99.71%;當回放設備為Philips DTM3115時,識別準確率雖不及以上兩種,但其準確率也達到了 99.7%以上。實驗結果表明:本文檢測算法能夠很好地檢測翻錄語音與原始語音,且對偷錄設備與回放設備有較好的頑健性。
5.3 加載翻錄語音檢測模塊后的識別系統
為更好地檢驗翻錄語音對說話人識別系統的攻擊情況,本文分別在GMM-UBM和i-vector說話人識別系統上進行了實驗。在實驗中,提取13維 MFCC基本特征,與一階、二階差分構成 39維特征參數。翻錄語音檢測模塊使用FFT點數為1 024。實驗中訓練了4個用戶模型,在測試時用每個用戶的翻錄語音作為攻擊語音,其中每個用戶模型使用原始語音130個、翻錄語音150個。
科研工作者從20世紀50年代開始進行說話人識別技術研究,至今取得了一定的進展[16]。GMM-UBM和i-vector說話人識別系統是經典和目前主流的兩個系統。GMM-UBM[17]主要利用UBM和少量的說話人數據,通過自適應算法得到目標人模型,最后用測試數據分別與模型和UBM進行打分比較;基于i-vector并進行信道補償的說話人識別系統[18]根據 UBM 和 T子空間提取i-vector,建立GPLDA(Gaussian probabilistic linear discriminate analysis,高斯概率線性判別分析)模型及說話人模型,測試階段用測試語音對模型進行打分比較,本實驗打分方式采用對數似然比。
本實驗分別在GMM-UBM和i-vector說話人識別系統上,測試來源不同的回放設備和偷錄設備的翻錄語音是否能夠攻擊成功,檢測結果如圖10(a)和圖10(b)所示。在GMM-UBM系統上,未加載翻錄語音檢測模塊的說話人識別系統的EER為46.33%,加載了翻錄語音檢測模塊后,該系統的EER降為6.48%,下降了約40%。在i-vector系統上,系統對翻錄語音的攻擊有一定的防御性,但并不能完全抵抗攻擊,該系統的EER為27.78%,當加載了翻錄語音檢測模塊時,系統EER降為5.56%,下降了約22%。該數據說明本檢測算法能夠有效地提高GMM-UBM和i-vector識別系統抵抗翻錄語音攻擊的能力。
5.4 對比實驗
將本文算法與典型的3種算法在本文數據庫上進行對比,實驗結果見表7。參考文獻[5]算法采用短時能量法提取靜音,利用譜減法進行濾波,提取MFCC特征參數。參考文獻[7]方法采用高通濾波器進行去噪,提取信道模式噪聲,并提取6個統計特征及6階Legendre多項式系數。參考文獻[10]中算法將語音信號進行MP3編碼后,提取比例因子統計特征作為檢測特征。表7中,ACC表示準確率,EER表示將檢測模塊加載到GMM-UBM、i-vector說話人識別系統時,系統的等錯誤概率。

圖10 加載翻錄語音檢測模塊前后的等錯誤概率對比

表7 本文算法與參考文獻[5,7,10]算法檢測結果的對比
由表7可以看出,對于多種偷錄及回放設備的翻錄語音,本文算法優于參考文獻[5,7,10]算法,識別率分別提高了約26%、約21%和約0.1%。解決了參考文獻[5,7]中設備過于單一的問題,更具實用性。另外,參考文獻[5,7,10]中算法使用特征維數分別為39維、12維和21維,本文算法共計10維特征,維數更低。
本文針對多種偷錄設備與回放設備的翻錄語音攻擊,提出了基于相位譜的翻錄語音檢測算法。并通過模擬實際翻錄語音攻擊的整個物理過程,建立了實驗語音數據庫。本文確定了最佳檢測效果的FFT點數,對來源不同錄音設備的翻錄語音進行了檢測,其檢測率達到了99.04%,在此基礎上,將該檢測算法模塊加載到說話人識別系統中,其抵抗翻錄語音攻擊的能力提升了約22%。在今后的研究中,將進一步探究各種錄音設備及回放設備對語音的影響,并且在檢測方法上進行創新和改進。
[1]SHANG W, STEVENSON M. A playback attack detector for speaker verification systems[C]//2008 IEEE International Symposium on Communications Control and Signal Processing (ISCCSP), March 12-14, 2008, Bordeaux, France. New Jersey: IEEE Press, 2008:1144-1149.
[2]SHANG W, STEVENSON M. Score normalization in playback attack detection[C]//IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP) , March 14-19, 2008, Dallas, USA. New Jersey: IEEE Press, 2010:1678-1681.
[3]JAKUB G, MARCIN G, RAFAL S. Playback attack detection for text-dependent speaker verification over telephone channels [J]. Speech Communication, 2015(67):143-153.
[4]WU Z, GAO S, CLING E S, et al. A study on replay attack and anti-spoofing for text-dependent speaker verification[C]//IEEE 2014 Summit and Conference, Asia-Pacific Signal and Information Processing Association, December 9-12, 2014, Siem Reap, Cambodia. New Jersey: IEEE Press, 2014: 35-45.
[5]張利鵬, 曹犟, 徐明星. 防止假冒者闖入說話人識別系統[J].清華大學學報(自然科學版), 2008, 48(S1): 699-703. ZHANG L P, CAO J, XU M X. Prevention of impostors entering speaker recognition systems[J]. Journal of Tsinghua university (Science and Technology ), 2008 , 48(S1): 699-703.
[6]王志鋒, 賀前華, 張雪源, 等. 基于模式噪聲的錄音回放攻擊檢測[J]. 華南理工大學學報, 2011, 39(10): 7-12. WANG Z F, HE Q H, ZHANG X Y, et al. Channel pattern noise based playback detection algorithm speaker recognition[J]. Journal of South China University of Technology(Natural Science Edition), 2011, 39(10): 7-12.
[7]WANG Z F, HE Q H, ZHANG X Y, et al. Channel pattern noise based playback detection algorithm speaker recognition [C]// IEEE International Conference on Machine Learning and Cybernetics(ICMLC), July 10-13, 2011, Guilin, China. New Jersey: IEEE Press, 2011: 1708-1713.
[8]VILLABA J, LLEIDA E. Detecting replay attacks from far-field recordings on speaker verification systems[C]//COST 2011 European Conference on Biometrics and ID Management, March 8-10, 2011, Brandenburg, Germany. New York: ACM Press, 2011: 274-285.
[9]VILLABA J, LLEIDA E. Preventing replay attacks on speaker verification systems[C]//IEEE International Carnahan Conference on Security Technology (ICCST), October 18-21, 2011, San Francisco, USA. New Jersey: IEEE Press, 2011: 1-8.
[10]CHEN Y N, WANG R D, YAN D Q, et al. Voice playback detection based on long-window scale-factors[J]. International Journal of Security and Its Application, 2016, 10(12): 299-310.
[11]鄭志彬.信息網絡安全威脅及技術發展趨勢[J].電信科學, 2009, 25(2): 28-34. ZHENG Z B. Overview of mobile communication services security[J].Telecommunications Science, 2009, 25(2): 28-34.
[12]王帥, 汪來富, 金華敏, 等. 網絡安全分析中的大數據技術應用[J]. 電信科學, 2015, 31(7): 145-150. WANG S, WANG L F, JIN H M, et al. Big data application in network security analysis [J]. Telecommunications Science, 2015, 31(7): 145-150.
[13]OPPENHERIM A V, LIM J S. The important of phase in signals[J]. Processing of the IEEE, 1981, 69(5): 529-541.
[14]DUAN K B, RAJAPAKSE J C, WANG H Y, et al. Multiple SVM-RFE for gene selection in cancer classification with expression data[J]. IEEE Transactions on Nano Bioscience, 2005, 4(3): 228-234.
[15]王天慶, 李愛軍. 連續漢語語音識別語料庫的設計[C]// 第六屆全國現代語音學學術會議論文集(下), 2003年 10月18-20日, 天津, 中國. 天津: 天津人民出版社, 2003. WANG T Q, LI A J. The design of the continuous Chinese speech recognition corpus[C]//The sixth national conference on modern phonetics learning, October 18-20, 2003, Tianjin, China, Tianjin: Tianjin Remin Chubanshe, 2003.
[16]楊震, 徐敏捷, 劉璋峰, 等. 語音大數據信息處理架構及關鍵技術研究[J]. 電信科學, 2013, 29(11): 1-5. YANG Z, XU M J, LIU Z F, et al. Study of audio frequency big data processing architecture and key technology[J]. Telecom munications Science, 2013, 29(11): 1-5.
[17]CHAKROBORTY S, ROY A, SAHA G. Improved closed set text-independent speaker identification by combining MFCC with evidence from flipped filter banks[J]. International Journal of Signal Processing, 2007, 4(2): 114-122.
[18]KANAGASUNDARAM A, DEANA D, SRIDHARAN S, et al. I-vector based speaker recognition using advanced channel compensation techniques[J]. Computer Speech and Language, 2014, 28(1): 121-140.
Recapture voice replay detection based on phase spectrum
LI Can, WANG Rangding, YAN Diqun, CHEN Yanan
College of Information Science and Engineering, Ningbo University, Ningbo 315211, China
Due to a high similarity between the recaptured voice recorded by high-fidelity ripping equipment and the original voice, the automatic speaker verification(ASV)system used to be attacked illegally by the recaptured voice. In order to improve the ability of resisting the attack, a recaptured voice detection method was proposed based on the difference of phase spectrum between original and recaptured voices for the ASV system. In addition, the effects of different recording and replay devices, the FFT were discussed. Experimental results show that the proposed method can accurately recognize the recording voice, of which detection rate is 99.04%。Meanwhile, the equal error rate (EER) of the ASV system has dropped about 22% with this method being integrated, which indicates that the system’s ability of resisting playback attack is enhanced.
ASV system, recaptured voice detection, phase spectrum
s: The National Natural Science Foundation of China (No. 61672302, No.61300055), Natural Science Foundation of Zhejiang Province of China (No.LZ15F020010, No.Y17F020051), The Scientific Research Foundation of Ningbo University (No.XKXL1405, No.XKXL1420, No.XKXL1509, No. XKXL1503), K.C. Wong Magna Fund in Ningbo University
TP391
A
10.11959/j.issn.1000?0801.2017126

李璨(1992?),女,寧波大學信息科學與工程學院碩士生,主要研究方向為多媒體通信與信息安全等。

王讓定(1962?),男,博士,寧波大學高等技術研究院教授、博士生導師,主要研究方向為多媒體通信與取證、信息隱藏與隱寫分析、智能抄表及傳感網絡技術等。

嚴迪群(1979?),男,博士,寧波大學信息科學與工程學院副教授、碩士生導師,主要研究方向為多媒體通信、信息安全、基于深度學習的數字語音取證等。

陳亞楠(1990?),女,寧波大學信息科學與工程學院碩士生,主要研究方向為多媒體通信與信息安全等。
2017?01?23;
2017?03?20
王讓定,wangrangding@nbu.edu.cn
國家自然科學基金資助項目(No.61672302,No.61300055);浙江省自然科學基金資助項目(No.LZ15F020010,No.Y17F020051);寧波大學科研基金資助項目(No.XKXL1405,No.XKXL1420,No.XKXL1509,No.XKXL1503);寧波大學王寬誠幸福基金資助項目