999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語音分離的人工設計特征、參數化特征和可學習特征的比較

2021-10-27 05:57:14朱文博王謀張曉雷SusantoRahardja
關鍵詞:特征

朱文博,王謀,張曉雷,Susanto Rahardja

(西北工業大學航海學院智能聲學與臨境通信研究中心,陜西西安 710072)

1 引言

語音分離的目的是將多個音源的混合語音分離成其對應成分。在本文中,我們研究了基于深度學習的說話人無關情況下的語音分離,其中說話人無關的情況是指訓練時所用到的說話人與測試中的說話人可以不相同[1]。Hershey 等人首先提出用深度聚類的方法來解決語音分離問題[2]。在此之后,針對語音分離問題又提出了多種方法,例如置換不變訓練[3-4],深度吸引子網絡[5]。在這些方法中,被廣泛應用的聲學特征是短時傅里葉變換的幅度譜(short -time Fourier transform,STFT)。然而,在從分離后的幅度譜恢復成時域信號的過程中,所用到的是含有噪聲的相位譜,這會導致得到次優的性能。

為了克服這一缺陷,數據驅動的從時域到時頻域變換的可學習特征成為了新的趨勢。其中代表性的就是一維卷積濾波器(1D-conv)[6-9]。由于該變換是與分離網絡聯合訓練的,并且不需要額外的人工操作,因此該變換相比于STFT來說使語音分離的性能得到了提升。在這些時域方法中,Conv-Tasnet在幀長設置為僅2 毫秒的低時延情況下得到了杰出的分離性能,從而受到了廣泛的關注。

近期有一些工作旨在研究Conv-Tasnet 的聲學特征。例如,Ditter 和Gerkmann 用人工設計特征[10],即多相位gammatone濾波器組(MPGTF)來代替Conv-Tasnet中編碼器部分的可學習特征,并在尺度無關信噪比(scale-invariant source-to-noise,SI-SNR)上帶來了提升。Pariente 等人將參數化濾波器擴展為了復值的解析濾波器[11-12],同時他們也提出了類似的一維卷積濾波器的解析版本。解析的一維卷積濾波器相比于原始的Conv-Tasnet 也有性能上的提升。上述結果表明,人工設計特征和參數化特征與目前最先進的可學習特征相比也具有競爭力。

然而,目前缺少對于可學習特征,人工設計特征以及參數化特征的比較。受到用人工設計特征來代替編碼器或解碼器的可學習特征的啟發,在這篇文章中我們將三種類型的特征在Conv-Tasnet 框架下進行了比較。同時為了了解這三種特征之間的聯系,我們將多相位gammatone 濾波器組和參數化特征進行了結合,提出了參數化多相位gammatone 濾波器組(ParaMPGTF)。其中,ParaMPGTF的中心頻率和帶寬將與分離網絡聯合訓練。我們在WSJ0-2mix 數據集[2]上比較了STFT、MPGTF、ParaMPGTF 以及可學習特征。實驗結果表明:如果解碼器是可學習特征,將編碼器設置為參與比較特征中的任意一種都產生了相似的性能。我們還比較了將STFT、MPGTF、ParaMPGTF 作為編碼器,它們的逆變換作為解碼器。實驗結果表明:我們所提出的ParaMPGTF 比其他兩種人工設計特征的性能要好。

本文將以下面所述進行組織編排。第二節介紹了比較的框架以及所提出的ParaMPGTF,第三節展示實驗結果。第四節總結了我們的發現。

2 方法

2.1 問題描述

本文研究的基礎分離框架是Conv-Tasnet。如圖1 所示,它由三個主要部分構成:編碼器,分離網絡和解碼器。編碼器和解碼器采用小幀長來顯著降低系統時延。編碼器和解碼器是可學習的一維卷積濾波器,他的作用是在時域信號和時頻特征之間進行類似的轉換。分離網絡是一個由一維擴張卷積塊堆疊成的全卷積的分離模塊[13-14],以SI-SNR 為損失進行優化。其作用是為每個音源產生一個掩模。

圖1 Conv‐Tasnet的框架圖

2.2 比較框架

2.3 參數化多相位gammatone濾波器組

3 實驗及結果

3.1 數據集

我們使用WSJ0-2mix 數據集對雙說話人語音分離性能進行比較[2]。它包含了30個小時的訓練數據,10 小時的驗證數據以及5 小時的測試數據。WSJ0-2mix中的混合語音是通過在Wall Street Journal(WSJ0)訓練集si_tr_s 中隨機選擇不同的說話者和句子產生的,并將它們以-5分貝到5分貝范圍中的隨機信噪比混合。測試集中的句子來自于WSJ0數據集中si_dt_05 和si_et_05 中16個訓練中未用到的說話人。WSJ0-2mix中所有的語音均被重采樣至8000赫茲。

3.2 實驗設置

該網絡在4秒長的片段上進行了200個周期的訓練。優化器采用Adam 優化器,初始學習率為0.001。如果在驗證集上連續5個周期性能沒有提升則學習率減半。同時,當驗證集上的性能在過去的10個周期內都沒有提升時,網絡訓練將會被停止。網絡的超參數設置遵循Conv-Tasnet 中的網絡超參數[10],其中濾波器數目為512。時序卷積網絡(Temporal Convolutional Networks,TCN)的掩模函數分別被設置為sigmoid 函數和修正線性單元(rectified linear unit,Re-LU)。對于ParaMPGTF,我們將階數設置為2,幅度設置為1。我們將和的初始值設置為其經驗值,即我們將SI-SNR 作為評價指標。所報告的結果均是3000 句測試混合語音的平均結果。

3.3 解碼器為可學習特征時的結果

我們首先比較了解碼器為可學習特征,編碼器為STFT,MPGTF,ParaMPGTF和可學習特征時的情況,表1 列出了比較結果。從表1 中可以看出,這四種特征并沒有產生很大的性能差異。如果我們仔細比較,我們發現STFT特征在測試集和驗證集都達到最高的性能。MPGTF 和ParaMPGTF 性能比較接近,ParaMPGTF 在驗證集上略好于MPGTF,而在測試集上略差于MPGTF。

表1 當解碼器為可學習特征時,不同特征作為編碼器的比較

3.4 解碼器為編碼器逆變換時的結果

圖2 所示的是用MPGTF,ParaMPGTF,STFT 和可學習特征作為編碼器,解碼器為可學習特征的幅度譜圖,由于STFT 的實部部分和虛部部分有相似的形狀[17],因此我們這里只繪制了從1 到256 頻點的STFT。濾波器在0 到4000 赫茲的范圍內均勻分布。從圖中可以看出,ParaMPGTF 和MPGTF 的幅度譜圖是相似的。這一現象不僅說明了它們的性能相似,而且也說明了參數化特征能夠被成功地優化。不僅如此,圖2也表明了(1)MPGTF是一個良好的人工設計特征,(2)可學習的解碼器能夠有效的學習到編碼器的反變換。表2 列出了人工設計特征MPGTF 的和以及ParaMPGTF 中優化得到的和。從表中我們可以看出兩組參數十分接近,這也進一步解釋了MPGTF和ParaMPGTF相似的性能。

表2 當解碼器為可學習特征時,MPGT和ParaMPGTF中和的比較

表2 當解碼器為可學習特征時,MPGT和ParaMPGTF中和的比較

圖2 不同設置的編碼器和解碼器的幅度譜圖的可視化。左邊為基于MPGTF的編碼器,中間為基于ParaMPGTF的編碼器,右邊為基于STFT的編碼器。

在該實驗中,我們將分別將編碼器設置為STFT,MPGTF,ParaMPGTF,并將解碼器設置為其對應的逆變換。表3 列出了STFT,MPGTF,ParaMPGTF 以及它們逆變換分別作為編碼器和解碼器的實驗結果。從表中我們可以看出,這三種比較方法的性能大體上是相似的。

表3 編碼器和解碼器為不同特征及其逆變換時的比較

如果我們仔細研究細節,我們發現在測試集和驗證集上,我們所提出的ParaMPGTF 都達到了最好的性能,這也表明了參數化訓練的策略有改進傳統人工設計特征的潛力。圖3展示的是將解碼器為編碼器的逆變換時所訓練的模型在驗證集上的收斂曲線。圖中我們可以發現可學習特征比人工設計特征和參數化特征收斂的更快。盡管人工設計特征和ParaMPGTF 在前期以相似的速度收斂,然而ParaMPGTF 收斂的更快。

圖3 不同編碼器‐解碼器的收斂曲線

4 結論

在本文中,我們提出了一種參數化的多相位gammatone 濾波器組。Para MPGTF將MPGTF中的核心參數與網絡進行聯合訓練。我們還在同一個實驗框架中比較了人工設計特征,參數化特征和可學習特征。據我們所知,這是第一個將三種特征放在一起比較。所比較的特征有STFT,MPGTF,ParaMPGTF 和可學習特征。實驗結果表明:當解碼器設置為可學習特征時,這四種特征的表現相似。STFT 比其他特征的性能稍好。當解碼器設置為編碼器的逆變換時,ParaMPGTF比其他人工設計特征的性能好。

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 国产资源免费观看| 免费看美女毛片| 精品免费在线视频| 高清国产在线| Aⅴ无码专区在线观看| 99久久国产综合精品女同| 免费精品一区二区h| 日韩精品免费一线在线观看| 亚洲午夜福利精品无码不卡 | 色欲国产一区二区日韩欧美| 2020精品极品国产色在线观看| 亚洲一级色| 国产中文在线亚洲精品官网| 国产精品伦视频观看免费| 高清无码手机在线观看| 亚洲欧美激情小说另类| 午夜性刺激在线观看免费| 免费在线a视频| 欧美一区二区三区香蕉视| 国产成人1024精品| 国产乱子伦无码精品小说| 国产福利影院在线观看| 国产极品美女在线| 午夜不卡福利| 久久99国产综合精品女同| 91亚瑟视频| 国产91精品最新在线播放| 99视频精品在线观看| 91偷拍一区| 亚洲成人黄色在线观看| 欧美日韩免费| 欧美一区福利| 波多野结衣视频网站| 国产精品亚洲一区二区三区z| 亚洲日本韩在线观看| 看你懂的巨臀中文字幕一区二区| 中文字幕久久精品波多野结| 国产成人超碰无码| 欧美亚洲另类在线观看| 欧美黄色a| 手机在线看片不卡中文字幕| 97在线观看视频免费| 国产亚卅精品无码| 999精品在线视频| 国产综合精品日本亚洲777| 精品超清无码视频在线观看| 日韩无码真实干出血视频| 国产不卡一级毛片视频| 国产精品露脸视频| 日本精品αv中文字幕| 一本大道香蕉久中文在线播放| 一本综合久久| 国产成人一级| 成人亚洲国产| 亚洲综合网在线观看| 98精品全国免费观看视频| 欧美色图久久| 久久综合色天堂av| 久久一色本道亚洲| 一级毛片不卡片免费观看| 精品国产成人a在线观看| 爆操波多野结衣| 这里只有精品免费视频| 国产菊爆视频在线观看| 久久精品亚洲热综合一区二区| 久久6免费视频| 亚洲天堂网站在线| 国产一级视频久久| 人妻中文字幕无码久久一区| aaa国产一级毛片| 国产成人综合久久精品尤物| 97成人在线观看| 亚洲日韩在线满18点击进入| 日本三级欧美三级| 天天综合色网| 成人av专区精品无码国产| 67194在线午夜亚洲| 丁香亚洲综合五月天婷婷| 黄色福利在线| 99久久精品免费看国产电影| 99re在线视频观看| 91精品国产福利|