曾招華 景新幸 楊海燕
(桂林電子科技大學(xué),廣西 桂林 541004)
用改進(jìn)的遺傳算法實(shí)現(xiàn)語(yǔ)音特征矢量的矢量量化
曾招華 景新幸 楊海燕
(桂林電子科技大學(xué),廣西 桂林 541004)
矢量量化作為一種數(shù)據(jù)壓縮技術(shù)在語(yǔ)音識(shí)別中占有重要的地位,傳統(tǒng)的LBG算法收斂速度快,但易陷入局部最優(yōu);而傳統(tǒng)的遺傳算法雖能得到全局最優(yōu)碼本,但收斂速度慢。文章結(jié)合它們各自的優(yōu)點(diǎn),對(duì)遺傳算法進(jìn)行改進(jìn),得到一種改進(jìn)的碼本設(shè)計(jì)方法。實(shí)驗(yàn)結(jié)果表明,提出的算法性能優(yōu)于傳統(tǒng)的遺傳算法,不僅收斂速度快,而且失真測(cè)度小。
矢量量化;GA;收斂速度;失真測(cè)度
矢量量化是20世紀(jì)70年代后期發(fā)展起來(lái)的一種數(shù)據(jù)壓縮和編碼技術(shù),目前已廣泛應(yīng)用于語(yǔ)音編碼、語(yǔ)音合成、語(yǔ)音識(shí)別和說(shuō)話(huà)人識(shí)別等領(lǐng)域。矢量量化的關(guān)鍵問(wèn)題是如何獲取VQ碼本,通常采用的是LBG算法,盡管其收斂速度快,但極易陷入局部最優(yōu),往往只能獲取局部最優(yōu)碼本。遺傳算法具有良好的全局搜索能力,可以快速地將解空間中的全體解搜索出,而不會(huì)陷入局部最優(yōu)解的快速下降陷進(jìn)。傳統(tǒng)的遺傳算法由于初始種群中的個(gè)體都是隨機(jī)產(chǎn)生的,收斂速度比較慢。本文提出一種改進(jìn)的遺傳算法,將語(yǔ)音特征矢量集進(jìn)行 LBG聚類(lèi),生成一個(gè)碼本作為初始種群的其中一個(gè)個(gè)體,其他個(gè)體仍是隨機(jī)產(chǎn)生的,這樣不僅可以有效加快算法的收斂速度,而且提高了種群的平均適應(yīng)度值,即降低了平均失真測(cè)度。本文首先描述了改進(jìn)的遺傳算法,然后敘述了實(shí)驗(yàn)步驟和流程圖,最后給出了實(shí)驗(yàn)結(jié)果分析和結(jié)論。
由于遺傳算法的整體搜索策略和優(yōu)化搜索方法在計(jì)算時(shí)不依賴(lài)于梯度信息或其它輔助知識(shí),而只需要影響搜索方向的目標(biāo)函數(shù)和相應(yīng)的適應(yīng)度函數(shù),所以遺傳算法提供了一種求解復(fù)雜系統(tǒng)問(wèn)題的通用框架,它不依賴(lài)于問(wèn)題的具體領(lǐng)域,對(duì)問(wèn)題的種類(lèi)有很強(qiáng)的魯棒性,因而其基本原理與方法是一樣的。
本文遺傳算法的實(shí)現(xiàn)涉及四個(gè)方面:參數(shù)的編碼和初始群體的設(shè)定,適應(yīng)度函數(shù)的設(shè)計(jì),遺傳操作,算法控制參數(shù)的設(shè)定。
遺傳算法中的個(gè)體采用二進(jìn)制位串表示,對(duì)應(yīng)生物遺傳中的染色體,是算法的操作對(duì)象。本文個(gè)體采用不同的碼本長(zhǎng)度,碼矢為24階MFCC系數(shù)構(gòu)成,每個(gè)語(yǔ)音特征參數(shù)又由m=10位(這里m的選擇取決于具體問(wèn)題的精度要求)的二進(jìn)制碼串構(gòu)成。假設(shè)一個(gè)特征矢量為n為矢量維數(shù),二進(jìn)制位串的長(zhǎng)度為m,它與xij之間的映射關(guān)系為:


其中bi,ai分別為Xi的最大值和最小值,M為二進(jìn)制位串編碼對(duì)應(yīng)的十進(jìn)制數(shù)。實(shí)驗(yàn)中采用部分隨機(jī)生成種群個(gè)體與LBG聚類(lèi)生成的一個(gè)碼本所構(gòu)成的種群作為初始種群,對(duì)傳統(tǒng)遺傳算法采用全部隨機(jī)生成種群個(gè)體的方法進(jìn)行改進(jìn),以實(shí)現(xiàn)遺傳算法種群平均適應(yīng)度的快速收斂,同時(shí)達(dá)到提高收斂后種群的適應(yīng)度值的目的。
個(gè)體的適應(yīng)度函數(shù)如下:

遺傳操作包括選擇、交叉、變異三個(gè)基本遺傳算子。選擇又稱(chēng)復(fù)制,是在群體中選擇生命力強(qiáng)的個(gè)體產(chǎn)生新的群體的過(guò)程,個(gè)體 j被選中的概率與其適應(yīng)度成比例,即:遺傳算法中使用交叉算子來(lái)產(chǎn)生新的個(gè)體,是生物遺傳和進(jìn)化過(guò)程中的一個(gè)主要環(huán)節(jié);變異操作也是遺傳算法中重要的繁殖操作,它通過(guò)個(gè)體的突變以產(chǎn)生更優(yōu)秀的后代。
遺傳算法中的控制參數(shù)選擇非常關(guān)鍵,控制參數(shù)的不同選取會(huì)對(duì)遺傳算法的性能產(chǎn)生較大的影響,甚至影響到整個(gè)算法的收斂性。這些參數(shù)包括群體規(guī)模、終止進(jìn)化代數(shù)、二進(jìn)制編碼長(zhǎng)度、交叉概率cP和變異概率Pm等。
1.確定訓(xùn)練語(yǔ)音參數(shù)集中特征矢量的個(gè)數(shù)和維數(shù),并設(shè)定最大進(jìn)化代數(shù);
2.對(duì)訓(xùn)練語(yǔ)音矢量集進(jìn)行參數(shù)編碼和初始化種群;
3.評(píng)價(jià)當(dāng)前代種群:首先對(duì)當(dāng)前代的各個(gè)體進(jìn)行位串解碼、其次計(jì)算各個(gè)體的適應(yīng)度,最后對(duì)適應(yīng)值進(jìn)行調(diào)整,若滿(mǎn)足迭代終止條件則結(jié)束循環(huán),否則,進(jìn)行遺傳操作;
4.更新種群,輸出適應(yīng)度最大的個(gè)體即為最優(yōu)碼本。
實(shí)驗(yàn)流程如圖1所示,其中虛線(xiàn)部分為改進(jìn)部分:

圖1 碼本設(shè)計(jì)流程圖
實(shí)驗(yàn)中的訓(xùn)練矢量為從自建語(yǔ)音庫(kù)中選擇的若干語(yǔ)音經(jīng)過(guò)預(yù)處理和參數(shù)分析得到的24階MFCC系數(shù)構(gòu)成的語(yǔ)音特征矢量。圖2和圖3分別為遺傳算法優(yōu)化前和優(yōu)化后的種群平均適應(yīng)度變化曲線(xiàn)圖。圖中可以看到,優(yōu)化前和優(yōu)化后種群平均適應(yīng)度值在前50代都增長(zhǎng)很快,之后增長(zhǎng)較為緩慢,但優(yōu)化前還有繼續(xù)增長(zhǎng)的趨勢(shì),而優(yōu)化后則基本保持不變,即實(shí)現(xiàn)收斂,平均適應(yīng)度值達(dá)到550,高出優(yōu)化前的470。因此,采用LBG算法聚類(lèi)特征矢量作為初始種群中的一個(gè)碼本可以有效加快收斂速度,并提高了種群的適應(yīng)度值,即降低了種群平均失真測(cè)度。

圖2 優(yōu)化前

圖3 優(yōu)化后
傳統(tǒng)遺傳算法和優(yōu)化后遺傳算法不同碼本長(zhǎng)度失真測(cè)度對(duì)比,如下圖4所示:

圖4 優(yōu)化前和優(yōu)化后的失真測(cè)度對(duì)比
本文比較研究了傳統(tǒng)遺傳算法和改進(jìn)的遺傳算法用于語(yǔ)音特征矢量的VQ碼本設(shè)計(jì),給出了具體的實(shí)驗(yàn)步驟和方法。從實(shí)驗(yàn)結(jié)果可以看出,采用改進(jìn)的遺傳算法不僅可以有效地改進(jìn)遺傳算法的收斂速度,而且提高了種群的平均適應(yīng)度,即降低了種群平均失真測(cè)度。
[1]趙立.語(yǔ)音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社, 2009.5.
[2]雷英杰,等.MATLAB 遺傳算法工具箱及應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2005.
[3]Chavan, P.U.,Chavan, P.P.,Dandawate, Y.H. Codebook Optimization in Vector Quantization using Genetic Algorithm.IEEE International Conference on Computer and Electrical Engineering.12/28/2009 to 12/30/2009,Dubai.Page(s):280-283.
TP301.6
A
1008-1151(2011)04-0059-02
2011-01-20
國(guó)家自然科學(xué)基金(609661002)
曾招華(1984-),男,江西吉安人,桂林電子科技大學(xué)碩士,研究方向?yàn)檎Z(yǔ)音識(shí)別。