999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于單目標(biāo)跟蹤算法的發(fā)音自動校準(zhǔn)系統(tǒng)設(shè)計

2018-07-10 07:20:04李玉華
現(xiàn)代電子技術(shù) 2018年13期

李玉華

摘 要: 傳統(tǒng)發(fā)音校準(zhǔn)系統(tǒng)存在英語發(fā)音校準(zhǔn)準(zhǔn)確率低的問題,采用單目標(biāo)跟蹤算法設(shè)計發(fā)音自動校準(zhǔn)系統(tǒng),利用UNIX風(fēng)格子程序?qū)ψ詣有?zhǔn)系統(tǒng)硬件框架進(jìn)行構(gòu)建,遵循內(nèi)高聚合原則分析數(shù)據(jù)資源提取模塊流程。針對英語發(fā)音信息采集需利用模擬數(shù)字信號轉(zhuǎn)換來提高數(shù)據(jù)采樣效率,對發(fā)音校準(zhǔn)引擎A/D電路進(jìn)行設(shè)計。采用單目標(biāo)跟蹤算法提取相關(guān)特征,并形成邏輯層。開發(fā)嵌入式內(nèi)核結(jié)構(gòu),研究語音識別代碼。通過實(shí)驗(yàn)驗(yàn)證可知,該系統(tǒng)英語發(fā)音校準(zhǔn)準(zhǔn)確率高,對發(fā)音糾正能力較強(qiáng)。

關(guān)鍵詞: 單目標(biāo)跟蹤算法; 發(fā)音; 自動校準(zhǔn); A/D電路; 邏輯層; 語音識別

中圖分類號: TN02?34; TP273 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)13?0151?04

Abstract: The traditional pronunciation calibration system has low accuracy for English pronunciation calibration. Therefore, the single target tracking algorithm is adopted to design the pronunciation automatic calibration system. The UNIX?style subroutine is used to build the hardware framework of the automatic calibration system, which follows the high?polymeric principle to analyze the extraction process of the data resource extraction module. The A/D signal conversion is used for English pronunciation information acquisition to improve the data sampling efficiency, and its circuit is designed. The single target tracking algorithm is adopted to extract the related features to form a logical layer. The embedded kernel structure is developed, and the speech recognition code is studied. The experimental results show that the system has high accuracy for English pronunciation calibration, and strong pronunciation correction ability.

Keywords: single target tracking algorithm; pronunciation; automatic calibration; A/D circuit; logical layer; speech recognition

0 引 言

由于近幾年英語考試模式不斷更新,口試部分進(jìn)行了調(diào)整,只有筆試成績優(yōu)異的同學(xué)才能進(jìn)行口語考試。傳統(tǒng)考核機(jī)制存在校準(zhǔn)準(zhǔn)確率低的問題,對語言水平能力測試的公正性產(chǎn)生了很大影響。對于國際公司的業(yè)務(wù)往來需要具有優(yōu)秀口語能力的員工進(jìn)行無障礙交流,這就要求招聘時對員工進(jìn)行口語測試。公司基本應(yīng)聘要求就是個人的語言表達(dá)能力要強(qiáng),可通過群體進(jìn)行直接面試,而口語卻只能一一進(jìn)行,需要較多的人力與物力,無疑給企業(yè)招聘增加了難度。隨著口語交流障礙問題的出現(xiàn),信息技術(shù)的快速發(fā)展可有效解決該問題,由此計算機(jī)輔助學(xué)習(xí)技術(shù)應(yīng)運(yùn)而生。利用計算機(jī)技術(shù)解決口語中出現(xiàn)的問題,替代重復(fù)性工作行為[1]。

發(fā)音自動校準(zhǔn)系統(tǒng)的設(shè)計綜合了單目標(biāo)跟蹤算法,使該過程不用人為參與即可完成校準(zhǔn),并提高英語發(fā)音校準(zhǔn)的準(zhǔn)確率。針對學(xué)習(xí)者,可通過該系統(tǒng)進(jìn)行反復(fù)練習(xí),并根據(jù)評分結(jié)果及時調(diào)整自己的發(fā)音;針對大規(guī)模口語考試,使用該系統(tǒng)既提高了校準(zhǔn)效果,又提高了考試公正性。因此,發(fā)音自動校準(zhǔn)系統(tǒng)對發(fā)音學(xué)習(xí)和考試都有重要意義。

1 單目標(biāo)跟蹤算法系統(tǒng)設(shè)計

1.1 數(shù)據(jù)資源提取模塊設(shè)計

英語發(fā)音具有獨(dú)特技巧,需先了解發(fā)音器官:舌、唇、牙齒、聲帶、鼻腔和口腔。比如:“我喜歡這本書”,漢語主要看口型大小和前后開合情況,但是看不到身體形狀變化情況;而英文“I like this book”,除了可以看到嘴巴的張合情況,還能看到胸部有節(jié)奏的呼吸,英語發(fā)音主要靠氣流發(fā)出來,以胸腔進(jìn)行發(fā)音[2]。

針對這種情況,設(shè)計音頻文件提取流程,如圖1所示。測試者可在固定位置進(jìn)行錄音,完成錄音后將數(shù)據(jù)提交給系統(tǒng),系統(tǒng)通過校準(zhǔn)引擎A/D電路進(jìn)行判定。

1.2 發(fā)音校準(zhǔn)引擎A/D電路設(shè)計

針對英語發(fā)音信息采集需要利用模擬數(shù)字信號轉(zhuǎn)換來提高數(shù)據(jù)采樣效率,通常情況下采樣效率不小于150 kHz,在語音識別中,設(shè)計多頻振蕩器對發(fā)音準(zhǔn)確性進(jìn)行自動校準(zhǔn),而A/D電路轉(zhuǎn)換的校準(zhǔn)是實(shí)現(xiàn)對英語打印信息模式轉(zhuǎn)換的關(guān)鍵所在,通過對該電路原始語音信息進(jìn)行采集與控制,可提高系統(tǒng)自動校正數(shù)據(jù)的準(zhǔn)確性[3?4]。利用STM32F10內(nèi)核多頻振蕩器集成智能信息控制A/D采樣,并將數(shù)字信號處理(DSP)板上的15 V電壓通過[I2C]總線進(jìn)行電壓加載[5]。通常情況下,在低功耗4通道15位A/D電路轉(zhuǎn)換器上進(jìn)行并行和串行控制,獲取的輸入電壓為:

在發(fā)音準(zhǔn)確性數(shù)據(jù)采集電源設(shè)計中,將數(shù)字信號處理(DSP)板上的±15 V電壓兩端分別對電容進(jìn)行濾波處理。通過模擬信號發(fā)射范圍進(jìn)行同步采樣,由此完成系統(tǒng)硬件部分的設(shè)計。

2 系統(tǒng)軟件設(shè)計

設(shè)計系統(tǒng)軟件部分,采用單目標(biāo)跟蹤算法對各個候選目標(biāo)區(qū)域?qū)嵤┢ヅ洌ㄎ荒繕?biāo)在校準(zhǔn)序列中的位置。利用跟蹤原理提取相關(guān)特征,獲得目標(biāo)表達(dá)效果,該算法構(gòu)建邏輯層主要包括三個層次,分別是輸入層、多隱層和輸出層[7]。輸入層主要負(fù)責(zé)將收集的數(shù)據(jù)輸入到系統(tǒng)中,有利于可視化分類;多隱層利用人工神經(jīng)網(wǎng)絡(luò)對跟蹤數(shù)據(jù)進(jìn)行本質(zhì)刻畫;輸出層主要負(fù)責(zé)對整合后數(shù)據(jù)輸出,實(shí)現(xiàn)無監(jiān)督數(shù)據(jù)傳輸[8]。

單目標(biāo)跟蹤算法可遵循人工神經(jīng)網(wǎng)絡(luò)模式,利用目標(biāo)跟蹤來模仿人腦,通過對發(fā)音數(shù)據(jù)特征進(jìn)行組合形成抽象邏輯層。單目標(biāo)跟蹤算法與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)之間的相同點(diǎn)在于都采用分層結(jié)構(gòu)對邏輯層進(jìn)行構(gòu)建,而不同點(diǎn)在于本文算法采用了三層構(gòu)建模式,是最接近人類大腦的分層結(jié)構(gòu),每一層都可看作一個邏輯回歸(Logistic Regression)模型,根據(jù)該模型可對不同層次數(shù)據(jù)進(jìn)行跟蹤,方便系統(tǒng)對發(fā)音數(shù)據(jù)自動收集。單目標(biāo)跟蹤算法邏輯層構(gòu)建如圖3所示。

根據(jù)圖3建立的邏輯層,對發(fā)音自動校準(zhǔn)系統(tǒng)軟件的嵌入式內(nèi)核結(jié)構(gòu)進(jìn)行開發(fā),引導(dǎo)程序需調(diào)用說話者語音識別代碼,如下所示:

Generates Settings--->

PPI CAT24WC256 andCMOS EEPROMr--->

[*]downloaded I2C hus transmission protocol

//引導(dǎo)程序負(fù)責(zé)上電時初始化

DSP input clock CLKIN(PPI_ Philips memnry)--->

( /home/Documents/f automatically increase) XFR_TYPE load-ing I2C E2PROM

*Lash(DMAx_ 256 kb serial E2PROM CMOS)

//lib目錄下提供內(nèi)核

在該代碼基礎(chǔ)上,調(diào)用request_ irq單目標(biāo)跟蹤函數(shù)申請英語發(fā)音自動校準(zhǔn),利用freet_ irq單目標(biāo)跟蹤函數(shù)增加內(nèi)部地址[9]。而[I2C]總線校準(zhǔn)控制命令語句為:

#define data transmission rate_pwm"pwm"

int I2C hus standard_MAP()

ret =CAT24WC256_pwm_open(misc)

通過硬件部分設(shè)計的A/D轉(zhuǎn)換器進(jìn)行軟件程序的打開和關(guān)閉,保證總線數(shù)據(jù)傳輸效率,由此實(shí)現(xiàn)對發(fā)音準(zhǔn)確性自動校準(zhǔn)的設(shè)計與分析[10]。

3 實(shí) 驗(yàn)

為了驗(yàn)證基于單目標(biāo)跟蹤算法的發(fā)音自動校準(zhǔn)系統(tǒng)設(shè)計的合理性進(jìn)行了如下實(shí)驗(yàn)。

3.1 實(shí)驗(yàn)環(huán)境設(shè)置

采用語音識別技術(shù)對多生源音頻進(jìn)行匹配,實(shí)驗(yàn)環(huán)境設(shè)置為:

1) 配置PXI?6713語音播放通道,系統(tǒng)對發(fā)音進(jìn)行自動采集,且頻率不低于15 MHz;

2) 利用標(biāo)準(zhǔn)VPP儀器對英語發(fā)音進(jìn)行控制,控制整個校準(zhǔn)過程對發(fā)音識別分辨率不低于5位;

3) 發(fā)音信號輸入頻率范圍較大,盡量使英語發(fā)音采集到的信息通道和輸出通道都使用5通道進(jìn)行同步和異步輸入;

4) 控制功率處于低消耗模式,A/D轉(zhuǎn)換速率大于150 kHz,總線傳輸分辨率至少為10位。

3.2 實(shí)驗(yàn)結(jié)果與分析

將發(fā)音數(shù)據(jù)庫里的數(shù)據(jù)內(nèi)容設(shè)置為自動校準(zhǔn)系統(tǒng)的輸入內(nèi)容,標(biāo)準(zhǔn)語音存儲庫存儲的是句子語音文件和標(biāo)記的語音信息。利用TIMIT語音庫對系統(tǒng)進(jìn)行訓(xùn)練,由500個說話者錄制而成,每人可朗誦10句因素較全的英文句子。而發(fā)音庫是具有開放式屬性的數(shù)據(jù)庫,可為任何人提交內(nèi)容,單詞總量可達(dá)到357 000。待自動校準(zhǔn)語音數(shù)據(jù)庫為實(shí)驗(yàn)待測語音數(shù)據(jù)庫,將10名說話者的發(fā)音水平按照高低進(jìn)行排序,使每人按照順序依次讀10句英文,記錄者需將這些發(fā)音內(nèi)容記錄下來作為實(shí)驗(yàn)數(shù)據(jù)。同時,請5位導(dǎo)師對這100句英文的發(fā)音情況進(jìn)行評分,評分結(jié)果需記錄。

利用單目標(biāo)跟蹤算法不斷進(jìn)行反復(fù)迭代運(yùn)算,在該過程中,雖然數(shù)據(jù)量大,運(yùn)算起來較為復(fù)雜,但每個句子的運(yùn)算流程卻是一致的。以標(biāo)準(zhǔn)語音庫中的例句為例,分析該句子組成的基本發(fā)音信息,如表1所示。

如表1所示,獲取基本信息后,需要將音頻數(shù)據(jù)進(jìn)行參數(shù)化,首先對數(shù)據(jù)進(jìn)行預(yù)加重、分針和加窗。然后對每幀數(shù)據(jù)進(jìn)行提取,獲取結(jié)果在系統(tǒng)頁面上顯示如圖4所示。

發(fā)音自動校準(zhǔn)系統(tǒng)獲取信息之后,可在頁面展示每幀音頻頻率波動情況,由圖4可知,窗口上方為音頻數(shù)據(jù)的波形圖,下方為不同時刻的音素信息。每幀采樣點(diǎn)數(shù)量是采樣頻率乘以幀長度,根據(jù)表1中音頻基本信息以及發(fā)音庫數(shù)據(jù)組織格式,設(shè)置語音幀長度為15 ms,采樣點(diǎn)數(shù)量為240點(diǎn)。

根據(jù)上述實(shí)驗(yàn)過程,對待測發(fā)音數(shù)據(jù)進(jìn)行校準(zhǔn)。為了驗(yàn)證本文系統(tǒng)發(fā)音校準(zhǔn)的準(zhǔn)確率,將傳統(tǒng)發(fā)音校準(zhǔn)系統(tǒng)與基于單目標(biāo)跟蹤算法的發(fā)音自動校準(zhǔn)系統(tǒng)的校準(zhǔn)結(jié)果進(jìn)行對比,如表2所示。

為了使實(shí)驗(yàn)結(jié)果更加明確,利用折線圖對結(jié)果進(jìn)行展示,如圖5所示。

由圖5可知,傳統(tǒng)系統(tǒng)對發(fā)音校準(zhǔn)的準(zhǔn)確率小于本文設(shè)計的系統(tǒng)。

3.3 實(shí)驗(yàn)結(jié)論

針對基于單目標(biāo)跟蹤算法發(fā)音自動校準(zhǔn)系統(tǒng)所進(jìn)行的實(shí)驗(yàn)可充分驗(yàn)證該系統(tǒng)設(shè)計的合理性,通過發(fā)音自動校準(zhǔn)界面,獲取待測語音基本信息,根據(jù)例句描述語音特征提取結(jié)果,并將傳統(tǒng)系統(tǒng)與本文系統(tǒng)校準(zhǔn)準(zhǔn)確情況進(jìn)行對比,可充分體現(xiàn)本文設(shè)計的系統(tǒng)具有較好的自動校準(zhǔn)效果。

4 結(jié) 語

發(fā)音自動校準(zhǔn)是一個極為復(fù)雜的過程,其中涉及聲學(xué)和語言學(xué)的知識以及對音頻信號的處理,由于說話者發(fā)音特點(diǎn)存在差異性,因此發(fā)音規(guī)則非常復(fù)雜,對發(fā)音進(jìn)行自動校準(zhǔn)也十分困難。為此,本文提出基于單目標(biāo)跟蹤算法發(fā)音自動校準(zhǔn)系統(tǒng)的設(shè)計。通過實(shí)驗(yàn)驗(yàn)證系統(tǒng)設(shè)計的合理性,該系統(tǒng)具有較好的自動校準(zhǔn)準(zhǔn)確率,利用該系統(tǒng)可使學(xué)習(xí)者易于發(fā)現(xiàn)自己發(fā)音的不足,有針對性地改正發(fā)音效果。

參考文獻(xiàn)

[1] 盛琥,趙溫波,王立明,等.基于量測轉(zhuǎn)換與輸入估計的機(jī)動目標(biāo)跟蹤算法[J].系統(tǒng)工程與電子技術(shù),2015,37(1):31?36.

SHENG Hu, ZHAO Wenbo, WANG Liming, et al. Maneuvering target tracking algorithm based on converted measurement and input estimation [J]. Systems engineering and electronics, 2015, 37(1): 31?36.

[2] 任航.基于擬蒙特卡洛濾波的改進(jìn)式粒子濾波目標(biāo)跟蹤算法[J].電子測量與儀器學(xué)報,2015,29(2):289?295.

REN Hang. Improved particle filter target tracking algorithm based on quasi Monte Carlo filtering [J]. Journal of electronic measurement and instrumentation, 2015, 29(2): 289?295.

[3] 李康,何發(fā)智,潘一騰,等.基于簇相似的多分類器目標(biāo)跟蹤算法[J].電子學(xué)報,2016,44(4):821?825.

LI Kang, HE Fazhi, PAN Yiteng, et al. Multi?classifier object tracking based on cluster similarity [J]. Acta electronica sinica, 2016, 44(4): 821?825.

[4] 孫銳,黃靜茹,丁文秀.一種基于子空間學(xué)習(xí)的實(shí)時目標(biāo)跟蹤算法[J].光電工程,2015,42(2):52?58.

SUN Rui, HUANG Jingru, DING Wenxiu. A real?time object tracking algorithm based on subspace learning [J]. Opto?electronic engineering, 2015, 42(2): 52?58.

[5] 劉哲,陳懇,鄭紫微.基于HOG與多實(shí)例在線學(xué)習(xí)的目標(biāo)跟蹤算法[J].計算機(jī)工程,2015,41(1):158?163.

LIU Zhe, CHEN Ken, ZHENG Ziwei. Object tracking algorithm based on HOG and multiple?instance online learning [J]. Computer engineering, 2015, 41(1): 158?163.

[6] 陳杏源,鄭烈心,裴海龍.基于Camshift和SURF的目標(biāo)跟蹤系統(tǒng)[J].計算機(jī)工程與設(shè)計,2016,37(4):902?906.

CHEN Xingyuan, ZHENG Liexin, PEI Hailong. Object tracking system based on Camshift and SURF [J]. Computer engineering and design, 2016, 37(4): 902?906.

[7] HU Yumei, HU Zhentao, ZHENG Shanshan, et al. Novel target tracking algorithm based on joint estimation of system error and state [J]. Computer science, 2015, 42(11): 310?313.

[8] ZHU Hanhua, ZHAO Songying, LI Jingshu, et al. Monocular vision?based moving object tracking [J]. Navigation of China, 2017, 40(2): 1?5.

[9] TIAN Anhong, YANG Siyuan, TANG Jinwen, et al. Target tracking algorithm research of integrated positioning system based on particle filter [J]. Journal of projectiles, rockets, missiles and guidance, 2015(2): 134?136.

[10] 王衛(wèi)民,金力.基于Android的手語動畫自動生成軟件設(shè)計[J].電子設(shè)計工程,2017,25(18):42?45.

WANG Weimin, JIN Li. Sign language animation generation of software design based on Android [J]. Electronic design engineering, 2017, 25(18): 42?45.

[11] 侯向丹,董永峰,坎啟嬌,等.基于運(yùn)動軌跡的視頻目標(biāo)跟蹤算法[J].計算機(jī)工程與設(shè)計,2015,36(4):995?998.

HOU Xiangdan, DONG Yongfeng, KAN Qijiao, et al. Video target tracking based on movement trace [J]. Computer engineering and design, 2015, 36(4): 995?998.

[12] 李志國,顧鑫,祝樹生,等.基于特征確定性的目標(biāo)跟蹤算法[J].激光與紅外,2015,45(5):576?579.

LI Zhiguo, GU Xin, ZHU Shusheng, et al. Target tracking algorithm based on certainty measurement of the feature [J]. Laser & infrared, 2015, 45(5): 576?579.

主站蜘蛛池模板: 天天做天天爱天天爽综合区| 国产激情无码一区二区APP | 亚洲无码91视频| 国产精品视频观看裸模| 2020国产免费久久精品99| 欧美中文一区| 国内99精品激情视频精品| 亚洲成人黄色网址| 99热这里只有精品在线观看| 亚洲第一中文字幕| 国产精品视频a| 中文字幕无码电影| 98精品全国免费观看视频| 激情视频综合网| 亚洲综合日韩精品| 国产一在线| AV片亚洲国产男人的天堂| 欧美成人A视频| 亚洲福利一区二区三区| 不卡的在线视频免费观看| 精品久久国产综合精麻豆| 四虎精品国产永久在线观看| 香蕉久久国产超碰青草| 看你懂的巨臀中文字幕一区二区 | 九九九精品成人免费视频7| 2022国产无码在线| 一区二区在线视频免费观看| 美女内射视频WWW网站午夜| 免费国产不卡午夜福在线观看| 91精品情国产情侣高潮对白蜜| 国产原创第一页在线观看| 国模视频一区二区| 国产精品无码影视久久久久久久 | 欧美天天干| 国内毛片视频| 日韩中文字幕亚洲无线码| 性色一区| 精品免费在线视频| 欧美专区日韩专区| 国产精品3p视频| 国产99视频免费精品是看6| 欧美高清三区| 亚洲天堂网视频| 色首页AV在线| 成人欧美日韩| 久久人与动人物A级毛片| 色亚洲成人| 青草国产在线视频| 制服丝袜一区| 国产产在线精品亚洲aavv| 国内精品久久久久久久久久影视| 在线观看精品国产入口| 国产免费网址| 麻豆精品久久久久久久99蜜桃| 精品一区二区三区波多野结衣| 国产精欧美一区二区三区| 亚洲性日韩精品一区二区| 福利视频一区| 欧美成人A视频| 2020国产在线视精品在| 欧美yw精品日本国产精品| 自慰网址在线观看| 经典三级久久| 亚洲视频在线青青| 精品国产www| 免费一级成人毛片| 四虎永久在线| 日韩视频免费| 精品欧美一区二区三区久久久| 在线观看免费国产| 国产va免费精品观看| 玖玖精品在线| av在线手机播放| 欧美亚洲日韩中文| 91久久青青草原精品国产| 国产精品露脸视频| 国产精品久久久久久久久久久久| 特级欧美视频aaaaaa| 四虎成人在线视频| 国产成人1024精品下载| a级毛片一区二区免费视频| 色吊丝av中文字幕|