劉士蕾
摘要:伴隨著科學(xué)技術(shù)進(jìn)步與發(fā)展,廣播電視作為傳統(tǒng)媒體成為人們接收新聞信息的主要途徑。與此同時(shí),廣播電視檢測(cè)也得到了快速發(fā)展,最顯著的特征就是融入了語(yǔ)音識(shí)別技術(shù),對(duì)工作質(zhì)量、工作效率的提升具有重要作用。現(xiàn)如今,怎樣更好地在廣播電視檢測(cè)中應(yīng)用語(yǔ)音識(shí)別技術(shù)也得到了重視,成為廣播電視事業(yè)發(fā)展重要研究課題。基于此,文章研究了語(yǔ)音識(shí)別技術(shù)在廣播電視監(jiān)測(cè)的應(yīng)用。
關(guān)鍵詞:語(yǔ)音識(shí)別技術(shù);廣播電視監(jiān)測(cè);應(yīng)用發(fā)展
面對(duì)日益復(fù)雜的電磁環(huán)境,怎樣做好無(wú)線電頻率資源控制,確保各頻段業(yè)務(wù)的順利進(jìn)行成為無(wú)線電管理與監(jiān)測(cè)人員重要工作內(nèi)容。廣播電視監(jiān)測(cè)人員主要工作內(nèi)容即是確保廣播電視頻譜資源的科學(xué)利用,掌握頻譜荷載狀態(tài)進(jìn)而更好地服務(wù)于廣大群眾。現(xiàn)如今,語(yǔ)音識(shí)別技術(shù)的出現(xiàn)為監(jiān)測(cè)人員工作提供了便利條件,該技術(shù)能夠?qū)φZ(yǔ)音信號(hào)特點(diǎn)展開(kāi)判斷,實(shí)現(xiàn)頻譜占用智能化識(shí)別,對(duì)廣播電視監(jiān)測(cè)具有重要作用。
1 語(yǔ)音識(shí)別分析
語(yǔ)音識(shí)別系統(tǒng)分為訓(xùn)練與語(yǔ)音識(shí)別。其中,前者主要作用是語(yǔ)音搜集、信息分析進(jìn)而開(kāi)展信號(hào)處理與模板構(gòu)建。訓(xùn)練工程中語(yǔ)音識(shí)別技術(shù)主要通過(guò)聲音的高低、強(qiáng)弱、音色及社會(huì)屬性科學(xué)分析。而后者則是進(jìn)行音波提取的時(shí)間變化及語(yǔ)音特點(diǎn),根據(jù)不同方法推算語(yǔ)音特點(diǎn)矢量排序與發(fā)音模板的距離。聲音辨別過(guò)程中,把語(yǔ)音特點(diǎn)與聲學(xué)模型綜合對(duì)比從而獲得理想的識(shí)別效果。即使分類錯(cuò)誤也無(wú)妨,仍然能夠結(jié)合聲學(xué)模型更正,尤其是相同音的生字,結(jié)合前后語(yǔ)義進(jìn)行準(zhǔn)確識(shí)別。由此可見(jiàn),語(yǔ)音識(shí)別技術(shù)運(yùn)行過(guò)程為:首先,語(yǔ)音信號(hào)中產(chǎn)生的語(yǔ)音信息是通過(guò)短時(shí)幅度譜時(shí)間變化編碼。其次,語(yǔ)音閱讀聲學(xué)信號(hào)可以輸送多個(gè)不同的、分散的符號(hào)。最后,語(yǔ)音交互只是一種認(rèn)知形式,無(wú)法和語(yǔ)法、語(yǔ)義分割[1]。
1.1 語(yǔ)音識(shí)別準(zhǔn)備
語(yǔ)音識(shí)別應(yīng)用在廣播電視監(jiān)測(cè)中對(duì)搜集語(yǔ)音文件展開(kāi)判斷,根據(jù)現(xiàn)有技術(shù)需求,語(yǔ)音文件格式在30 s左右wav或pcm數(shù)據(jù)的無(wú)壓縮音頻,采樣率為11 025 Hz,采樣比特16 bit與單通道模式。音頻信息將256個(gè)采樣點(diǎn)氛圍一組為一幀,幀則是語(yǔ)音識(shí)別單位。對(duì)幀展開(kāi)傅里葉變化由各幀內(nèi)提取干音頻特點(diǎn)。43幀為一組,等同于1 s的數(shù)據(jù)成一組,組是語(yǔ)種判斷的基礎(chǔ)單元。
1.2 音頻特點(diǎn)
音頻文件研究過(guò)程中,一般對(duì)時(shí)域特點(diǎn)和頻域分析,常見(jiàn)音頻特點(diǎn)包含:時(shí)域特點(diǎn)與頻域特點(diǎn)。其中,時(shí)域特點(diǎn)分為ZCR,HZCRR,STE,LSTER,RMS,SFR,SED。頻域特點(diǎn)分為:SF,SC:,SRF,BP,SBE,NFR。(1)過(guò)零率與高過(guò)零率幀比率。過(guò)零率代表窗內(nèi)信號(hào)中信號(hào)波形穿出零點(diǎn)頻率,因?yàn)檎Z(yǔ)音信號(hào)轉(zhuǎn)換涵蓋清音與濁音,有著較強(qiáng)與較低的過(guò)零率,音樂(lè)信號(hào)較為穩(wěn)定代表語(yǔ)音信號(hào)過(guò)零率改變迅速。基于客觀性上來(lái)說(shuō),方差較多,超出零率幀比率較高能夠準(zhǔn)確判斷語(yǔ)音與非語(yǔ)音。(2)靜音幀比率。靜音幀比率指的是窗內(nèi)靜音幀占據(jù)的比例,一幀能量不及預(yù)定靜音門(mén)限后表示該幀是靜音幀。在預(yù)定靜音門(mén)低時(shí),語(yǔ)音音調(diào)不同,純語(yǔ)音中靜音幀比率超出音樂(lè)與非純語(yǔ)音內(nèi)靜音幀比例。
2 語(yǔ)音識(shí)別應(yīng)用在廣播監(jiān)測(cè)中的作用
2.1 聲紋識(shí)別
該技術(shù)結(jié)合了語(yǔ)音波形分析人行為特點(diǎn)的語(yǔ)音狀態(tài),判斷講話人身份。首先,講話人身份識(shí)別,能夠判斷出說(shuō)話人;其次,判斷某個(gè)語(yǔ)音是否為指定的人聲音。聲紋識(shí)別將語(yǔ)音信號(hào)為基礎(chǔ),結(jié)合人的發(fā)音特點(diǎn)掌握講話人個(gè)性。從生物學(xué)范圍而言,聲紋識(shí)別為生物因子認(rèn)證范圍,與指紋識(shí)別有著相通性。指紋識(shí)別即是利用每個(gè)人指紋不同進(jìn)行判斷,而聲紋識(shí)別則是抓住講話人特點(diǎn)作出準(zhǔn)確判斷。
2.2 內(nèi)容辨識(shí)
內(nèi)容辨別主要針對(duì)語(yǔ)音內(nèi)容的判斷,通過(guò)語(yǔ)音的物理屬性、生理屬性分析講話內(nèi)容,將判斷語(yǔ)音信號(hào)承載的內(nèi)容為目標(biāo)。不過(guò),內(nèi)容識(shí)別具有一定困難性,容易受到講話人發(fā)音、方言、表達(dá)習(xí)慣等影響;也正是由于內(nèi)容辨識(shí)的困難性才衍生出聲紋識(shí)別。想要讓聲紋與語(yǔ)法、語(yǔ)義模型符合,還需要利用詞性標(biāo)記、詞語(yǔ)區(qū)分、語(yǔ)境理解等科學(xué)判斷語(yǔ)音內(nèi)容,處理過(guò)程較為繁瑣。
2.3 語(yǔ)種與語(yǔ)音辨別
語(yǔ)種識(shí)別是語(yǔ)音材料兼容的語(yǔ)種特征判斷,語(yǔ)音內(nèi)容判斷與智能翻譯技術(shù)就是基于語(yǔ)種識(shí)別衍生而來(lái)。語(yǔ)種識(shí)別能夠?qū)τ?jì)算機(jī)中不同語(yǔ)音材料展開(kāi)判斷,將語(yǔ)音材料提取至識(shí)別系統(tǒng)內(nèi),即是利用語(yǔ)種識(shí)別技術(shù)。
語(yǔ)音標(biāo)準(zhǔn)判斷,利用個(gè)人語(yǔ)音材料和語(yǔ)音標(biāo)準(zhǔn)模型比較進(jìn)行語(yǔ)音標(biāo)準(zhǔn)狀態(tài)分析;同時(shí)找到不標(biāo)準(zhǔn)發(fā)音。現(xiàn)如今,該項(xiàng)技術(shù)已經(jīng)被廣泛應(yīng)用在語(yǔ)言教學(xué)與語(yǔ)音標(biāo)準(zhǔn)檢測(cè)中[2]。
3 語(yǔ)音識(shí)別技術(shù)在廣播電視監(jiān)測(cè)的應(yīng)用
伴隨著語(yǔ)音識(shí)別技術(shù)的進(jìn)步,通過(guò)自動(dòng)化語(yǔ)音識(shí)別達(dá)到廣播頻道中頻率節(jié)目播出狀態(tài)的判斷,利用語(yǔ)音信號(hào)特點(diǎn)提取關(guān)鍵數(shù)據(jù)信息,分析語(yǔ)音類型、語(yǔ)種,把靜音、噪音、言語(yǔ)信號(hào)給予分類實(shí)現(xiàn)頻道中不同頻譜占用的智能化辨別音樂(lè)、言語(yǔ)等方面語(yǔ)音識(shí)別技術(shù)理論與綜合研究。
現(xiàn)階段,廣播電視監(jiān)測(cè)融入了語(yǔ)音識(shí)別、電視內(nèi)容監(jiān)測(cè),節(jié)約了人力資源投入,對(duì)社會(huì)和諧穩(wěn)定與監(jiān)測(cè)事業(yè)進(jìn)步具有重要影響。(1)應(yīng)用狀態(tài)。首先,電視監(jiān)測(cè)。電視監(jiān)測(cè)中語(yǔ)音識(shí)別技術(shù)經(jīng)過(guò)對(duì)電視欄目?jī)?nèi)容構(gòu)建語(yǔ)音模板與文字模板。隨后,節(jié)目播出時(shí)與播放的電視語(yǔ)音展開(kāi)語(yǔ)音識(shí)別,找到語(yǔ)音模板與文字配合內(nèi)容實(shí)時(shí)錄像找到播出異態(tài)和播出問(wèn)題。利用系統(tǒng)輸送至值班人員展開(kāi)預(yù)警,便于工作人員及時(shí)處理,解決故障問(wèn)題。經(jīng)過(guò)電視監(jiān)測(cè)應(yīng)用語(yǔ)音技術(shù),系統(tǒng)判斷率達(dá)到99%,達(dá)到了電視智能化監(jiān)測(cè)。(2)廣播監(jiān)測(cè)。語(yǔ)種識(shí)別技術(shù)應(yīng)用在廣播電視監(jiān)測(cè)中有著重要意義。因?yàn)閲?guó)外電臺(tái)對(duì)國(guó)內(nèi)播音時(shí)間、語(yǔ)種較多,想要利用人工展開(kāi)實(shí)時(shí)判斷對(duì)工作人員提出了嚴(yán)格要求,人力資源、時(shí)間投入較大。針對(duì)這一問(wèn)題,通過(guò)語(yǔ)音識(shí)別技術(shù)利用衛(wèi)星接收搜集語(yǔ)音庫(kù)文件。隨后,把錄制的電臺(tái)播出語(yǔ)音頻譜和語(yǔ)音庫(kù)展開(kāi)特征碼比較,便于及時(shí)判斷語(yǔ)種。不過(guò),語(yǔ)音物理屬性有著明顯差異,現(xiàn)階段多數(shù)語(yǔ)言判斷應(yīng)用仍然存在諸多不足,話語(yǔ)辨別逐步確定。語(yǔ)音識(shí)別廣播電視監(jiān)測(cè)還融入了音頻指紋相近度法,這種技術(shù)方法是在訓(xùn)練程序中適應(yīng)濾波器,起到信道模型作用。濾波器由混合信號(hào)與干擾信號(hào)提取魯棒的特點(diǎn)音頻指紋,經(jīng)過(guò)迭代搜集推算音頻指紋的匹配相近距離,結(jié)合距離門(mén)限分析試驗(yàn)影響效果。同時(shí),將距離較近的門(mén)限轉(zhuǎn)為置信度[3]。
現(xiàn)階段,語(yǔ)音識(shí)別包含遠(yuǎn)程回傳、信息搜集、特征碼,信息數(shù)據(jù)占據(jù)的帶寬需要高,通常在2 M以下。此外,因?yàn)檫h(yuǎn)程設(shè)備異常問(wèn)題匯報(bào)合格數(shù)據(jù),監(jiān)測(cè)人員難以及時(shí)搜集數(shù)據(jù)精準(zhǔn)性。
4 實(shí)例分析
4.1 信號(hào)解調(diào)設(shè)備
信號(hào)解調(diào)設(shè)備結(jié)束檢測(cè)信號(hào)源解調(diào)后,其組成為一臺(tái)或幾臺(tái)調(diào)頻廣播解調(diào)器、調(diào)幅廣播解調(diào)器、有線電視解調(diào)器。調(diào)頻廣播/解調(diào)器把既定頻率的調(diào)頻/調(diào)幅廣播電臺(tái)信號(hào)解調(diào)為普通音頻信號(hào)。隨后,把音頻信號(hào)送至信號(hào)搜集站錄音。調(diào)頻廣播/解調(diào)器數(shù)量能夠結(jié)合檢測(cè)頻道的數(shù)量分配。
4.2 信號(hào)預(yù)處理設(shè)備
系統(tǒng)內(nèi)添加AQC4信號(hào)預(yù)處理設(shè)備,有助于信號(hào)判斷。用過(guò)音頻信號(hào)預(yù)處理設(shè)備對(duì)音頻信號(hào)展開(kāi)分析且結(jié)合分析結(jié)果,控制信號(hào)處理器對(duì)音頻信號(hào)展開(kāi)噪音、失真修正、電平,從而形成可用的信號(hào)源文件。
4.3 多路信號(hào)搜集站
有線電視解調(diào)器把既定頻道的有線電網(wǎng)射頻信號(hào)內(nèi)的伴音與影響解調(diào)為視頻信號(hào)與模擬音頻信號(hào)。隨后,把音頻、視頻信號(hào)送至信號(hào)搜集站記錄。有線電視解調(diào)器的量能夠結(jié)合檢測(cè)的頻道數(shù)量分配。此外,多路檢測(cè)信號(hào)搜集站能夠同時(shí)接收電視信號(hào)與廣播音頻信號(hào),展開(kāi)信號(hào)搜集、壓縮并儲(chǔ)存于服務(wù)器陳列柜內(nèi)。搜集站可以劃分為廣播信號(hào)搜集站與電視信號(hào)搜集站。
廣播信號(hào)搜集站能夠一同對(duì)各路廣播信號(hào)采錄,采錄頁(yè)面中實(shí)時(shí)顯示信號(hào)的音量光柱并具有軟調(diào)音臺(tái),能夠結(jié)合各路信號(hào)大小展開(kāi)增益控制。同時(shí),研發(fā)了監(jiān)聽(tīng)按鈕,實(shí)時(shí)監(jiān)控各路輸入信號(hào)。尤其是對(duì)廣播時(shí)段特征,每周每天分別設(shè)計(jì)采錄時(shí)間表從而確保采錄有效性,提升系統(tǒng)運(yùn)行水平。第一,能夠同時(shí)獲得廣播音頻信號(hào)實(shí)時(shí)采集壓縮格式。第二,能夠?qū)崟r(shí)監(jiān)聽(tīng)。并顯示錄音信號(hào)音量彩條,在發(fā)生信號(hào)異常后自主警報(bào)從而避免信號(hào)故障而丟失錄音內(nèi)容。第三,結(jié)合不同廣播頻道播出時(shí)間,設(shè)計(jì)錄音通道的錄音時(shí)間。
4.4 視頻信號(hào)采集站
電視信號(hào)采集站能夠?qū)?路電視信號(hào)采錄,視頻信號(hào)采集站能夠?qū)﹄娨曅盘?hào)得音頻信號(hào)碼流實(shí)時(shí)復(fù)合。采錄選擇MPEG壓縮格式,每路壓縮碼流可選。結(jié)合不同頻道播出時(shí)間,不同頻道采錄時(shí)間能夠獨(dú)立設(shè)計(jì)。采錄時(shí),頁(yè)面能夠顯示每錄視頻圖像并對(duì)視頻信號(hào)監(jiān)聽(tīng)。此外,綜合調(diào)節(jié)每路信號(hào)得對(duì)比度、飽和度、色度從而確保采錄質(zhì)量。采錄視音頻文件自動(dòng)傳輸至文件服務(wù)器。
5 結(jié)語(yǔ)
綜合分析,無(wú)線電頻管理和監(jiān)測(cè)作為廣播電視管理人員主要工作內(nèi)容,伴隨著無(wú)線電技術(shù)的運(yùn)用于業(yè)務(wù)推廣,對(duì)于無(wú)線電頻率資源需求越來(lái)越高。廣播電視監(jiān)測(cè)自動(dòng)化、智能化是主要發(fā)展趨勢(shì),語(yǔ)音識(shí)別發(fā)揮著重要作用。在語(yǔ)音識(shí)別技術(shù)與廣播電視監(jiān)測(cè)中也要注重校正,防止發(fā)生偏差,保證廣播電視監(jiān)測(cè)作用發(fā)揮。
[參考文獻(xiàn)]
[1]劉蕾.智能播種機(jī)嵌入式英語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)設(shè)計(jì)與研究[J].農(nóng)機(jī)化研究,2018(12):240-244.
[2]曹慧,潘琦,呂明珠,等.基于虛擬儀器手持式回放語(yǔ)音識(shí)別裝置設(shè)計(jì)[J].安陽(yáng)工學(xué)院學(xué)報(bào),2018(2):69-72.
[3]肖強(qiáng),周民偉,張海波,等.語(yǔ)音識(shí)別技術(shù)在電子病歷中應(yīng)用的難點(diǎn)及對(duì)策[J].中國(guó)數(shù)字醫(yī)學(xué),2018(3):66.