999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

智能語音技術在廣播領域的應用探索

2023-01-17 02:08:54管海建
電視技術 2022年6期
關鍵詞:智能系統

管海建

(湖北廣播電視臺,湖北 武漢 430022)

0 引言

智能語音技術包括語音識別、語音合成、口語評測、語義理解、自然語言處理等內容。其中語音識別和語音合成技術使得各種終端具備了聽說能力,在機器人、智能家居、移動終端等設備中實現廣泛應用。隨著5G 移動網絡的普及和人工智能技術的飛速發展,語音識別和播報技術極大提升了應用程序中的交互效率和體驗,在移動終端的人機交互中得到廣泛應用,

1952 年,貝爾研究所成功發布第一個能識別簡單英文和數字發音的試驗系統。經過幾十年的發展和進步,從字母、孤立詞的識別逐漸發展到大詞匯量語音連續識別。隨著語音識別技術的不斷進步,語音識別在優化模型的算法、語音特征提取和優化、提高系統的準確率等方面取得較大進展,相關產品也逐漸走向市場,端點檢測、噪音消除、智能打斷、大詞匯量識別、特征提取、多操識別以及熱詞識別等相關課題紛紛取得突破。在全球范圍內,智能語音技術商業化已經取得了很大的成果。國外的谷歌、微軟、蘋果等公司推出了智能語音商用產品,國內的科大訊飛、捷通華聲、中科信利、云知聲等語音企業以及百度、騰訊、阿里等互聯網巨頭也紛紛推出集成智能語音技術的產品和配套解決方案。此外,隨著語音識別準確率的逐步提高,各類軟硬件都開始集成語音識別功能,語音識別技術逐漸融入了有交互需求的各類產品。

語音合成指將以文字為主的媒體內容轉化為人類語音輸出,語音合成的產品用途十分廣泛。和語音識別一樣,語音合成也是智能語音技術的重要組成部分。語音合成可以將文字等媒體內容轉譯成自然清晰、標準流暢的語音輸出,包括且不限于中文、外文或者方言等,可以實現不同音色的高度模擬。通過語音合成技術的應用,可以極大程度地提高媒體工作效率,例如路況、氣象預報等都可以通過語音合成來自動實現。

1 語音識別系統工作原理

語音識別系統相對復雜,技術原理涉及多個學科,包括信號處理、模式識別、統計分析以及人工智能等。語音識別主要采用模式匹配的方法,通過提取輸入信號的聲學特征作為模板存入數據庫,在識別信號時與數據庫中模板進行比較后輸出相似度最高的結果。語音信號經過話筒輸入采集轉變成電信號,在輸入端經過信號處理消除噪聲,切除前后端的靜音段,然后利用移動窗函數進行分幀,分幀后的波形再進行轉換,每一幀波形變成一個多維向量,這個過程稱為聲學特征提取。目前,聲學特征提取有多種不同的復雜算法。

系統模型的建立包括聲學和語言兩部分,其中隱馬爾可夫模型是應用最廣泛的建模方法。此外,人工神經網絡也是語音識別技術發展的一個熱點。雖然模型匹配的方法很多,但是受發音習慣、方言等的影響,很多語音還需要結合上下文的含義判斷,準確識別相對存在一定的的難度。隨著技術的不斷進步,整個系統模型識別匹配的準確率一般都達到了90%以上,可以滿足日常應用的需要。

近年來,深度學習理論被廣泛研究與應用,智能語音技術在語音識別方面也取得了一定突破。通過各種帶有語音功能的場景和應用程序,網絡中大量的用戶數據被不斷收集和匯總到后臺,有的語音產品僅針對喚醒識別一項功能就錄制了超過8 萬條語音來建立狀態模型,這些海量數據通過神經網絡的分析和學習不斷完善數據模型和匹配算法。

2 智能語音技術與電臺節目生產流程的融合

在廣播電視等媒體的節目編輯中,經常需要將采訪中獲得的大量語音素材整理成文字或者將播出稿件轉換成文字稿、將語音信號轉換成視頻字幕等,這些剛性需求為智能語音技術在電臺的融合與應用提供了契機。無論是廣播、電視、報紙等傳統媒體,還是以微博、微信、視頻平臺等為代表的新媒體,時效性一直是行業聚焦的競爭點。在采訪(錄音)、聽音打字、整理寫稿的過程中,整理錄音和打字都耗費了大量時間成本,而利用語音識別技術能夠顯著降低成本并提高時效性。

根據廣播電臺的節目生產流程,廣播節目件的生成通常需要經過音頻節目的采編制作和新聞稿件的采編,包括采訪寫稿、審稿、存儲、發播等環節。新聞稿件的采訪會使用便攜式錄音設備,傳統采訪錄音設備目前還不具備語音識別功能,需要將錄音文件導出后進行識別。節目審聽階段,可以應用語音識別技術來進行關鍵字查找、定位。目前語音合成技術也逐漸成熟,合成效果已經很接近自然發音。在移動終端的應用中,合成語音播報天氣、路況、講故事等已經十分普遍。在電臺節目播出過程中,可以嘗試將主持人聲音制作成語音庫,輸入文字后轉換成音頻稿件用于播出。

3 智能語音技術的應用

結合湖北臺節目采編流程,筆者研發設計了一款基于Windows 操作系統的應用,即智能語音識別采編器,融合了語音識別、語音合成、字幕轉寫以及語音分析等多種常用功能。

3.1 語音識別

語音音頻支持內錄、線路輸入、文件導入等多種采集和導入方式,適合不同場合的語音采集工作。

內錄是指錄制本地計算機的音頻,即計算機聲卡所播放的聲音,將聲卡播放的內容識別成文字。這項功能多用于截取錄制的采訪錄音或音頻中的一段轉換為文字,可直接利用操作系統自帶播放器進行播放,同時打開采編器內錄開關進行語音識別和轉換。

線路輸入指通過計算機聲卡外接話筒輸入音頻信號,將話筒音頻信號實時轉換識別為漢字,可用于記者編輯采用語音寫稿、會議記錄、實時采訪等場景。文件導入可將計算機內音頻文件導入到采編器進行文字轉換,適合轉換已錄制好的語音文件。

語音識別引擎安裝在本地計算機,使用過程中不需要聯網,語音識別過程不會受到網速的影響。在外接話筒進行語音識別時,轉換的文字會在屏幕上實時顯示,而且識別過程中可以隨時進行文字修正。系統能夠對識別出的同音詞語結合整句話語義進行自動糾正和匹配,利用關鍵詞也可以預置人名、地名等專用名詞,大大提高了識別正確率。

3.2 字幕轉寫

傳統的字幕整理耗時費力,利用端點檢測、分段、語義理解等技術可以自動生成字幕,再由人工進行簡單修正審核即可直接應用。語音轉換后的文字生成字幕可直接拖放在擴展屏上顯示,通過視頻編輯軟件豐富字幕場景。字幕轉寫功能可以為電臺大型活動現場視頻、會議大屏等提供字幕。

3.3 語音分析

隨著廣播事業的發展,節目審聽的工作也越來越多。作為媒體管理的重要組成部分,對音視頻等的監管比對文字的監管要困難得多。傳統的節目審聽采用純人工方式,由專人進行大量煩瑣枯燥的機械性工作。而應用語音識別技術將關鍵詞預置進審聽系統,導入審聽節目后可進行自動審核,系統檢測到關鍵詞則警報提示,大大提高了審聽效率。此外,在語音識別轉文字的過程中,可以將預置的關鍵詞高亮顯示或直接替換。

3.4 語音合成

智能語音播報是基于語音合成業務提供服務,語音合成由底層服務來完成。通過語音合成服務的應用接入和調用,由系統軟件實現對新聞稿件的自動播報。在實際應用過程中,只需要將文稿導入系統,由系統實現對新聞稿件的自動播報。

語音合成功能的實現分為文字和聲學兩部分。文字部分主要是輸入文稿的語言學分析,生成發音規則。聲學部分則根據發音規則來合成音頻輸出,實現發音的功能。對于輸入的文本進行語種判斷,然后根據文本含義進行字詞斷句拆分,根據詞義結合上下文區分多音字歧義字等將文本標準化并轉成語素標記。與此同時,還要分析標注字詞連句的韻律、高低曲折以及抑揚頓挫等發音技巧。將標注的文本轉化為聲音輸出有多種方法可以實現,比較普遍的是波形拼接法。波形拼接需要較長時間的人聲錄音采集,要能盡可能多地覆蓋到所有的語音音節和音素。通過發音語料庫來拼接對應的文本,錄音時間越長,拼接發音就越純正。波形拼接法輸出音質較好,可以很好地模擬錄制的人聲來發音。此外還有參數合成法,通過錄音文件的頻譜參數來建模,建立文本序列和語音特征參數的映射關系,再將音頻特征轉化成音頻輸出。語音合成支持將錄入的文字或者文本文件直接轉換成語音,有標準普通話、地方方言等。轉換的語音保存為音頻文件,可以通過快捷方式上傳到FTP 服務器,也可以直接通過本地聲卡輸出用于播放。

為了使合成語音后的文件迅速進入制播網絡,臺內制播網絡也開發了一個文件掃描功能,播出系統掃描文字轉換的語音并轉碼實現自動上單,用于節目制作和播出。湖北廣播電視臺廣播智能語音識別采編器經過試用,語音識別速度和正確率都取得了令人滿意的效果。將該系統與各地同行進行了共享交流,展示了其語音寫稿、語音識別、字幕轉寫、智能語音播報等功能,系統實用性獲得了大家的一致好評。

4 結語

語音識別技術經過多年的發展己經相對成熟,其對標準普通話的識別能夠滿足人們日常工作中的需要,但是在方言和嘈雜環境下的識別正確率還有待提高。從目前的發展來看,語音合成播報已經開始逐步應用于實踐,特別是在手機應用程序中取得了較多應用成效。人工智能合成的語音可以流暢地對文本播報,但是播報顯得生硬,聲音相對呆板,是否適用于實際廣播播出還需要進一步論證和測試。在電臺等傳統媒體中,采訪機、新聞采編系統、制播系統等軟硬件系統都有著相對完善的體系。在不會大幅提升成本的條件下,如何將語音識別融入到媒體現有的采編和制播系統也是其在傳媒領域進一步推廣應用面臨的一個難題。

猜你喜歡
智能系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
智能制造 反思與期望
半沸制皂系統(下)
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
主站蜘蛛池模板: 91精品国产无线乱码在线| 亚洲综合色婷婷| 91年精品国产福利线观看久久 | 国产欧美高清| 日韩精品中文字幕一区三区| 国产99精品视频| 日本91视频| 一区二区影院| 久久精品最新免费国产成人| 亚洲欧洲国产成人综合不卡| 欧美天天干| 国产精品天干天干在线观看 | 亚洲欧美自拍视频| 亚洲另类色| 超碰aⅴ人人做人人爽欧美| 女高中生自慰污污网站| 日韩大片免费观看视频播放| 极品国产一区二区三区| 三上悠亚在线精品二区| 日韩黄色精品| 欧美在线天堂| 欧美日韩成人在线观看| 国产精品女同一区三区五区| 亚洲色大成网站www国产| 中文字幕调教一区二区视频| 中文字幕免费在线视频| 无码日韩人妻精品久久蜜桃| 精品国产免费观看一区| 国产一区二区三区免费观看| 国产香蕉国产精品偷在线观看| 国产一区二区视频在线| 亚洲天堂高清| 黄色污网站在线观看| 91久久夜色精品国产网站| a毛片在线免费观看| 久久久91人妻无码精品蜜桃HD| 中文字幕波多野不卡一区| 永久成人无码激情视频免费| 欧美精品高清| 欧美成在线视频| 亚洲国产综合精品一区| 91口爆吞精国产对白第三集| 18禁色诱爆乳网站| 欧美一级专区免费大片| 一本无码在线观看| 欧美激情二区三区| 日韩第九页| 动漫精品中文字幕无码| 国产亚洲精品自在线| 亚洲国产欧美目韩成人综合| 国产视频自拍一区| 欧美日本中文| 久久国产精品影院| 亚洲成aⅴ人在线观看| 国产九九精品视频| yjizz国产在线视频网| 不卡无码h在线观看| 高清无码一本到东京热| 欧洲成人免费视频| 欧美啪啪一区| 欧美亚洲国产精品第一页| 草逼视频国产| 亚洲综合色区在线播放2019| a毛片在线播放| 午夜一级做a爰片久久毛片| 伊人激情综合网| 日韩视频免费| 99久久精品国产麻豆婷婷| 婷婷亚洲综合五月天在线| 人人91人人澡人人妻人人爽| 国产综合色在线视频播放线视 | 久久一日本道色综合久久| 欧美成人免费午夜全| 久久国产乱子| 亚洲欧洲AV一区二区三区| 无码高潮喷水在线观看| 无码视频国产精品一区二区| 91欧美亚洲国产五月天| 色妞永久免费视频| 毛片免费在线视频| 久久精品只有这里有| 在线看片中文字幕|