999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

廣告信息識別系統的研究與設計

2016-05-30 03:06:40宋明杰楊闖王瑞祥劉朝暉閻少宏
科技尚品 2016年2期

宋明杰 楊闖 王瑞祥 劉朝暉 閻少宏

摘 要:以廣告信息監測為主要目的,完成了信息監測系統的結構和功能的設計,基于音頻匹配算法(DTW)的語音識別技術,開發了一套針對廣告信息識別的信息管理系統。該系統包括一套完整的軟硬件設施,為廣告監播部門和人員提供實用、功能豐富的管理工具,實現廣告信息的識別、監測、預警、報告等的智能化處理,經過隨機抽取樣本的檢測,準確率基本穩定在86%,經驗證效果顯著。

關鍵詞:廣告;監播系統;語音識別;信息監測

21世紀是信息的時代,信息成為各個領域乃至各個國家的重要戰略資源,信息的安全傳播是信息安全的重要組成部分,關系到國家安全和社會穩定。隨著經濟的發展,廣告成為社會生活的重要組成部分,而其帶來的社會問題也更加突出,特別是虛假廣告信息和非法小電臺播報的非法信息,嚴重影響人們的日常生活,并為社會帶來很多不穩定因素,廣告檢測、監測成為監管部門亟待解決的問題。由于廣播信息具有傳播范圍廣、制作成本低、部分非法電臺較隱蔽等特點,電波信號不易察覺,且大量儲存將消耗很大的儲存資源。目前,廣播監管僅局限于對異常電臺頻率的監管。

基于上述分析,設計了電臺廣播信息識別(監播)系統,考慮到數據量大和電臺數眾多,分別開發和使用了數據預處理系統、多路分頻器和實時信息分析系統平臺,并進行了性能分析,為實現人工智能廣告信息監播提供解決方案。

1 工作原理及算法

1.1 語音識別原理

語音識別技術經過近40年的發展,已經成為聲學、數字信號處理、概率統計、語言學、人工智能等多學科交叉的一項綜合性技術,基于語音識別技術研發的系統成功應用于很多場景,為語音識別技術在廣告信息監播領域的應用作重要鋪墊。

語音識別系統整體上由兩大部分組成:訓練和識別。訓練時對預先收集的海量語音、語音數據庫進行信號處理和建模,提取語音識別系統所需的“語言模型”和“聲學模型”。識別過程是對用戶輸入的音頻資料提取特征向量,利用訓練好的“語言模型”和“聲學模型”進行統計模式識別,得到其包含的文字信息。線性預測(LPC)、梅爾倒譜系數(MFCC)等作為特征向量的組成部分。

1.2 改進的DTW算法

本次試驗采用了一種整體路徑約束DTW算法(ADTW),利用平行四邊形限制動態規整范圍,如下圖1所示:

平行四邊形之外的路徑點對應的幀匹配距離不需要計算,也無需保存所有的距離和積累距離矩陣,充分利用這兩個特性,可以減少計算量和儲存空間,可提高識別速率、節約存儲空間。把實際的動態彎折分為三段:和,其中:

和都取最相近的整數。由此也得出對M和N長度的限制條件:

當不能滿足以上條件時,則認為兩者差別過大,無法進行動態彎折匹配。此時,在x軸上的每一幀不需要與y軸上的每一幀進行匹配比較,而只需與y軸上間的數據幀進行比較,兩者的計算公式如下:

當出現的情況時彎折匹配三段分別是和。對于x軸上每前進一幀,盡管與之比較的y軸上的幀數不同,但彎折特性是一樣的,積累距離矩陣更新可用以下公式實現:

模版匹配ADTW算法提高了原有的DTW算法,限制了識別區域,在保證正確的前提下大大減少了計算量,節約了存儲空間,提高了運行速度。

2 系統組成和軟件設計

廣告信息識別系統主要包括信號采集模塊、存儲磁盤列陣、廣告樣本數據庫、音頻匹配服務器、監管數據庫、操作員終端和自動警報系統??紤]到信息采集時數據占用空間巨大,而硬盤對于大數據的存儲速度隨數據量和時間的增加而減小,因此采用循環分散式存儲技術,將采集到的信息分成信息塊,一次存放在不同的磁盤中。下圖2給出了系統結構圖:

2.1 多路分頻器(VGA分頻器)

VGA分頻器又稱VGA信號寬帶矩陣切換器,將多路電視、電臺信號從輸入通道切換到相應的信道上,使各路信號之間彼此獨立地進入到信號調節器中,保證信號的獨立性,并減少長距離信號傳輸造成的信號衰減現象。

2.2 信號解調器

經分頻器分發出來的載波信號在計算機識別之前,需經過解調器將載波信號還原為計算機可以識別的“0”和“1”信號,或模擬信號,這個過程稱為“解調”,也稱A/D轉換。

2.3 信號采集服務列陣

信號采集服務器主要進行語音識別的準備設備,完成原始數據的采集、備份,音頻特征的建模,為后續的語音識別做準備工作,主要有以下功能特點:

語音信號采用G.722的高壓縮格式,占用磁盤空間小,失真率低;

采用磁盤列陣存儲方式,存儲速度快;

支持分段節目錄制;

具有很好的擴展性,方便存儲識別擴容。

2.4 廣告監管服務器

廣告識別服務器是整個廣告信息識別的核心組件,完成語音文件匹配、識別結果保存和語音識別數據庫的更新。功能特點如下:

語音識別廣告準確率穩定在85%左右(主要受方言和普通話標準程度的影響);

高性能運算平臺,具有高穩定性和可靠性,免維護,可7×24h不間斷運行;

并行優化運算,可對數據進行快速、穩定處理。

2.5 操作員終端

系統中,相關廣告人員的日常工作都在操作員終端上進行,由隨系統開發的操作員終端軟件提供簡潔、明了的人機交互界面(圖3為操作員終端界面),功能如下:

以波形和文字相結合的方式顯示選擇監管頻道的聲音文件,使聲音看得見;

支持拖拽定位功能,可快速尋找定位廣告位置;

對新的廣告樣本進行特征提取并建立新的廣告樣本,更新語音識別數據庫;

監管數據的查看,生成報表。

3 結論

本文針對廣告信息識別的特點和要求,利用梅爾倒譜系數等10個參數作為特征參數,構建語音識別算法,針對廣告監播的特點和要求,設計出一套改進監播體系,然后簡單介紹了各部分的組成及功能,從整體的性能分析來看,監播系統的優點突出:如識別率高、數據處理速度快、原始數據保存妥善;系統的高穩定性和升級的擴展性,支持關鍵詞搜索等等。隨著市場的快速發展和技術的不斷提升,越來越多的新技術可應用到本系統中,使系統更加適應市場需求,并有較好的市場前景預期。

參考文獻

[1]沈昌祥,張煥國.信息安全總述[J].中國科學 E輯:信息科學,2007,37(2):129-150.

[2]李志華,張憲平.我國電視廣告的當代特征和發展策略[D].山西大學,2012.

[3]劉瀟,和應民.語音識別關鍵技術研究[D].哈爾濱工程大學,2006.

[4]徐剛,周志芳.語音信號近似度模型匹配研究[D].華北電力大學,2013.

[5]雷靜.語音識別技術的研究和基本實現[D].武漢理工大學,2002.

(作者單位:華北理工大學 數學建模創新實驗室)

主站蜘蛛池模板: 亚洲第一成年人网站| 97色伦色在线综合视频| 一个色综合久久| 视频一本大道香蕉久在线播放| 中文字幕第4页| 国产成人综合日韩精品无码首页| 国产日韩精品欧美一区喷| 日韩A∨精品日韩精品无码| 91毛片网| 97精品国产高清久久久久蜜芽| 一区二区三区四区在线| 欧美日韩精品在线播放| 国产在线高清一级毛片| 国产精品护士| 自拍欧美亚洲| 91网站国产| 国产麻豆va精品视频| 日韩欧美国产精品| 欧美伦理一区| 日本不卡在线播放| 亚洲一道AV无码午夜福利| 久久久精品国产SM调教网站| 四虎在线观看视频高清无码| 热热久久狠狠偷偷色男同| 黄色网站不卡无码| 久久国产精品影院| 欧美一级色视频| 搞黄网站免费观看| 久久久久中文字幕精品视频| 播五月综合| 91精品视频网站| 为你提供最新久久精品久久综合| 日韩高清欧美| 国产精品久久自在自线观看| 国产白浆一区二区三区视频在线| av一区二区三区在线观看| 日韩在线成年视频人网站观看| 伊人成人在线视频| 亚洲欧洲自拍拍偷午夜色| 国产成人综合日韩精品无码首页| 国产成人亚洲综合a∨婷婷| 亚洲欧美不卡| 在线亚洲小视频| 欧美视频在线第一页| 免费av一区二区三区在线| 四虎永久免费在线| 国产精品男人的天堂| 国产主播福利在线观看| 国产精品55夜色66夜色| 国产午夜人做人免费视频中文| 久久久久久高潮白浆| 成人韩免费网站| 精品无码国产一区二区三区AV| 婷婷色在线视频| 亚洲无码精彩视频在线观看| 97国产精品视频自在拍| 国产精品黑色丝袜的老师| 亚洲系列中文字幕一区二区| 香蕉国产精品视频| 日韩欧美国产三级| 亚洲a级毛片| 国产精品亚洲一区二区在线观看| 国产剧情一区二区| 综1合AV在线播放| 欧美午夜在线播放| 91丨九色丨首页在线播放| a级毛片免费看| 婷婷午夜天| 不卡无码h在线观看| 欧美日韩另类在线| 91蜜芽尤物福利在线观看| 激情综合图区| 亚洲欧美日韩视频一区| 中国黄色一级视频| 一级爱做片免费观看久久| 久久人体视频| 免费一级毛片在线播放傲雪网| 九月婷婷亚洲综合在线| 亚洲精品中文字幕无乱码| 在线高清亚洲精品二区| 久久精品国产精品青草app| 国产一级视频久久|