999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

廣告信息識別系統的研究與設計

2016-05-30 03:06:40宋明杰楊闖王瑞祥劉朝暉閻少宏
科技尚品 2016年2期

宋明杰 楊闖 王瑞祥 劉朝暉 閻少宏

摘 要:以廣告信息監測為主要目的,完成了信息監測系統的結構和功能的設計,基于音頻匹配算法(DTW)的語音識別技術,開發了一套針對廣告信息識別的信息管理系統。該系統包括一套完整的軟硬件設施,為廣告監播部門和人員提供實用、功能豐富的管理工具,實現廣告信息的識別、監測、預警、報告等的智能化處理,經過隨機抽取樣本的檢測,準確率基本穩定在86%,經驗證效果顯著。

關鍵詞:廣告;監播系統;語音識別;信息監測

21世紀是信息的時代,信息成為各個領域乃至各個國家的重要戰略資源,信息的安全傳播是信息安全的重要組成部分,關系到國家安全和社會穩定。隨著經濟的發展,廣告成為社會生活的重要組成部分,而其帶來的社會問題也更加突出,特別是虛假廣告信息和非法小電臺播報的非法信息,嚴重影響人們的日常生活,并為社會帶來很多不穩定因素,廣告檢測、監測成為監管部門亟待解決的問題。由于廣播信息具有傳播范圍廣、制作成本低、部分非法電臺較隱蔽等特點,電波信號不易察覺,且大量儲存將消耗很大的儲存資源。目前,廣播監管僅局限于對異常電臺頻率的監管。

基于上述分析,設計了電臺廣播信息識別(監播)系統,考慮到數據量大和電臺數眾多,分別開發和使用了數據預處理系統、多路分頻器和實時信息分析系統平臺,并進行了性能分析,為實現人工智能廣告信息監播提供解決方案。

1 工作原理及算法

1.1 語音識別原理

語音識別技術經過近40年的發展,已經成為聲學、數字信號處理、概率統計、語言學、人工智能等多學科交叉的一項綜合性技術,基于語音識別技術研發的系統成功應用于很多場景,為語音識別技術在廣告信息監播領域的應用作重要鋪墊。

語音識別系統整體上由兩大部分組成:訓練和識別。訓練時對預先收集的海量語音、語音數據庫進行信號處理和建模,提取語音識別系統所需的“語言模型”和“聲學模型”。識別過程是對用戶輸入的音頻資料提取特征向量,利用訓練好的“語言模型”和“聲學模型”進行統計模式識別,得到其包含的文字信息。線性預測(LPC)、梅爾倒譜系數(MFCC)等作為特征向量的組成部分。

1.2 改進的DTW算法

本次試驗采用了一種整體路徑約束DTW算法(ADTW),利用平行四邊形限制動態規整范圍,如下圖1所示:

平行四邊形之外的路徑點對應的幀匹配距離不需要計算,也無需保存所有的距離和積累距離矩陣,充分利用這兩個特性,可以減少計算量和儲存空間,可提高識別速率、節約存儲空間。把實際的動態彎折分為三段:和,其中:

和都取最相近的整數。由此也得出對M和N長度的限制條件:

當不能滿足以上條件時,則認為兩者差別過大,無法進行動態彎折匹配。此時,在x軸上的每一幀不需要與y軸上的每一幀進行匹配比較,而只需與y軸上間的數據幀進行比較,兩者的計算公式如下:

當出現的情況時彎折匹配三段分別是和。對于x軸上每前進一幀,盡管與之比較的y軸上的幀數不同,但彎折特性是一樣的,積累距離矩陣更新可用以下公式實現:

模版匹配ADTW算法提高了原有的DTW算法,限制了識別區域,在保證正確的前提下大大減少了計算量,節約了存儲空間,提高了運行速度。

2 系統組成和軟件設計

廣告信息識別系統主要包括信號采集模塊、存儲磁盤列陣、廣告樣本數據庫、音頻匹配服務器、監管數據庫、操作員終端和自動警報系統??紤]到信息采集時數據占用空間巨大,而硬盤對于大數據的存儲速度隨數據量和時間的增加而減小,因此采用循環分散式存儲技術,將采集到的信息分成信息塊,一次存放在不同的磁盤中。下圖2給出了系統結構圖:

2.1 多路分頻器(VGA分頻器)

VGA分頻器又稱VGA信號寬帶矩陣切換器,將多路電視、電臺信號從輸入通道切換到相應的信道上,使各路信號之間彼此獨立地進入到信號調節器中,保證信號的獨立性,并減少長距離信號傳輸造成的信號衰減現象。

2.2 信號解調器

經分頻器分發出來的載波信號在計算機識別之前,需經過解調器將載波信號還原為計算機可以識別的“0”和“1”信號,或模擬信號,這個過程稱為“解調”,也稱A/D轉換。

2.3 信號采集服務列陣

信號采集服務器主要進行語音識別的準備設備,完成原始數據的采集、備份,音頻特征的建模,為后續的語音識別做準備工作,主要有以下功能特點:

語音信號采用G.722的高壓縮格式,占用磁盤空間小,失真率低;

采用磁盤列陣存儲方式,存儲速度快;

支持分段節目錄制;

具有很好的擴展性,方便存儲識別擴容。

2.4 廣告監管服務器

廣告識別服務器是整個廣告信息識別的核心組件,完成語音文件匹配、識別結果保存和語音識別數據庫的更新。功能特點如下:

語音識別廣告準確率穩定在85%左右(主要受方言和普通話標準程度的影響);

高性能運算平臺,具有高穩定性和可靠性,免維護,可7×24h不間斷運行;

并行優化運算,可對數據進行快速、穩定處理。

2.5 操作員終端

系統中,相關廣告人員的日常工作都在操作員終端上進行,由隨系統開發的操作員終端軟件提供簡潔、明了的人機交互界面(圖3為操作員終端界面),功能如下:

以波形和文字相結合的方式顯示選擇監管頻道的聲音文件,使聲音看得見;

支持拖拽定位功能,可快速尋找定位廣告位置;

對新的廣告樣本進行特征提取并建立新的廣告樣本,更新語音識別數據庫;

監管數據的查看,生成報表。

3 結論

本文針對廣告信息識別的特點和要求,利用梅爾倒譜系數等10個參數作為特征參數,構建語音識別算法,針對廣告監播的特點和要求,設計出一套改進監播體系,然后簡單介紹了各部分的組成及功能,從整體的性能分析來看,監播系統的優點突出:如識別率高、數據處理速度快、原始數據保存妥善;系統的高穩定性和升級的擴展性,支持關鍵詞搜索等等。隨著市場的快速發展和技術的不斷提升,越來越多的新技術可應用到本系統中,使系統更加適應市場需求,并有較好的市場前景預期。

參考文獻

[1]沈昌祥,張煥國.信息安全總述[J].中國科學 E輯:信息科學,2007,37(2):129-150.

[2]李志華,張憲平.我國電視廣告的當代特征和發展策略[D].山西大學,2012.

[3]劉瀟,和應民.語音識別關鍵技術研究[D].哈爾濱工程大學,2006.

[4]徐剛,周志芳.語音信號近似度模型匹配研究[D].華北電力大學,2013.

[5]雷靜.語音識別技術的研究和基本實現[D].武漢理工大學,2002.

(作者單位:華北理工大學 數學建模創新實驗室)

主站蜘蛛池模板: 久久免费精品琪琪| 久草青青在线视频| 一级做a爰片久久免费| 国产麻豆va精品视频| 国产第一色| 成人日韩精品| 国产99精品久久| 国产福利免费在线观看| 日本欧美午夜| 亚洲无码高清一区二区| 午夜国产精品视频黄| 色综合久久久久8天国| 无码国产伊人| 在线欧美国产| 欧美在线网| 亚洲天堂免费观看| 5555国产在线观看| 亚洲综合色婷婷| 欧美三级不卡在线观看视频| 97久久精品人人| 国内老司机精品视频在线播出| 国产xx在线观看| 国产人人乐人人爱| 试看120秒男女啪啪免费| 国产精品露脸视频| 热伊人99re久久精品最新地| 国产日韩精品欧美一区灰| 老司机午夜精品网站在线观看 | 国产一区二区三区精品久久呦| 毛片最新网址| 啦啦啦网站在线观看a毛片| 亚洲乱码精品久久久久..| 精品剧情v国产在线观看| 欧美啪啪一区| 91成人在线免费视频| 人妻丰满熟妇αv无码| 九色免费视频| 亚洲精品天堂在线观看| 永久免费av网站可以直接看的| 制服丝袜国产精品| 在线网站18禁| 国产真实乱子伦视频播放| 欧美日韩中文字幕在线| 日本在线国产| 国产精品久久精品| 国内精品一区二区在线观看| 久久久久人妻一区精品色奶水| 8090成人午夜精品| 色有码无码视频| 亚洲成人一区二区三区| 欧美.成人.综合在线| 久久综合伊人 六十路| 欧美午夜在线观看| 亚洲国产av无码综合原创国产| 91久久青青草原精品国产| 亚洲香蕉伊综合在人在线| 理论片一区| 日韩二区三区| 亚洲精品你懂的| www亚洲精品| 少妇高潮惨叫久久久久久| 精品国产免费观看| 亚洲黄网在线| 久久久久国产一级毛片高清板| 国产精品久久久免费视频| 日韩大片免费观看视频播放| 欧美色视频网站| 欧美 国产 人人视频| 国产又黄又硬又粗| 永久免费无码成人网站| 人妻91无码色偷偷色噜噜噜| 夜夜操天天摸| 色偷偷综合网| 538国产视频| 99青青青精品视频在线| 性做久久久久久久免费看| 国产在线精品网址你懂的| 国产成人福利在线视老湿机| 无码专区第一页| 免费又黄又爽又猛大片午夜| 亚洲色图欧美一区| 好紧太爽了视频免费无码|