999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的視頻語音提取文本系統(tǒng)設(shè)計與實現(xiàn)

2021-12-27 08:12:13彭長嶺
電子樂園·中旬刊 2021年3期
關(guān)鍵詞:深度學習

彭長嶺

摘要:伴隨人類社會步入信息化時代,多媒體技術(shù)在網(wǎng)絡(luò)教學當中應(yīng)用范圍愈加廣泛,并且,在新冠疫情時期,網(wǎng)絡(luò)教學自身優(yōu)勢得到充分發(fā)揮,但是,現(xiàn)階段市面上的線上視頻編輯平臺功能單一,且效率不高。基于此,本文將主要以深度學習為基礎(chǔ),針對視頻語音提取文本系統(tǒng)的設(shè)計與實現(xiàn)展開探討。

關(guān)鍵詞:深度學習;音頻語音;文本提取

引言:語音識別技術(shù)在過去的幾十年中取得了一定的發(fā)展,目前,大部分語音識別是基于在線云服務(wù)平臺和電子計算機,嵌入式終端設(shè)備采用的離線語音識別技術(shù)并不完善,不能滿足移動機器人、聲控機械設(shè)備等在離線終端設(shè)備語音識別要求。

1研究背景

在線遠程教育市場持續(xù)發(fā)展,該領(lǐng)域的教育平臺百花齊放,但大多缺乏競爭優(yōu)勢,傳統(tǒng)視頻解決方案服務(wù)平臺功能單一,效率較低,用戶實際操作復(fù)雜,在激烈的市場競爭中,視頻語音采集和語音識別功能的開發(fā)設(shè)計,完成快速的文字轉(zhuǎn)換,提高課堂教學視頻的質(zhì)量,無疑將占據(jù)有利的地位[1]。功能齊全、操作簡單的視頻、視頻、語音采集,不僅能以高視頻質(zhì)量吸引學生,也能以優(yōu)秀的用戶體驗吸引教師,本系統(tǒng)的開發(fā)設(shè)計,必將推動互聯(lián)網(wǎng)科技教育云平臺的快速發(fā)展。音視頻語音采集文字系統(tǒng)軟件的首要目標是準確編輯教師教學課堂視頻、視頻和語音。系統(tǒng)軟件智能分為網(wǎng)頁和網(wǎng)站后臺管理。智能管理系統(tǒng),網(wǎng)頁向教師展示視頻倉庫控制模塊、視頻剪輯控制模塊、視頻編輯控制模塊、語音識別技術(shù)控制模塊、審理控制模塊、個人中心控制模塊的功能。

2系統(tǒng)總體架構(gòu)

系統(tǒng)主要由麥克風、音頻編解碼集成ic、嵌入式CPU、PC四部分組成,麥克風采用MP34DTO1TR規(guī)格的MEMS數(shù)據(jù)麥克風,完成視頻和語音信號的記錄和采集,輸出PDM文件格式的視頻信號數(shù)據(jù)信號;音頻編解碼集成ic采用WM8994EC超功耗低質(zhì)保碼解碼集成ic,用于接收麥克風輸出的視頻信號數(shù)據(jù)信號,解壓后將數(shù)據(jù)信號編號輸出到嵌入式CPU;嵌入式CPU采用STM32F746NGH6規(guī)格的嵌入式MCU,根據(jù)集成ic的SAI插座與音頻解碼集成ic連接完成對輸入的音頻數(shù)據(jù)信息的識別,并將識別結(jié)果輸出到串口端口通訊;由于嵌入式服務(wù)平臺資源相對有限,無法滿足基于深度神經(jīng)網(wǎng)絡(luò)的聲學材料模型練習的要求,因此使用PC來完成聲學材料模型的練習[2]。

3語音功能實現(xiàn)及算法分析

3.1語音識別實現(xiàn)

在語音識別方面,從動態(tài)時間整潔模型,到混合高斯函數(shù)-隱馬爾可夫模型,再到使用機器學習的端到端語音識別模型,最終百度搜索開源系統(tǒng)的PaddlePaddle架構(gòu)被選中,在DeepSpeech2的基礎(chǔ)上開發(fā),選用端到端語音識別技術(shù),應(yīng)用CTC損失函數(shù),采用雙層CNN、RNN深度神經(jīng)元網(wǎng)絡(luò)模型進行訓練。與傳統(tǒng)的DNN/HMM語音識別相比,有很大的命中率和效率提升[3]。一、svm算法:將視頻和語音數(shù)據(jù)庫查詢中的音頻特征提取為電子計算機可以識別的空間矢量數(shù)據(jù)信息,是進行驗尸神經(jīng)元網(wǎng)絡(luò)練習的基礎(chǔ),在獲取特征時,有兩個常用的狀態(tài)參數(shù)作為獲取模板的關(guān)鍵,即線性預(yù)測分析指數(shù)(LPCC)和梅爾倒譜指數(shù)(MFCC),LPCC的主要概念是通過多個歷史時間和時間信號的線性組合,可以使當前時間數(shù)據(jù)信號成為可能。MFCC是源自人類聽覺系統(tǒng)研究擴聲功能,它采用同態(tài)求解的方法得到音頻數(shù)據(jù)信號的離散變量傅立葉變換的對數(shù),然后逆變換得到倒譜指數(shù),與MFCC相比,LPCC的完成更容易,響應(yīng)速度也快,同時,也會對特征解析的信息進行指標值歸一化、預(yù)處理等實際操作。其次,聲學材料模型:一個好的優(yōu)化算法模型可以逼近基礎(chǔ)理論的極限,團隊對語音識別的技術(shù)性進行了調(diào)研,選取了學術(shù)界時尚的識別框架和新穎的工藝,并結(jié)合具體的業(yè)務(wù)流程,改變了訓練集,完成了課堂教學視頻的語音識別系統(tǒng)。

3.2聲學模型訓練與移植

聲學材料模型練習使用Google語音命令數(shù)據(jù)集作為訓練集,應(yīng)用Tensorflow架構(gòu)中標準化的交叉熵損失和adam優(yōu)化器進行練習。大batch size為100,模型更新20000次迭代,原始學習率為5×10-,前10000次迭代后降為10-4。運動數(shù)據(jù)信息改善環(huán)境噪聲和任意時移可達100ms,以模擬復(fù)雜的環(huán)境,提高操作系統(tǒng)的可擴展性[4]。使用ARM開發(fā)設(shè)計的深度神經(jīng)網(wǎng)絡(luò)庫amnn創(chuàng)建DS-CNN神經(jīng)網(wǎng)絡(luò)架構(gòu),將聲學材料模型練習得到的各種模型的主要參數(shù)鍵入結(jié)構(gòu)的相應(yīng)部分。之后創(chuàng)建新的嵌入式項目時,可以移植已經(jīng)進入聲學材料模型主要參數(shù)的DS-CNN神經(jīng)元網(wǎng)絡(luò),就可以移植聲學材料模型。

4系統(tǒng)設(shè)計與實現(xiàn)

4.1后臺管理系統(tǒng)

(1)登錄模塊:后臺管理人員輸入賬號和登錄密碼完成信息的實際操作。(2)首頁模塊:在該模塊中,還可以對網(wǎng)站系統(tǒng)日志進行查詢和管理,并根據(jù)瀏覽量、用戶總數(shù)、用戶在線時間、收入、信息、訂單信息等信息進行查詢和管理等根據(jù)比率圖、直方圖、折線統(tǒng)計圖進行數(shù)據(jù)可視化,簡單明了,提高了管理員對信息的理解。(3)管理信息系統(tǒng)模塊:管理信息系統(tǒng)分為用戶管理方式和人員角色管理方式,審批用戶資料,維護服務(wù)平臺一般用戶和VIP會員用戶的資料信息內(nèi)容。(4)視頻存儲管理模塊:該模塊分為三個模塊:視頻文檔管理、用戶視頻個人收藏、用戶變更歷史時間管理。能夠管理用戶的各種類型的視頻。(5)語音識別管理模塊:網(wǎng)站管理員對用戶的聲音模型進行管理,保證用戶可以在網(wǎng)絡(luò)平臺上選擇聲音模型完成語音識別。最后,課程內(nèi)容視頻基本不變,提高了學生的課堂體驗。(7)審理管理:用戶審理信息的管理。

4.2用戶Web端

(1) 新增用戶注冊控制模塊:門戶服務(wù)于教師和客戶。簡單的大數(shù)據(jù)可視化方式,可以輕松喚起最復(fù)雜的操作流程,為用戶帶來簡單合理的管理員賬戶操作流程管理方法。(2)視頻庫控制模塊:視頻庫控制模塊給出了視頻文件格式管理方法功能。客戶還可以進行提交、一鍵下載、刪除視頻文件格式等操作。此外,控制模塊還產(chǎn)生采集、訪問、分類等功能。其他省時省力的功能。(3)進一步提升客戶體驗和工作效率。同時客戶可以返回列表頁面對所有切片進行監(jiān)管操作流程,實現(xiàn)簡單的xml分析和檢查。(4) 視頻加載控制模塊:視頻加載控制模塊是該方向的重要控制模塊,可以將視頻分片,獲取文字提示和錯誤的音頻集錦。不正確的音頻更改包括兩種方法:文本智能語音系統(tǒng)系統(tǒng)生成和音頻替換。(5)語音識別技術(shù)控制模塊:一般的文字轉(zhuǎn)語音都有非常明顯的機器設(shè)備視頻和視頻語音情況。為了更好更快地滿足消費者的感受,新的語音識別技術(shù)的使用帶來了多種智能語音系統(tǒng)軟件實物模型供客戶選擇,從而達到更細致、更具體的更換實際效果[5]。(6) 個人中控模塊:客戶還可以在個人中控模塊中查看個人隱私信息的內(nèi)容。如果遇到問題,可以通過幫助中心綜合服務(wù)平臺的助手了解問題。

結(jié)語:

本文明確提出了當今視頻編輯服務(wù)平臺、整體項目設(shè)計、實際語音識別建立方案中存在的一些難點問題,集成k8s和服務(wù)網(wǎng)格,完成云端省時省力部署,真正保證語音識別的準確性和效率,實時音文本轉(zhuǎn)換,多種視頻傳輸文件格式,一鍵切片省時省力,審理信息多元化呈現(xiàn),用戶數(shù)據(jù)信息形象可視化、服務(wù)平臺助手正確引導(dǎo)提醒,用戶應(yīng)用方便高效等特點,最終將提升在線教學視頻的質(zhì)量,推動文教行業(yè)大數(shù)據(jù)、智能化、智能化系統(tǒng)的轉(zhuǎn)型發(fā)展,以全步驟的數(shù)據(jù)信息聚合和整合,完成高效的數(shù)據(jù)共享。

參考文獻

[1]姚錦江, 程允權(quán). 基于深度學習的視頻檢索系統(tǒng)設(shè)計與實現(xiàn)[J]. 計算機測量與控制, 2019, v.27;No.249(06):237-241.

[2]許業(yè)寬, 黃魯. 基于深度學習的嵌入式離線語音識別系統(tǒng)設(shè)計[J]. 信息技術(shù)與網(wǎng)絡(luò)安全, 2019, 38(04):67-70.

[3]張千, 王慶瑋, 張悅,等. 基于深度學習的文本特征提取研究綜述[J]. 計算機技術(shù)與發(fā)展, 2019(12):61-65.

[4]梁建勝, 溫賀平. 基于深度學習的視頻關(guān)鍵幀提取與視頻檢索[J]. 控制工程, 2019, 026(005):965-970.

[5]胡婕, 陶宏才. 基于深度學習的領(lǐng)域問答系統(tǒng)的設(shè)計與實現(xiàn)[J]. 成都信息工程大學學報, 2019, 034(003):232-237.

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構(gòu)建
面向大數(shù)據(jù)遠程開放實驗平臺構(gòu)建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務(wù)中基于深度學習的虛假交易識別研究
利用網(wǎng)絡(luò)技術(shù)促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉(zhuǎn)課堂融合的深度學習場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學習算法應(yīng)用于巖石圖像處理的可行性研究
主站蜘蛛池模板: 天天婬欲婬香婬色婬视频播放| 国产在线观看99| 干中文字幕| 免费a级毛片视频| 91香蕉视频下载网站| 97免费在线观看视频| 久久青草免费91观看| 99热这里只有成人精品国产| 黄色污网站在线观看| 日本高清免费不卡视频| 人人看人人鲁狠狠高清| 91福利免费| 乱系列中文字幕在线视频| 大香伊人久久| 中文字幕 欧美日韩| 精品无码一区二区三区在线视频| 国产视频大全| 国产玖玖视频| 午夜一区二区三区| 色天天综合| 日韩精品中文字幕一区三区| 呦视频在线一区二区三区| 亚洲天堂久久| 日本精品αv中文字幕| 亚洲精品成人片在线观看| 欧美成人手机在线观看网址| 精品少妇人妻无码久久| 国产系列在线| 一本综合久久| 不卡午夜视频| 亚洲黄网在线| 国产无人区一区二区三区| 制服丝袜一区二区三区在线| 亚洲精品男人天堂| 亚洲精品成人福利在线电影| 国产日韩欧美视频| 九九九国产| 午夜视频免费一区二区在线看| 伊人查蕉在线观看国产精品| 天天摸天天操免费播放小视频| 91久久国产综合精品| 免费Aⅴ片在线观看蜜芽Tⅴ| 香蕉久久永久视频| 亚洲天堂久久新| 日韩精品免费一线在线观看| 国产 在线视频无码| 就去吻亚洲精品国产欧美| 国产丝袜啪啪| 日韩欧美在线观看| 国产免费久久精品99re不卡| 伊人激情综合网| 日本一本正道综合久久dvd| 思思热精品在线8| www亚洲天堂| 久久综合国产乱子免费| 人妻精品全国免费视频| 91福利免费视频| 午夜毛片福利| 亚洲 欧美 日韩综合一区| 日日噜噜夜夜狠狠视频| 99久久99这里只有免费的精品| 狠狠色狠狠综合久久| 亚洲人成在线精品| 99ri精品视频在线观看播放| 国产特级毛片| 欧美综合区自拍亚洲综合天堂| 五月婷婷精品| 久久免费视频6| 尤物精品视频一区二区三区| 美美女高清毛片视频免费观看| 日韩高清欧美| 国产真实自在自线免费精品| 99精品福利视频| 在线看片国产| 婷婷成人综合| 日本国产在线| 天堂av高清一区二区三区| 久久精品亚洲专区| 国产在线一区视频| 在线网站18禁| 久久久精品无码一区二区三区| 亚洲欧美极品|